Markdown-to-Image – 开源的在线 Markdown 转海报编辑器 Markdown-to-Image是什么 Markdown-to-Image是开源的Markdown 转海报编辑器,作为React组件能将Markdown文本内容转换成图像,适用于创建社交媒体帖子、海... Ai项目 2个月前1,2450
TÜLU 3 – Ai2 推出的系列开源指令遵循模型 TÜLU 3是什么 TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本... Ai项目 2个月前1,3100
EchoMimicV2 – 阿里推出的开源数字人项目,能生成完整数字人半身动画 EchoMimicV2是什么 EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。EchoMimi... Ai项目 2个月前2,0050
FlipSketch – 萨里大学推出的文本引导生成无约束草图动画的AI系统 FlipSketch是什么 FlipSketch 是萨里大学推出的创新系统,能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现:微调草图风格的帧生成、用噪声细化保持输入草图视觉完整性的参考... Ai项目 2个月前1,4400
StoryTeller – 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统 StoryTeller是什么 StoryTeller是字节跳动、上海交通大学和北京大学共同推出的系统,能基于音频视觉角色识别技术改善长视频描述的质量和一致性。系统结合低级视觉概念和高级剧情信息,生成详... Ai项目 2个月前1,4100
DELIFT – 数据高效语言模型指令微调算法 DELIFT是什么 DELIFT(Data Efficient Language model Instruction Fine-Tuning)是基于高效数据优化语言模型指令微调,一种新颖的算法,用在优... Ai项目 2个月前1,0300
HART – 麻省理工学院推出的自回归视觉生成模型 HART是什么 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直接生成1024×1024像素的高分辨率图像,质量媲美扩... Ai项目 2个月前1,3100
WebDreamer – 基于大语言模型模拟网页交互增强网络规划能力的框架 WebDreamer是什么 WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体,基于大型语言模型(LLMs),特别是GPT-4o,作为世界模型预测网站上的交互结... Ai项目 2个月前8550
Kandinsky-3 – 开源的文本到图像生成框架,适应多种图像生成任务 Kandinsky-3是什么 Kandinsky-3是基于潜在扩散模型的文本到图像(T2I)生成框架,支持高质量和逼真度在图像合成。Kandinsky-3能适应多种图像生成任务,包括文本引导的修复/扩... Ai项目 2个月前1,3800
CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架 CAVIA是什么 CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块,增强视频的视角一致性和时... Ai项目 2个月前1,3050