TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法 TokenVerse是什么 TokenVerse 是基于预训练文本到图像扩散模型的多概念个性化图像生成方法。能从单张图像中解耦复杂的视觉元素和属性,从多张图像中提取概念进行无缝组合生成。支持多种概念... Ai项目 3周前4,9650
MILS – Meta AI 推出的零样本生成高质量多模态描述方法 MILS是什么 MILS(Multimodal Iterative LLM Solver)是Meta AI提出的无需训练即可赋予大型语言模型(LLM)多模态能力的方法。通过多步推理,提示LLM生成候选... Ai项目 12个月前4,9650
Eino – 字节跳动开源的大模型应用开发框架 Eino是什么 Eino 是字节跳动开源的大模型应用开发框架,能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础,具备稳定的内核、灵活的扩展性和完善的工具生态。Eino 的核心... Ai项目 12个月前4,9650
LangBot – 多模态即时聊天机器人构建与管理的开源平台 LangBot是什么 LangBot 是开源的即时聊天机器人平台,支持多平台(如 QQ、微信、飞书、Discord 等)和多种大语言模型(如 ChatGPT、DeepSeek、Gemini 等)。La... Ai项目 12个月前04,9650
DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型 DeepCoder-14B-Preview是什么 DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型,基于 Deepseek-R1... Ai项目 12个月前04,9650
Phi-4-reasoning – 微软推出的Phi-4推理模型系列 Phi-4-reasoning是什么 Phi-4-reasoning 是微软推出的 140 亿参数的推理模型,专为复杂推理任务设计。通过监督微调(SFT)训练而成,使用了 OpenAI 的 o3-mi... Ai项目 3周前4,9600
TryOffDiff – AI虚拟试穿技术,单张穿着者图片生成标准化服装图像 TryOffDiff是什么 TryOffDiff(VTOFF)是基于扩散模型的新型虚拟试穿技术,用高保真服装重建实现虚拟试穿,专注于从单张穿着者照片生成标准化的服装图像。与传统的Virtual Try... Ai项目 3周前4,9600
OSUM – 西北工业大学开源的语音理解模型 OSUM是什么 OSUM(Open Speech Understanding Model)是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSUM结合Whisper编码器和Q... Ai项目 12个月前04,9600
VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架 VideoPainter是什么 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter... Ai项目 12个月前04,9600
DreamActor-M1 – 字节跳动推出的 AI 图像动画框架 DreamActor-M1是什么 DreamActor-M1是字节跳动推出的先进AI图像动画框架,能将静态人物照片转化为生动的动画视频。采用混合引导机制,结合隐式面部表示、3D头部球体和3D身体骨架等... Ai项目 12个月前04,9600