Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第80页

TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法

TokenVerse是什么 TokenVerse 是基于预训练文本到图像扩散模型的多概念个性化图像生成方法。能从单张图像中解耦复杂的视觉元素和属性，从多张图像中提取概念进行无缝组合生成。支持多种概念...

Ai项目

3周前

4,9650

MILS – Meta AI 推出的零样本生成高质量多模态描述方法

MILS是什么 MILS（Multimodal Iterative LLM Solver）是Meta AI提出的无需训练即可赋予大型语言模型（LLM）多模态能力的方法。通过多步推理，提示LLM生成候选...

Ai项目

12个月前

4,9650

Eino – 字节跳动开源的大模型应用开发框架

Eino是什么 Eino 是字节跳动开源的大模型应用开发框架，能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础，具备稳定的内核、灵活的扩展性和完善的工具生态。Eino 的核心...

Ai项目

12个月前

4,9650

LangBot – 多模态即时聊天机器人构建与管理的开源平台

LangBot是什么 LangBot 是开源的即时聊天机器人平台，支持多平台（如 QQ、微信、飞书、Discord 等）和多种大语言模型（如 ChatGPT、DeepSeek、Gemini 等）。La...

Ai项目

12个月前

04,9650

DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型

DeepCoder-14B-Preview是什么 DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型，基于 Deepseek-R1...

Ai项目

12个月前

04,9650

Phi-4-reasoning – 微软推出的Phi-4推理模型系列

Phi-4-reasoning是什么 Phi-4-reasoning 是微软推出的 140 亿参数的推理模型，专为复杂推理任务设计。通过监督微调（SFT）训练而成，使用了 OpenAI 的 o3-mi...

Ai项目

3周前

4,9600

TryOffDiff – AI虚拟试穿技术，单张穿着者图片生成标准化服装图像

TryOffDiff是什么 TryOffDiff（VTOFF）是基于扩散模型的新型虚拟试穿技术，用高保真服装重建实现虚拟试穿，专注于从单张穿着者照片生成标准化的服装图像。与传统的Virtual Try...

Ai项目

3周前

4,9600

OSUM – 西北工业大学开源的语音理解模型

OSUM是什么 OSUM（Open Speech Understanding Model）是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSUM结合Whisper编码器和Q...

Ai项目

12个月前

04,9600

VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架

VideoPainter是什么 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架，专门用在处理任意长度的视频内容。VideoPainter...

Ai项目

12个月前

04,9600

DreamActor-M1 – 字节跳动推出的 AI 图像动画框架

DreamActor-M1是什么 DreamActor-M1是字节跳动推出的先进AI图像动画框架，能将静态人物照片转化为生动的动画视频。采用混合引导机制，结合隐式面部表示、3D头部球体和3D身体骨架等...

Ai项目

12个月前

04,9600