OpenAI o3-mini – OpenAI 推出的全新推理模型 OpenAI o3-mini是什么 OpenAI o3-mini是OpenAI正式发布的全新推理模型。是OpenAI推理系列中最新、成本效益最高的模型,专为科学、数学和编程等技术领域优化。支持三种推理... Ai项目 11个月前7,8200
AgentScope – 阿里开源的多智能体开发平台 AgentScope是什么 AgentScope是阿里巴巴集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持,内置多种模型API和... Ai项目 2周前7,7650
Edicho – 蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法 Edicho是什么 Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的,基于扩散模型的图像编辑方法,能在多图像间实现一致性编辑。Edicho用免训练的方法,无需额外训练即可应用。E... Ai项目 2周前7,6700
Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型 Gemini 2.0是什么 Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1... Ai项目 2周前7,6550
BiliNote – 开源 AI 视频笔记工具,自动提取视频内容生成Markdown格式 BiliNote是什么 BiliNote 是开源的 AI 视频笔记助手,支持基于哔哩哔哩、YouTube 等视频链接,自动提取视频内容生成结构清晰、重点明确的 Markdown 格式笔记。BiliNo... Ai项目 12个月前07,5900
ChatTTSPlus – 开源文本转语音工具,ChatTTS扩展版支持语音克隆 ChatTTSPlus是什么 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音合成的性能和灵活性。在Windows平台上,实现了超过... Ai项目 2周前7,5600
FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架 FantasyTalking是什么 FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模... Ai项目 12个月前07,5500
Open Deep Research – Deep Research开源复现版智能体,支持切换多种语言模型 Open Deep Research是什么 Open Deep Research 是开源的 AI 智能体,是Deep Research开源复现项目,基于推理大量网络数据完成复杂的多步骤研究任务。Ope... Ai项目 11个月前7,4700
Gemma 3 – 谷歌最新推出的开源多模态 AI 模型 Gemma 3是什么 Gemma 3 是谷歌最新推出的开源人工智能模型,专为开发者设计,支持多种设备上的人工智能应用开发。支持超过 35 种语言,具备分析文本、图像及短视频的能力,提供四种不同尺寸的模... Ai项目 11个月前07,4500
TIGER – 清华大学推出的轻量级语音分离模型 TIGER是什么 TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)是清华大学研究团队提出的轻量级... Ai项目 11个月前07,4450