Devika – 开源的AI编程工具,理解和执行复杂的人类指令 Devika 是什么 Devika是开源的AI编程工具,能理解并拆分复杂指令,基于集成AI搜索和网页浏览能力搜集信息,编写代码实现目标。Devika支持多种AI模型,具备高级规划推理能力,能进行上下文... Ai项目 4周前4,9400
AI-Researcher – 香港大学推出的开源自动化科学研究工具 AI-Researcher是什么 AI-Researcher 是香港大学数据科学实验室推出的开源自动化科学研究工具,基于大型语言模型(LLM)代理实现从研究想法到论文发表的全流程自动化。AI-Rese... Ai项目 12个月前04,9400
SkyReels-V2 – 昆仑万维开源的无限时长电影生成模型 SkyReels-V2是什么 SkyReels-V2是昆仑万维SkyReels团队推出的无限时长电影生成模型,基于扩散强迫(Diffusion-forcing)框架,结合多模态大语言模型(MLLM... Ai项目 12个月前04,9400
LIMO – 上海交大推出的高效推理方法,仅需817条训练样本 LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能力。核心假设是在... Ai项目 12个月前4,9350
Step-Audio – 阶跃星辰开源的语音交互模型 Step-Audio是什么 Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Ste... Ai项目 12个月前04,9350
DynaSaur – Adobe 推出的大语言模型代理框架 DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和... Ai项目 4周前4,9300
VMB – 中科院联合多所高校机构推出增强多模态音乐生成的框架 VMB是什么 VMB(Visuals Music Bridge)是中国科学院信息工程研究所、中国科学院大学网络空间安全学院、上海人工智能实验室、上海交通大学等机构推出的多模态音乐生成框架,能从文本、图... Ai项目 4周前4,9300
TripoSR – Stability AI 联合 VAST 开源的 3D 生成模型 TripoSR是什么 TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构,采用了... Ai项目 12个月前04,9300
Gemini 2.5 Flash – 谷歌推出的最新 AI 推理模型 Gemini 2.5 Flash是什么 Gemini 2.5 Flash 是 Google 推出的高效、低延迟的最新 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash... Ai项目 12个月前04,9300
Neural4D 2o – DreamTech 推出支持多模态交互的 3D 模型 Neural4D 2o是什么 Neural4D 2o 是 DreamTech 推出的全球首个支持多模态交互的 3D 大模型。模型基于文本、图像、3D 和运动数据的联合训练,实现 3D 生成的上下文一致... Ai项目 12个月前04,9300