Devika – 开源的AI编程工具,理解和执行复杂的人类指令 Devika 是什么 Devika是开源的AI编程工具,能理解并拆分复杂指令,基于集成AI搜索和网页浏览能力搜集信息,编写代码实现目标。Devika支持多种AI模型,具备高级规划推理能力,能进行上下文... Ai项目 2周前4,7500
iDP3 – 斯坦福大学联合多所高校推出的改进型3D视觉运动策略 iDP3是什么 iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的改进型3D视觉运动策略(如三维扩散策略),提升人形机器人在多样化环境中的自主操作能力... Ai项目 2周前6,5850
Proactive Agent – 清华联合面壁智能开源的新一代主动Agent交互范式 Proactive Agent是什么 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式 ,具备主动性,能预测用户需求并在没有直接指令的情况下采取行动。Pro... Ai项目 2周前6,1400
EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型 EMOVA是什么 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOV... Ai项目 2周前4,8650
OminiControl – AI图像生成框架,实现图像主题控制和空间精确控制 OminiControl是什么 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和... Ai项目 2周前5,1250
Talker-Reasoner – 谷歌DeepMind推出的双思维AI代理架构 Talker-Reasoner是什么 Talker-Reasoner是谷歌DeepMind推出的双思维AI代理架构,借鉴人类的认知理论,将代理分为两个模块:Talker和Reasoner。Talker... Ai项目 2周前5,4500
Diffusion Self-Distillation – 斯坦福大学推出的零样本定制图像生成技术 Diffusion Self-Distillation是什么 Diffusion Self-Distillation(扩散自蒸馏,简称DSD)是斯坦福大学吴佳俊团队推出的零样本定制图像生成技术,用预训... Ai项目 2周前5,3000
Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型 Open Materials 2024是什么 Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集,专注于无机材... Ai项目 2周前4,8200
CodeDPO – 北京大学联合字节共同推出的代码生成优化框架 CodeDPO是什么 CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架,能提升代码模型在正确性和效率方面的表现。框架基于自生成和验证机制,同时构建和评估代码及其测试用例,用PageRank... Ai项目 2周前5,7100
Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务 Voice-Pro是什么 Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言... Ai项目 2周前5,5250