FLUX-Text – 阿里推出的多语言场景文本编辑框架 FLUX-Text是什么 FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架,基于扩散模型(Diffusion Model)和轻量级字形嵌入模块。框架基于注入字形条件信息,提升复杂场景下文本... Ai项目 2周前4,3600
MCA-Ctrl – 中科院和中科大推出的图像定制生成框架 MCA-Ctrl是什么 MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂... Ai项目 2周前4,6100
AgentCPM-GUI – 清华联合面壁智能开源的端侧GUI智能体模型 AgentCPM-GUI是什么 AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V(80 亿参数)构建,能接受智... Ai项目 2周前4,8050
AG-UI – AI Agent与前端应用交互的开源协议 AG-UI是什么 AG-UI(Agent-User Interaction Protocol)是开源的、轻量级的、基于事件的协议,支持标准化AI Agent 与前端应用之间的交互。AG-UI定义16种... Ai项目 2周前5,9400
DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架 DreamFit是什么 DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。框架能显著减少模型复杂度和训练成本,基于... Ai项目 2周前6,6200
Minion Agent – 开源的多功能 AI Agent 框架 Minion Agent是什么 Minion Agent是Agent框架,支持浏览器操作、MCP、自动规划和深度研究等功能。Minion Agent支持多种模型,基于灵活的配置选项满足不同需求。用户用... Ai项目 2周前4,7400
Being-M0 – 北大联合人民大学推出的人形机器人通用动作生成模型 Being-M0是什么 Being-M0 是北京大学、中国人民大学等机构联合推出的首个大规模人形机器人通用动作生成模型。Being-M0 基于业界首个百万级动作数据集 MotionLib,用创新的 M... Ai项目 2周前4,4350
DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架 DanceGRPO是什么 DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域,覆盖两大生成范式(diffusion 和 recti... Ai项目 2周前5,2850
AlphaEvolve – 谷歌 DeepMind 推出的通用科学AI Agent AlphaEvolve是什么 AlphaEvolve是谷歌DeepMind推出的通用科学Agent,基于结合大型语言模型(LLMs)的创造力和自动评估器来设计和优化高级算法。用Gemini Flash... Ai项目 2周前4,9850
WorldMem – 南洋理工联合北大和上海 AI Lab 推出的世界生成模型 WorldMem是什么 WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制,解决传统世界生成模型在长时序下缺乏一致性的关键问题。在Wo... Ai项目 2周前5,2800