StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架
StreamBridge是什么 StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(Video-LLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减压...
Step1X-3D – 阶跃星辰联合LightIllusions开源的3D资产生成框架
Step1X-3D是什么 Step1X-3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程,从超过 500 万个 3D 资产中筛选出...
OpenVision – 加州大学开源的视觉编码器家族
OpenVision是什么 OpenVision是加州大学圣克鲁兹分校(UCSC)推出的完全开放、高效且灵活的高级视觉编码器家族,专注于多模态学习。提供从5.9M到632.1M参数的多种规模模型,适用...
FLUX-Text – 阿里推出的多语言场景文本编辑框架
FLUX-Text是什么 FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架,基于扩散模型(Diffusion Model)和轻量级字形嵌入模块。框架基于注入字形条件信息,提升复杂场景下文本...
MCA-Ctrl – 中科院和中科大推出的图像定制生成框架
MCA-Ctrl是什么 MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂...
AgentCPM-GUI – 清华联合面壁智能开源的端侧GUI智能体模型
AgentCPM-GUI是什么 AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V(80 亿参数)构建,能接受智...
AG-UI – AI Agent与前端应用交互的开源协议
AG-UI是什么 AG-UI(Agent-User Interaction Protocol)是开源的、轻量级的、基于事件的协议,支持标准化AI Agent 与前端应用之间的交互。AG-UI定义16种...
DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架
DreamFit是什么 DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。框架能显著减少模型复杂度和训练成本,基于...
Minion Agent – 开源的多功能 AI Agent 框架
Minion Agent是什么 Minion Agent是Agent框架,支持浏览器操作、MCP、自动规划和深度研究等功能。Minion Agent支持多种模型,基于灵活的配置选项满足不同需求。用户用...
Being-M0 – 北大联合人民大学推出的人形机器人通用动作生成模型
Being-M0是什么 Being-M0 是北京大学、中国人民大学等机构联合推出的首个大规模人形机器人通用动作生成模型。Being-M0 基于业界首个百万级动作数据集 MotionLib,用创新的 M...