Teacher2Task – 谷歌推出的多教师学习框架 Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N... Ai项目 5个月前2,8700
AppAgentX – 西湖大学推出的自我进化式 GUI 代理框架 AppAgentX是什么 AppAgentX 是西湖大学推出的新型自我进化式 GUI(图形用户界面)代理框架,基于从执行历史中抽象出高级动作提升代理在智能手机交互中的效率和智能性。AppAgentX结... Ai项目 5个月前02,8700
Kimi-VL – 月之暗面开源的轻量级多模态视觉语言模型 Kimi-VL是什么 Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M... Ai项目 5个月前02,8700
Aria-UI – 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型 Aria-UI是什么 Aria-UI是香港大学和Rhymes AI共同推出的为图形用户界面(GUI)定位任务设计的大型多模态模型。基于纯视觉方法,不依赖于HTML或AXTree等辅助输入,用大规模、多... Ai项目 5个月前2,8500
MVoT – 微软联合剑桥和中科院推出的多模态推理可视化框架 MVoT是什么 MVoT(Multimodal Visualization-of-Thought)是微软研究院、剑桥大学语言技术实验室、中国科学院自动化研究所推出的新型多模态推理范式,基于生成图像可视... Ai项目 5个月前02,8500
MedRAX – AI医学推理Agent,用于胸部X光检查和解决复杂医学问题 MedRAX是什么 MedRAX(Medical Reasoning Agent for Chest X-ray)是专门用于胸部X光检查的医学推理AI代理。通过整合最先进的胸部X光分析工具和多模态大型... Ai项目 5个月前02,8500
OmniThink – 浙大联合阿里通义实验室推出的深度思考机器写作框架 OmniThink是什么 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架,通过模拟人类的迭代扩展和反思过程,突破大型语言模型在机器写作中的知识边界。框架通过信息树和概念池... Ai项目 5个月前2,8400
Neural4D 2o – DreamTech 推出支持多模态交互的 3D 模型 Neural4D 2o是什么 Neural4D 2o 是 DreamTech 推出的全球首个支持多模态交互的 3D 大模型。模型基于文本、图像、3D 和运动数据的联合训练,实现 3D 生成的上下文一致... Ai项目 5个月前02,8400
KuaiFormer – 快手推出的检索框架,基于Transformer KuaiFormer是什么 KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer... Ai项目 5个月前2,8350
SkyReels-A1 – 昆仑万维开源的表情动作可控算法 SkyReels-A1是什么 SkyReels-A1是昆仑万维开源的中国首个SOTA(State-of-the-Art)级别的基于视频基座模型的表情动作可控算法。SkyReels-A1能实现更精准可控... Ai项目 5个月前02,8350