MoLing – 本地AI办公自动化助手,基于 MCP 服务器 MoLing是什么 MoLing 是无依赖的本地办公自动化助手,是基于计算机和浏览器使用的 MCP 服务器。MoLing 基于操作系统 API 实现系统交互,支持文件系统操作(如读写、合并、统计和聚合... Ai项目 1年前04,9000
Versatile-OCR-Program – 开源多模态OCR工具,精准提取复杂结构化数据 Versatile-OCR-Program是什么 Versatile-OCR-Program是开源多模态OCR工具,支持从复杂的教育材料中提取结构化数据,生成适合机器学习训练的高质量数据集。Versa... Ai项目 1年前04,8650
Kimi-VL – 月之暗面开源的轻量级多模态视觉语言模型 Kimi-VL是什么 Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M... Ai项目 1年前05,7500
FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架 FantasyTalking是什么 FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模... Ai项目 1年前07,6100
BrowseComp – OpenAI 开源的 AI Agent 网络浏览能力基准 BrowseComp是什么 BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育... Ai项目 1年前05,2800
日日新SenseNova V6 – 商汤推出的多模态融合模型系列 日日新SenseNova V6是什么 日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列,基于6000亿参数的多模态MoE架构,实现文本、图像和视频的原生融合。日日新Sense... Ai项目 1年前05,9900
明岐 – 上海交大推出的医学多模态大模型,精准诊断罕见病 明岐是什么 明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构,整合医学影像、病历文本及化验指标等数据,为... Ai项目 1年前05,1750
Fourier N1 – 傅利叶推出的首款开源人形机器人 Fourier N1是什么 Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米,体重38公斤,拥有23个自由度,采用铝合金与工程塑料复合结构,兼具强度与灵活性。搭载的F... Ai项目 1年前06,0550
ScholarCopilot – 滑铁卢与卡内基梅隆大学联合推出的AI学术写作助手 ScholarCopilot是什么 ScholarCopilot 是加拿大滑铁卢大学与卡内基梅隆大学的研究团队开发的专为学术写作设计的人工智能工具,基于 Qwen-2.5-7B 模型,通过动态检索引用... Ai项目 1年前04,3850
AgentPrune – 同济联合港中文等机构推出的多智能体通信优化框架 AgentPrune是什么 AgentPrune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型(LLM)驱动的多智能体系统通信优化框架,通过“剪枝”技术,剔除冗余或有害的通信内容,降低通信... Ai项目 1年前04,4950