Aurora – 微软推出的大气基础模型 Aurora是什么 Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构,处理不同分... Ai项目 2周前4,3800
DeepWiki MCP – Cognition Labs推出的MCP服务工具 DeepWiki MCP是什么 DeepWiki MCP 是Cognition Labs推出的远程服务器,基于开放标准的 Model Context Protocol(MCP)。DeepWiki MC... Ai项目 2周前4,3600
Gemini Diffusion – 谷歌推出的文本扩散模型 Gemini Diffusion是什么 Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini ... Ai项目 2周前5,6200
3DTown – 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架 3DTown是什么 3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域,基于预训练的... Ai项目 2周前5,0000
SurfSense – 开源AI研究助手,个人知识库与全球数据源无缝链接 SurfSense是什么 SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Not... Ai项目 2周前4,8700
Vid2World – 清华联合重庆大学推出视频模型转为世界模型的框架 Vid2World是什么 Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基于视频扩散因果化和因... Ai项目 2周前4,6200
Pixel Reasoner – 滑铁卢联合港科大等高校推出的视觉语言模型 Pixel Reasoner是什么 Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理能力。模型... Ai项目 2周前5,2250
MTVCrafter – 中科院联合中国电信等机构推出的人像动画生成框架 MTVCrafter是什么 MTVCrafter是中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于原始3D运动序列进行高质量动画生成... Ai项目 2周前4,7250
Morphik – 开源的多模态检索增强生成工具 Morphik是什么 Morphik 是开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索,采用 ColPali 等技术... Ai项目 2周前5,2150
BLIP3-o – Salesforce Research等机构推出的多模态模型 BLIP3-o是什么 BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像特... Ai项目 2周前5,1700