Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第6页

Aurora – 微软推出的大气基础模型

Aurora是什么 Aurora是微软研究院推出的13亿参数的大气基础模型，基于从海量大气数据中提取有价值信息，用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构，处理不同分...

Ai项目

2周前

4,3800

DeepWiki MCP – Cognition Labs推出的MCP服务工具

DeepWiki MCP是什么 DeepWiki MCP 是Cognition Labs推出的远程服务器，基于开放标准的 Model Context Protocol（MCP）。DeepWiki MC...

Ai项目

2周前

4,3600

Gemini Diffusion – 谷歌推出的文本扩散模型

Gemini Diffusion是什么 Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同，基于逐步细化噪声生成输出，能快速迭代纠正错误，让Gemini ...

Ai项目

2周前

5,6200

3DTown – 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架

3DTown是什么 3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术，将输入图像分解为重叠区域，基于预训练的...

Ai项目

2周前

5,0000

SurfSense – 开源AI研究助手，个人知识库与全球数据源无缝链接

SurfSense是什么 SurfSense 是开源的 AI 研究工具，类似于 NotebookLM 和 Perplexity，具备更强的扩展性。工具能与多种外部数据源（如搜索引擎、Slack、Not...

Ai项目

2周前

4,8700

Vid2World – 清华联合重庆大学推出视频模型转为世界模型的框架

Vid2World是什么 Vid2World是清华大学联合重庆大学推出的创新框架，支持将全序列、非因果的被动视频扩散模型（VDM）转换为自回归、交互式、动作条件化的世界模型。模型基于视频扩散因果化和因...

Ai项目

2周前

4,6200

Pixel Reasoner – 滑铁卢联合港科大等高校推出的视觉语言模型

Pixel Reasoner是什么 Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型（VLM），基于像素空间推理增强模型对视觉信息的理解和推理能力。模型...

Ai项目

2周前

5,2250

MTVCrafter – 中科院联合中国电信等机构推出的人像动画生成框架

MTVCrafter是什么 MTVCrafter是中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架，基于原始3D运动序列进行高质量动画生成...

Ai项目

2周前

4,7250

Morphik – 开源的多模态检索增强生成工具

Morphik是什么 Morphik 是开源的多模态检索增强生成（RAG）工具，专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索，采用 ColPali 等技术...

Ai项目

2周前

5,2150

BLIP3-o – Salesforce Research等机构推出的多模态模型

BLIP3-o是什么 BLIP3-o是Salesforce Research等机构推出的创新多模态模型，融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像特...

Ai项目

2周前

5,1700