RelightVid – 上海 AI Lab联合复旦等高校推出的视频重照明模型 RelightVid是什么 RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、背景视频或HD... Ai项目 3周前6600
HRAvatar – 清华联合IDEA推出的单目视频生成3D头像技术 HRAvatar是什么 HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术,基于精准的... Ai项目 3周前6900
Pocket Flow – 开源的轻量级AI应用开发框架,仅用100行代码实现 Pocket Flow是什么 Pocket Flow 是极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工... Ai项目 3周前8000
Aurora – 微软推出的大气基础模型 Aurora是什么 Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构,处理不同分... Ai项目 3周前6800
DeepWiki MCP – Cognition Labs推出的MCP服务工具 DeepWiki MCP是什么 DeepWiki MCP 是Cognition Labs推出的远程服务器,基于开放标准的 Model Context Protocol(MCP)。DeepWiki MC... Ai项目 3周前7100
Gemini Diffusion – 谷歌推出的文本扩散模型 Gemini Diffusion是什么 Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini ... Ai项目 3周前3500
3DTown – 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架 3DTown是什么 3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域,基于预训练的... Ai项目 3周前5000
SurfSense – 开源AI研究助手,个人知识库与全球数据源无缝链接 SurfSense是什么 SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Not... Ai项目 3周前4100
Vid2World – 清华联合重庆大学推出视频模型转为世界模型的框架 Vid2World是什么 Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基于视频扩散因果化和因... Ai项目 3周前5800
Pixel Reasoner – 滑铁卢联合港科大等高校推出的视觉语言模型 Pixel Reasoner是什么 Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理能力。模型... Ai项目 3周前8850