Agixxw

帅气的我简直无法用语言描述!

RelightVid – 上海 AI Lab联合复旦等高校推出的视频重照明模型

RelightVid是什么 RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、背景视频或HD...
3周前
6600

HRAvatar – 清华联合IDEA推出的单目视频生成3D头像技术

HRAvatar是什么 HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术,基于精准的...
3周前
6900

Pocket Flow – 开源的轻量级AI应用开发框架,仅用100行代码实现

Pocket Flow是什么 Pocket Flow 是极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工...
3周前
8000

Aurora – 微软推出的大气基础模型

Aurora是什么 Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构,处理不同分...
3周前
6800

DeepWiki MCP – Cognition Labs推出的MCP服务工具

DeepWiki MCP是什么 DeepWiki MCP 是Cognition Labs推出的远程服务器,基于开放标准的 Model Context Protocol(MCP)。DeepWiki MC...
3周前
7100

Gemini Diffusion – 谷歌推出的文本扩散模型

Gemini Diffusion是什么 Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini ...
3周前
3500

3DTown – 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架

3DTown是什么 3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域,基于预训练的...
3周前
5000

SurfSense – 开源AI研究助手,个人知识库与全球数据源无缝链接

SurfSense是什么 SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Not...
3周前
4100

Vid2World – 清华联合重庆大学推出视频模型转为世界模型的框架

Vid2World是什么 Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基于视频扩散因果化和因...
3周前
5800

Pixel Reasoner – 滑铁卢联合港科大等高校推出的视觉语言模型

Pixel Reasoner是什么 Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理能力。模型...
3周前
8850