FaceLift – Adobe 联合加州大学推出的单张图像到 3D 头部模型生成技术 FaceLift是什么 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的头部模型。FaceLift基于两阶段的流程实现:基于扩... Ai项目 5个月前2,2450
SVFR – 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架 SVFR是什么 SVFR(Stable Video Face Restoration)是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统一框架,整合了视频人脸修复(BFR)、着色和修复任务... Ai项目 5个月前2,6950
TimesFM 2.0 – 谷歌研究团队开源的时间序列预测模型 TimesFM 2.0是什么 TimesFM 2.0是谷歌研究团队推出的开源时间序列预测模型。具备强大的预测能力,可处理长达2048个时间点的单变量时间序列,支持任意预测时间跨度。模型采用仅解码器架构... Ai项目 5个月前2,6400
NeuralSVG – 文本驱动矢量图形生成技术,转化为有层次结构的矢量图形 NeuralSVG是什么 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络,将文本提示转化为具有层次结构的矢量图形。该网络以形状索引为输入,输出形状参数,再经可微渲染器... Ai项目 5个月前2,6600
ViTPose – 基于 Transformer 架构的人体姿态估计模型 ViTPose是什么 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通过将输入图像切块并送入 Transformer blo... Ai项目 5个月前2,6150
Nemotron-CC – 英伟达推出的大型预训练数据集 Nemotron-CC是什么 Nemotron-CC是NVIDIA团队推出的大型预训练数据集,能将Common Crawl数据转化为适用于长序列预训练的高质量语料。Nemotron-CC数据集结合分类... Ai项目 5个月前2,1450
NVIDIA-Ingest – 英伟达开源的智能文档提取及结构化工具 NVIDIA-Ingest是什么 NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDIA-Ingest能将文档转换为元数据和文本,便于嵌入到... Ai项目 5个月前2,5250
Eko – Fellou AI 推出的开源 AI 代理开发框架 Eko是什么 Eko是Fellou AI推出的生产就绪型JavaScript框架,基于自然语言驱动的方式,帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台,包括计算机桌面环境和... Ai项目 5个月前3,2400
Emotion-LLaMA – 多模态情绪识别与推理模型,融合音频、视觉和文本输入 Emotion-LLaMA是什么 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模型基于修改版LLaMA,经指令调整以提升情感识别能力... Ai项目 5个月前2,4600
GR00T-Teleop – 英伟达发布通过 Apple Vision Pro 捕捉人类动作的技术 GR00T-Teleop是什么 GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVIDIA CloudXR连接Apple Vision P... Ai项目 5个月前2,2200