Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型 Prometheus是什么 Prometheus是创新的3D感知潜在扩散模型,专门用于快速生成文本到3D场景的内容。能在几秒钟内完成对象和场景级别的3D生成,同时保持高质量的输出和良好的泛化能力。核心... Ai项目 2周前4,5050
Riona-AI-Agent – AI社交工具,可在社交媒体平台自动化交互点赞评论 Riona-AI-Agent是什么 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 Instagram、Twitter 和 GitHub ... Ai项目 2周前6,7550
MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统 MiniRAG是什么 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感... Ai项目 2周前5,0750
GR00T-Teleop – 英伟达发布通过 Apple Vision Pro 捕捉人类动作的技术 GR00T-Teleop是什么 GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVIDIA CloudXR连接Apple Vision P... Ai项目 2周前5,7700
Emotion-LLaMA – 多模态情绪识别与推理模型,融合音频、视觉和文本输入 Emotion-LLaMA是什么 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模型基于修改版LLaMA,经指令调整以提升情感识别能力... Ai项目 2周前6,1500
Eko – Fellou AI 推出的开源 AI 代理开发框架 Eko是什么 Eko是Fellou AI推出的生产就绪型JavaScript框架,基于自然语言驱动的方式,帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台,包括计算机桌面环境和... Ai项目 2周前6,0400
NVIDIA-Ingest – 英伟达开源的智能文档提取及结构化工具 NVIDIA-Ingest是什么 NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDIA-Ingest能将文档转换为元数据和文本,便于嵌入到... Ai项目 2周前5,4650
Nemotron-CC – 英伟达推出的大型预训练数据集 Nemotron-CC是什么 Nemotron-CC是NVIDIA团队推出的大型预训练数据集,能将Common Crawl数据转化为适用于长序列预训练的高质量语料。Nemotron-CC数据集结合分类... Ai项目 2周前3,9750
ViTPose – 基于 Transformer 架构的人体姿态估计模型 ViTPose是什么 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通过将输入图像切块并送入 Transformer blo... Ai项目 2周前5,1250
NeuralSVG – 文本驱动矢量图形生成技术,转化为有层次结构的矢量图形 NeuralSVG是什么 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络,将文本提示转化为具有层次结构的矢量图形。该网络以形状索引为输入,输出形状参数,再经可微渲染器... Ai项目 2周前4,9400