Llama Nemotron – 英伟达推出的系列推理模型 Llama Nemotron是什么 Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的... Ai项目 12个月前05,2400
Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型 Audio-SDS是什么 Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域... Ai项目 2周前5,2350
UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构 UltraMem是什么 UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,显著降低推理成本,推理速度较 ... Ai项目 12个月前05,2350
Scribe – ElevenLabs 推出的高精度语音转文本模型 Scribe是什么 Scribe 是 ElevenLabs 推出的高精度语音转文本模型,专为多语言和复杂音频环境设计。支持99种语言,英语和意大利语的转录准确率分别达到96.7%和98.7%,在小语种... Ai项目 12个月前05,2350
Open Computer Agent – Hugging Face 推出的免费云端 AI Agent 工具 Open Computer Agent是什么 Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行,基于预装的... Ai项目 2周前5,2300
Satori – 开源的大语言推理模型,具备自回归搜索和自我纠错能力 Satori是什么 Satori是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言模型,专注于提升推理能力。基于Qwen-2.5-Math-7B,Satori通过小规模的格式微调和大规模的增... Ai项目 12个月前05,2300
FoloUp – 开源AI语音面试平台,自动生成定制化面试问题 FoloUp是什么 FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然、对话式的语音面试。平台能实时... Ai项目 12个月前05,2300
Morphik – 开源的多模态检索增强生成工具 Morphik是什么 Morphik 是开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索,采用 ColPali 等技术... Ai项目 2周前5,2250
Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物 Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展... Ai项目 2周前5,2250
MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法 MultiBooth是什么 MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成... Ai项目 2周前5,2250