Oliva – 开源语音RAG助手,实时语音搜索向量数据库 Oliva是什么 Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强生成)架构,帮助用户在 Qdrant 向量数据库中实时... Ai项目 5个月前02,7000
GLM-Zero – 智谱AI推出的深度推理模型 GLM-Zero是什么 GLM-Zero是智谱AI基于扩展强化学习技术的推理模型,专注于提升模型的深度推理能力。擅长处理数理逻辑、代码编写和复杂问题解决,在AIME 2024、MATH500和Live... Ai项目 5个月前2,6950
MarS – 微软亚洲研究院开源的金融市场模拟预测引擎 MarS是什么 MARS(Market Simulation)是微软亚洲研究院推出的金融市场模拟预测引擎,基于生成型基础模型LMM(Large Market Model)模拟金融市场中的订单流和市场动... Ai项目 5个月前2,6950
VideoCaptioner – AI视频字幕处理工具,支持字幕样式调整和多格式导出 VideoCaptioner是什么 VideoCaptioner(中文名:卡卡字幕助手)是基于大语言模型(LLM)的智能字幕处理工具,能简化视频字幕的生成与优化流程。VideoCaptioner支持语... Ai项目 5个月前02,6950
Lyria 2 – DeepMind 推出的 AI 音乐生成模型 Lyria 2是什么 Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,具备高保真音频生成能力,能输出 48kHz、24-bit 的... Ai项目 4个月前2,6900
AutoTrain – Hugging Face 开源的无代码模型训练平台 AutoTrain是什么 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署... Ai项目 5个月前2,6900
SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统 SOLAMI是什么 SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动,基于社交视觉-语言-行为模型,提供超越传统文本和语音... Ai项目 5个月前2,6900
Agentic Object Detection – 吴恩达团队推出的Agent目标检测技术 Agentic Object Detection是什么 Agentic Object Detection 是吴恩达团队开发的新型目标检测技术,通过智能代理(Agent)系统实现无需标注数据的目标检测... Ai项目 5个月前02,6900
Bolt3D – 牛津大学联合谷歌推出的 3D 场景生成技术 Bolt3D是什么 Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型,能在单个 GPU 上,仅需不到七秒的时间,直接从一张... Ai项目 5个月前02,6900
InfiMM-WebMath-40B – 字节联合中科院开源的超大规模多模态数据集 InfiMM-WebMath-40B是什么 InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Co... Ai项目 5个月前2,6850