Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第117页

TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术

TaoAvatar是什么 TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术，能生成照片级逼真的3D全身虚拟形象，支持高分辨率渲染且存储需求低...

Ai项目

1年前

07,0050

Mureka O1 – 昆仑万维推出的音乐推理大模型

Mureka O1是什么 Mureka O1是昆仑万维发布的全球首款音乐推理大模型，全球首个引入“思维链”（Chain of Thought，CoT）技术的音乐模型，Mureka O1在推理过程中加入...

Ai项目

1年前

09,6650

Mureka V6 – 昆仑万维推出的AI音乐创作基座模型

Mureka V6是什么 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型，支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL（in-context learning）技术，使声...

Ai项目

1年前

09,3350

Video-T1 – 清华联合腾讯推出的视频生成技术

Video-T1是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术，基于测试时扩展（Test-Time Scaling，TTS）提升视频生成的质量和一致性。传统视频生成模型在训...

Ai项目

1年前

05,9000

Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型

Fin-R1是什么 Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构，通过在金融推理场景的高质量思维链数据上进行SFT...

Ai项目

1年前

04,6100

Oliva – 开源语音RAG助手，实时语音搜索向量数据库

Oliva是什么 Oliva 是开源的语音RAG助手，结合 Langchain 和 Superlinked 技术，基于语音驱动的 RAG（检索增强生成）架构，帮助用户在 Qdrant 向量数据库中实时...

Ai项目

1年前

04,8000

Qwen2.5-Omni – 阿里开源的端到端多模态模型

Qwen2.5-Omni是什么 Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型，拥有7B参数，Qwen2.5-Omni具备强大的多模态感知能力，能处理文本、图像、音频和视频输入...

Ai项目

1年前

06,1800

Cosmos-Reason1 – NVIDIA推出的系列多模态大语言模型

Cosmos-Reason1是什么 Cosmos-Reason1 是 NVIDIA 推出的系列多模态大型语言模型，基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型：Cosm...

Ai项目

1年前

04,5050

RF-DETR – Roboflow推出的实时目标检测模型

RF-DETR是什么 RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值（mAP）的实时模型，性能优于现有的目标检测模型。RF-DET...

Ai项目

1年前

05,1200

Bolt3D – 牛津大学联合谷歌推出的 3D 场景生成技术

Bolt3D是什么 Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术，是潜在扩散模型，能在单个 GPU 上，仅需不到七秒的时间，直接从一张...

Ai项目

1年前

05,0800