TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术 TaoAvatar是什么 TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,支持高分辨率渲染且存储需求低... Ai项目 1年前07,0050
Mureka O1 – 昆仑万维推出的音乐推理大模型 Mureka O1是什么 Mureka O1是昆仑万维发布的全球首款音乐推理大模型,全球首个引入“思维链”(Chain of Thought,CoT)技术的音乐模型,Mureka O1在推理过程中加入... Ai项目 1年前09,6650
Mureka V6 – 昆仑万维推出的AI音乐创作基座模型 Mureka V6是什么 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context learning)技术,使声... Ai项目 1年前09,3350
Video-T1 – 清华联合腾讯推出的视频生成技术 Video-T1是什么 Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在训... Ai项目 1年前05,9000
Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型 Fin-R1是什么 Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构,通过在金融推理场景的高质量思维链数据上进行SFT... Ai项目 1年前04,6100
Oliva – 开源语音RAG助手,实时语音搜索向量数据库 Oliva是什么 Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强生成)架构,帮助用户在 Qdrant 向量数据库中实时... Ai项目 1年前04,8000
Qwen2.5-Omni – 阿里开源的端到端多模态模型 Qwen2.5-Omni是什么 Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入... Ai项目 1年前06,1800
Cosmos-Reason1 – NVIDIA推出的系列多模态大语言模型 Cosmos-Reason1是什么 Cosmos-Reason1 是 NVIDIA 推出的系列多模态大型语言模型,基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型:Cosm... Ai项目 1年前04,5050
RF-DETR – Roboflow推出的实时目标检测模型 RF-DETR是什么 RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值(mAP)的实时模型,性能优于现有的目标检测模型。RF-DET... Ai项目 1年前05,1200
Bolt3D – 牛津大学联合谷歌推出的 3D 场景生成技术 Bolt3D是什么 Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型,能在单个 GPU 上,仅需不到七秒的时间,直接从一张... Ai项目 1年前05,0800