Seed1.5-Embedding – 字节跳动 Seed 团队推出的向量模型 Seed1.5-Embedding是什么 Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型,基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。模型在权... Ai项目 2周前6,1600
FastVLM – 苹果推出的高效视觉语言模型 FastVLM是什么 FastVLM是苹果推出的高效的视觉语言模型(VLM),能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器,有效减少视觉token数量,显著降低编码... Ai项目 2周前4,4700
Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型 Audio-SDS是什么 Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域... Ai项目 2周前5,1250
PrimitiveAnything – 腾讯联合清华大学推出的新型3D形状生成框架 PrimitiveAnything是什么 PrimitiveAnything是腾讯人工智能平台部(AIPD)和清华大学联合开发的新型3D形状生成框架。将复杂的3D形状分解为简单的基元元素,通过自回归方... Ai项目 2周前6,0000
OptoChat AI – 南智光电联合南大推出的光子芯片领域专用大模型 OptoChat AI是什么 OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链,集成超过30万条光子芯片相关专利、文献和行业数据资源,具备强大的数据... Ai项目 2周前3,9050
Xianyu AutoAgent – AI闲鱼客服机器人,支持多专家协同决策 Xianyu AutoAgent是什么 Xianyu AutoAgent 是为闲鱼平台设计的智能客服机器人系统。支持实现7×24小时自动化值守,多专家协同决策、智能议价及上下文感知对话。基于上下文感知... Ai项目 2周前4,8000
Matrix-Game – 昆仑万维开源的工业界首个空间智能大模型 Matrix-Game是什么 Matrix-Game是昆仑万维开源的工业界首个10B+空间智能大模型,是Matrix-Zero世界模型中的可交互视频生成大模型。模型基于两阶段训练策略,根据用户输入生成... Ai项目 2周前4,7650
GitFriend – AI GitHub助手,自动生成定制化README文件 GitFriend是什么 GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具,能简化 GitHub 的使用流程,提升开发效率。GitFri... Ai项目 2周前6,0900
Muyan-TTS – 开源文本转语音模型,零样本语音合成 Muyan-TTS是什么 Muyan-TTS 是为播客场景设计的开源文本转语音(TTS)模型。模型预训练超过10万小时的播客音频数据,能实现零样本语音合成,无需大量目标说话人的语音数据可生成高质量语音... Ai项目 2周前4,4750
Chinese-LiPS – 智源研究院联合南大开源的中文多模态语音识别数据集 Chinese-LiPS是什么 Chinese-LiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和演讲者的幻... Ai项目 2周前4,2550