Aya Vision – Cohere 推出多模态、多语言的视觉模型 Aya Vision是什么 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文本翻译和... Ai项目 12个月前04,6050
BGE-VL – 智源研究院联合多所高校开源的多模态向量模型 BGE-VL是什么 BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型,基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务,如图文检索和组合图像检索,基于高... Ai项目 12个月前04,8050
混元图生视频 – 腾讯混元开源的图生视频模型 混元图生视频是什么 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实... Ai项目 12个月前06,7400
Granite 3.2 – IBM 开源的多模态系列 AI 模型 Granite 3.2是什么 Granite 3.2 是IBM开源的多模态AI模型系列,具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本, Granite 3.2 Instruc... Ai项目 12个月前05,6550
Resume Matcher – 开源AI简历优化工具,解析简历和职位描述提供改进建议 Resume Matcher是什么 Resume Matcher 是开源的 AI 简历优化工具,帮助求职者提升简历通过自动化筛选系统(ATS)的概率。Resume Matcher基于解析简历和职位描述... Ai项目 12个月前07,3950
OpenManus – MetaGPT 团队推出的 Manus 开源复刻版 OpenManus是什么 OpenManus 是MetaGPT 团队推出的开源复刻版 Manus,提供无需邀请码的 AI Agent 。OpenManus基于模块化设计,支持多种语言模型和工具链,能执... Ai项目 12个月前04,8400
NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互 NEXUS-O是什么 NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与交互。N... Ai项目 12个月前04,1750
OWL – 开源多智能体协作系统,动态交互实现任务自动化 OWL是什么 OWL(Optimized Workforce Learning)是基于CAMEL-AI框架开发的多智能体协作系统,通过智能体之间的动态交互实现高效的任务自动化。通过角色分配和任务分解... Ai项目 12个月前05,7750
TicVoice 7.0 – 出门问问推出的第七代语音合成引擎 TicVoice 7.0是什么 TicVoice 7.0 是出门问问推出的第七代高品质 TTS(语音合成)引擎,基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiC... Ai项目 12个月前03,9350
GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型 GEN3C是什么 GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存指导视频生... Ai项目 12个月前05,6350