Gemma 3 – 谷歌最新推出的开源多模态 AI 模型

Gemma 3是什么 Gemma 3 是谷歌最新推出的开源人工智能模型,专为开发者设计,支持多种设备上的人工智能应用开发。支持超过 35 种语言,具备分析文本、图像及短视频的能力,提供四种不同尺寸的模...
7个月前
04,8800

EmoLLM – 专注于心理健康支持的大语言模型

EmoLLM是什么 EmoLLM 是专注于心理健康支持的大型语言模型,通过多模态情感理解为用户提供情绪辅导和心理支持。结合了文本、图像、视频等多种数据形式,基于先进的多视角视觉投影技术,从不同角度捕捉...
7个月前
4,7950

RoboBrain – 智源研究院开源的具身大脑模型

RoboBrain是什么 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T...
7个月前
04,7900

混元图生视频 – 腾讯混元开源的图生视频模型

混元图生视频是什么 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实...
7个月前
04,7100