Agixxw

帅气的我简直无法用语言描述!

GitFriend – AI GitHub助手,自动生成定制化README文件

GitFriend是什么 GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具,能简化 GitHub 的使用流程,提升开发效率。GitFri...
1个月前
1,0400

Muyan-TTS – 开源文本转语音模型,零样本语音合成

Muyan-TTS是什么 Muyan-TTS 是为播客场景设计的开源文本转语音(TTS)模型。模型预训练超过10万小时的播客音频数据,能实现零样本语音合成,无需大量目标说话人的语音数据可生成高质量语音...
1个月前
9250

Chinese-LiPS – 智源研究院联合南大开源的中文多模态语音识别数据集

Chinese-LiPS是什么 Chinese-LiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和演讲者的幻...
1个月前
8250

ViLAMP – 蚂蚁联合人民大学推出的视觉语言模型

ViLAMP是什么 ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是蚂蚁集团和中国人民大学联合推出的视觉语言模型,专门用在高效处理长视频内容。基于混...
1个月前
5750

Seed1.5-VL – 字节跳动Seed推出的视觉语言多模态大模型

Seed1.5-VL是什么 Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型,具备强大的通用多模态理解和推理能力,推理成本显著降低。模型由一个 532M 参数的视觉编码...
1个月前
7350

Co-Sight – 中兴通讯开源的超级智能体项目

Co-Sight是什么 Co-Sight是中兴通讯开源的超级智能体项目,为协同视觉分析平台及智能自动化底座。采用多智能体架构,构建“数字团队”协同体系,通过DAG任务引擎驱动,实现任务的高效调度与执行...
1个月前
1,0000

MCPHub – 一站式MCP服务器聚合平台

MCPHub 是什么 MCPHub是一站式MCP(模型上下文协议)服务器聚合平台。支持将多个MCP服务器整合到不同的流式HTTP(SSE)端点,基于直观的Web界面和强大的协议处理能力,简化AI工具的...
1个月前
7200

HealthBench – OpenAI推出的开源医疗测试基准

HealthBench是什么 HealthBench是OpenAI推出的开源医疗测试基准,用在评估大型语言模型(LLMs)在医疗保健领域的表现和安全性。HealthBench包含5000个模型与用户或...
1个月前
6950

Seedance 1.0 lite – 火山引擎推出的视频生成模型

Seedance 1.0 lite是什么 Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p...
1个月前
6450

Nexus-Gen – 魔搭联合华东师范等机构开源的全模态图像生成模型

Nexus-Gen是什么 Nexus-Gen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。Nexus-Gen融合强大的语言模型与扩散模型的能力,基于...
1个月前
1,0750