混元图像2.0 – 腾讯推出的实时生图大模型 混元图像2.0是什么 混元图像2.0(Hunyuan Image 2.0)是腾讯推出的业内首个毫秒级响应的实时生图大模型。混元图像2.0支持文本、语音、草图等多种交互方式,用户输入指令后,图像能同步生... Ai项目 1个月前4,2950
流畅阅读 – 开源AI浏览器翻译插件,支持双语对照显示 流畅阅读是什么 流畅阅读(FluentRead)是开源的浏览器翻译插件,致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术,支持多种翻译引擎,包括传统机器翻译和AI大模型翻译,支持用户自定... Ai项目 1年前04,2950
Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语 Indic Parler-TTS是什么 Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音(TTS)模型,专门用于印度语言和英语的语... Ai项目 1年前04,2950
ModelEngine – 华为开源的全流程 AI 开发工具链 ModelEngine是什么 ModelEngine 是华为开源的全流程 AI 开发工具链,围绕数据使能、模型使能和应用使能三大核心功能展开,解决 AI 行业化落地过程中数据工程耗时长、模型训练和应用... Ai项目 1年前04,2950
DeepSeek Artifacts – Hugging Face推出的AI编程工具,基于DeepSeek V3 DeepSeek Artifacts是什么 DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,能生成React和Tailwind CSS的前端代码。工具基于Deep... Ai项目 1个月前4,2900
MindLLM – 耶鲁联合剑桥等机构推出的医疗领域 AI 模型 MindLLM是什么 MindLLM 是耶鲁大学、达特茅斯学院和剑桥大学联合推出的AI模型,能将脑部功能性磁共振成像(fMRI)信号解码为自然语言文本。MindLLM基于一个主体无关(subject... Ai项目 1年前04,2500
Phi-4-Multimodal – 微软最新推出的多模态语言模型 Phi-4-Multimodal是什么 Phi-4-Multimodal 是微软最新推出的多模态语言模型,拥有 56 亿参数,能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异... Ai项目 1年前04,2450
Magnitude – 开源 AI Agent 驱动的端到端测试框架 Magnitude是什么 Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例,用强大的推理代理规划和调整测试流程,基于快速的视觉代理执... Ai项目 1年前04,2450
MobileVD – 首个针对移动设备优化的视频扩散模型 MobileVD是什么 MobileVD(Mobile Video Diffusion)是首个针对移动设备优化的视频扩散模型,Qualcomm AI Research团队开发。模型基于Stable V... Ai项目 1个月前4,2250
ENEL – 上海 AI Lab 推出的无编码器3D大型多模态模型 ENEL是什么 ENEL(Exploring the Potential of Encoder-free Architectures in 3D LMMs)是创新的无编码器3D大型多模态模型(3D L... Ai项目 1年前04,2250