Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第126页

混元图像2.0 – 腾讯推出的实时生图大模型

混元图像2.0是什么混元图像2.0（Hunyuan Image 2.0）是腾讯推出的业内首个毫秒级响应的实时生图大模型。混元图像2.0支持文本、语音、草图等多种交互方式，用户输入指令后，图像能同步生...

Ai项目

1个月前

4,2950

流畅阅读 – 开源AI浏览器翻译插件，支持双语对照显示

流畅阅读是什么流畅阅读（FluentRead）是开源的浏览器翻译插件，致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术，支持多种翻译引擎，包括传统机器翻译和AI大模型翻译，支持用户自定...

Ai项目

1年前

04,2950

Indic Parler-TTS – 开源多语言TTS模型，专注于合成印度语和英语

Indic Parler-TTS是什么 Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音（TTS）模型，专门用于印度语言和英语的语...

Ai项目

1年前

04,2950

ModelEngine – 华为开源的全流程 AI 开发工具链

ModelEngine是什么 ModelEngine 是华为开源的全流程 AI 开发工具链，围绕数据使能、模型使能和应用使能三大核心功能展开，解决 AI 行业化落地过程中数据工程耗时长、模型训练和应用...

Ai项目

1年前

04,2950

DeepSeek Artifacts – Hugging Face推出的AI编程工具，基于DeepSeek V3

DeepSeek Artifacts是什么 DeepSeek Artifacts是Hugging Face推出的免费AI编程工具，能生成React和Tailwind CSS的前端代码。工具基于Deep...

Ai项目

1个月前

4,2900

MindLLM – 耶鲁联合剑桥等机构推出的医疗领域 AI 模型

MindLLM是什么 MindLLM 是耶鲁大学、达特茅斯学院和剑桥大学联合推出的AI模型，能将脑部功能性磁共振成像（fMRI）信号解码为自然语言文本。MindLLM基于一个主体无关（subject...

Ai项目

1年前

04,2500

Phi-4-Multimodal – 微软最新推出的多模态语言模型

Phi-4-Multimodal是什么 Phi-4-Multimodal 是微软最新推出的多模态语言模型，拥有 56 亿参数，能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异...

Ai项目

1年前

04,2450

Magnitude – 开源 AI Agent 驱动的端到端测试框架

Magnitude是什么 Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例，用强大的推理代理规划和调整测试流程，基于快速的视觉代理执...

Ai项目

1年前

04,2450

MobileVD – 首个针对移动设备优化的视频扩散模型

MobileVD是什么 MobileVD（Mobile Video Diffusion）是首个针对移动设备优化的视频扩散模型，Qualcomm AI Research团队开发。模型基于Stable V...

Ai项目

1个月前

4,2250

ENEL – 上海 AI Lab 推出的无编码器3D大型多模态模型

ENEL是什么 ENEL（Exploring the Potential of Encoder-free Architectures in 3D LMMs）是创新的无编码器3D大型多模态模型（3D L...

Ai项目

1年前

04,2250