智能信息网
  • 全网热搜榜
  • AI文章资讯
    • AI教程
    • AI知识
    • Ai项目
  • 排行榜
  • 投稿
  • 关于我们
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      Ai项目

      共 1320 篇文章
      排序
      发布更新浏览点赞
      Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型

      Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型

      Gemini 2.0是什么 Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1...
      Ai项目
      2周前
      7,6850
      书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列

      书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列

      书生·万象InternVL 2.5是什么 书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的...
      Ai项目
      2周前
      4,9900
      ChatTTSPlus – 开源文本转语音工具,ChatTTS扩展版支持语音克隆

      ChatTTSPlus – 开源文本转语音工具,ChatTTS扩展版支持语音克隆

      ChatTTSPlus是什么 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音合成的性能和灵活性。在Windows平台上,实现了超过...
      Ai项目
      2周前
      7,7500
      MMAudio – 基于多模态联合训练实现高质量 AI 音频合成项目

      MMAudio – 基于多模态联合训练实现高质量 AI 音频合成项目

      MMAudio是什么 MMAudio是先进视频到音频合成技术,基于多模态联合训练,让模型能在广泛的视听和音频文本数据集上进行训练。技术的核心是同步模块,确保生成的音频与视频帧精确匹配,实现高度同步。M...
      Ai项目
      2周前
      4,7050
      Ultravox – 端到端多模态大模型,直接理解文本和人类语音

      Ultravox – 端到端多模态大模型,直接理解文本和人类语音

      Ultravox是什么 Ultravox是新型的多模态大型语言模型(LLM),能直接理解文本和人类语音,无需依赖单独的自动语音识别(ASR)阶段。基于多模态投影器技术将音频数据转换为高维空间表示,与L...
      Ai项目
      2周前
      4,9100
      Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物

      Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物

      Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展...
      Ai项目
      2周前
      5,2250
      TEN Agent – 开源的实时多模态 AI 代理框架

      TEN Agent – 开源的实时多模态 AI 代理框架

      TEN Agent是什么 TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agent能实现语音、文本、图像的多模态交互,具备天气查询、网...
      Ai项目
      2周前
      5,6700
      FLOAT – 基于流匹配的音频驱动说话人头像生成模型

      FLOAT – 基于流匹配的音频驱动说话人头像生成模型

      FLOAT是什么 FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动设计。模型基于Transfor...
      Ai项目
      2周前
      4,9450
      SynCamMaster – 快手联合浙大、清华等机构推出的多视角视频生成模型

      SynCamMaster – 快手联合浙大、清华等机构推出的多视角视频生成模型

      SynCamMaster是什么 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型,能结合6自由度相机姿势,从任意视点生成开放世界视...
      Ai项目
      2周前
      4,7450
      STIV – 苹果公司推出的视频生成大模型

      STIV – 苹果公司推出的视频生成大模型

      STIV是什么 STIV(Scalable Text and Image Conditioned Video Generation)是苹果公司推出的视频生成大模型。STIV拥有8.7亿参数,能处理文本...
      Ai项目
      2周前
      5,1550
      加载更多
      智能信息网
      智能信息网 | AI导航官网:www.agixxw.com —— 热门AI工具导航。持续收录ChatGPT、Deepseek、Auto-GPT、免费AI工具、AIGC产品、AGI应用等智能信息资源。及时追踪热点资讯与产品情报,助力用户精准搜索与降本增效。Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

      友链申请 免责声明 广告合作 关于我们 网站地图

      • AI图像工具
        • AI图像处理
        • AI会议工具
        • Ai办公应用
      • AI学习平台
        • AI学习网站
        • AI法律助手
        • AI电商运营
      • AiPPT神器
        • AI写作工具
        • Ai办公应用
        • AI文档协作
      • AI对话工具
        • AI思维导图
        • AI文生视频
        • AI生成视频
      扫码进QQ群智能信息网
      扫码进QQ群


        
      网址
      网址文章软件书籍