Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第43页

Hali – 特斯联Buttons推出的多模态多智能体协作Agent

Hali是什么 Hali是特斯联联合国际轻奢品牌Buttons推出的多模态多智能体协作AI Agent。Hali具备类人思考、长记忆、物理世界感知和多智能体协作四大特点，语义理解准确率超97%，中英文...

Ai项目

2周前

5,4900

PaliGemma 2 – 谷歌DeepMind推出的全新视觉语言模型

PaliGemma 2是什么 PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型（VLM），作为PaliGemma模型的升级版。结合SigLI...

Ai项目

2周前

5,4850

NPOA – 开源舆情检测工具，实时监控网络舆情与分析

NPOA是什么 NPOA 是开源的功能强大的舆情监测工具，可以帮助用户实时监控网络舆情，了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理技术，可以分析大量的网络数据，提供可视化的舆情分析报告...

Ai项目

12个月前

05,4800

VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1是什么 VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像中的目标物体，如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qw...

Ai项目

12个月前

05,4800

OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架

OmniCam是什么 OmniCam 是先进的多模态视频生成框架，通过摄像机控制实现高质量的视频生成。支持多种输入模态组合，用户可以提供文本描述、视频中的轨迹或图像作为参考，精确控制摄像机的运动轨迹...

Ai项目

12个月前

05,4800

Nova Sonic – 亚马逊推出的新型生成式 AI 语音模型

Nova Sonic是什么 Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中，能根据说话者的语调、风格等声学上下文调整生成的语音响应，对话更自然。N...

Ai项目

12个月前

05,4800

SVDQuant – MIT 推出的扩散模型后训练量化技术

SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术，针对扩散模型，将模型的权重和激活值量化至4位，减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中...

Ai项目

2周前

5,4650

o1-pro – OpenAI 推出的升级版推理模型

o1-pro是什么 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本，o1-pro 是目前 OpenAI 最强大的推理模型，核心优势在于显著提升的计算能力，能更好地应对复杂问题，提供更一...

Ai项目

12个月前

05,4650

LBM – AI图像转换框架，实现可控阴影生成

LBM是什么 LBM（Latent Bridge Matching）是Jasper Research团队推出的新型图像到图像转换框架，基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推...

Ai项目

2周前

5,4600

LangGraph WhatsApp Agent – 用于构建与 WhatsApp 用户互动的 AI Agent

LangGraph WhatsApp Agent是什么 LangGraph WhatsApp Agent 是基于 LangGraph 和 Twilio 构建的开源项目，用在开发与 WhatsApp 用...

Ai项目

2周前

5,4600