Hali – 特斯联Buttons推出的多模态多智能体协作Agent Hali是什么 Hali是特斯联联合国际轻奢品牌Buttons推出的多模态多智能体协作AI Agent。Hali具备类人思考、长记忆、物理世界感知和多智能体协作四大特点,语义理解准确率超97%,中英文... Ai项目 2周前5,4900
PaliGemma 2 – 谷歌DeepMind推出的全新视觉语言模型 PaliGemma 2是什么 PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型(VLM),作为PaliGemma模型的升级版。结合SigLI... Ai项目 2周前5,4850
NPOA – 开源舆情检测工具,实时监控网络舆情与分析 NPOA是什么 NPOA 是开源的功能强大的舆情监测工具,可以帮助用户实时监控网络舆情,了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理技术,可以分析大量的网络数据,提供可视化的舆情分析报告... Ai项目 12个月前05,4800
VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型 VLM-R1是什么 VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型,通过自然语言指令精确定位图像中的目标物体,如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qw... Ai项目 12个月前05,4800
OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架 OmniCam是什么 OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图像作为参考,精确控制摄像机的运动轨迹... Ai项目 12个月前05,4800
Nova Sonic – 亚马逊推出的新型生成式 AI 语音模型 Nova Sonic是什么 Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整生成的语音响应,对话更自然。N... Ai项目 12个月前05,4800
SVDQuant – MIT 推出的扩散模型后训练量化技术 SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中... Ai项目 2周前5,4650
o1-pro – OpenAI 推出的升级版推理模型 o1-pro是什么 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势在于显著提升的计算能力,能更好地应对复杂问题,提供更一... Ai项目 12个月前05,4650
LBM – AI图像转换框架,实现可控阴影生成 LBM是什么 LBM(Latent Bridge Matching)是Jasper Research团队推出的新型图像到图像转换框架,基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推... Ai项目 2周前5,4600
LangGraph WhatsApp Agent – 用于构建与 WhatsApp 用户互动的 AI Agent LangGraph WhatsApp Agent是什么 LangGraph WhatsApp Agent 是基于 LangGraph 和 Twilio 构建的开源项目,用在开发与 WhatsApp 用... Ai项目 2周前5,4600