LEOPARD – 腾讯AI Lab西雅图实验室推出的视觉语言模型 LEOPARD是什么 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD基于两个主要技术创新:一是策划约一百万条专门针对文本丰富... Ai项目 5个月前3,3500
LAM – 微软推出的大型行动模型,能自主操作Windows程序 LAM是什么 LAM是微软推出的名为“Large Action Model”(简称 LAM)的新人工智能模型。与传统语言模型不同,LAM能够自主操作Windows程序,实现真实任务执行。 能理解文本... Ai项目 5个月前3,3500
Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型 Gemini 2.0是什么 Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1... Ai项目 5个月前3,3450
Psi R0 – 灵初智能推出的端到端具身模型 Psi R0是什么 Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环长程灵巧操作任务。Psi R... Ai项目 5个月前3,3450
Delta-CoMe – 清华联合 OpenBMB 等高校开源的新型增量压缩算法 Delta-CoMe是什么 Delta-CoMe是清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法,一个80G的A100 GPU能轻松加载多达50个7B模型... Ai项目 5个月前3,3250
FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准 FullStack Bench是什么 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈编程和多语言编程能力评估。FullStack Benc... Ai项目 5个月前3,3100
Imagen 4 – 谷歌推出的最新图像生成AI模型 Imagen 4是什么 Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面,Imagen 4... Ai项目 4个月前3,3050
KHOJ – 开源 AI 个人化助手,一站式知识管理工具 KHOJ是什么 KHOJ是开源的个人化AI助手,帮助用户整合和检索知识。支持连接用户的在线和本地文档,如PDF、Markdown、纯文本、GitHub和Notion文件等,通过语义搜索功能,快速找到所... Ai项目 5个月前3,3000
Proxy Lite – 开源视觉语言模型,支持自动化网页任务 Proxy Lite是什么 Proxy Lite 是开源的轻量级视觉语言模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器,完成网页交互、数据抓取、表单填写... Ai项目 5个月前03,3000
Deep Research Web UI – 开源 AI 研究助手,逐步深入挖掘研究主题 Deep Research Web UI是什么 Deep Research Web UI 是开源的 AI 研究助手工具,帮助用户高效地进行深度研究。通过 AI 驱动的迭代搜索,逐步深入挖掘指定主题,以... Ai项目 5个月前03,3000