Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第3页

Baichuan-M1-14B – 百川智能推出的行业首个开源医疗增强大模型

Baichuan-M1-14B是什么 Baichuan-M1-14B是百川智能推出的行业首个开源医疗增强大模型，医疗能力超越了更大参数量的Qwen2.5-72B，与o1-mini相差无几。专为医疗场景...

Ai项目

2周前

6,4050

TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法

TokenVerse是什么 TokenVerse 是基于预训练文本到图像扩散模型的多概念个性化图像生成方法。能从单张图像中解耦复杂的视觉元素和属性，从多张图像中提取概念进行无缝组合生成。支持多种概念...

Ai项目

2周前

4,8750

Baichuan-M1-preview – 百川智能推出的国内首个全场景深度思考模型

Baichuan-M1-preview是什么 Baichuan-M1-preview 是百川智能推出的国内首个全场景深度思考模型。模型具备语言、视觉和搜索三大领域的推理能力，在数学、代码等多个权威评测...

Ai项目

2周前

4,8300

PaSa – 字节跳动推出的学术论文检索智能体

PaSa是什么 PaSa是字节跳动研究团队（ByteDance Research）推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为，自动调用搜索引擎、浏览相关论文并追踪引文网络，为用户提...

Ai项目

2周前

4,9000

EMO2 – 阿里研究院推出的音频驱动头像视频生成技术

EMO2是什么 EMO2 （End-Effector Guided Audio-Driven Avatar Video Generation）是阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术，全...

Ai项目

2周前

4,6450

UI-TARS – 字节跳动推出的开源原生 GUI 代理模型

UI-TARS是什么 UI-TARS是字节跳动推出的新一代原生图形用户界面（GUI）代理模型，通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力，能实时理解动...

Ai项目

2周前

6,4500

Step-Video V2 – 阶跃星辰推出的升级版视频生成模型

Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新，采用了更高压缩比的VAE模型以及深度优化的DiT...

Ai项目

2周前

5,2750

EmoLLM – 专注于心理健康支持的大语言模型

EmoLLM是什么 EmoLLM 是专注于心理健康支持的大型语言模型，通过多模态情感理解为用户提供情绪辅导和心理支持。结合了文本、图像、视频等多种数据形式，基于先进的多视角视觉投影技术，从不同角度捕捉...

Ai项目

2周前

10,0350

VideoChat-Flash – 上海 AI Lab 等机构推出针对长视频建模的多模态大模型

VideoChat-Flash是什么 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言模型（MLLM），模型通过分层压缩技术（HiCo）高效处...

Ai项目

2周前

5,2150

WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具

WebWalker是什么 WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型（LLMs）在网页浏览任务中性能的工具。通过模拟网页导航任务，帮助模型更好地处理长上下文信息。We...

Ai项目

2周前

4,3900