Baichuan-M1-14B – 百川智能推出的行业首个开源医疗增强大模型 Baichuan-M1-14B是什么 Baichuan-M1-14B是百川智能推出的行业首个开源医疗增强大模型,医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。专为医疗场景... Ai项目 2周前6,4050
TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法 TokenVerse是什么 TokenVerse 是基于预训练文本到图像扩散模型的多概念个性化图像生成方法。能从单张图像中解耦复杂的视觉元素和属性,从多张图像中提取概念进行无缝组合生成。支持多种概念... Ai项目 2周前4,8750
Baichuan-M1-preview – 百川智能推出的国内首个全场景深度思考模型 Baichuan-M1-preview是什么 Baichuan-M1-preview 是百川智能推出的国内首个全场景深度思考模型。模型具备语言、视觉和搜索三大领域的推理能力,在数学、代码等多个权威评测... Ai项目 2周前4,8300
PaSa – 字节跳动推出的学术论文检索智能体 PaSa是什么 PaSa是字节跳动研究团队(ByteDance Research)推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为,自动调用搜索引擎、浏览相关论文并追踪引文网络,为用户提... Ai项目 2周前4,9000
EMO2 – 阿里研究院推出的音频驱动头像视频生成技术 EMO2是什么 EMO2 (End-Effector Guided Audio-Driven Avatar Video Generation)是阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,全... Ai项目 2周前4,6450
UI-TARS – 字节跳动推出的开源原生 GUI 代理模型 UI-TARS是什么 UI-TARS是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力,能实时理解动... Ai项目 2周前6,4500
Step-Video V2 – 阶跃星辰推出的升级版视频生成模型 Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新,采用了更高压缩比的VAE模型以及深度优化的DiT... Ai项目 2周前5,2750
EmoLLM – 专注于心理健康支持的大语言模型 EmoLLM是什么 EmoLLM 是专注于心理健康支持的大型语言模型,通过多模态情感理解为用户提供情绪辅导和心理支持。结合了文本、图像、视频等多种数据形式,基于先进的多视角视觉投影技术,从不同角度捕捉... Ai项目 2周前10,0350
VideoChat-Flash – 上海 AI Lab 等机构推出针对长视频建模的多模态大模型 VideoChat-Flash是什么 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言模型(MLLM),模型通过分层压缩技术(HiCo)高效处... Ai项目 2周前5,2150
WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具 WebWalker是什么 WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型(LLMs)在网页浏览任务中性能的工具。通过模拟网页导航任务,帮助模型更好地处理长上下文信息。We... Ai项目 2周前4,3900