子曰-o1 – 网易有道推出国内首个输出分步式讲解的推理模型 子曰-o1是什么 子曰-o1是网易有道发布的国内首个输出分步式讲解的推理模型。模型采用14B轻量级架构,专为消费级显卡设计,能在低显存设备上稳定运行。通过思维链技术,模拟人类的思考方式,以“自言自语... Ai项目 5个月前2,2200
豆包大模型1.5 – 字节跳动推出的最新版大模型 豆包大模型1.5是什么 豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得分在知识、代码、推理、中文等多个测评基准上优于GPT... Ai项目 5个月前2,5950
OmniManip – 智元机器人联合北大推出的通用机器人操作框架 OmniManip是什么 OmniManip 是北京大学与智元机器人联合实验室开发的通用机器人操作框架,通过结合视觉语言模型(VLM)的高层次推理能力和精确的三维操作能力,实现机器人在非结构化环境中的... Ai项目 5个月前2,2250
WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具 WebWalker是什么 WebWalker是阿里巴巴自然语言处理团队开发的用于评估和提升大型语言模型(LLMs)在网页浏览任务中性能的工具。通过模拟网页导航任务,帮助模型更好地处理长上下文信息。We... Ai项目 5个月前1,9800
VideoChat-Flash – 上海 AI Lab 等机构推出针对长视频建模的多模态大模型 VideoChat-Flash是什么 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言模型(MLLM),模型通过分层压缩技术(HiCo)高效处... Ai项目 5个月前2,9150
EmoLLM – 专注于心理健康支持的大语言模型 EmoLLM是什么 EmoLLM 是专注于心理健康支持的大型语言模型,通过多模态情感理解为用户提供情绪辅导和心理支持。结合了文本、图像、视频等多种数据形式,基于先进的多视角视觉投影技术,从不同角度捕捉... Ai项目 5个月前4,2350
Step-Video V2 – 阶跃星辰推出的升级版视频生成模型 Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新,采用了更高压缩比的VAE模型以及深度优化的DiT... Ai项目 5个月前2,4050
UI-TARS – 字节跳动推出的开源原生 GUI 代理模型 UI-TARS是什么 UI-TARS是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力,能实时理解动... Ai项目 5个月前2,2200
EMO2 – 阿里研究院推出的音频驱动头像视频生成技术 EMO2是什么 EMO2 (End-Effector Guided Audio-Driven Avatar Video Generation)是阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,全... Ai项目 5个月前2,4350
PaSa – 字节跳动推出的学术论文检索智能体 PaSa是什么 PaSa是字节跳动研究团队(ByteDance Research)推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为,自动调用搜索引擎、浏览相关论文并追踪引文网络,为用户提... Ai项目 5个月前2,4600