LIMO – 上海交大推出的高效推理方法,仅需817条训练样本 LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能力。核心假设是在... Ai项目 12个月前4,9350
Step-Audio – 阶跃星辰开源的语音交互模型 Step-Audio是什么 Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Ste... Ai项目 12个月前04,9350
PP-DocBee – 百度飞桨推出的文档图像理解多模态大模型 PP-DocBee是什么 PP-DocBee是百度飞桨(PaddlePaddle)团队推出的专注于文档图像理解的多模态大模型。基于ViT+MLP+LLM架构,具备强大的中文文档解析能力,能高效处理文字... Ai项目 12个月前04,9350
Seed-Coder – 字节跳动开源的代码模型系列 Seed-Coder是什么 Seed-Coder是字节跳动开源的8B规模代码模型系列,提升代码生成与理解能力。包含Base、Instruct和Reasoning三个版本,分别适用于代码补全、指令遵循和... Ai项目 3周前4,9300
Kandinsky-3 – 开源的文本到图像生成框架,适应多种图像生成任务 Kandinsky-3是什么 Kandinsky-3是基于潜在扩散模型的文本到图像(T2I)生成框架,支持高质量和逼真度在图像合成。Kandinsky-3能适应多种图像生成任务,包括文本引导的修复/扩... Ai项目 3周前4,9300
RLCM – 康奈尔大学推出的优化文本到图像一致性模型的框架 RLCM是什么 RLCM(Reinforcement Learning for Consistency Model)是康奈尔大学推出用在优化文本到图像生成模型的框架,基于强化学习方法微调一致性模型适应... Ai项目 3周前4,9300
JoyCaption – 开源的图像提示词生成工具 JoyCaption是什么 JoyCaption 是开源的图像提示词生成工具,用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种族、性别和取向,最小化过滤理解世界的各个方面,但不支持... Ai项目 3周前4,9300
LaWGPT – 南京大学推出的中文法律大语言模型 LaWGPT是什么 LaWGPT 是南京大学推出的中文法律大语言模型,基于 LLaMA 模型进行二次预训练,融入大量中文法律知识。专注于法律领域,能理解和生成与法律相关的文本,适用于法律咨询、案例分析... Ai项目 12个月前04,9300
Gemini 2.5 Flash – 谷歌推出的最新 AI 推理模型 Gemini 2.5 Flash是什么 Gemini 2.5 Flash 是 Google 推出的高效、低延迟的最新 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash... Ai项目 12个月前04,9300
FineWeb 2 – Hugging Face推出的多语言预训练数据集 FineWeb 2是什么 FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII... Ai项目 3周前4,9250