Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第65页

MiniMax-01 – MiniMax开源的全新系列模型

MiniMax-01是什么 MiniMax-01是MiniMax推出的全新系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01首...

Ai项目

3周前

5,1400

SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser是什么 SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术，专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”（Mask...

Ai项目

3周前

5,1400

Step-Video-TI2V – 阶跃星辰开源的图生视频模型

Step-Video-TI2V是什么 Step-Video-TI2V 是阶跃星辰（StepFun）推出的开源图生视频（Image-to-Video）生成模型，拥有 300 亿参数，能根据文本描述和图像...

Ai项目

12个月前

05,1400

DeepSeek-GRM – DeepSeek 联合清华推出的通用奖励模型

DeepSeek-GRM是什么 DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型（Generalist Reward Modeling）。通过点式生成式奖励建模（Poi...

Ai项目

12个月前

05,1400

ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose是什么 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络，通过将输入图像切块并送入 Transformer blo...

Ai项目

3周前

5,1350

MiniMind – 开源的AI模型训练工具，2小时训练25.8M小模型

MiniMind是什么 MiniMind 是开源的超小型语言模型项目，极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计，最小版本仅需25.8M参数，体积仅为GPT-3...

Ai项目

12个月前

05,1350

Project Mariner – 谷歌推出的浏览网站智能体，能帮用户操作表格、在线购物

Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术，用 Chrome 扩展...

Ai项目

3周前

5,1300

MEMO – 音频驱动的生成肖像说话视频框架，保持身份一致性和表现力

MEMO是什么 MEMO（Memory-Guided EMOtionaware diffusion）是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架，用在生成具有身份一致...

Ai项目

3周前

5,1300

k1 视觉思考模型 – kimi推出的 k1 系列强化学习模型

k1 视觉思考模型是什么 k1 视觉思考模型是kimi推出的k1系列强化学习AI模型，原生支持端到端图像理解和思维链技术，将能力扩展到数学之外的更多基础科学领域。k1模型在图像理解、数学、物理、化学等...

Ai项目

3周前

5,1300

TheoremExplainAgent – AI教学双智能体，数理化定理自动转动画

TheoremExplainAgent是什么 TheoremExplainAgent（TEA）是滑铁卢大学、Votee AI等机构开源的多模态代理系统，基于生成长篇动画视频帮助人们更好地理解数学和科学...

Ai项目

12个月前

05,1300