MiniMax-01 – MiniMax开源的全新系列模型 MiniMax-01是什么 MiniMax-01是MiniMax推出的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01首... Ai项目 3周前5,1400
SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术 SmartEraser是什么 SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术,专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”(Mask... Ai项目 3周前5,1400
Step-Video-TI2V – 阶跃星辰开源的图生视频模型 Step-Video-TI2V是什么 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有 300 亿参数,能根据文本描述和图像... Ai项目 12个月前05,1400
DeepSeek-GRM – DeepSeek 联合清华推出的通用奖励模型 DeepSeek-GRM是什么 DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。通过点式生成式奖励建模(Poi... Ai项目 12个月前05,1400
ViTPose – 基于 Transformer 架构的人体姿态估计模型 ViTPose是什么 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通过将输入图像切块并送入 Transformer blo... Ai项目 3周前5,1350
MiniMind – 开源的AI模型训练工具,2小时训练25.8M小模型 MiniMind是什么 MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GPT-3... Ai项目 12个月前05,1350
Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物 Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展... Ai项目 3周前5,1300
MEMO – 音频驱动的生成肖像说话视频框架,保持身份一致性和表现力 MEMO是什么 MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致... Ai项目 3周前5,1300
k1 视觉思考模型 – kimi推出的 k1 系列强化学习模型 k1 视觉思考模型是什么 k1 视觉思考模型是kimi推出的k1系列强化学习AI模型,原生支持端到端图像理解和思维链技术,将能力扩展到数学之外的更多基础科学领域。k1模型在图像理解、数学、物理、化学等... Ai项目 3周前5,1300
TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画 TheoremExplainAgent是什么 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和科学... Ai项目 12个月前05,1300