OctoTools – 斯坦福推出解决复杂推理任务的开源智能体框架 OctoTools是什么 OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片(tool cards)封装工具功能,无需额外训... Ai项目 12个月前06,5350
Veo 2 – 谷歌 DeepMind 推出的 AI 视频生成模型,支持高达 4K 分辨率 Veo 2是什么 Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作,理解镜头控制指令,能模... Ai项目 2周前6,5250
Make-It-Animatable – 中科大联合腾讯推出的自动生成即时动画准备资产 Make-It-Animatable是什么 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架,能在不到一秒钟内让任何3D人形模型准备好进行角色动画状态... Ai项目 2周前6,5000
Sa2VA – 字节跳动等机构开源的多模态大语言模型 Sa2VA是什么 Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任... Ai项目 12个月前06,5000
PhotoDoodle – 字节联合新加坡国立大学等推出的艺术化图像编辑框架 PhotoDoodle是什么 PhotoDoodle是新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合推出的艺术化图像编辑框架,基于少量样本学习艺术家的独特风格,实现照片涂鸦... Ai项目 12个月前06,5000
Psi R0 – 灵初智能推出的端到端具身模型 Psi R0是什么 Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环长程灵巧操作任务。Psi R... Ai项目 2周前6,4950
Firefly Image Model 4 – Adobe 推出的图像生成模型 Firefly Image Model 4是什么 Firefly Image Model 4 是 Adobe 最新推出的图像生成模型,是目前最快、最具控制性和最逼真的 Firefly 图像模型,支持生... Ai项目 2周前6,4900
LAM – 微软推出的大型行动模型,能自主操作Windows程序 LAM是什么 LAM是微软推出的名为“Large Action Model”(简称 LAM)的新人工智能模型。与传统语言模型不同,LAM能够自主操作Windows程序,实现真实任务执行。 能理解文本... Ai项目 2周前6,4900
混元图生视频 – 腾讯混元开源的图生视频模型 混元图生视频是什么 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实... Ai项目 12个月前06,4800
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统 WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室... Ai项目 12个月前06,4750