Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第14页

OctoTools – 斯坦福推出解决复杂推理任务的开源智能体框架

OctoTools是什么 OctoTools 是斯坦福大学推出的开源智能体框架，基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片（tool cards）封装工具功能，无需额外训...

Ai项目

12个月前

06,5350

Veo 2 – 谷歌 DeepMind 推出的 AI 视频生成模型，支持高达 4K 分辨率

Veo 2是什么 Veo 2 是 Google DeepMind 推出的 AI 视频生成模型，能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作，理解镜头控制指令，能模...

Ai项目

2周前

6,5250

Make-It-Animatable – 中科大联合腾讯推出的自动生成即时动画准备资产

Make-It-Animatable是什么 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架，能在不到一秒钟内让任何3D人形模型准备好进行角色动画状态...

Ai项目

2周前

6,5000

Sa2VA – 字节跳动等机构开源的多模态大语言模型

Sa2VA是什么 Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是SAM2和LLaVA结合而成，能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任...

Ai项目

12个月前

06,5000

PhotoDoodle – 字节联合新加坡国立大学等推出的艺术化图像编辑框架

PhotoDoodle是什么 PhotoDoodle是新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合推出的艺术化图像编辑框架，基于少量样本学习艺术家的独特风格，实现照片涂鸦...

Ai项目

12个月前

06,5000

Psi R0 – 灵初智能推出的端到端具身模型

Psi R0是什么 Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作，能够将多个技能串联混训，生成具有推理能力的智能体，完成并闭环长程灵巧操作任务。Psi R...

Ai项目

2周前

6,4950

Firefly Image Model 4 – Adobe 推出的图像生成模型

Firefly Image Model 4是什么 Firefly Image Model 4 是 Adobe 最新推出的图像生成模型，是目前最快、最具控制性和最逼真的 Firefly 图像模型，支持生...

Ai项目

2周前

6,4900

LAM – 微软推出的大型行动模型，能自主操作Windows程序

LAM是什么 LAM是微软推出的名为“Large Action Model”（简称 LAM）的新人工智能模型。与传统语言模型不同，LAM能够自主操作Windows程序，实现真实任务执行。能理解文本...

Ai项目

2周前

6,4900

混元图生视频 – 腾讯混元开源的图生视频模型

混元图生视频是什么混元图生视频是腾讯混元推出的开源图生视频模型，用户可以通过上传一张图片进行简短描述，让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实...

Ai项目

12个月前

06,4800

WorldCraft – 港科大推出的3D虚拟世界创建和定制系统

WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型（LLM）代理的3D世界创建和定制系统，用在创建和定制逼真的3D虚拟世界。基于自然语言交互，让用户能轻松生成复杂的室...

Ai项目

12个月前

06,4750