Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第96页

FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架

FantasyID是什么 FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成（IPT2V）框架，基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器（Di...

Ai项目

12个月前

05,1850

SigStyle – 吉大联合 Adobe 等机构推出的风格迁移框架

SigStyle是什么 SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架，支持将单张风格图像中独特的视觉特征（如几何结构、色彩搭配、笔触等）无缝迁移到内容...

Ai项目

12个月前

06,0100

VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1是什么 VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像中的目标物体，如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qw...

Ai项目

12个月前

05,4800

FacePoke – 开源的实时面部编辑工具，拖拽操作面部表情

FacePoke是什么 FacePoke是基于AI技术的开源实时面部编辑工具。用户基于简单的鼠标拖拽操作，对人物照片中的头部朝向（如抬头、低头、左右摇头）和面部表情（如眼睛睁闭、眼球方向、眉毛和嘴巴变...

Ai项目

12个月前

04,7000

BFS-Prover – 字节豆包推出的自动定理证明系统

BFS-Prover是什么 BFS-Prover 是字节跳动豆包大模型团队推出的基于大语言模型（LLM）的自动定理证明系统，通过改进传统的广度优先搜索（BFS）算法，结合专家迭代、直接偏好优化等技术...

Ai项目

12个月前

04,0900

PySpur – 开源 AI 代理构建工具，拖拽式构建 AI 工作流

PySpur是什么 PySpur 是开源的轻量级可视化 AI 智能体工作流构建器，简化 AI 系统的开发流程。基于拖拽式界面让用户能快速构建、测试和迭代 AI 工作流，无需编写复杂代码。PySpur ...

Ai项目

12个月前

04,5800

Wan2.1 – 阿里开源的AI视频生成大模型

Wan2.1是什么 Wan2.1是阿里云开源的AI视频生成大模型，具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务，包含两种尺寸的模型，14B参数的专业版擅长复杂运动生成和物理建模，性能...

Ai项目

12个月前

08,7950

AgentRefine – 北京邮电大学联合美团推出的智能体合成框架

AgentRefine是什么 AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架，通过“精炼调整”（Refinement Tuning）提升基于大型语言模型（LLM）的智能体在多样化...

Ai项目

12个月前

04,0350

DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM是什么 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法（GEMM）设计的库，目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家（MoE...

Ai项目

12个月前

04,9050

TinyR1-Preview – 奇虎360联合北大团队推出的推理模型

TinyR1-Preview是什么 TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量，逼近Deepseek-R1-671B的性能，Ti...

Ai项目

12个月前

04,5450