FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架 FantasyID是什么 FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Di... Ai项目 12个月前05,1850
SigStyle – 吉大联合 Adobe 等机构推出的风格迁移框架 SigStyle是什么 SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架,支持将单张风格图像中独特的视觉特征(如几何结构、色彩搭配、笔触等)无缝迁移到内容... Ai项目 12个月前06,0100
VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型 VLM-R1是什么 VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型,通过自然语言指令精确定位图像中的目标物体,如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qw... Ai项目 12个月前05,4800
FacePoke – 开源的实时面部编辑工具,拖拽操作面部表情 FacePoke是什么 FacePoke是基于AI技术的开源实时面部编辑工具。用户基于简单的鼠标拖拽操作,对人物照片中的头部朝向(如抬头、低头、左右摇头)和面部表情(如眼睛睁闭、眼球方向、眉毛和嘴巴变... Ai项目 12个月前04,7000
BFS-Prover – 字节豆包推出的自动定理证明系统 BFS-Prover是什么 BFS-Prover 是字节跳动豆包大模型团队推出的基于大语言模型(LLM)的自动定理证明系统,通过改进传统的广度优先搜索(BFS)算法,结合专家迭代、直接偏好优化等技术... Ai项目 12个月前04,0900
PySpur – 开源 AI 代理构建工具,拖拽式构建 AI 工作流 PySpur是什么 PySpur 是开源的轻量级可视化 AI 智能体工作流构建器,简化 AI 系统的开发流程。基于拖拽式界面让用户能快速构建、测试和迭代 AI 工作流,无需编写复杂代码。PySpur ... Ai项目 12个月前04,5800
Wan2.1 – 阿里开源的AI视频生成大模型 Wan2.1是什么 Wan2.1是阿里云开源的AI视频生成大模型,具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务,包含两种尺寸的模型,14B参数的专业版擅长复杂运动生成和物理建模,性能... Ai项目 12个月前08,7950
AgentRefine – 北京邮电大学联合美团推出的智能体合成框架 AgentRefine是什么 AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架,通过“精炼调整”(Refinement Tuning)提升基于大型语言模型(LLM)的智能体在多样化... Ai项目 12个月前04,0350
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库 DeepGEMM是什么 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE... Ai项目 12个月前04,9050
TinyR1-Preview – 奇虎360联合北大团队推出的推理模型 TinyR1-Preview是什么 TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,Ti... Ai项目 12个月前04,5450