Claude 3.7 Sonnet – Anthropic 推出的首款混合推理模型 Claude 3.7 Sonnet是什么 Claude 3.7 Sonnet 是 Anthropic 公司推出的全球首款混合推理模型,具备“标准模式”和“扩展思考模式”两种运行方式。标准模式下,Cla... Ai项目 12个月前08,5850
DeepEP – DeepSeek 开源的专家并行通信库,专为 MoE 训练和推理设计 DeepEP是什么 DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 GPU 内核,支持节点内和节点... Ai项目 12个月前04,9550
QwQ-Max – 阿里推出的深度推理模型,基于 Qwen2.5-Max QwQ-Max是什么 QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型,是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出,QwQ-Max专注于深度推理、数... Ai项目 12个月前05,6250
FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架 FantasyID是什么 FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Di... Ai项目 12个月前05,1850
SigStyle – 吉大联合 Adobe 等机构推出的风格迁移框架 SigStyle是什么 SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架,支持将单张风格图像中独特的视觉特征(如几何结构、色彩搭配、笔触等)无缝迁移到内容... Ai项目 12个月前06,0100
VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型 VLM-R1是什么 VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型,通过自然语言指令精确定位图像中的目标物体,如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qw... Ai项目 12个月前05,4800
FacePoke – 开源的实时面部编辑工具,拖拽操作面部表情 FacePoke是什么 FacePoke是基于AI技术的开源实时面部编辑工具。用户基于简单的鼠标拖拽操作,对人物照片中的头部朝向(如抬头、低头、左右摇头)和面部表情(如眼睛睁闭、眼球方向、眉毛和嘴巴变... Ai项目 12个月前04,7000
BFS-Prover – 字节豆包推出的自动定理证明系统 BFS-Prover是什么 BFS-Prover 是字节跳动豆包大模型团队推出的基于大语言模型(LLM)的自动定理证明系统,通过改进传统的广度优先搜索(BFS)算法,结合专家迭代、直接偏好优化等技术... Ai项目 12个月前04,1300
PySpur – 开源 AI 代理构建工具,拖拽式构建 AI 工作流 PySpur是什么 PySpur 是开源的轻量级可视化 AI 智能体工作流构建器,简化 AI 系统的开发流程。基于拖拽式界面让用户能快速构建、测试和迭代 AI 工作流,无需编写复杂代码。PySpur ... Ai项目 12个月前04,5800
Wan2.1 – 阿里开源的AI视频生成大模型 Wan2.1是什么 Wan2.1是阿里云开源的AI视频生成大模型,具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务,包含两种尺寸的模型,14B参数的专业版擅长复杂运动生成和物理建模,性能... Ai项目 12个月前08,7950