GPDiT – 清华北大联合阶跃星辰等推出的视频生成模型 GPDiT是什么 GPDiT(Generative Pre-trained Autoregressive Diffusion Transformer)是北京大学、清华大学、StepFun公司及中国科学... Ai项目 2周前5,1600
Skywork-VL Reward – Skywork AI开源的多模态奖励模型 Skywork-VL Reward是什么 Skywork-VL Reward是Skywork AI开源的多模态奖励模型,能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5-VL-7B... Ai项目 2周前4,6400
ChatUI – 阿里推出的开源智能对话式 UI 组件库 ChatUI是什么 ChatUI 是阿里团队推出的开源智能对话式 UI 组件库,能帮助开发者快速构建高质量的聊天应用,提供响应式设计、国际化、主题定制等功能。ChatUI 基于阿里巴巴 Alime C... Ai项目 2周前4,3550
FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架 FaceShot是什么 FaceShot是同济大学、上海 AI Lab和南京理工大学推出的新型无需训练的肖像动画生成框架。用外观引导的地标匹配模块和基于坐标的地标重定位模块,为各种角色生成精确且鲁棒的... Ai项目 2周前4,9750
MT-Color – 上海交大联合哔哩哔哩推出的可控图像着色框架 MT-Color是什么 MT-Color是上海交通大学联合哔哩哔哩推出的基于扩散模型的可控图像着色框架,基于用户提供的实例感知文本和掩码实现精确的实例级图像着色。框架基于像素级掩码注意力机制防止色彩溢... Ai项目 2周前5,8050
Speech-02 – MiniMax 推出的新一代文本转语音模型 Speech-02是什么 Speech-02 是 MiniMax 推出的新一代文本到语音(TTS)模型。模型基于回归 Transformer 架构,实现零样本语音克隆,仅需几秒参考语音能生成高度相似的... Ai项目 2周前4,3550
Stable Audio Open Small – Stability AI和Arm推出的文本到音频生成模型 Stable Audio Open Small是什么 Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable ... Ai项目 2周前4,5500
LBM – AI图像转换框架,实现可控阴影生成 LBM是什么 LBM(Latent Bridge Matching)是Jasper Research团队推出的新型图像到图像转换框架,基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推... Ai项目 2周前5,2500
Sketch2Anim – 爱丁堡大学等机构推出的2D草图转3D动画框架 Sketch2Anim是什么 Sketch2Anim 是爱丁堡大学联合Snap Research、东北大学推出的自动化框架,能将2D草图故事板直接转换为高质量的3D动画。基于条件运动合成技术,用3D关... Ai项目 2周前4,7900
SWE-1 – Windsurf推出的首个软件工程 AI 模型系列 SWE-1是什么 SWE-1是Windsurf团队推出的首个软件工程 AI 模型系列,专为整个软件开发流程优化,涵盖代码生成、测试、调试、资料查找等开发环节,提升开发效率和用户体验。SWE-1包含三款... Ai项目 2周前4,6150