DynVFX – AI视频增强技术,将新动态内容与原始视频无缝融合 DynVFX是什么 DynVFX是创新的视频增强技术,能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉语言模型(VLM),实现了在不依赖复杂用户输入的情况下... Ai项目 5个月前02,5300
TongGeometry – 北京通院联合北大AI研究院推出的几何模型 TongGeometry是什么 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于... Ai项目 5个月前02,5300
Orpheus TTS – 开源AI语音合成系统,支持多种语音风格 Orpheus TTS是什么 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克... Ai项目 5个月前02,5300
SkyReels-V2 – 昆仑万维开源的无限时长电影生成模型 SkyReels-V2是什么 SkyReels-V2是昆仑万维SkyReels团队推出的无限时长电影生成模型,基于扩散强迫(Diffusion-forcing)框架,结合多模态大语言模型(MLLM... Ai项目 5个月前02,5300
StoryWeaver – 厦大和网易伏羲联合推出的统一故事可视化 AI 模型 StoryWeaver是什么 StoryWeaver是厦门大学多媒体可信感知与高效计算教育部重点实验室和网易伏羲人工智能实验室推出的AI模型,能用知识增强的故事角色定制实现高质量的故事可视化。Stor... Ai项目 5个月前2,5250
Kokoro-TTS – 轻量级文本转语音模型,支持多语言多语音风格生成 Kokoro-TTS是什么 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构,采用纯... Ai项目 5个月前2,5250
VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型 VideoReward是什么 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据,涵盖视觉质量、运动质量和文本对齐三个维度... Ai项目 5个月前2,5250
瑞智病理大模型 – 瑞金联合华为推出的多模态互动式病理大模型 瑞智病理大模型是什么 瑞智病理大模型(RuiPath)是上海交通大学医学院附属瑞金医院与华为共同推出的临床级国产多模态互动式病理大模型。模型覆盖了中国每年全癌种发病人数90%的常见癌种,包含垂体神经内... Ai项目 5个月前02,5250
GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架 GaussianAnything是什么 GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D 生成框架。GaussianAnything 基于交互式... Ai项目 5个月前02,5250
MAGI-1 – Sand AI 开源的首个自回归视频生成模型 MAGI-1是什么 MAGI-1 是 Sand AI 开源的全球首个自回归视频生成大模型,采用自回归架构,通过逐块预测视频序列生成流畅自然的视频,支持无限扩展和一镜到底的长视频生成。模型原生分辨率可达... Ai项目 5个月前02,5250