Fish Speech 1.5 – Fish Audio 推出的语音合成模型,支持13种语言 Fish Speech 1.5是什么 Fish Speech 1.5 是Fish Audio 推出的文本到语音(TTS)模型,基于深度学习技术如Transformer、VITS、VQVAE和GPT等... Ai项目 2周前4,8750
Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型 Motion Prompting是什么 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术,基于运动轨迹(motion trajectori... Ai项目 2周前5,6650
FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准 FullStack Bench是什么 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈编程和多语言编程能力评估。FullStack Benc... Ai项目 2周前25,3000
GenCast – 谷歌DeepMind推出的AI气象预测模型 GenCast是什么 GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast在97.2%的预测任务中超越全球顶尖的中期天气预报系统... Ai项目 2周前6,9400
Micro LLAMA – 教学版 LLAMA 3模型实现,用于学习大模型的核心原理 Micro LLAMA是什么 Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言模型架构。整个项目仅约180行代码,便于理解和学习。Micro LLAMA用的是LLA... Ai项目 2周前6,0050
Perplexideez – 开源本地AI搜索助手,智能搜索信息来源追溯 Perplexideez是什么 Perplexideez是本地AI助手,支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础,支持Ollama或Open... Ai项目 2周前5,0750
ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型 ConsisID是什么 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tu... Ai项目 2周前4,8150
TPDM – 西湖大学联合北大等高校推出的时间预测扩散模型 TPDM是什么 TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能... Ai项目 2周前6,4200
TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型 TeleAI 视频生成大模型是什么 TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜头草图,再基于草图生成视频。TeleAI 视频生成大模... Ai项目 2周前5,0100
Luma Photon – Luma AI 推出的全新图像生成模型 Luma Photon是什么 Luma Photon 是 Luma AI 推出的新一代图像生成模型,用创新的架构提供超高图像质量和低成本效率。Luma Photon支持个性化和创造性的图像生成,能理解... Ai项目 2周前4,6200