Mahilo – AI多智能体框架,支持创建与人类互动的多智能体系统 Mahilo是什么 Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对交互的监督和控制。Mahilo... Ai项目 12个月前06,3400
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统 WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室... Ai项目 12个月前06,5350
Mobius – 重庆邮电联合美团等推出的无缝循环视频生成技术 Mobius是什么 Mobius 是先进的无缝循环视频生成技术,能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型,能自动识别视频中的关键元素并生成平滑过渡的循环片段,无需用户... Ai项目 12个月前04,5800
WarriorCoder – 微软联合华南理工大学推出的代码生成大模型 WarriorCoder是什么 WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型(LLM)。基于模拟专家模型之间的对抗生成高质量训练数据,提升模型性能。与传统... Ai项目 12个月前04,6150
xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架 xAR是什么 xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context L... Ai项目 12个月前05,3150
Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型 Avat3r是什么 Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头像... Ai项目 12个月前04,9700
WhisperChain – AI实时语音转文字工具,自动对文本进行清理和优化 WhisperChain是什么 WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 ... Ai项目 12个月前04,7600
星火医疗大模型X1 – 讯飞医疗推出的深度推理大模型 星火医疗大模型X1是什么 星火医疗大模型X1是科大讯飞发布的深度推理大模型,专门针对医疗领域设计,具备强大的复杂问题处理能力。模型通过深度推理算法,能逐步解释循证过程,显著降低医疗幻觉问题,提升医疗场... Ai项目 12个月前05,0400
story-flicks – AI视频生成工具,一键生成高清故事短视频 story-flicks是什么 story-flicks 是基于AI大模型的项目,支持一键生成高清故事短视频。用户输入故事主题后,系统基于AI技术生成包含图像、文本、音频和字幕的短视频。story-f... Ai项目 12个月前08,1350
CSM – Sesame团队推出的语音对话模型 CSM是什么 CSM(Conversational Speech Model)是Sesame团队推出的新型语音对话模型,提升语音助手的自然度和情感交互能力。CSM基于多模态学习框架,结合文本和语音数据... Ai项目 12个月前04,4950