WarriorCoder – 微软联合华南理工大学推出的代码生成大模型 WarriorCoder是什么 WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型(LLM)。基于模拟专家模型之间的对抗生成高质量训练数据,提升模型性能。与传统... Ai项目 12个月前04,6150
xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架 xAR是什么 xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context L... Ai项目 12个月前05,3150
Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型 Avat3r是什么 Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头像... Ai项目 12个月前04,9700
WhisperChain – AI实时语音转文字工具,自动对文本进行清理和优化 WhisperChain是什么 WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 ... Ai项目 12个月前04,7600
星火医疗大模型X1 – 讯飞医疗推出的深度推理大模型 星火医疗大模型X1是什么 星火医疗大模型X1是科大讯飞发布的深度推理大模型,专门针对医疗领域设计,具备强大的复杂问题处理能力。模型通过深度推理算法,能逐步解释循证过程,显著降低医疗幻觉问题,提升医疗场... Ai项目 12个月前05,0400
story-flicks – AI视频生成工具,一键生成高清故事短视频 story-flicks是什么 story-flicks 是基于AI大模型的项目,支持一键生成高清故事短视频。用户输入故事主题后,系统基于AI技术生成包含图像、文本、音频和字幕的短视频。story-f... Ai项目 12个月前08,1350
CSM – Sesame团队推出的语音对话模型 CSM是什么 CSM(Conversational Speech Model)是Sesame团队推出的新型语音对话模型,提升语音助手的自然度和情感交互能力。CSM基于多模态学习框架,结合文本和语音数据... Ai项目 12个月前04,4950
AgiBot Digital World – 智元机器人推出的机器人仿真框架 AgiBot Digital World是什么 AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能研究与应用提供高效支持。AgiBot Digital ... Ai项目 12个月前04,5550
ARTalk – 东京大学等机构推出的3D头部动画生成框架 ARTalk是什么 ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然的面部表情及头部姿势生成。ARTalk用多尺度运动码... Ai项目 12个月前04,4150
LuminaBrush – AI光源绘制工具,手绘光影线条自动生成光影效果 LuminaBrush是什么 LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目,用两阶段方法:第一阶段将图像转换为“均匀照明”的外观,第二... Ai项目 12个月前05,0800