MagicClay – Adobe 推出的3D建模工具,文本引导3D模型局部雕刻 MagicClay是什么 MagicClay 是 Adobe 推出3D建模工具,结合网格和有向距离场(SDF)技术,支持艺术家基于文本提示对3D模型的特定部分进行雕刻,同时保持模型的其他区域不变。Ma... Ai项目 1个月前4,2200
LDGen – 理想汽车推出的多语言文本到图像生成技术 LDGen是什么 LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,提取文本中的精确语义信息... Ai项目 1年前04,2150
SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型 SoulChat2.0是什么 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型。首次定义了特定心理咨询师的数... Ai项目 1个月前4,2100
Seaweed-7B – 字节推出的视频生成模型 Seaweed-7B是什么 Seaweed-7B 是字节跳动团队推出的视频生成模型,拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容... Ai项目 1年前04,2050
Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型 Magma是什么 Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解和执行多模态输入的任务,覆盖数字和物理环境。Magma... Ai项目 1年前04,1750
NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互 NEXUS-O是什么 NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与交互。N... Ai项目 1年前04,1750
Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架 Hallo3是什么 Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)的肖像图像动画技术,能生成高度动态和逼真的视频。Hal... Ai项目 1个月前4,1700
Mercury Coder – Inception Labs 推出的商业级扩散大型语言模型 Mercury Coder是什么 Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型(dLLM),是 Mercury 系列中专门用在代码生成的模型。Mercury... Ai项目 1年前04,1650
Amazon Nova Premier – 亚马逊推出的多模态AI模型 Amazon Nova Premier是什么 Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型,能处理文本、图像和视频输入(不包括音频),擅长处理需要深度理解上下文... Ai项目 1个月前4,1600
OptoChat AI – 南智光电联合南大推出的光子芯片领域专用大模型 OptoChat AI是什么 OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链,集成超过30万条光子芯片相关专利、文献和行业数据资源,具备强大的数据... Ai项目 1个月前4,1550