Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第127页

MagicClay – Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

MagicClay是什么 MagicClay 是 Adobe 推出3D建模工具，结合网格和有向距离场（SDF）技术，支持艺术家基于文本提示对3D模型的特定部分进行雕刻，同时保持模型的其他区域不变。Ma...

Ai项目

1个月前

4,2200

LDGen – 理想汽车推出的多语言文本到图像生成技术

LDGen是什么 LDGen是创新的文本到图像合成技术，通过结合大型语言模型（LLMs）与扩散模型，提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术，提取文本中的精确语义信息...

Ai项目

1年前

04,2150

SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型

SoulChat2.0是什么 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型。首次定义了特定心理咨询师的数...

Ai项目

1个月前

4,2100

Seaweed-7B – 字节推出的视频生成模型

Seaweed-7B是什么 Seaweed-7B 是字节跳动团队推出的视频生成模型，拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容...

Ai项目

1年前

04,2050

Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型

Magma是什么 Magma 是微软研究院推出的新型多模态AI基础模型，能为多模态人工智能代理（AI agents）提供通用能力。Magma能理解和执行多模态输入的任务，覆盖数字和物理环境。Magma...

Ai项目

1年前

04,1750

NEXUS-O – 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

NEXUS-O是什么 NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型，能实现对语言、音频和视觉信息的全方位感知与交互。N...

Ai项目

1年前

04,1750

Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架

Hallo3是什么 Hallo3是复旦大学和百度公司联合推出的，基于扩散变换器网络（Diffusion Transformer Networks）的肖像图像动画技术，能生成高度动态和逼真的视频。Hal...

Ai项目

1个月前

4,1700

Mercury Coder – Inception Labs 推出的商业级扩散大型语言模型

Mercury Coder是什么 Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型（dLLM），是 Mercury 系列中专门用在代码生成的模型。Mercury...

Ai项目

1年前

04,1650

Amazon Nova Premier – 亚马逊推出的多模态AI模型

Amazon Nova Premier是什么 Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型，能处理文本、图像和视频输入（不包括音频），擅长处理需要深度理解上下文...

Ai项目

1个月前

4,1600

OptoChat AI – 南智光电联合南大推出的光子芯片领域专用大模型

OptoChat AI是什么 OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链，集成超过30万条光子芯片相关专利、文献和行业数据资源，具备强大的数据...

Ai项目

1个月前

4,1550