Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第49页

Step-Video V2 – 阶跃星辰推出的升级版视频生成模型

Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新，采用了更高压缩比的VAE模型以及深度优化的DiT...

Ai项目

2周前

5,3550

AI co-scientist – 谷歌推出多智能体协作的 AI 科研助手

AI co-scientist是什么 AI co-scientist 是谷歌推出的多智能体AI系统，作为虚拟科研机器人，协助科研人员搞定各种繁琐的科研任务，包括科研选题、文献检索和实验设计。AI co...

Ai项目

12个月前

05,3550

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制，如音频、表情等。核心架构包括并行 Mamba 结构，通过多个分支利用不同驱动信号分别...

Ai项目

12个月前

05,3550

VoiceCanvas – 开源AI语音合成平台，支持多语言、多音色、声音克隆服务

VoiceCanvas是什么 VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务，支持超过 50 种语言，集成 OpenAI TTS、AWS Polly 和...

Ai项目

2周前

5,3500

AvatarFX – Character.AI 推出的 AI 视频生成模型

AvatarFX是什么 AvatarFX 是 Character.AI 推出的先进 AI 视频生成模型。基于上传一张图片和选择声音，让角色瞬间“活起来”，实现说话、唱歌和表达情感。AvatarFX支持...

Ai项目

2周前

5,3500

CLaMP 3- 清华团队推出的音乐信息检索框架

CLaMP 3是什么 CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习，将乐谱（如ABC符号）、音频（如MERT特征）和表演信号（如MIDI文本...

Ai项目

12个月前

05,3500

Dolphin – 字节跳动开源的文档解析大模型

Dolphin是什么 Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法，第一阶段生成文档布局元素序列，第二阶段用元素作为锚点并行解析内容。Dolphi...

Ai项目

2周前

5,3450

GLM-Zero – 智谱AI推出的深度推理模型

GLM-Zero是什么 GLM-Zero是智谱AI基于扩展强化学习技术的推理模型，专注于提升模型的深度推理能力。擅长处理数理逻辑、代码编写和复杂问题解决，在AIME 2024、MATH500和Live...

Ai项目

2周前

5,3450

Claude 3.7 Max – Cursor 上线的最新 AI 模型，支持200k上下文

Claude 3.7 Max是什么 Claude 3.7 Max 是 Cursor 推出的专为复杂代码任务设计的最新 AI 模型，称为史上最强代码助手。基于 Claude 3.7 思考模型，具备 20...

Ai项目

12个月前

05,3450

StoryTeller – 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统

StoryTeller是什么 StoryTeller是字节跳动、上海交通大学和北京大学共同推出的系统，能基于音频视觉角色识别技术改善长视频描述的质量和一致性。系统结合低级视觉概念和高级剧情信息，生成详...

Ai项目

2周前

5,3400