Step-Video V2 – 阶跃星辰推出的升级版视频生成模型 Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新,采用了更高压缩比的VAE模型以及深度优化的DiT... Ai项目 2周前5,3550
AI co-scientist – 谷歌推出多智能体协作的 AI 科研助手 AI co-scientist是什么 AI co-scientist 是谷歌推出的多智能体AI系统,作为虚拟科研机器人,协助科研人员搞定各种繁琐的科研任务,包括科研选题、文献检索和实验设计。AI co... Ai项目 12个月前05,3550
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架 ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不同驱动信号分别... Ai项目 12个月前05,3550
VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务 VoiceCanvas是什么 VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和... Ai项目 2周前5,3500
AvatarFX – Character.AI 推出的 AI 视频生成模型 AvatarFX是什么 AvatarFX 是 Character.AI 推出的先进 AI 视频生成模型。基于上传一张图片和选择声音,让角色瞬间“活起来”,实现说话、唱歌和表达情感。AvatarFX支持... Ai项目 2周前5,3500
CLaMP 3- 清华团队推出的音乐信息检索框架 CLaMP 3是什么 CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习,将乐谱(如ABC符号)、音频(如MERT特征)和表演信号(如MIDI文本... Ai项目 12个月前05,3500
Dolphin – 字节跳动开源的文档解析大模型 Dolphin是什么 Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphi... Ai项目 2周前5,3450
GLM-Zero – 智谱AI推出的深度推理模型 GLM-Zero是什么 GLM-Zero是智谱AI基于扩展强化学习技术的推理模型,专注于提升模型的深度推理能力。擅长处理数理逻辑、代码编写和复杂问题解决,在AIME 2024、MATH500和Live... Ai项目 2周前5,3450
Claude 3.7 Max – Cursor 上线的最新 AI 模型,支持200k上下文 Claude 3.7 Max是什么 Claude 3.7 Max 是 Cursor 推出的专为复杂代码任务设计的最新 AI 模型,称为史上最强代码助手。基于 Claude 3.7 思考模型,具备 20... Ai项目 12个月前05,3450
StoryTeller – 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统 StoryTeller是什么 StoryTeller是字节跳动、上海交通大学和北京大学共同推出的系统,能基于音频视觉角色识别技术改善长视频描述的质量和一致性。系统结合低级视觉概念和高级剧情信息,生成详... Ai项目 2周前5,3400