Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第124页

Llama 4 – Meta 开源的多模态系列AI模型，重夺开源王座

Llama 4是什么 Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家（MoE）架构，在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个...

Ai项目

1年前

04,5800

OmniTalker – 阿里推出的实时文本驱动说话头像生成框架

OmniTalker是什么 OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术，能同时处理文本、图像、音频和视频等多种模态输入，以流式方式生成自然语音响应。核心架构为 Thinker...

Ai项目

1年前

05,3700

Seedream 3.0 – 字节推出的 AI 图片生成模型，精准生成复杂中文内容

Seedream 3.0是什么 Seedream 3.0（即梦3.0）是字节跳动推出的AI图片生成模型，模型支持原生 2K 分辨率图像输出，快速生成高品质图像，仅需 3 秒。模型在小字生成与排版、美感...

Ai项目

1年前

04,6150

Quasar Alpha – 支持百万 token 上下文的免费 AI 模型

Quasar Alpha是什么 Quasar Alpha 是支持 100 万 token 的超大上下文窗口的预发布版 AI 模型，可处理超长文本和复杂文档。代码生成能力出色，生成速度快，延迟低，指令遵...

Ai项目

1年前

07,0350

OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架

OmniCam是什么 OmniCam 是先进的多模态视频生成框架，通过摄像机控制实现高质量的视频生成。支持多种输入模态组合，用户可以提供文本描述、视频中的轨迹或图像作为参考，精确控制摄像机的运动轨迹...

Ai项目

1年前

05,6100

AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统

AnimeGamer是什么 AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型（MLLM），支持玩家基于开放式的语言指令，用动漫角色的身份沉浸于动...

Ai项目

1年前

06,7200

Awesome MCP Servers – 开源的MCP资源聚合平台，覆盖多个垂直领域

Awesome MCP Servers是什么 Awesome MCP Servers 是开源项目，汇集各种基于 Model Context Protocol (MCP) 的服务器。Awesome MC...

Ai项目

1年前

04,8450

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制，如音频、表情等。核心架构包括并行 Mamba 结构，通过多个分支利用不同驱动信号分别...

Ai项目

1年前

05,3550

SkyReels-A2 – 昆仑万维推出的可控视频生成框架

SkyReels-A2是什么 SkyReels-A2是昆仑万维推出的可控视频生成框架，支持根据文本提示将任意视觉元素（如人物、物体、背景）组合成合成视频，严格保持与每个元素的参考图像的一致性。基于设计...

Ai项目

1年前

04,4500

ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集

ChildMandarin是什么 ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室（HLT Lab）共同推出的，针对3-5岁儿童的普通话语音数据集。数据集包含41.25...

Ai项目

1年前

04,9850