Llama 4 – Meta 开源的多模态系列AI模型,重夺开源王座 Llama 4是什么 Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个... Ai项目 1年前04,5800
OmniTalker – 阿里推出的实时文本驱动说话头像生成框架 OmniTalker是什么 OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。核心架构为 Thinker... Ai项目 1年前05,3700
Seedream 3.0 – 字节推出的 AI 图片生成模型,精准生成复杂中文内容 Seedream 3.0是什么 Seedream 3.0(即梦3.0)是字节跳动推出的AI图片生成模型,模型支持原生 2K 分辨率图像输出,快速生成高品质图像,仅需 3 秒。模型在小字生成与排版、美感... Ai项目 1年前04,6150
Quasar Alpha – 支持百万 token 上下文的免费 AI 模型 Quasar Alpha是什么 Quasar Alpha 是支持 100 万 token 的超大上下文窗口的预发布版 AI 模型,可处理超长文本和复杂文档。代码生成能力出色,生成速度快,延迟低,指令遵... Ai项目 1年前07,0350
OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架 OmniCam是什么 OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图像作为参考,精确控制摄像机的运动轨迹... Ai项目 1年前05,6100
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统 AnimeGamer是什么 AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用动漫角色的身份沉浸于动... Ai项目 1年前06,7200
Awesome MCP Servers – 开源的MCP资源聚合平台,覆盖多个垂直领域 Awesome MCP Servers是什么 Awesome MCP Servers 是开源项目,汇集各种基于 Model Context Protocol (MCP) 的服务器。Awesome MC... Ai项目 1年前04,8450
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架 ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不同驱动信号分别... Ai项目 1年前05,3550
SkyReels-A2 – 昆仑万维推出的可控视频生成框架 SkyReels-A2是什么 SkyReels-A2是昆仑万维推出的可控视频生成框架,支持根据文本提示将任意视觉元素(如人物、物体、背景)组合成合成视频,严格保持与每个元素的参考图像的一致性。基于设计... Ai项目 1年前04,4500
ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集 ChildMandarin是什么 ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)共同推出的,针对3-5岁儿童的普通话语音数据集。数据集包含41.25... Ai项目 1年前04,9850