Quasar Alpha – 支持百万 token 上下文的免费 AI 模型 Quasar Alpha是什么 Quasar Alpha 是支持 100 万 token 的超大上下文窗口的预发布版 AI 模型,可处理超长文本和复杂文档。代码生成能力出色,生成速度快,延迟低,指令遵... Ai项目 1年前07,0350
OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架 OmniCam是什么 OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图像作为参考,精确控制摄像机的运动轨迹... Ai项目 1年前05,6100
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统 AnimeGamer是什么 AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用动漫角色的身份沉浸于动... Ai项目 1年前06,7200
Awesome MCP Servers – 开源的MCP资源聚合平台,覆盖多个垂直领域 Awesome MCP Servers是什么 Awesome MCP Servers 是开源项目,汇集各种基于 Model Context Protocol (MCP) 的服务器。Awesome MC... Ai项目 1年前04,8450
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架 ACTalker是什么 ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不同驱动信号分别... Ai项目 1年前05,3550
SkyReels-A2 – 昆仑万维推出的可控视频生成框架 SkyReels-A2是什么 SkyReels-A2是昆仑万维推出的可控视频生成框架,支持根据文本提示将任意视觉元素(如人物、物体、背景)组合成合成视频,严格保持与每个元素的参考图像的一致性。基于设计... Ai项目 1年前04,3800
ChildMandarin – 智源联合南开开源的低幼儿童中文语音数据集 ChildMandarin是什么 ChildMandarin 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)共同推出的,针对3-5岁儿童的普通话语音数据集。数据集包含41.25... Ai项目 1年前04,9850
MagicColor – 香港科技大学推出的多实例线稿图着色框架 MagicColor是什么 MagicColor 是香港科技大学推出的多实例线稿图着色框架,支持高效地为线稿图添加色彩。MagicColor基于自监督训练策略和实例引导模块,解决多实例数据不足的问题... Ai项目 1年前04,7550
Step-R1-V-Mini – 阶跃星辰最新推出的多模态推理模型 Step-R1-V-Mini是什么 Step-R1-V-Mini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型在视觉... Ai项目 1年前05,1300
SeniorTalk – 智源联合南开开源的超高龄老年人中文对话语音数据集 SeniorTalk是什么 SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超高... Ai项目 1年前04,8350