Qwen2.5-Turbo – 阿里推出的长文本模型,支持上下文长度1M tokens Qwen2.5-Turbo是什么 Qwen2.5-Turbo是阿里推出的先进模型,将上下文长度从 128k 扩展到了 1M tokens ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更... Ai项目 4周前4,9200
CogView4 – 智谱开源的AI文生图模型,支持生成汉字 CogView4是什么 CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一,达到开源文生图模型的最先进... Ai项目 4周前4,9200
ReCamMaster – 浙大联合快手等推出的视频重渲染框架 ReCamMaster是什么 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,结合多相机同步数据集和相机姿态... Ai项目 12个月前04,9200
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息 YT Navigator是什么 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能... Ai项目 12个月前04,9200
Step1X-3D – 阶跃星辰联合LightIllusions开源的3D资产生成框架 Step1X-3D是什么 Step1X-3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程,从超过 500 万个 3D 资产中筛选出... Ai项目 4周前4,9150
Teacher2Task – 谷歌推出的多教师学习框架 Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N... Ai项目 4周前4,9150
Ivy-VL – AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型 Ivy-VL是什么 Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI模型,专为移动端和边缘设备设计。模型拥有3B参数量,相较于其他多模态大模型,显著降低计算资... Ai项目 4周前4,9150
OmniManip – 智元机器人联合北大推出的通用机器人操作框架 OmniManip是什么 OmniManip 是北京大学与智元机器人联合实验室开发的通用机器人操作框架,通过结合视觉语言模型(VLM)的高层次推理能力和精确的三维操作能力,实现机器人在非结构化环境中的... Ai项目 4周前4,9150
SepLLM – 基于分隔符压缩加速大语言模型的高效框架 SepLLM是什么 SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型(LLM)的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率。SepLLM的... Ai项目 12个月前04,9150
Heygem – 硅基智能推出的开源数字人模型 Heygem是什么 Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,在 60... Ai项目 12个月前04,9150