Seedream 3.0 – 字节推出的 AI 图片生成模型,精准生成复杂中文内容 Seedream 3.0是什么 Seedream 3.0(即梦3.0)是字节跳动推出的AI图片生成模型,模型支持原生 2K 分辨率图像输出,快速生成高品质图像,仅需 3 秒。模型在小字生成与排版、美感... Ai项目 5个月前02,4250
Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架 Diff-Instruct是什么 Diff-Instruct是先进的知识转移方法,用于从预训练的扩散模型中提取知识,指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leible... Ai项目 5个月前2,4200
VidTok – 微软开源的视频分词器,支持连续和离散分词化 VidTok是什么 VidTok(Video Tokenizer)是微软开源的先进的视频分词器,通过高效的算法将视频内容转换成一系列“视频词”。支持连续和离散分词化,具有灵活的压缩率和多样化的隐空间... Ai项目 5个月前2,4200
Figma-Low-Code – 将Figma设计转换为Vue.js应用程序的开源项目 Figma-Low-Code是什么 Figma-Low-Code是开源的项目,基于Luisa框架,支持开发者直接将Figma设计转换为Vue.js应用程序。大幅减少设计师与开发者之间的交接时间,减少前... Ai项目 5个月前2,4200
MiniMax-01 – MiniMax开源的全新系列模型 MiniMax-01是什么 MiniMax-01是MiniMax推出的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01首... Ai项目 5个月前2,4200
CityDreamer4D – 南洋理工推出的无边界 4D 城市建模框架 CityDreamer4D是什么 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体(如车辆)与静态场景(如建筑和道路)分离,通过三个... Ai项目 5个月前2,4200
Satori – 开源的大语言推理模型,具备自回归搜索和自我纠错能力 Satori是什么 Satori是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言模型,专注于提升推理能力。基于Qwen-2.5-Math-7B,Satori通过小规模的格式微调和大规模的增... Ai项目 5个月前02,4200
Collaborative Gym – 支持人与AI代理实时交互协作的评估框架 Collaborative Gym是什么 Collaborative Gym(Co-Gym)是专注于人机协作(Human-Agent Collaboration)的框架,支持人类与AI代理之间的实时交... Ai项目 5个月前02,4200
腾讯混元T1 – 腾讯混元推出的最新深度思考模型 T1是什么 T1(Thinker)是腾讯混元推出的最新深度思考模型,已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考,支持联网搜索功能,能从互联网信源、微信公众号、视频号等腾讯生态内容中获取信息... Ai项目 5个月前02,4200
子曰翻译2.0 – 网易有道推出的最新翻译大模型 子曰翻译2.0是什么 子曰翻译2.0是网易有道推出的最新翻译大模型,模型在数据、算法和评估三个关键维度进行了系统性升级,实现了翻译质量、效率和鲁棒性的质的飞跃。 在数据层面,有道收集清洗了数千万高质量... Ai项目 5个月前02,4200