日日新SenseNova V6 – 商汤推出的多模态融合模型系列 日日新SenseNova V6是什么 日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列,基于6000亿参数的多模态MoE架构,实现文本、图像和视频的原生融合。日日新Sense... Ai项目 12个月前05,8800
MT-Color – 上海交大联合哔哩哔哩推出的可控图像着色框架 MT-Color是什么 MT-Color是上海交通大学联合哔哩哔哩推出的基于扩散模型的可控图像着色框架,基于用户提供的实例感知文本和掩码实现精确的实例级图像着色。框架基于像素级掩码注意力机制防止色彩溢... Ai项目 2周前5,8750
Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准 Math24o是什么 Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力。使用2024年全国高中数... Ai项目 12个月前05,8750
SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型 SPAR3D是什么 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩... Ai项目 2周前5,8700
Genie 2 – 谷歌DeepMind推出的最新一代基础世界模型 Genie 2是什么 Genie 2是DeepMind推出的新一代大规模基础世界模型,仅凭一张图片生成长达1分钟的可交互3D游戏世界。Genie 2能模拟出物体交互、角色动画、物理效果等复杂动态,支持... Ai项目 2周前5,8550
瑞智病理大模型 – 瑞金联合华为推出的多模态互动式病理大模型 瑞智病理大模型是什么 瑞智病理大模型(RuiPath)是上海交通大学医学院附属瑞金医院与华为共同推出的临床级国产多模态互动式病理大模型。模型覆盖了中国每年全癌种发病人数90%的常见癌种,包含垂体神经内... Ai项目 12个月前05,8550
Step-1o Audio – 阶跃星辰推出的国内首个千亿参数端到端语音大模型 Step-1o Audio是什么 Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力,能精准识别用户语气中的情感,结合语境做出贴心回应。如,在用户分享喜... Ai项目 2周前5,8450
R1-Onevision – 开源多模态视觉推理模型,基于 Qwen2.5-VL 微调 R1-Onevision是什么 R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在... Ai项目 12个月前05,8450
LaDeCo – 西安交大联合微软推出的自动图形设计构图方法 LaDeCo是什么 LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计构图方法,基于将设计任务分解为层次化的步骤来实现。LaDeCo对输入的设计元素进行层规划,将它们分配到不同的语义层,比如... Ai项目 2周前5,8400
Vanna – 开源AI检索生成框架,自动生成精确的SQL查询 Vanna是什么 Vanna是开源的Python RAG(Retrieval-Augmented Generation)框架,能帮助用户基于大型语言模型(LLMs)为其数据库生成精确的SQL查询。Va... Ai项目 2周前5,8300