BlueLM-V-3B – ViVo联合香港中文大学推出的算法和系统协同设计方法
BlueLM-V-3B是什么 BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法,支持高效部署多模态大型语言模型(MLLM)至移动设备。模型以小尺寸...
AtomThink – 华为诺亚方舟联合多所高校推出的多模态数学推理框架
AtomThink是什么 AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。框架基于构建长链的思维(CoT)引导多模态大型语...
DeepSeek-R1-Lite – 深度求索推出的新一代AI推理模型,媲美OpenAI o1-preview
DeepSeek-R1-Lite是什么 DeepSeek-R1-Lite是深度求索推出的新一代AI推理模型,DeepSeek-R1-Lite用强化学习训练,具备长思维链推理能力,能实时展示推理思考过程...
Samsung Gauss2 – 三星推出的第二代多模态生成式AI模型
Samsung Gauss2是什么 Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型,能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和...
AlphaQubit – 谷歌推出的量子错误解码器
AlphaQubit是什么 AlphaQubit是谷歌推出基于AI技术的量子错误解码器,用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别,助力量...
CAD-MLLM – 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统
CAD-MLLM是什么 CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的,计算机辅助设计(CAD)模型生成系统,根据用户的多种输入(如文本描述、图...
LaTRO – 基于自我奖励提升LLMs复杂推理能力的框架
LaTRO是什么 LaTRO(Latent Reasoning Optimization)是先进的框架,提升大型语言模型(LLMs)在复杂推理任务中的表现。基于将推理过程类比为从潜在分布中采样,用变分...
ReCapture – 谷歌和新加坡国立大学共同推出的视频处理技术
ReCapture是什么 ReCapture是谷歌和新加坡国立大学推出的视频处理技术,能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCapture用多视图扩散模型或基于深度的点云渲染生成带有...
MagicClay – Adobe 推出的3D建模工具,文本引导3D模型局部雕刻
MagicClay是什么 MagicClay 是 Adobe 推出3D建模工具,结合网格和有向距离场(SDF)技术,支持艺术家基于文本提示对3D模型的特定部分进行雕刻,同时保持模型的其他区域不变。Ma...
StableV2V – 中国科技大学开源的视频编辑项目
StableV2V是什么 StableV2V是中国科技大学推出的开源视频编辑项目,基于文本、草图、图片等输入实现视频中物体的精准编辑和替换。项目用形状一致的编辑范式,基于三个主要组件:Prompted...