kimi-thinking-preview – 月之暗面推出的多模态思考模型 kimi-thinking-preview是什么 kimi-thinking-preview 是月之暗面推出的多模态思考模型,具备深度推理能力,擅长解决复杂问题,如代码、数学和工作难题。模型基于 re... Ai项目 1个月前9150
UniTok – 字节联合港大、华中科技推出的统一视觉分词器 UniTok是什么 UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器,能同时支持视觉生成和理解任务。基于多码本量化技术,将视觉特征分割成多个小块,每块用独立的子码本进行量化,极大... Ai项目 1个月前6100
D-DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型 D-DiT是什么 D-DiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。模型结合连续图像扩... Ai项目 1个月前6850
NoteLLM – 小红书推出的笔记推荐多模态大模型框架 NoteLLM是什么 NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的强大语义理解能力,结合对比... Ai项目 1个月前8000
Granite 4.0 Tiny Preview – IBM推出的语言模型 Granite 4.0 Tiny Preview是什么 Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite... Ai项目 1个月前6250
Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型 Gemini 2.5 Pro (I/O 版)是什么 Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemin... Ai项目 1个月前7900
VPP – 清华和星动纪元推出的首个AIGC机器人大模型 VPP是什么 VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场景生成机器... Ai项目 1个月前1,2800
Amazon Nova Premier – 亚马逊推出的多模态AI模型 Amazon Nova Premier是什么 Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型,能处理文本、图像和视频输入(不包括音频),擅长处理需要深度理解上下文... Ai项目 1个月前8400
ICEdit – 浙江大学联合哈佛大学推出的指令式图像编辑框架 ICEdit是什么 ICEdit(In-Context Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文... Ai项目 1个月前1,1650
FlexiAct – 清华联合腾讯推出的动作迁移模型 FlexiAct是什么 FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下,将参考视频中的动作迁移到目标主体上,在空间结构差异较大或跨域的... Ai项目 1个月前7850