NVILA – 英伟达推出的视觉语言大模型 NVILA是什么 NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统优化,减少资源消耗,在... Ai项目 3周前5,1850
GenMAC – 港大、清华联合微软推出文本到视频生成的多代理协作框架 GenMAC是什么 GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架,用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计三个阶段,在生成与重新设计之... Ai项目 3周前5,1850
Enhance-A-Video – 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法 Enhance-A-Video是什么 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生成增强算法。算法能够显著提升AI视频生成质量,特别是在... Ai项目 3周前5,1850
ProtGPS – 麻省理工学院等机构推出的蛋白质语言模型 ProtGPS是什么 ProtGPS(Protein Localization Prediction Model)是麻省理工学院(MIT)和怀特黑德生物医学研究所推出的,基于深度学习的蛋白质语言模型... Ai项目 12个月前05,1850
FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架 FantasyID是什么 FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Di... Ai项目 12个月前05,1850
ScrapeGraphAI – AI网络爬虫工具,自动分析目标网页结构提取关键数据 ScrapeGraphAI是什么 ScrapeGraphAI 是基于大型语言模型(LLM)驱动的智能网络爬虫工具包,专注于从各类网站和HTML内容中高效提取结构化数据。具备三大核心功能:SmartSc... Ai项目 3周前5,1800
BLIP3-o – Salesforce Research等机构推出的多模态模型 BLIP3-o是什么 BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像特... Ai项目 3周前5,1800
TRELLIS – 微软联合清华和中科大推出的高质量 3D 生成模型 TRELLIS是什么 TRELLIS是清华大学、中国科学技术大学和微软研究院推出的3D生成模型,基于Structured LATent(SLAT)表示法,从文本或图像提示中生成高质量、多样化的3D资产... Ai项目 3周前5,1800
TongGeometry – 北京通院联合北大AI研究院推出的几何模型 TongGeometry是什么 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于... Ai项目 12个月前05,1800
Reka Flash 3 – Reka AI 推出的开源推理模型 Reka Flash 3是什么 Reka Flash 3 是 Reka AI 推出的开源推理模型,拥有 21 亿参数。支持多模态输入,包括文本、图像、视频和音频,可处理最多 32k 个令牌的上下文长度... Ai项目 12个月前05,1800