FlagevalMM – 智源开源的多模态模型评测框架

FlagevalMM是什么 FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,支持多种任务和指标。框架采用评测与模型推理解耦的设计...
2周前
5,7850

LightLab – 谷歌等机构推出的图像光源控制模型

LightLab是什么 LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。模型支持用户调整光源的强度和颜色,插入虚拟光源,及改变环境光的强度...
2周前
5,7800

Cube 3D – Roblox 推出的 AI 3D 生成模型

Cube 3D是什么 Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的 3D 对象,与游戏引擎兼容...
12个月前
05,7750

AutoVFX – 自然语言驱动的视频特效编辑框架

AutoVFX是什么 AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(VFX)视频。框架集成神经场景建模、基于大型语言模型...
2周前
5,7700

Teacher2Task – 谷歌推出的多教师学习框架

Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N...
2周前
5,7700