Agixxw

帅气的我简直无法用语言描述!

MTVCrafter – 中科院联合中国电信等机构推出的人像动画生成框架

MTVCrafter是什么 MTVCrafter是中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于原始3D运动序列进行高质量动画生成...
3周前
5050

Morphik – 开源的多模态检索增强生成工具

Morphik是什么 Morphik 是开源的多模态检索增强生成(RAG)工具,专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索,采用 ColPali 等技术...
3周前
5550

BLIP3-o – Salesforce Research等机构推出的多模态模型

BLIP3-o是什么 BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像特...
4周前
9100

ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

ShotAdapter是什么 ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架,基于微调预训练的文本到视频模型,引入过渡标记和局部注意力掩码策略,实现对多镜头视频的生...
4周前
7650

Index-AniSora – B站开源的动漫视频生成模型

Index-AniSora是什么 Index-AniSora 是哔哩哔哩开源的先进动漫视频生成模型,模型支持一键生成多种动漫风格的视频,涵盖番剧片段、国创动画、VTuber 内容等。模型包含超过 10...
4周前
7000

LightLab – 谷歌等机构推出的图像光源控制模型

LightLab是什么 LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。模型支持用户调整光源的强度和颜色,插入虚拟光源,及改变环境光的强度...
4周前
4100

WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列

WorldPM是什么 WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1...
4周前
7550

SketchVideo – 快手联合多所高校推出基于草图的视频生成与编辑框架

SketchVideo是什么 SketchVideo 是中国科学院大学,香港科技大学和快手可灵团队推出的基于草图的视频生成与编辑框架。在关键帧上绘制草图,结合文本提示,实现对视频的空间布局和运动的精细...
4周前
9200

Custom-SVG – Adobe联合香港城市大学推出的SVG定制生成框架

Custom-SVG是什么 Custom-SVG 是Adobe和香港城市大学推出的两阶段风格的SVG定制生成框架,基于文本提示生成具有定制风格的高质量 SVG 图形。框架推出一种两阶段的生成流程,基于...
4周前
4800

YuLan-OneSim – 人大高瓴AI团队推出的社会模拟器

YuLan-OneSim是什么 YuLan-OneSim(玉兰-万象)是中国人民大学高瓴 AI 学院RUC-GSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为...
4周前
7900