Granite 3.2 – IBM 开源的多模态系列 AI 模型 Granite 3.2是什么 Granite 3.2 是IBM开源的多模态AI模型系列,具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本, Granite 3.2 Instruc... Ai项目 12个月前05,6550
REEF – 上海AI Lab联合中科院等高校推出用于大模型的指纹识别技术 REEF是什么 REEF(Representation Encoding Fingerprints)是用于大型语言模型(LLM)的指纹识别技术。通过在模型训练过程中嵌入特定的编码信息,为每个模型生成一... Ai项目 2周前5,6450
PIKE-RAG – 微软亚洲研究院推出的检索增强型生成框架 PIKE-RAG是什么 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能... Ai项目 12个月前05,6450
LIGER – Meta AI 等机构推出的混合检索模型 LIGER是什么 LIGER是Meta AI等机构推出的混合检索模型,结合生成式检索和密集检索的优点。LIGER用生成式检索模块生成有限的候选项目集,基于密集检索对候选项目进行排序和优化,保留生成式检... Ai项目 2周前5,6400
I2V3D – 香港城市大学联合微软推出的图像到视频生成框架 I2V3D是什么 I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学(CG)管线的精确... Ai项目 12个月前05,6400
GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型 GEN3C是什么 GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存指导视频生... Ai项目 12个月前05,6350
UniFluid – 谷歌联合麻省理工推出的多模态图像生成与理解框架 UniFluid是什么 UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成离散文本标记和... Ai项目 12个月前05,6350
SketchVideo – 快手联合多所高校推出基于草图的视频生成与编辑框架 SketchVideo是什么 SketchVideo 是中国科学院大学,香港科技大学和快手可灵团队推出的基于草图的视频生成与编辑框架。在关键帧上绘制草图,结合文本提示,实现对视频的空间布局和运动的精细... Ai项目 2周前5,6300
SwiftEdit – AI文本引导图像编辑框架,0.23秒内实现高质量的图像编辑 SwiftEdit是什么 SwiftEdit是VinAI Research团队推出的文本引导的图像编辑框架,基于创新的一步扩散技术,能在0.23秒内实现快速且高质量的图像编辑。工具的核心优势在于一步反... Ai项目 2周前5,6300
DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术 DisPose是什么 DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的,提高人物图像动画质量的控制技术,基于从骨骼姿态和参考图像中提取有效的控制信号,无需额外的密... Ai项目 2周前5,6300