DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术 DisPose是什么 DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的,提高人物图像动画质量的控制技术,基于从骨骼姿态和参考图像中提取有效的控制信号,无需额外的密... Ai项目 2周前5,4900
CLEAR – 新加坡国立大学推出的线性注意力机制,生成8K图像时提速6.3倍 CLEAR是什么 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意力限制在局部窗口内,CLEAR实现了对图像分辨率的线性... Ai项目 2周前4,9950
InvSR – 开源图像超分辨率模型,高清修复老旧照片 InvSR是什么 InvSR是创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。用大型预训练扩散模型中丰富的图像先验,改善超分辨率的效果。InvSR的核心在于深度噪声预测器,预测器能估计出... Ai项目 2周前6,5700
HelloMeme – 面部表情与姿态迁移框架,基于Stable Diffusion 1.5模型理解能力 HelloMeme是什么 HelloMeme是基于最新的Diffusion生成技术的框架,实现表情与姿态的迁移,HelloMeme集成空间编织注意力(Spatial Knitting Attentio... Ai项目 2周前5,1350
Kheish – 开源的多智能体协调平台,可灵活配置多个Agent解决复杂任务 Kheish是什么 Kheish是基于大型语言模型(LLM)的多智能体编排开源平台,用多个专门的角色(智能体)和灵活的工作流协调复杂任务的各个步骤,如提案生成、审核、验证和格式化,产生高质量结果。平台... Ai项目 2周前4,7500
Univer – 开源 AI 办公工具,支持Word、Excel等文档处理全栈解决方案 Univer是什么 Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行,易于集成到各种应用中。Un... Ai项目 2周前5,6350
Bamba-9B – 基于 Mamba2 架构的仅解码语言模型 Bamba-9B是什么 Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提高大型语言模... Ai项目 2周前5,6800
VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集 VSI-Bench是什么 VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集,研究者构建用在评... Ai项目 2周前4,8800
Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型 Baichuan4-Finance是什么 Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型,包括Baichuan4-Finance-Base和Baichuan4-Financ... Ai项目 2周前4,5450
ERA-42 – 星动纪元推出的端到端原生机器人大模型 ERA-42是什么 ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任务。ERA-42无需预编程,具备快速学习新技能的能力... Ai项目 2周前7,0800