AutoRAG – 中科院开源的自主迭代检索模型 AutoRAG是什么 AutoRAG是中国科学院计算技术研究所(ICT/CAS)、中国科学院的人工智能安全重点实验室及中国科学院大学的研究人员共同推出的新型自主迭代检索模型,专为大型语言模型(LLMs... Ai项目 5个月前2,6100
Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术 Wonderland是什么 Wonderland是多伦多大学、Snap和UCLA的研究团队推出的技术,能够从单张图像生成高质量、广范围的3D场景,允许控制摄像轨迹。证明了三维重建模型可以有效地建立在扩... Ai项目 5个月前2,6050
星火纪要 – 科大讯飞推出的会议交流总结和分析平台 星火纪要是什么 星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台,广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容,提升工作学习效率;辅助企业从众多会议... Ai项目 5个月前2,6050
CustomVideoX – 中科大联合浙大等推出的个性化视频生成框架 CustomVideoX是什么 CustomVideoX 是中科大和浙大等联合提出的创新的个性化视频生成框架,通过参考图像和文本描述生成高质量的定制化视频。框架基于视频扩散变换器(Video Diff... Ai项目 5个月前02,6050
Voyage Multimodal-3 – Voyage AI 推出的多模态嵌入模型 Voyage Multimodal-3是什么 Voyage Multimodal-3 是 Voyage AI 推出的先进的多模态嵌入模型,能处理交错的文本和图像,并从 PDF、幻灯片、表格等截图中捕捉... Ai项目 5个月前2,6000
LongAlign – 港大推出的提升文本到图像扩散模型处理长文本对齐方法 LongAlign是什么 LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编码模型... Ai项目 5个月前2,6000
MetaMorph – 统一多模态理解与生成大模型,基于VPiT 预测多模态 token MetaMorph是什么 MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive In... Ai项目 5个月前2,6000
X-Dyna – 字节联合斯坦福等高校推出的动画生成框架 X-Dyna是什么 X-Dyna 是基于扩散模型的动画生成框架,基于驱动视频中的面部表情和身体动作,将单张人类图像动画化,生成具有真实感和环境感知能力的动态效果。核心是 Dynamics-Adapte... Ai项目 5个月前2,6000
TeleAI-t1-preview – 中国电信推出的复杂推理大模型 TeleAI-t1-preview是什么 TeleAI-t1-preview是中国电信人工智能研究院发布的“复杂推理大模型”,具备强大的逻辑推理与数学推导能力。通过强化学习训练方法,引入探索、反思等思... Ai项目 5个月前2,6000
Muse – 微软研究院推出的生成式AI模型 Muse是什么 Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习... Ai项目 5个月前02,6000