Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第99页

VideoFusion – AI视频剪辑工具，自动去除视频黑边、水印和字幕

VideoFusion是什么 VideoFusion 是开源的短视频拼接与处理软件，专为高效视频编辑设计。支持自动去除视频中的黑边、水印和字幕，能将视频自动旋转为横屏或竖屏，适配不同播放场景。软件具备...

Ai项目

12个月前

04,6500

Baichuan-Audio – 百川智能开源的端到端语音交互模型

Baichuan-Audio是什么 Baichuan-Audio是百川智能推出的端到端音频大语言模型，支持无缝集成音频理解和生成功能，实现支持高质量、可控的实时中英双语对话。Baichuan-Audi...

Ai项目

12个月前

05,4000

AIMv2 – 苹果开源的多模态自回归预训练视觉模型

AIMv2是什么 AIMv2是苹果公司开源的多模态自回归预训练视觉模型，通过图像和文本的深度融合提升视觉模型的性能。采用创新的预训练框架，将图像划分为非重叠的图像块，将文本分解为子词令牌，然后将两者拼...

Ai项目

12个月前

05,2100

VidSketch – 浙江大学推出的视频动画生成框架

VidSketch是什么 VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架，根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于...

Ai项目

12个月前

05,2000

HippoRAG 2 – 俄亥俄州立大学推出的检索增强生成框架

HippoRAG 2是什么 HippoRAG 2是俄亥俄州立大学推出的检索增强生成（RAG）框架，解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化Page...

Ai项目

12个月前

04,4350

LDGen – 理想汽车推出的多语言文本到图像生成技术

LDGen是什么 LDGen是创新的文本到图像合成技术，通过结合大型语言模型（LLMs）与扩散模型，提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术，提取文本中的精确语义信息...

Ai项目

12个月前

04,2150

AI-Infra-Guard – 腾讯开源的 AI 基础设施安全评估工具

AI-Infra-Guard是什么 AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具，能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支...

Ai项目

12个月前

05,8950

Mahilo – AI多智能体框架，支持创建与人类互动的多智能体系统

Mahilo是什么 Mahilo 是灵活的多智能体框架，支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信，智能体之间能自主共享上下文和信息，保持人类对交互的监督和控制。Mahilo...

Ai项目

12个月前

06,3400

WorldCraft – 港科大推出的3D虚拟世界创建和定制系统

WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型（LLM）代理的3D世界创建和定制系统，用在创建和定制逼真的3D虚拟世界。基于自然语言交互，让用户能轻松生成复杂的室...

Ai项目

12个月前

06,5350

Mobius – 重庆邮电联合美团等推出的无缝循环视频生成技术

Mobius是什么 Mobius 是先进的无缝循环视频生成技术，能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型，能自动识别视频中的关键元素并生成平滑过渡的循环片段，无需用户...

Ai项目

12个月前

04,5800