Open Computer Agent – Hugging Face 推出的免费云端 AI Agent 工具 Open Computer Agent是什么 Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行,基于预装的... Ai项目 2周前5,1300
Absolute Zero – 清华大学等机构推出的语言模型推理训练方法 Absolute Zero是什么 Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolu... Ai项目 2周前4,7950
Avatar IV – HeyGen 最新推出的AI数字人模型 Avatar IV是什么 Avatar IV 是 HeyGen 最新推出的AI数字人模型,用在快速创建逼真视频。用户只需上传一张照片和一段脚本或音频,能生成自然流畅的视频。模型基于音频驱动的表情引擎... Ai项目 2周前4,8600
Insert Anything – 浙大联合哈佛大学和南洋理工推出的图像插入框架 Insert Anything是什么 Insert Anything是浙江大学、哈佛大学和南洋理工大学的研究人员联合推出的基于上下文编辑的图像插入框架。框架基于将参考图像中的对象无缝插入到目标场景中... Ai项目 2周前4,1900
QLIP – 英伟达推出的视觉标记化方法 QLIP是什么 QLIP(Quantized Language-Image Pretraining)是英伟达等推出的视觉标记化方法,结合高质量的图像重建和零样本图像理解能力。QLIP二进制球形量化(B... Ai项目 2周前4,8300
ZeroSearch – 阿里通义开源的大模型搜索引擎框架 ZeroSearch是什么 ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架,基于强化学习激励大模型的搜索能力,无需与真实搜索引擎交互。框架爱基于大模型预训练知识,转化为检索模块... Ai项目 2周前4,4350
Chatlog – 开源AI聊天记录分析工具,自动解析、可视化和挖掘聊天记录 Chatlog是什么 Chatlog是开源的聊天记录分析工具,支持高效解析、可视化和挖掘微信、QQ、Telegram等主流聊天工具的聊天记录。工具支持从本地数据库文件获取数据,提供智能分析、数据可视化... Ai项目 2周前6,8600
HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架 HunyuanCustom是什么 HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件,支持生成具有特定主体... Ai项目 2周前6,9650
VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务 VoiceCanvas是什么 VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和... Ai项目 2周前5,0900
DeerFlow – 字节跳动开源的深度研究框架 DeerFlow 是什么 DeerFlow 是字节跳动开源的深度研究框架,能帮助用户高效完成复杂的研究任务。DeerFlow结合语言模型与多种工具,如网络搜索、爬虫和 Python 执行,能快速生成全... Ai项目 2周前6,5600