Satori – 开源的大语言推理模型,具备自回归搜索和自我纠错能力 Satori是什么 Satori是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言模型,专注于提升推理能力。基于Qwen-2.5-Math-7B,Satori通过小规模的格式微调和大规模的增... Ai项目 5个月前02,4300
Goku – 港大和字节联合推出的最新视频生成模型 Goku是什么 Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectified flow Transformer框架,支持文生视频、图生视频及文生图... Ai项目 5个月前02,4900
AnythingLLM – 开源的全栈 AI 客户端,支持本地部署和API集成 AnythingLLM是什么 AnythingLLM 是开源免费且支持多模态交互的全栈 AI 客户端。AnythingLLM支持文本、图像和音频等多种输入方式,将任何文档或内容转化为上下文,供各种语言... Ai项目 5个月前02,3800
VideoCaptioner – AI视频字幕处理工具,支持字幕样式调整和多格式导出 VideoCaptioner是什么 VideoCaptioner(中文名:卡卡字幕助手)是基于大语言模型(LLM)的智能字幕处理工具,能简化视频字幕的生成与优化流程。VideoCaptioner支持语... Ai项目 5个月前02,6950
Zonos – ZyphraAI 开源的多语言 TTS 模型 Zonos是什么 Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zo... Ai项目 5个月前02,3350
InspireMusic – 阿里通义实验室开源的音乐生成技术 InspireMusic是什么 InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术,通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术,支持通过简单的文字描述或音频提示快速生成... Ai项目 5个月前02,2250
YAYI-Ultra – 中科闻歌推出的混合专家模型 YAYI-Ultra是什么 YAYI-Ultra (雅意)是中科闻歌研发的企业级大语言模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领域的专... Ai项目 5个月前03,2200
HUGWBC – 上海交大联合上海 AI Lab 推出的人形机器人全身控制器 HUGWBC是什么 HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器... Ai项目 5个月前02,2350
TPO – AI优化框架,动态调整推理模型的输出,更符合人类偏好 TPO是什么 TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TPO通过将奖励信号转化为文本反馈... Ai项目 5个月前02,2050
PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具 PDF to Podcast是什么 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动的音频内容,如播客。基于大型语... Ai项目 5个月前02,5100