AutoMouser – AI Chrome扩展程序,实时交互跟踪自动生成测试代码 AutoMouser是什么 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作,如点击、拖动、悬停... Ai项目 2周前5,5300
MangaNinja – 基于参考图像的线稿着色技术 MangaNinja是什么 MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与图像质量。能应对多样化的上色挑战... Ai项目 2周前4,9650
CogView-3-Flash – 智谱推出的首个免费AI图像生成模型 CogView-3-Flash 是什么 CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,能根据文本描述生成高审美分数的图像,支持多种分辨率,满足专业领域需求。模型具备创意多样性... Ai项目 2周前4,2200
GLM-Realtime – 智谱推出的端到端多模态模型 GLM-Realtime是什么 GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容... Ai项目 2周前4,7400
Step R-mini – 阶跃星辰推出的 Step 系列首个推理模型 Step R-mini是什么 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长主动规划、尝试和反思,基于慢思... Ai项目 2周前5,0350
RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束 RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCVAD和SileroVAD进行精... Ai项目 2周前4,9300
Pipecat – 构建语音和多模态对话代理的开源框架 Pipecat是什么 Pipecat是开源的Python框架,专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音(TTS)和对话处理功能,简化AI服务的复杂协调、网络传输、音频处理和多模态... Ai项目 2周前5,3700
RAIN – 视频流制作实时动画生成和真人表情移植解决方案 RAIN是什么 RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于消费级硬件,如单个RTX 4090 GPU,实现无限视... Ai项目 2周前5,1400
Luma Ray2 – Luma AI 推出的最新视频生成模型 Luma Ray2是什么 Luma Ray2 是 Luma AI 推出的最新视频生成模型,Ray2 基于 Luma 新的多模态架构训练后展现出先进功能,该架构的计算能力是 Ray1 的 10 倍。能生... Ai项目 2周前6,7900
KHOJ – 开源 AI 个人化助手,一站式知识管理工具 KHOJ是什么 KHOJ是开源的个人化AI助手,帮助用户整合和检索知识。支持连接用户的在线和本地文档,如PDF、Markdown、纯文本、GitHub和Notion文件等,通过语义搜索功能,快速找到所... Ai项目 2周前6,0200