Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第8页

AutoMouser – AI Chrome扩展程序，实时交互跟踪自动生成测试代码

AutoMouser是什么 AutoMouser是Chrome扩展程序，能智能地跟踪用户交互，基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作，如点击、拖动、悬停...

Ai项目

2周前

5,5300

MangaNinja – 基于参考图像的线稿着色技术

MangaNinja是什么 MangaNinja是基于参考图像的线稿上色方法，具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案，提升了上色的准确性与图像质量。能应对多样化的上色挑战...

Ai项目

2周前

4,9650

CogView-3-Flash – 智谱推出的首个免费AI图像生成模型

CogView-3-Flash 是什么 CogView-3-Flash 是智谱推出的首个免费AI图像生成模型，能根据文本描述生成高审美分数的图像，支持多种分辨率，满足专业领域需求。模型具备创意多样性...

Ai项目

2周前

4,2200

GLM-Realtime – 智谱推出的端到端多模态模型

GLM-Realtime是什么 GLM-Realtime是智谱推出的全新端到端多模态模型，具备低延迟的视频理解与语音交互能力，特别融入清唱功能，让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容...

Ai项目

2周前

4,7400

Step R-mini – 阶跃星辰推出的 Step 系列首个推理模型

Step R-mini是什么 Step R-mini（全称Step Reasoner mini）是阶跃星辰推出的推理模型，是 Step 系列模型家族的首个推理模型，擅长主动规划、尝试和反思，基于慢思...

Ai项目

2周前

5,0350

RealtimeSTT – AI实时语音转文本库，自动检测说话的开始与结束

RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库，专为低延迟应用设计。有强大的语音活动检测功能，可自动识别说话的开始与结束，通过WebRTCVAD和SileroVAD进行精...

Ai项目

2周前

4,9300

Pipecat – 构建语音和多模态对话代理的开源框架

Pipecat是什么 Pipecat是开源的Python框架，专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音（TTS）和对话处理功能，简化AI服务的复杂协调、网络传输、音频处理和多模态...

Ai项目

2周前

5,3700

RAIN – 视频流制作实时动画生成和真人表情移植解决方案

RAIN是什么 RAIN（Real-time Animation Of Infinite Video Stream）是创新的实时动画解决方案，基于消费级硬件，如单个RTX 4090 GPU，实现无限视...

Ai项目

2周前

5,1400

Luma Ray2 – Luma AI 推出的最新视频生成模型

Luma Ray2是什么 Luma Ray2 是 Luma AI 推出的最新视频生成模型，Ray2 基于 Luma 新的多模态架构训练后展现出先进功能，该架构的计算能力是 Ray1 的 10 倍。能生...

Ai项目

2周前

6,7900

KHOJ – 开源 AI 个人化助手，一站式知识管理工具

KHOJ是什么 KHOJ是开源的个人化AI助手，帮助用户整合和检索知识。支持连接用户的在线和本地文档，如PDF、Markdown、纯文本、GitHub和Notion文件等，通过语义搜索功能，快速找到所...

Ai项目

2周前

6,0200