InternVL – OpenGVLab 推出的多模态大模型 InternVL是什么 InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型,专注于视觉与语言任务。采用 ViT-MLP-LLM 架构,通过视觉模块(如 InternViT... Ai项目 1年前06,0000
Umi-OCR – 免费 OCR 文字识别工具,支持截图、批量图片排版解析 Umi-OCR是什么 Umi-OCR 是免费开源的离线 OCR 文字识别软件。无需联网,解压即用,支持截图、批量图片、PDF 扫描件的文字识别,能识别数学公式、二维码,可生成双层可搜索 PDF。内置多... Ai项目 1年前05,4400
Orpheus TTS – 开源AI语音合成系统,支持多种语音风格 Orpheus TTS是什么 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克... Ai项目 1年前04,9600
o1-pro – OpenAI 推出的升级版推理模型 o1-pro是什么 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势在于显著提升的计算能力,能更好地应对复杂问题,提供更一... Ai项目 1年前05,4650
Crack Coder – AI技术面试工具,提供实时编程问题支持 Crack Coder是什么 Crack Coder 是开源的隐形 AI 辅助工具,专为技术面试设计。Crack Coder支持在后台运行,完全隐形,无法被屏幕录制或监控软件检测到。Crack Cod... Ai项目 1年前05,8050
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息 YT Navigator是什么 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能... Ai项目 1年前04,9200
Step-Video-TI2V – 阶跃星辰开源的图生视频模型 Step-Video-TI2V是什么 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有 300 亿参数,能根据文本描述和图像... Ai项目 1年前05,1600
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目 Dify-Plus是什么 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额... Ai项目 1年前09,5450
gpt-4o-transcribe – OpenAI 推出的语音转文本模型 gpt-4o-transcribe是什么 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降... Ai项目 1年前04,7300
GPT-4o mini TTS – OpenAI 推出的文本转语音模型 GPT-4o mini TTS是什么 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、情感和风格,例... Ai项目 1年前05,8100