Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第43页

DiffSensei – AI 漫画生成框架，能生成可控的黑白漫画面板

DiffSensei是什么 DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架，能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生成器和多模态...

Ai项目

2周前

4,6150

Maya – 开源多语言多模态模型，能处理和理解八种不同语言

Maya是什么 Maya是开源的多语言多模态模型，基于指令微调扩展模型在多种语言和文化背景下的能力。Maya基于LLaVA框架，包含新创建的包含八种语言的预训练数据集，提高视觉-语言任务中的文化和语言...

Ai项目

2周前

4,5600

千影 QianYing – 巨人网络推出的有声游戏生成大模型

千影 QianYing是什么千影 QianYing是巨人网络推出的有声游戏生成大模型，包含游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame面向开放世界游戏，是巨...

Ai项目

2周前

4,6500

Promptic – 轻量级LLM应用开发框架，通过一行代码切换不同LLM

Promptic是什么 Promptic是轻量级的LLM应用开发框架，提供高效且符合Python风格的开发方式。基于LiteLLM，Promptic支持开发者能轻松切换不同的LLM服务提供商，只需更改...

Ai项目

2周前

4,9950

SwiftEdit – AI文本引导图像编辑框架，0.23秒内实现高质量的图像编辑

SwiftEdit是什么 SwiftEdit是VinAI Research团队推出的文本引导的图像编辑框架，基于创新的一步扩散技术，能在0.23秒内实现快速且高质量的图像编辑。工具的核心优势在于一步反...

Ai项目

2周前

5,6300

ChatMCP – AI 聊天客户端，基于 MCP 支持多语言和自动化安装

ChatMCP是什么 ChatMCP 是基于模型上下文协议（MCP）的 AI 聊天客户端，支持与各种大型语言模型（LLM）如 OpenAI、Claude 和 OLLama 等进行交互。ChatMCP具...

Ai项目

2周前

5,1700

Multimodal Live API – 谷歌推出支持多模态交互、低延迟实时互动的AI接口

Multimodal Live API是什么 Multimodal Live API 是谷歌推出的低延迟、双向交互的AI接口，支持文本、音频和视频输入，用音频和文本形式输出，能帮助开发者构建具有实时音...

Ai项目

2周前

3,9900

CodeArena – 用于测试不同LLM编程能力的在线平台

CodeArena是什么 CodeArena是在线平台，基于让多个大型语言模型（LLM）同时构建相同的应用程序，实时显示排名结果，比较LLM生成代码的能力。CodeArena平台主要评估和比较不同LL...

Ai项目

2周前

5,2700

Phi-4 – 微软开源的14B参数小语言模型，擅长数学等领域的复杂推理

Phi-4是什么 Phi-4是微软推出的14B参数小型语言模型，在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点，大量融入合成数据，提升模型在STEM问答和数学竞...

Ai项目

2周前

7,3750

Insight-V – 提升长链视觉推理能力的多模态模型

Insight-V是什么 Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型，能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流程生产高质量的推理...

Ai项目

2周前

5,0200