Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第82页

DeepRant 鲸喷 – 专为游戏玩家设计的多语言快捷翻译开源工具

DeepRant 鲸喷是什么 DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能帮助玩家在国际服务器中快速进行文字交流，消除语言障碍。玩家在游戏中选中文字后按下快捷键，翻...

Ai项目

12个月前

04,8150

StochSync – AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像

StochSync是什么 StochSync（Stochastic Diffusion Synchronization）是创新的图像生成技术，专门用于在复杂空间（如360°全景图或3D表面纹理）中生成...

Ai项目

12个月前

04,3500

Sonic – 腾讯联合浙大推出的音频驱动肖像动画框架

Sonic是什么 Sonic是腾讯和浙江大学推出的音频驱动肖像动画框架，基于全局音频感知生成逼真的面部表情和动作。Sonic基于上下文增强音频学习和运动解耦控制器，分别提取音频片段内的长期时间音频知识...

Ai项目

12个月前

04,9400

FireRedASR – 小红书开源的自动语音识别模型

FireRedASR是什么 FireRedASR 是小红书开源的工业级自动语音识别（ASR）模型家族，支持普通话、中文方言和英语，在普通话 ASR 基准测试中达到了新的最佳水平（SOTA），在歌词识别...

Ai项目

12个月前

04,5500

MVoT – 微软联合剑桥和中科院推出的多模态推理可视化框架

MVoT是什么 MVoT（Multimodal Visualization-of-Thought）是微软研究院、剑桥大学语言技术实验室、中国科学院自动化研究所推出的新型多模态推理范式，基于生成图像可视...

Ai项目

12个月前

06,8300

DynVFX – AI视频增强技术，将新动态内容与原始视频无缝融合

DynVFX是什么 DynVFX是创新的视频增强技术，能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉语言模型（VLM），实现了在不依赖复杂用户输入的情况下...

Ai项目

12个月前

04,6400

WorldSense – 小红书联合上海交大推出的多模态全面评测新基准

WorldSense是什么 WorldSense是小红书和上海交通大学推出的，用在评估多模态大型语言模型（MLLMs）在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSens...

Ai项目

12个月前

04,5200

Kiln AI- 开源 AI 原型设计和数据集协作开发工具，微调专属模型

Kiln AI是什么 Kiln AI是开源的 AI 开发工具，能简化大型语言模型（LLM）的微调、合成数据生成和数据集协作。Kiln AI提供直观的桌面应用程序，支持 Windows、MacOS 和 ...

Ai项目

12个月前

04,9900

Airweave – 将任何应用程序转为 Agent 知识库的开源工具

Airweave是什么 Airweave 是开源工具，能将任何应用程序的数据（包括API、数据库、网站等）同步到图数据库和向量数据库中，让数据能基于智能代理或搜索机制进行检索。Airweave用数据分...

Ai项目

12个月前

05,1250

MotionCanvas – 港中文和 Adobe 等机构推出的可控图像到视频生成方法

MotionCanvas是什么 MotionCanvas是香港中文大学、Adobe 研究院和莫纳什大学推出的图像到视频（I2V）生成方法，能将静态图像转化为具有丰富动态效果的视频。MotionCanv...

Ai项目

12个月前

04,4700