Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第64页

Muse – 微软研究院推出的生成式AI模型

Muse是什么 Muse是微软推出的首个用在游戏创意生成的生成式AI模型，基于“World and Human Action Model”（WHAM）。Muse能生成游戏视觉效果和控制器操作，基于学习...

Ai项目

12个月前

05,1500

FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架

FaceShot是什么 FaceShot是同济大学、上海 AI Lab和南京理工大学推出的新型无需训练的肖像动画生成框架。用外观引导的地标匹配模块和基于坐标的地标重定位模块，为各种角色生成精确且鲁棒的...

Ai项目

3周前

5,1450

FastExcel – 开源的高性能 Excel 处理工具

FastExcel是什么 FastExcel是基于Java的开源库，提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel，提供性能优化、bug修复，新...

Ai项目

3周前

5,1450

Zerox – 开源的OCR工具，零样本识别多种格式文件

Zerox是什么 Zerox是开源的本地化高精度OCR工具，基于GPT-4o-mini模型，无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件，擅长处理扫描版文档及复杂布局...

Ai项目

3周前

5,1450

CustomVideoX – 中科大联合浙大等推出的个性化视频生成框架

CustomVideoX是什么 CustomVideoX 是中科大和浙大等联合提出的创新的个性化视频生成框架，通过参考图像和文本描述生成高质量的定制化视频。框架基于视频扩散变换器（Video Diff...

Ai项目

12个月前

05,1450

FlexTok – Apple 联合 EPFL 推出的图像处理技术

FlexTok是什么 FlexTok 是瑞士洛桑联邦理工学院（EPFL）和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列（token sequences），以灵活的长度描述图...

Ai项目

12个月前

05,1450

VACE – 阿里通义推出的视频生成与编辑框架

VACE是什么 VACE（Video Creation and Editing）是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视频任务（如参考视频生成、视频到视频编辑、遮罩编辑等）到...

Ai项目

12个月前

05,1450

文心大模型X1 – 百度推出的深度思考模型

文心大模型X1是什么文心大模型X1是百度推出的深度思考模型。具备“长思维链”，擅长中文知识问答、文学创作、逻辑推理等。X1增加了多模态能力，能理解和生成图片，能调用工具生成代码、图表等丰富内容。基于...

Ai项目

12个月前

05,1450

ModernBERT – 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

ModernBERT是什么 ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型，是...

Ai项目

3周前

5,1400

video-analyzer – AI 视频分析工具，提取视频关键帧、生成视频详细描述

video-analyzer是什么 video-analyzer 是开源的视频分析工具，结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容，并生成视频的详细...

Ai项目

3周前

5,1400