Muse – 微软研究院推出的生成式AI模型 Muse是什么 Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习... Ai项目 12个月前05,1500
FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架 FaceShot是什么 FaceShot是同济大学、上海 AI Lab和南京理工大学推出的新型无需训练的肖像动画生成框架。用外观引导的地标匹配模块和基于坐标的地标重定位模块,为各种角色生成精确且鲁棒的... Ai项目 3周前5,1450
FastExcel – 开源的高性能 Excel 处理工具 FastExcel是什么 FastExcel是基于Java的开源库,提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel,提供性能优化、bug修复,新... Ai项目 3周前5,1450
Zerox – 开源的OCR工具,零样本识别多种格式文件 Zerox是什么 Zerox是开源的本地化高精度OCR工具,基于GPT-4o-mini模型,无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件,擅长处理扫描版文档及复杂布局... Ai项目 3周前5,1450
CustomVideoX – 中科大联合浙大等推出的个性化视频生成框架 CustomVideoX是什么 CustomVideoX 是中科大和浙大等联合提出的创新的个性化视频生成框架,通过参考图像和文本描述生成高质量的定制化视频。框架基于视频扩散变换器(Video Diff... Ai项目 12个月前05,1450
FlexTok – Apple 联合 EPFL 推出的图像处理技术 FlexTok是什么 FlexTok 是瑞士洛桑联邦理工学院(EPFL)和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列(token sequences),以灵活的长度描述图... Ai项目 12个月前05,1450
VACE – 阿里通义推出的视频生成与编辑框架 VACE是什么 VACE(Video Creation and Editing)是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视频任务(如参考视频生成、视频到视频编辑、遮罩编辑等)到... Ai项目 12个月前05,1450
文心大模型X1 – 百度推出的深度思考模型 文心大模型X1是什么 文心大模型X1是百度推出的深度思考模型。具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等。X1增加了多模态能力,能理解和生成图片,能调用工具生成代码、图表等丰富内容。基于... Ai项目 12个月前05,1450
ModernBERT – 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型 ModernBERT是什么 ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型,是... Ai项目 3周前5,1400
video-analyzer – AI 视频分析工具,提取视频关键帧、生成视频详细描述 video-analyzer是什么 video-analyzer 是开源的视频分析工具,结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容,并生成视频的详细... Ai项目 3周前5,1400