Vision Parse – 开源的 PDF 转 Markdown 工具 Vision Parse是什么 Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别... Ai项目 2周前6,6600
SnapGen – Snap联合港科大等机构推出的移动端文生图模型 SnapGen是什么 SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像(T2I)扩散模型,能在移动设备上快速生成高分辨率(1024×1024像素)的图像... Ai项目 2周前6,6550
腾讯混元T1 – 腾讯混元推出的最新深度思考模型 T1是什么 T1(Thinker)是腾讯混元推出的最新深度思考模型,已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考,支持联网搜索功能,能从互联网信源、微信公众号、视频号等腾讯生态内容中获取信息... Ai项目 12个月前06,6500
SEMIKONG – 专为半导体领域设计的大型语言模型 SEMIKONG是什么 SEMIKONG是专门为半导体行业定制的大型语言模型(LLM),是Aitomatic、FPT Software和东京电子有限公司联合推出的。基于深入的领域知识,解决半导体制造和... Ai项目 2周前6,6450
LHM – 阿里通义开源的单图生成可动画3D人体模型 LHM是什么 LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transform... Ai项目 12个月前06,6450
DevDocs – 开源的技术文档爬取和处理工具 DevDocs是什么 DevDocs 是专为程序员和开发者设计的开源技术文档爬取和处理工具,基于智能爬虫技术,快速爬取、整理技术文档,将理解文档的时间从数周缩短至几小时。DevDocs支持1-5层深度... Ai项目 12个月前06,6450
DELIFT – 数据高效语言模型指令微调算法 DELIFT是什么 DELIFT(Data Efficient Language model Instruction Fine-Tuning)是基于高效数据优化语言模型指令微调,一种新颖的算法,用在优... Ai项目 2周前6,6300
DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架 DreamFit是什么 DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。框架能显著减少模型复杂度和训练成本,基于... Ai项目 2周前6,6200
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统 AnimeGamer是什么 AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用动漫角色的身份沉浸于动... Ai项目 12个月前06,6200
MV-Adapter – 北航联合 VAST 等开源的多视图一致图像生成模型 MV-Adapter是什么 MV-Adapter是多视图一致图像生成模型,是北京航空航天大学、VAST和上海交通大学的研究团队推出的。MV-Adapter能将预训练的文本到图像扩散模型转化为多视图图像... Ai项目 2周前6,6100