Large Action Models – 微软推出的行动大模型开发框架 Large Action Models是什么 Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large L... Ai项目 5个月前2,7600
Freestyler – 西工大联合微软和香港大学推出的说唱乐生成模型 Freestyler是什么 Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组(ASLP@NPU)、微软及香港中文大学深圳研究院大数据研究所共同推出的说唱乐生成模型,能直接根据歌... Ai项目 5个月前2,7550
BrushEdit – 腾讯和北大等联合推出的图像编辑框架,指令引导图像编辑和修复 BrushEdit是什么 BrushEdit是腾讯、北京大学、香港中文大学及清华大学联合推出的先进图像编辑框架,是BrushNet模型的高级迭代版本。框架结合多模态大型语言模型(MLLMs)和双分支图... Ai项目 5个月前2,7500
SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型 SpeechGPT 2.0-preview是什么 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交互系统,基于百万小时级中文语音数据训练,采用端到端架构... Ai项目 5个月前2,7500
Mooncake – 月之暗面Kimi联合清华等机构推出的大模型推理架构 Mooncake是什么 Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充分利用的... Ai项目 5个月前2,7450
Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型 Embodied Reasoner是什么 Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型,基于视觉搜索、推理和行动协同完成复杂任务... Ai项目 4个月前2,7400
TPDM – 西湖大学联合北大等高校推出的时间预测扩散模型 TPDM是什么 TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能... Ai项目 5个月前2,7400
CodeArena – 用于测试不同LLM编程能力的在线平台 CodeArena是什么 CodeArena是在线平台,基于让多个大型语言模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成代码的能力。CodeArena平台主要评估和比较不同LL... Ai项目 5个月前2,7400
Vision Parse – 开源的 PDF 转 Markdown 工具 Vision Parse是什么 Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别... Ai项目 5个月前2,7400
Concept Lancet – 宾夕法尼亚大学推出的图像编辑框架 Concept Lancet是什么 Concept Lancet(CoLan)是宾夕法尼亚大学的研究团队推出的零样本、即插即用的图像编辑框架。Concept Lancet基于在潜在空间中对图像进行稀疏... Ai项目 4个月前2,7350