Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型 Open Materials 2024是什么 Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集,专注于无机材... Ai项目 2个月前1,5300
CodeDPO – 北京大学联合字节共同推出的代码生成优化框架 CodeDPO是什么 CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架,能提升代码模型在正确性和效率方面的表现。框架基于自生成和验证机制,同时构建和评估代码及其测试用例,用PageRank... Ai项目 2个月前9700
Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务 Voice-Pro是什么 Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言... Ai项目 2个月前1,2450
Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术 Generative Omnimatte是什么 Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每... Ai项目 2个月前1,5050
GLM-PC – 智谱推出的电脑智能体,基于CogAgent视觉多模态模型构建 GLM-PC是什么 GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务,如文档处理、网页搜索、信息整理、社交互动等... Ai项目 2个月前1,4900
TryOffDiff – AI虚拟试穿技术,单张穿着者图片生成标准化服装图像 TryOffDiff是什么 TryOffDiff(VTOFF)是基于扩散模型的新型虚拟试穿技术,用高保真服装重建实现虚拟试穿,专注于从单张穿着者照片生成标准化的服装图像。与传统的Virtual Try... Ai项目 2个月前1,2400
GLM-Edge – 智谱开源的端侧大语言和多模态系列模型 GLM-Edge是什么 GLM-Edge是智谱开源的一系列端侧部署优化的大语言对话模型和多模态理解模型,包含GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V... Ai项目 2个月前1,2950
FlagevalMM – 智源开源的多模态模型评测框架 FlagevalMM是什么 FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,支持多种任务和指标。框架采用评测与模型推理解耦的设计... Ai项目 2个月前1,4950
Delta-CoMe – 清华联合 OpenBMB 等高校开源的新型增量压缩算法 Delta-CoMe是什么 Delta-CoMe是清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法,一个80G的A100 GPU能轻松加载多达50个7B模型... Ai项目 2个月前1,2950
Agent-E – 基于AutoGen代理框架构建的AI浏览器自动化系统 Agent-E是什么 Agent-E是基于AutoGen代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。Agent-E基于自然语言交互,能执行填写表单、搜索排序电商产品、定位网页内容、管理网... Ai项目 2个月前1,4050