TripoSF – VAST AI 开源的新一代 3D 基础模型 TripoSF是什么 TripoSF是VAST推出的新一代3D基础模型,突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法,结合稀疏体素结构,仅在物体表面附近的区域存储... Ai项目 12个月前05,1000
Multi-SWE-bench – 字节豆包开源的多语言代码修复基准 Multi-SWE-bench是什么 Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括... Ai项目 12个月前05,1000
The Language of Motion – 斯坦福李飞飞团队推出的统一多模态语言模型 The Language of Motion是什么 The Language of Motion是斯坦福大学李飞飞团队推出的多模态语言模型,能整合人类动作中的言语和非言语语言。模型能处理文本、语音和动... Ai项目 3周前5,0950
R2R – AI 检索增强生成应用开发平台,支持多模态内容处理、混合搜索、知识图谱构建 R2R是什么 R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索生成)。R2R集成多模态内容摄取、混合搜索、知识图谱构建、GraphRAG聚类分... Ai项目 3周前5,0950
Memory Layers – Meta 开源不增加算力时增加大模型的参数方法 Memory Layers是什么 Memory Layers是Meta推出的用可训练的键值查找机制为模型增加额外参数的方法,它不会增加浮点运算次数(FLOPs)。基于稀疏激活Memory Layers... Ai项目 3周前5,0950
MAETok – 港大联合北大等机构推出的自动编码器 MAETok是什么 MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的扩散模型的新型图像标记化方法。MAETok基于掩码建模(M... Ai项目 12个月前5,0950
OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架 OThink-MR1是什么 OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖... Ai项目 12个月前05,0950
RAGEN – 训练大模型推理 Agent 的开源强化学习框架 RAGEN是什么 RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Poli... Ai项目 3周前5,0900
TANGOFLUX – 英伟达联合新加坡科技设计大学开源的文本到音频生成模型 TANGOFLUX是什么 TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40 GPU上仅用3.7秒生成长达... Ai项目 3周前5,0900
RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束 RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCVAD和SileroVAD进行精... Ai项目 3周前5,0900