WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集 WebLI-100B是什么 WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数... Ai项目 12个月前05,9200
BAG – 港中文联合腾讯推出的3D可穿戴资产生成技术 BAG是什么 BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术,通过结合多视图图像扩散模型和控制网络... Ai项目 12个月前06,2650
通古大模型 – 华南理工大学推出的古籍大语言模型 通古大模型是什么 通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练,使用24.1亿古籍... Ai项目 12个月前06,1750
ENEL – 上海 AI Lab 推出的无编码器3D大型多模态模型 ENEL是什么 ENEL(Exploring the Potential of Encoder-free Architectures in 3D LMMs)是创新的无编码器3D大型多模态模型(3D L... Ai项目 12个月前04,2050
AnyCharV – 港中文联合清华等机构推出的角色可控视频生成框架 AnyCharV是什么 AnyCharV是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,生成高质量的角色视频。AnyChar... Ai项目 12个月前05,0600
NobodyWho – AI游戏引擎插件,本地运行 LLM 实现互动小说创作 NobodyWho是什么 NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需... Ai项目 12个月前07,1600
PIKE-RAG – 微软亚洲研究院推出的检索增强型生成框架 PIKE-RAG是什么 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能... Ai项目 12个月前05,6450
Collaborative Gym – 支持人与AI代理实时交互协作的评估框架 Collaborative Gym是什么 Collaborative Gym(Co-Gym)是专注于人机协作(Human-Agent Collaboration)的框架,支持人类与AI代理之间的实时交... Ai项目 12个月前04,8200
TIGER – 清华大学推出的轻量级语音分离模型 TIGER是什么 TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)是清华大学研究团队提出的轻量级... Ai项目 12个月前07,6050
NPOA – 开源舆情检测工具,实时监控网络舆情与分析 NPOA是什么 NPOA 是开源的功能强大的舆情监测工具,可以帮助用户实时监控网络舆情,了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理技术,可以分析大量的网络数据,提供可视化的舆情分析报告... Ai项目 12个月前05,4800