Social Media Agent – AI社交媒体内容管理工具,输入URL自动生成帖子 Social Media Agent是什么 Social Media Agent是智能的社交媒体内容管理工具,能帮用户收集、整理和安排发布社交媒体帖子,基于输入的URL内容生成Twitter和Link... Ai项目 5个月前02,1100
Matrix-Zero – 昆仑万维推出的世界模型 Matrix-Zero是什么 Matrix-Zero是昆仑万维推出的世界模型,包含两款子模型:3D场景生成大模型和可交互视频生成大模型。Matrix-Zero能将用户输入的图片转化为可自由探索的真实3... Ai项目 5个月前04,1600
Sa2VA – 字节跳动等机构开源的多模态大语言模型 Sa2VA是什么 Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任... Ai项目 5个月前02,9800
WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集 WebLI-100B是什么 WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数... Ai项目 5个月前03,3400
BAG – 港中文联合腾讯推出的3D可穿戴资产生成技术 BAG是什么 BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术,通过结合多视图图像扩散模型和控制网络... Ai项目 5个月前02,5850
通古大模型 – 华南理工大学推出的古籍大语言模型 通古大模型是什么 通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练,使用24.1亿古籍... Ai项目 5个月前02,6550
ENEL – 上海 AI Lab 推出的无编码器3D大型多模态模型 ENEL是什么 ENEL(Exploring the Potential of Encoder-free Architectures in 3D LMMs)是创新的无编码器3D大型多模态模型(3D L... Ai项目 5个月前01,9450
AnyCharV – 港中文联合清华等机构推出的角色可控视频生成框架 AnyCharV是什么 AnyCharV是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,生成高质量的角色视频。AnyChar... Ai项目 5个月前02,6000
NobodyWho – AI游戏引擎插件,本地运行 LLM 实现互动小说创作 NobodyWho是什么 NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需... Ai项目 5个月前02,6600
PIKE-RAG – 微软亚洲研究院推出的检索增强型生成框架 PIKE-RAG是什么 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能... Ai项目 5个月前03,3350