StoryTeller – 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统 StoryTeller是什么 StoryTeller是字节跳动、上海交通大学和北京大学共同推出的系统,能基于音频视觉角色识别技术改善长视频描述的质量和一致性。系统结合低级视觉概念和高级剧情信息,生成详... Ai项目 5个月前2,6200
ViewExtrapolator – 南洋理工联合UCAS团队推出的新型视图合成方法 ViewExtrapolator是什么 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SV... Ai项目 5个月前2,6200
Amurex – 开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息 Amurex是什么 Amurex是AI会议助手,基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能,帮助用户提升会议效率。作为开源工具,Amurex强调透明度、安全性和隐私保护,让... Ai项目 5个月前2,6200
3D-Speaker – 阿里通义推出的多模态说话人识别任务开源项目 3D-Speaker是什么 3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目,基于结合声学、语义、视觉信息,实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模型、训... Ai项目 5个月前2,6200
NeuralSVG – 文本驱动矢量图形生成技术,转化为有层次结构的矢量图形 NeuralSVG是什么 NeuralSVG是创新的文本驱动矢量图形生成技术。通过一个小型的多层感知器网络,将文本提示转化为具有层次结构的矢量图形。该网络以形状索引为输入,输出形状参数,再经可微渲染器... Ai项目 5个月前2,6200
SurveyX – 人民大学联合悉尼大学等推出自动化生成学术综述的系统 SurveyX是什么 SurveyX 是基于大型语言模型(LLMs)自动化生成学术综述的系统,是中国人民大学、悉尼大学和中国东北大学联合推出的。基于用户提供论文标题和关键词,快速生成高质量、特定领域的... Ai项目 5个月前02,6200
ASAL – Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统 ASAL是什么 ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)的系统。ASAL是Sakana AI及MIT、OpenA... Ai项目 5个月前2,6150
AI Dev Gallery – 微软推出面向Windows开发者本地运行AI模型的开源工具 AI Dev Gallery是什么 AI Dev Gallery是微软推出的开源AI工具包和示例库,集成在Visual Studio中,帮助Windows开发者轻松集成端侧AI功能。AI Dev Ga... Ai项目 5个月前2,6150
Jina Reader – AI 网页解析工具,一键将网页内容转为适配LLM的文本格式 Jina Reader是什么 Jina Reader 是 Jina AI 推出的开源工具,能将互联网上的 HTML 网页内容转换为适合大型语言模型(LLMs)处理的纯文本格式。用户只需在网址前添加特定... Ai项目 5个月前2,6150
MultiFoley – Adobe 联合密歇根大学推出的音效生成系统 MultiFoley是什么 MultiFoley是Adobe Research和密歇根大学共同推出的音效生成系统,能基于文本、音频和视频的多模态控制生成Foley声音效果。系统支持用户根据文本提示、参... Ai项目 5个月前2,6100