CogView-3-Flash – 智谱推出的首个免费AI图像生成模型 CogView-3-Flash 是什么 CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,能根据文本描述生成高审美分数的图像,支持多种分辨率,满足专业领域需求。模型具备创意多样性... Ai项目 5个月前2,3400
MangaNinja – 基于参考图像的线稿着色技术 MangaNinja是什么 MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与图像质量。能应对多样化的上色挑战... Ai项目 5个月前2,5150
AutoMouser – AI Chrome扩展程序,实时交互跟踪自动生成测试代码 AutoMouser是什么 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作,如点击、拖动、悬停... Ai项目 5个月前2,6400
CogVideoX-Flash – 智谱推出的首个免费AI视频生成模型 CogVideoX-Flash是什么 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频理解模型,具备强大的视频生成能力。CogVideoX... Ai项目 5个月前2,2950
Mini-InternVL – 上海AI Lab联合清华等机构推出的轻量级多模态大模型 Mini-InternVL是什么 Mini-InternVL是“迷你版”书生·万象大模型,是上海AI实验室与清华大学、南京大学等机构联合推出的轻量级多模态大型语言模型系列,包含1B、2B和4B三个参数... Ai项目 5个月前2,2450
Weebo – AI语音聊天机器人,实时响应用户语音指令和问题 Weebo是什么 Weebo是实时语音聊天机器人,基于Whisper Small、Llama 3.2和Kokoro-82M技术驱动。能通过语音识别和生成技术,与用户进行自然流畅的对话,提供实时的语音交... Ai项目 5个月前2,7000
ParGo – 字节与中山大学联合推出的多模态大模型连接器 ParGo是什么 ParGo是字节团队与中山大学合作提出的创新的多模态大语言模型连接器,提升视觉和语言模态在多模态大语言模型(MLLMs)中的对齐效果。通过结合局部token和全局token,使用精心... Ai项目 5个月前2,1300
MatterGen – 微软推出的无机材料生成模型 MatterGen是什么 MatterGen是微软推出的创新生成模型,专门用在设计无机材料。基于独特的扩散过程,逐步细化原子类型、坐标和周期晶格,生成跨越周期表的稳定、多样化的无机材料。MatterG... Ai项目 5个月前2,4900
XMusic – 腾讯多媒体实验室自主研发的AI通用作曲框架 XMusic是什么 XMusic是腾讯多媒体实验室自主研发的AI通用作曲框架。用户只需上传视频、图片、文字、标签、哼唱等任意内容,XMusic能生成情绪、曲风、节奏可控的高质量音乐。基于自研的多模态和... Ai项目 5个月前2,4750
Seaweed APT – 字节跳动推出的单步图像和视频生成项目 Seaweed APT是什么 Seaweed APT是字节跳动推出的对抗性后训练(Adversarial Post-Training)模型,能实现图像和视频的一站式生成。Seaweed APT基于预训... Ai项目 5个月前2,2600