Qwen2vl-Flux – 开源的多模态图像生成模型,支持多种生成模式 Qwen2vl-Flux是什么 Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成... Ai项目 5个月前2,4050
Genie 2 – 谷歌DeepMind推出的最新一代基础世界模型 Genie 2是什么 Genie 2是DeepMind推出的新一代大规模基础世界模型,仅凭一张图片生成长达1分钟的可交互3D游戏世界。Genie 2能模拟出物体交互、角色动画、物理效果等复杂动态,支持... Ai项目 5个月前2,4050
Optimus-1 – 哈工大联合鹏城实验室推出的智能体框架 Optimus-1是什么 Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让智能体更好地执行复杂任务... Ai项目 5个月前2,4050
Qwen-Agent – 阿里通义开源的 Agent 应用开发框架 Qwen-Agent是什么 Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agen... Ai项目 5个月前2,4050
Step-Video V2 – 阶跃星辰推出的升级版视频生成模型 Step-Video V2是什么 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和创新,采用了更高压缩比的VAE模型以及深度优化的DiT... Ai项目 5个月前2,4050
Crawl4LLM – 清华和卡内基梅隆大学联合开源的智能爬虫系统 Crawl4LLM是什么 Crawl4LLM 是清华大学和卡内基梅隆大学联合开源的智能爬虫系统,提升大语言模型(LLM)预训练效率。Crawl4LLM基于智能评估网页对 LLM 预训练的价值,优先抓取... Ai项目 5个月前02,4050
R1-Onevision – 开源多模态视觉推理模型,基于 Qwen2.5-VL 微调 R1-Onevision是什么 R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在... Ai项目 5个月前02,4050
AgiBot Digital World – 智元机器人推出的机器人仿真框架 AgiBot Digital World是什么 AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能研究与应用提供高效支持。AgiBot Digital ... Ai项目 5个月前02,4050
Kiss3DGen – 基于图像扩散模型的3D资产生成框架 Kiss3DGen是什么 Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle Image”,将多视图图像及... Ai项目 5个月前02,4050
Luma Photon – Luma AI 推出的全新图像生成模型 Luma Photon是什么 Luma Photon 是 Luma AI 推出的新一代图像生成模型,用创新的架构提供超高图像质量和低成本效率。Luma Photon支持个性化和创造性的图像生成,能理解... Ai项目 5个月前2,4000