Eagle 2.5 – 英伟达推出的视觉语言模型 Eagle 2.5是什么 Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参... Ai项目 2个月前1,2450
Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型 Skywork-R1V 2.0是什么 Skywork-R1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模型(Sk... Ai项目 2个月前1,3000
Flex.2-preview – Ostris 推出的文本到图像扩散模型 Flex.2-preview是什么 Flex.2-preview 是Ostris开源的 80 亿参数文本到图像扩散模型,支持通用控制输入(如线条、姿态、深度)和内置修复功能。模型基于一个模型满足多种创... Ai项目 2个月前1,6650
DAM-3B – 英伟达推出的多模态大语言模型 DAM-3B是什么 DAM-3B(Describe Anything 3B)是英伟达推出的多模态大语言模型,专为生成图像和视频中特定区域的详细描述设计。模型通过点、边界框、涂鸦或掩码等方式指定目标区域... Ai项目 2个月前1,2150
Psi R0 – 灵初智能推出的端到端具身模型 Psi R0是什么 Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环长程灵巧操作任务。Psi R... Ai项目 2个月前1,2150
FireCrawl – 开源 AI 网络爬虫工具,擅长处理动态网页内容、自动爬取网站及子页面 FireCrawl是什么 FireCrawl是开源的AI爬虫工具,专门用在Web数据提取,转换为Markdown或其他结构化数据。FireCrawl具备强大的抓取能力,支持动态网页内容处理,提供智能爬... Ai项目 2个月前2,9200
VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器 VideoVAE+是什么 VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE),通过引入新的时空分离压缩机制和文本指导,实现了对大... Ai项目 2个月前1,6700
Languine – 面向开发者自动化应用程序的多语言翻译 AI 工具 Languine是什么 Languine 是 AI 驱动的翻译工具,能帮助开发者简化应用程序的开发过程。Languine 基于智能检测、AI 翻译、自动化工作流程和开发者友好的设计,让翻译管理变得高效... Ai项目 2个月前1,0500
Figma-Low-Code – 将Figma设计转换为Vue.js应用程序的开源项目 Figma-Low-Code是什么 Figma-Low-Code是开源的项目,基于Luisa框架,支持开发者直接将Figma设计转换为Vue.js应用程序。大幅减少设计师与开发者之间的交接时间,减少前... Ai项目 2个月前1,3600
AI Dev Gallery – 微软推出面向Windows开发者本地运行AI模型的开源工具 AI Dev Gallery是什么 AI Dev Gallery是微软推出的开源AI工具包和示例库,集成在Visual Studio中,帮助Windows开发者轻松集成端侧AI功能。AI Dev Ga... Ai项目 2个月前1,4050