ImageRAG – 基于检索增强生成的图像生成技术 ImageRAG是什么 ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技术,通过动态检索相关图像来提升文本到图像(T2I)模型... Ai项目 12个月前06,0450
X-R1 – 基于强化学习的低成本训练框架 X-R1是什么 X-R1是基于强化学习的低成本训练框架,能加速大规模语言模型的后训练(Scaling Post-Training)开发。X-R1用极低的成本训练0.5B(5亿参数)规模的R1-Zero... Ai项目 12个月前04,4650
Step-Video-T2V – 阶跃星辰开源的文本到视频模型 Step-Video-T2V是什么 Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型,拥有 300 亿参数,能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器... Ai项目 12个月前05,4950
unsloth – 开源的大语言模型微调工具 unsloth是什么 unsloth 是开源的大语言模型(LLM)微调工具,基于优化计算步骤和 GPU 内核,显著提升模型训练速度减少内存使用。Unsloth支持多种主流 LLM,如 Llama-3... Ai项目 12个月前05,0000
Matrix3D – 南大联合Apple、港科大推出的统一摄影测量模型 Matrix3D是什么 Matrix3D 是南京大学、苹果公司和香港科技大学合作推出的新型的统一摄影测量模型,能在一个模型中完成多个摄影测量子任务,包括姿态估计、深度预测和新视图合成。Matrix3D... Ai项目 12个月前05,1750
Light-A-Video – 上海AI Lab联合交大等高校推出的视频重照明方法 Light-A-Video是什么 Light-A-Video 是上海交通大学、中国科学技术大学、香港中文大学、香港科技大学、斯坦福大学及上海AI实验室的共同推出的无需训练的视频重照明方法,基于渐进式光... Ai项目 12个月前04,8650
Finedefics – 北大团队推出的细粒度多模态大模型 Finedefics是什么 Finedefics 是北京大学彭宇新教授团队推出的细粒度多模态大模型,提升多模态大语言模型(MLLMs)在细粒度视觉识别(FGVR)任务中的表现。模型通过引入对象的细粒度... Ai项目 12个月前04,8600
Step-Audio – 阶跃星辰开源的语音交互模型 Step-Audio是什么 Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Ste... Ai项目 12个月前04,9350
SkyReels-V1 – 昆仑万维开源首个面向AI短剧创作的视频生成模型 SkyReels-V1是什么 SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型。基于在千万级高质量影视数据上进行微调,实现影视级的人物微表情和肢体动作生成,支持33种细腻表情与... Ai项目 12个月前04,3600
LangFlow – AI应用构建工具,拖拽组件创建复杂工作流 LangFlow是什么 LangFlow 是低代码、可视化的 AI 应用构建工具,用于快速搭建和实验 LangChain 流水线。通过拖拽式界面,用户能轻松创建复杂的 AI 工作流,无需编写大量代码... Ai项目 12个月前05,0000