Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练 Oumi是什么 Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型(如 Llama、Qwe... Ai项目 5个月前2,2800
IC-Portrait – ETH联合浙大等推出的个性化肖像生成框架 IC-Portrait是什么 IC-Portrait是新型的个性化肖像生成框架,解决用户资料图像多样性(如外观和光照条件差异)带来的挑战。通过将肖像生成任务分解为“光照感知拼接”和“视角一致性适应”两... Ai项目 5个月前2,3100
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架 SyncAnimation是什么 SyncAnimation是实时端到端的音频驱动框架,用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频同步的上半身姿态和面部表情,包括嘴唇动作,实现高精度和... Ai项目 5个月前2,4950
BitsAI-CR – 字节跳动推出的自动化代码审查工具 BitsAI-CR是什么 BitsAI-CR是字节跳动团队推出的基于大型语言模型(LLM)的自动化代码审查工具,通过两阶段处理流程实现高效代码审查:RuleChecker 负责基于 219 条规则检测... Ai项目 5个月前2,8150
DiffSplat – 北大联合字节推出的 3D 生成框架 DiffSplat是什么 DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splats)。通过微调预训练的文本到图像扩散模型,基于强大的 ... Ai项目 5个月前2,6800
X-Prompt – 用于多模态视频目标分割的通用框架 X-Prompt是什么 X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数据的视频目标分割基础模型,使用... Ai项目 5个月前2,6100
VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型 VideoReward是什么 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,000条标注数据,涵盖视觉质量、运动质量和文本对齐三个维度... Ai项目 5个月前2,6450
MILS – Meta AI 推出的零样本生成高质量多模态描述方法 MILS是什么 MILS(Multimodal Iterative LLM Solver)是Meta AI提出的无需训练即可赋予大型语言模型(LLM)多模态能力的方法。通过多步推理,提示LLM生成候选... Ai项目 5个月前2,1950
OpenDeepResearcher – 开源 AI 研究工具,自动完成搜索、评估、提取和报告生成 OpenDeepResearcher是什么 OpenDeepResearcher 是开源的 AI 研究工具,能帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理,自动从网络中获取相关数据... Ai项目 5个月前2,5000
OCRmyPDF – 专为 PDF 文件转换为可搜索、可复制的文档AI工具 OCRmyPDF是什么 OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工具支持... Ai项目 5个月前3,0950