VideoAnydoor – 港大联合阿里达摩院等机构推出的零样本视频对象插入框架 VideoAnydoor是什么 VideoAnydoor是香港大学、阿里巴巴集团达摩院、湖畔实验室、华中科技大学联合推出的零样本的视频对象插入框架,能将特定对象以高保真度和精确运动控制的方式插入到视频... Ai项目 2周前5,5150
VideoLLaMA3 – 阿里达摩院推出的多模态基础模型 VideoLLaMA3是什么 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合了先进的视觉编码器(如 SigLip)和强大的语言生成... Ai项目 2周前5,5150
FLOAT – 基于流匹配的音频驱动说话人头像生成模型 FLOAT是什么 FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动设计。模型基于Transfor... Ai项目 2周前5,5050
星火纪要 – 科大讯飞推出的会议交流总结和分析平台 星火纪要是什么 星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台,广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容,提升工作学习效率;辅助企业从众多会议... Ai项目 2周前5,5050
HuatuoGPT-o1 – 港中文联合深圳大数据研究院开源的医学高级推理大模型 HuatuoGPT-o1是什么 HuatuoGPT-o1是香港中文大学(深圳)和深圳大数据研究院联合推出的,针对医学领域开发的复杂推理模型,基于复杂的推理能力提高解决医学问题的性能。模型用两个阶段的训... Ai项目 2周前5,5000
Aider – 开源AI编程助手,基于命令行指定自动完成代码修改 Aider是什么 Aider 是开源的AI辅助编程工具,基于终端与大型语言模型(LLM)配合,实现高效代码编辑和开发。Aider支持多种编程语言,如 Python、JavaScript、TypeScr... Ai项目 12个月前05,5000
Skywork-OR1 – 昆仑万维开源的高性能系列推理模型 Skywork-OR1是什么 Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR... Ai项目 12个月前05,5000
News Agents – 开源的终端新闻聚合与摘要系统 News Agents是什么 News Agents基于终端的新闻聚合与摘要系统。基于Amazon Q CLI作为 Agent 框架,用Model Context Protocol (MCP)解析RS... Ai项目 2周前5,4950
豆包大模型1.5 – 字节跳动推出的最新版大模型 豆包大模型1.5是什么 豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得分在知识、代码、推理、中文等多个测评基准上优于GPT... Ai项目 2周前5,4950
Step-Video-T2V – 阶跃星辰开源的文本到视频模型 Step-Video-T2V是什么 Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型,拥有 300 亿参数,能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器... Ai项目 12个月前05,4950