Rowboat – 开源AI编程工具,快速构建多智能体助手 Rowboat是什么 Rowboat 是开源的低代码 AI IDE,专注于构建多智能体助手的 MCP(多云平台)工具。通过可视化界面和 AI 辅助开发功能,帮助用户快速设计、配置和测试智能体工作流程... Ai项目 3周前5,0500
FreeScale – 无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像 FreeScale是什么 FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和融合不同尺度的信息... Ai项目 3周前5,0500
百聆 – AI语音对话助手,端到端时延低至800ms 百聆是什么 百聆(Bailing)是开源的语音对话助手,基于语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术实现与用户的自然语音对话,实现类GPT-4o的对话效... Ai项目 3周前5,0500
Find3D – 加州理工学院推出的3D部件分割模型 Find3D是什么 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据,并用对比训练方法训... Ai项目 3周前5,0450
Kheish – 开源的多智能体协调平台,可灵活配置多个Agent解决复杂任务 Kheish是什么 Kheish是基于大型语言模型(LLM)的多智能体编排开源平台,用多个专门的角色(智能体)和灵活的工作流协调复杂任务的各个步骤,如提案生成、审核、验证和格式化,产生高质量结果。平台... Ai项目 3周前5,0400
Baichuan-M1-preview – 百川智能推出的国内首个全场景深度思考模型 Baichuan-M1-preview是什么 Baichuan-M1-preview 是百川智能推出的国内首个全场景深度思考模型。模型具备语言、视觉和搜索三大领域的推理能力,在数学、代码等多个权威评测... Ai项目 3周前5,0400
FlashVideo – 字节联合港大推出的高分辨率视频生成框架 FlashVideo是什么 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视频生成中面临的巨大计算成本问题。在第一阶段,Flash... Ai项目 12个月前05,0400
SongGen – 上海 AI Lab 和北航、港中文推出的歌曲生成模型 SongGen是什么 SongGen是上海AI Lab、北京航空航天大学和香港中文大学推出的单阶段自回归Transformer模型,用在从文本生成歌曲。SongGen基于歌词和描述性文本(如乐器、风格... Ai项目 12个月前05,0400
UNO – 字节跳动推出的创新AI图像生成框架 UNO是什么 UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下的一致性难题。UNO基于扩散变... Ai项目 12个月前05,0400
万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型 万相首尾帧模型是什么 万相首尾帧模型(Wan2.1-FLF2V-14B)是开源的14B参数规模的首尾帧生视频模型。模型根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频过渡效果,支持多种风格和特效变... Ai项目 12个月前05,0400