QwQ-32B – 阿里通义千问开源的最新推理模型 QwQ-32B是什么 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 亿参数的 DeepSee... Ai项目 2个月前02,0200
GPT-4.5 – OpenAI 推出的最强聊天模型 GPT-4.5是什么 GPT-4.5 是 OpenAI 推出的最新大型聊天模型,是目前规模最大、性能最强的聊天模型。基于扩展无监督学习,提升模式识别、知识广度和创意生成能力,减少了幻觉现象,让对话更自... Ai项目 2个月前02,0100
Frames – Runway 推出的AI图像生成模型 Frames是什么 Frames是Runway推出的最新AI图像生成模型,在风格控制和视觉保真度方面取得巨大进步。Frames能维持风格一致性,支持广泛的创意探索,为项目建立特定外观,并生成符合用户美... Ai项目 2个月前1,9750
Cooragent – 清华 LeapLab 开源的 AI Agent 协作框架 Cooragent是什么 Cooragent是由清华大学LeapLab团队推出的开源AI Agent协作框架。用户基于简单的一句话描述快速创建Agent,支持Agent之间的协作,完成复杂任务。Coo... Ai项目 2个月前1,9650
ChatTTSPlus – 开源文本转语音工具,ChatTTS扩展版支持语音克隆 ChatTTSPlus是什么 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音合成的性能和灵活性。在Windows平台上,实现了超过... Ai项目 2个月前1,9200
Spark-TTS – AI文本转语音工具,支持中英零样本语音克隆 Spark-TTS是什么 Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实... Ai项目 2个月前01,9000
UniReal – 港大联合 Adobe 推出的通用图像生成和编辑框架 UniReal是什么 UniReal是香港大学和Adobe研究院共同推出的框架,专注于实现多种图像生成和编辑任务。框架基于模拟现实世界动态,能在单一模型中处理包括图像生成、编辑、定制和合成在内的广泛任... Ai项目 2个月前1,8600
EchoMimicV2 – 阿里推出的开源数字人项目,能生成完整数字人半身动画 EchoMimicV2是什么 EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。EchoMimi... Ai项目 2个月前1,8550
HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型 HealthGPT是什么 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言模型(Med-LVLM),通过异构知识适应技术实现医学视觉理解和生成任务的统一框架... Ai项目 2个月前01,8300
Qwen2.5-1M – 阿里通义千问开源的语言模型,支持100万Tokens上下文 Qwen2.5-1M是什么 Qwen2.5-1M是阿里通义千问团队推出的开源模型,支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-I... Ai项目 2个月前1,7900