VideoJAM – Meta 推出增强视频生成模型运动连贯性的框架 VideoJAM是什么 VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动信息,在推理阶段基于模型自身的运... Ai项目 5个月前2,4800
WiseDiag – 杭州智诊科技推出全球领先的医疗大模型 WiseDiag是什么 WiseDiag 是杭州智诊科技推出的全球领先的医疗大模型,专注于基于人工智能技术提升医疗服务的效率和质量。模型具有 730 亿参数和 32k 的上下文长度,基于超过 3 万亿... Ai项目 5个月前02,4800
LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型 LLaDA是什么 LLaDA(Large Language Diffusion with mAsking)是中国人民大学高瓴AI学院李崇轩、文继荣教授团队和蚂蚁集团共同推出的新型大型语言模型,基于扩散... Ai项目 5个月前02,4800
Multi-Speaker – AudioShake 推出的多说话人声分离模型 Multi-Speaker是什么 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在处理重叠语音时的... Ai项目 5个月前02,4800
Dolphin – 清华联合海天瑞声推出的语音识别大模型 Dolphin是什么 Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含普通话),能精准识别... Ai项目 5个月前02,4800
Infinity – 字节跳动推出的高分辨率图像生成模型 Infinity是什么 Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升... Ai项目 5个月前2,4750
MangaNinja – 基于参考图像的线稿着色技术 MangaNinja是什么 MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与图像质量。能应对多样化的上色挑战... Ai项目 5个月前2,4750
o1-pro – OpenAI 推出的升级版推理模型 o1-pro是什么 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势在于显著提升的计算能力,能更好地应对复杂问题,提供更一... Ai项目 5个月前02,4750
明岐 – 上海交大推出的医学多模态大模型,精准诊断罕见病 明岐是什么 明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构,整合医学影像、病历文本及化验指标等数据,为... Ai项目 5个月前02,4750
MedReason – 美国加州联合南洋理工等机构推出的医学推理框架 MedReason是什么 MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs)在医学领域的推理能... Ai项目 5个月前02,4750