k1.5 – Kimi推出的多模态思考模型 k1.5是什么 k1.5 是月之暗面Kimi推出的最新多模态思考模型,具备强大的推理和多模态处理能力。模型在 short-CoT(短链思维)模式下,数学、代码、视觉多模态和通用能力大幅超越了全球范围内... Ai项目 4周前4,6650
Zonos – ZyphraAI 开源的多语言 TTS 模型 Zonos是什么 Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zo... Ai项目 1年前04,6650
SmolDocling – 轻量级的多模态文档处理模型 SmolDocling是什么 SmolDocling(SmolDocling-256M-preview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等... Ai项目 1年前04,6650
Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版 Gemma 3 QAT是什么 Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Ge... Ai项目 1年前04,6650
ElevenLabs Flash – ElevenLabs推出的低延迟语音合成模型 ElevenLabs Flash是什么 ElevenLabs Flash是ElevenLabs推出的低延迟语音合成模型,专为快速对话型AI设计。ElevenLabs Flash有两个版本:Flash ... Ai项目 4周前4,6600
MetaStone-L1-7B – 元石智算推出的轻量级推理模型 MetaStone-L1-7B是什么 MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的... Ai项目 1年前04,6600
AddressCLIP – 中科院联合阿里云推出的端到端图像地理定位大模型 AddressCLIP是什么 AddressCLIP 是基于 CLIP 技术构建的端到端图像地理定位模型,中科院自动化所和阿里云联合开发。模型能通过一张照片实现街道级精度的定位,直接预测图像拍摄地点的... Ai项目 4周前4,6550
Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型 Infinite Mobility是什么 Infinite Mobility 是上海AI Lab推出的可交互物体生成模型,基于程序化生成技术,高效生成高质量的可交互物体数据资产。Infinite Mo... Ai项目 1年前04,6550
MoviiGen 1.1 – AI视频生成模型,支持生成电影级画质 MoviiGen 1.1是什么 MoviiGen 1.1 是ZulutionAI 推出的专注于生成电影级画质视频的AI模型。模型基于 Wan2.1 微调而成,经过专业电影制作人和AIGC创作者在60个... Ai项目 4周前4,6500
Aurora – 微软推出的大气基础模型 Aurora是什么 Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构,处理不同分... Ai项目 4周前4,6500