万相2.1 – 通义万相最新推出的视频生成模型 万相2.1是什么 万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现中文文字视频生成功能。升级后的通义万相... Ai项目 5个月前3,5000
Mistral Small 3.1 – Mistral AI 开源的多模态 AI 模型 Mistral Small 3.1是什么 Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型,有 240 亿参数,基于 Apache 2.0 许可证发布。在文本和多... Ai项目 5个月前03,4900
PPTAgent – 中科院推出的自动生成高质量演示文稿框架 PPTAgent是什么 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。PPTAgent分析参考演示文稿... Ai项目 5个月前3,4650
AlphaQubit – 谷歌推出的量子错误解码器 AlphaQubit是什么 AlphaQubit是谷歌推出基于AI技术的量子错误解码器,用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别,助力量... Ai项目 5个月前3,4600
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力 VisionFM是什么 VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、成像模态、设... Ai项目 5个月前3,4550
AnimateAnything – 浙江大学联合北航推出的统一可控视频生成技术 AnimateAnything是什么 AnimateAnything是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateAnything能精确操作视频,包括控制相机轨迹、文本提... Ai项目 5个月前3,4400
smolagents – Hugging Face 开源的轻量级 Agent 构建库 smolagents是什么 smolagents 是 Hugging Face 推出的轻量级开源库,简化智能代理的构建过程。极简的代码量(约千行)和直观的API设计,使开发者能快速搭建和部署智能代理... Ai项目 5个月前3,4400
Codex CLI – OpenAI 开源的AI编程智能体 Codex CLI是什么 Codex CLI 是 OpenAI 推出的轻量级AI编程智能体。Codex CLI基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制。Codex CLI 支... Ai项目 5个月前03,4350
MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力 MV-MATH是什么 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言模型(MLLMs)在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题,每个问题都结合了多个图像... Ai项目 5个月前03,4300
Quasar Alpha – 支持百万 token 上下文的免费 AI 模型 Quasar Alpha是什么 Quasar Alpha 是支持 100 万 token 的超大上下文窗口的预发布版 AI 模型,可处理超长文本和复杂文档。代码生成能力出色,生成速度快,延迟低,指令遵... Ai项目 5个月前03,4250