CodeArena – 用于测试不同LLM编程能力的在线平台 CodeArena是什么 CodeArena是在线平台,基于让多个大型语言模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成代码的能力。CodeArena平台主要评估和比较不同LL... Ai项目 2个月前1,6100
Phi-4 – 微软开源的14B参数小语言模型,擅长数学等领域的复杂推理 Phi-4是什么 Phi-4是微软推出的14B参数小型语言模型,在数学等领域的复杂推理以及传统语言处理方面表现出色。Phi-4用数据质量为核心训练重点,大量融入合成数据,提升模型在STEM问答和数学竞... Ai项目 2个月前1,8650
Insight-V – 提升长链视觉推理能力的多模态模型 Insight-V是什么 Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流程生产高质量的推理... Ai项目 2个月前1,3600
SVDQuant – MIT 推出的扩散模型后训练量化技术 SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中... Ai项目 2个月前1,5850
Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型 Meta Motivo是什么 Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。模... Ai项目 2个月前1,3850
Step-1o Audio – 阶跃星辰推出的国内首个千亿参数端到端语音大模型 Step-1o Audio是什么 Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力,能精准识别用户语气中的情感,结合语境做出贴心回应。如,在用户分享喜... Ai项目 2个月前1,6950
360gpt2-o1 – 360 推出国产自研 AI 大模型,多项评测优于GPT-4o 360gpt2-o1是什么 360gpt2-o1是 360 自研的 AI 大模型,在推理能力上有显著提升,特别是在数学和逻辑推理任务上表现出色。模型通过合成数据优化、模型后训练和“慢思考”范式实现了技... Ai项目 2个月前1,2150
POINTS 1.5 – 腾讯微信推出的多模态大模型 POINTS 1.5是什么 POINTS 1.5 是腾讯微信发布的多模态大模型,是POINTS 1.0的升级版本。 模型继续沿用了POINTS 1.0中的LLaVA架构,由一个视觉编码器、一个投影器和... Ai项目 2个月前1,2500
k1 视觉思考模型 – kimi推出的 k1 系列强化学习模型 k1 视觉思考模型是什么 k1 视觉思考模型是kimi推出的k1系列强化学习AI模型,原生支持端到端图像理解和思维链技术,将能力扩展到数学之外的更多基础科学领域。k1模型在图像理解、数学、物理、化学等... Ai项目 2个月前1,4200
FreeScale – 无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像 FreeScale是什么 FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和融合不同尺度的信息... Ai项目 2个月前1,4600