Pixtral Large – Mistral AI开源的超大多模态模型 Pixtral Large是什么 Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtr... Ai项目 3天前1300
Qwen2.5-Turbo – 阿里推出的长文本模型,支持上下文长度1M tokens Qwen2.5-Turbo是什么 Qwen2.5-Turbo是阿里推出的先进模型,将上下文长度从 128k 扩展到了 1M tokens ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更... Ai项目 3天前2200
StableV2V – 中国科技大学开源的视频编辑项目 StableV2V是什么 StableV2V是中国科技大学推出的开源视频编辑项目,基于文本、草图、图片等输入实现视频中物体的精准编辑和替换。项目用形状一致的编辑范式,基于三个主要组件:Prompted... Ai项目 3天前1050
SongCreator – AI音乐模型,能理解、生成和编辑歌曲 SongCreator是什么 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型,能从歌词出发生成包含声乐和伴奏的完整歌曲。基于双序列语言模型(DSLM)和注意... Ai项目 3天前1350
Teacher2Task – 谷歌推出的多教师学习框架 Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N... Ai项目 3天前1250
DynaSaur – Adobe 推出的大语言模型代理框架 DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和... Ai项目 3天前900
AutoTrain – Hugging Face 开源的无代码模型训练平台 AutoTrain是什么 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署... Ai项目 3天前600
EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型 EMOVA是什么 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOV... Ai项目 3天前1800
OminiControl – AI图像生成框架,实现图像主题控制和空间精确控制 OminiControl是什么 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和... Ai项目 3天前500
Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物 Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展... Ai项目 3天前1500