魔搭社区:阿里达摩院推出的AI模型社区,超过300+开源AI模型

魔搭社区:阿里达摩院推出的AI模型社区,超过300+开源AI模型

魔搭社区是什么魔搭社区(ModelScope)是阿里巴巴达摩院推出的综合性的人工智能模型共享与服务平台,为构建一个开放、高效、易用的AI模型生态,为开发者、研究人员和企业用户提供一站式的模型获取、部署和应用体验。 ModelScope平台汇集了丰富的预训练模型资源,涵盖自然语言处理、计算机视觉、语音识别等多个领域。用户可以通过简单的搜索和下载操作,快速获取所需的模型,结合平台提供的工具进行微调、优化和部署。魔搭社区支持多种硬件平台,包括昇腾、GPU等,满足不同用户的需求。魔搭社区的主要功能丰富的预训练模型:提供涵盖自然语言处理、计算机视觉、语音识别、多模态等多个领域的预训练模型。模型上下文协议(MCP):推出MCP广场,上架千余款热门MCP服务,包括支付宝、MiniMax等独家首发服务。MCP为大模型对接外部数据源和工具建立了统一标准,简化了开发流程。数据集与指标:提供多种数据集和性能评估指标,方便开发者进行模型训练和优化。模型推理与部署:支持在线推理、本地部署和云端部署。用户可以通过网页界面直接上传数据获取推理结果,也可以通过SDK在本地运行模型。分布式训练与优化:提供分布式训练工具,支持多种框架(如PyTorch、TensorFlow等),提供模型压缩、量化等优化工具。调试与集成:提供简单易用的调试环境和工具,支持第三方平台集成,降低开发者使用门槛。开源与社区共建:作为一个开源平台,鼓励开发者贡献模型和代码,形成开源协作生态。开发者社区:提供交流平台,开发者可以分享经验、讨论技术问题,共同推动AI技术的发展。如何使用魔搭社区访问平台:访问魔搭社区的官方网站,注册或登录。环境准备安装 Python:确保系统中已安装 Python(推荐版本 3.8 及以上)。安装 ModelScope Python 库:通过以下命令安装 ModelScope 的 Python 库。模型下载通过命令行下载:使用 ModelScope 提供的命令行工具下载模型。通过网页界面下载:访问魔搭社区官网,在模型库中搜索并下载所需的模型。模型推理:使用 Python 脚本加载模型并进行推理。模型微调:使用 ms-swift 进行微调ms-swift 是魔搭社区提供的大模型训练和部署框架。模型部署:使用 Vllm 部署模型,Vllm 是一个高效的推理框架,支持多 GPU 分布式推理。探索更多模型和工具:访问魔搭社区官网,浏览丰富的模型库、数据集和工具。参与社区交流:加入魔搭社区的开发者社区,与其他开发者交流经验,共同推动 AI 技术的发展。魔搭社区的应用场景AI研究与教育:研究人员和教育工作者可以用ModelScope上的模型进行AI相关的研究和教学活动,提高研究效率和学习效果。企业应用开发:企业可以用ModelScope上的模型快速开发AI应用,降低研发成本,加快产品上市时间。创业项目:初创企业可以借助ModelScope上的模型资源,开发创新的AI产品和服务,验证商业模式并实现产品的快速迭代。个人项目:个人开发者可以用ModelScope上的模型实现自己的创意,开发个性化的AI应用。多模态应用:ModelScope支持多种多模态模型,例如处理文本、图像和视频的InternVL3系列模型。可以应用于智能助手、内容创作、视频生成等领域。
01950
豆包大模型

豆包大模型

豆包大模型是什么豆包大模型是字节跳动推出的AI大模型家族,包括 豆包PixelDance、豆包Seaweed 视频生成、文生图、图生图、同声传译、角色扮演、语音合成、声音复刻、语音识别、Function Call和向量化等多个模型。豆包大模型具备强大的语言理解、生成和逻辑能力,能进行个性化创作、情绪丰富的语音合成、高精度语音识别、多风格图像生成和顶级的视频生成。豆包大模型通过火山引擎提供服务,支持企业和开发者构建智能化应用,推动AI技术在多种业务场景中的落地。豆包大模型的性能在多个评测中表现优异,例如在包括MMLU、BBH、GSM8K和HumanEval在内的11个业界公认的基准测试集中,Doubao-pro-4k模型的总体得分达到了76.8分,在代码能力、专业知识和指令遵循等方面的显著进步。豆包大模型的主要功能通用模型:字节跳动自研LLM模型,支持128K长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景。视频生成:通过精准语义理解、强大动态及运镜能力创作高质量视频,支持文本和图片生成两种模式。角色扮演:创作个性化角色,具备上下文感知和剧情推动能力,适合虚拟互动和故事创作。语音合成:生成自然生动的语音,能表达多种情绪,适用于文本到语音转换。声音复刻:快速克隆声音,高度还原音色和自然度,支持跨语种迁移,用于个性化语音合成。语音识别:准确识别和转录语音,支持多语种,适用于语音命令和转录服务。文生图:将文本转换为图像,擅长图文匹配和中国文化元素创作,用于图像生成和视觉内容创作。图生图:基于现有图像生成新图像,支持风格变换、扩图、重绘和涂抹等创意操作。同声传译:提供超低延时且自然高质量的实时翻译,支持跨语言同音色翻译,打破沟通中的语言壁垒。Function Call:准确识别和抽取功能参数,适合复杂工具调用和智能交互。向量化:提供向量检索能力,支持LLM知识库的核心理解,适用于多语言处理。豆包大模型的功能特点豆包通用模型Pro:字节跳动自研的高级语言模型,支持128K长文本处理,适用于问答、总结、创作等多种场景。豆包通用模型Lite:轻量级语言模型,提供更低的成本和延迟,适合预算有限的企业使用。豆包·视频生成模型:利用先进的语义理解技术,将文本和图片转化为引人入胜的高质量视频内容。豆包·语言识别模型:具备高准确率和灵敏度,能够快速准确地识别和转写多种语言的语音。豆包·Function Call模型:专为复杂工具调用设计,提供精确的功能识别和参数抽取能力。豆包·文生图模型:将文字描述转化为精美图像,尤其擅长捕捉和表现中国文化元素。豆包·语音合成模型:能够合成自然、生动的语音,表达丰富的情感和场景。豆包·向量化模型:专注于向量检索,为知识库提供核心理解能力,支持多种语言。豆包·声音复刻模型:仅需5秒即可实现声音的1:1克隆,提供高度相似的音色和自然度。豆包·同声传译模型:实现超低延迟的实时翻译,支持跨语言同音色翻译,消除语言障碍。豆包·角色扮演模型:具备个性化角色创作能力,能够根据上下文感知和剧情推动进行灵活的角色扮演。豆包大模型的产品官网产品官网:volcengine.com/product/doubao如何使用豆包大模型确定需求:明确项目或业务需求,比如是否需要文本生成、语音识别、图像创作、视频生成等。选择合适的模型:根据需求选择合适的豆包大模型,例如文生图模型、语音合成、视频生成模型等。注册和访问火山引擎:访问火山引擎官网注册账户,是字节跳动的云服务平台,提供豆包大模型的服务。申请访问权限:在火山引擎平台上申请使用豆包大模型的权限,填写相关信息和使用场景。API接入:获取相应的API接口信息,包括API的端点、请求方法和必要的认证信息。开发和测试:根据API文档开发应用程序,将豆包大模型集成到你的业务流程中。进行充分测试,确保模型的输出符合预期。部署应用:在测试无误后,将集成了豆包大模型的应用部署到生产环境。监控和优化:监控应用的性能和模型的效果,根据反馈进行优化。豆包大模型的产品定价大语言模型按tokens使用量付费:Doubao-lite-4k(包括分支版本lite-character):上下文长度4K、输入0.0003元/千tokens、输出0.0003元/千tokens、后付费、免费额度50万tokens。Doubao-lite-32k:上下文长度32K、输入0.0003元/千tokens、输出0.0006元/千tokens后付费、免费额度50万tokens。Doubao-lite-128k:上下文长度128K、输入0.0008元/千tokens、输出0.0010元/千tokens后付费、免费额度50万tokens。Doubao-pro-4k(包括分支版本pro-character、pro-functioncall):上下文长度4K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。Doubao-pro-32k:上下文长度32K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。Doubao-pro-128k:上下文长度128K、输入0.0050元/千tokens、输出0.0090元/千tokens后付费、免费额度50万tokens。按模型单元付费:独占的算力资源,更加独立可控Doubao-lite-4k、Doubao-lite-32k:可承载性能(TPS)3000、按小时60元/个、包月28000元/个。Doubao-lite-128k:可承载性能(TPS)4500、按小时240元/个、包月112000元/个。Doubao-pro-4k、Doubao-pro-32k:可承载性能(TPS)3200、按小时160元/个、包月80000元/个。Doubao-pro-128k:可承载性能(TPS)3500、按小时1200元/个、包月550000元/个。视觉模型豆包-文生图模型-智能绘图:推理服务、0.2元/次、后付费、免费额度200次。语音大模型Doubao-语音合成:推理服务、5元/万字符、后付费、免费额度5000字符。Doubao-声音复刻:推理服务、8元/万字符、后付费、免费额度5000字符。向量模型Doubao-embedding:最长输入长度4K、输入0.0005元/千tokens、后付费、免费50万tokens。模型精调按tokens使用量(训练文本*训练迭代次数)计费,训练完成后出账。Doubao-lite-4k、Doubao-lite-32k、Doubao-lite-128k:LoRA定价0.03元/千tokens、后付费。Doubao-pro-4k、Doubao-pro-32k、Doubao-pro-128k:LoRA定价0.05元/千tokens、后付费。更多模型及定价信息,可访问豆包大模型官网获取最新信息。豆包大模型的应用场景内容创作与媒体:使用文生图、图生图、视频生成模型生成文章配图、漫画、海报、短视频等视觉内容。语音合成模型为视频、动画制作配音。客户服务:通过角色扮演模型提供虚拟客服和聊天机器人服务。使用语音识别和语音合成模型改善语音客服系统。教育与培训:文生图模型辅助教学材料的制作,如生成教学插图。角色扮演模型创建个性化学习体验和虚拟教师。娱乐与游戏:在游戏中使用角色扮演模型创建非玩家角色(NPC)的对话和行为。用语音合成模型为游戏角色提供自然的语言交流。智能助手:结合语音识别和语音合成模型,开发智能个人助理。用文生图模型生成个性化的推荐内容。市场与广告:用文生图模型自动生成广告创意和营销素材。用通用模型分析消费者反馈,优化广告文案。企业自动化:通过Function Call模型自动化复杂的工作流程和工具调用。用向量化模型进行高效的信息检索和知识管理。搜索与推荐:用向量化模型改善搜索引擎的准确性和响应速度。结合通用模型为用户推荐相关内容或产品。法律与金融:用通用模型进行合同分析、案件研究和合规检查。用语音识别模型转录会议记录和访谈内容。
0750
OpenBMB:清华团队支持发起的大规模预训练语言模型库与相关工具

OpenBMB:清华团队支持发起的大规模预训练语言模型库与相关工具

OpenBMB全称为Open Lab for Big Model Base,旨在打造大规模预训练语言模型库与相关工具, 加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛,与国内外开发者共同努力形成大模型开源社区, 推动大模型生态发展,实现大模型的标准化、普及化和实用化,让大模型飞入千家万户。OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起。 发起团队拥有深厚的自然语言处理和预训练模型研究基础,近年来围绕模型预训练、提示微调、模型压缩技术等方面在顶级国际会议上发表了数十篇高水平论文。
01900
Watsonx.ai

Watsonx.ai

Watsonx.ai是IBM于5月9日发布的新一代企业级生成式人工智能和机器学习平台,Watsonx.ai将由基础模型驱动的新的生成性人工智能和传统的机器学习结合起来,成为一个跨越人工智能生命周期的强大平台。使用Watsonx.ai,开发人员可以轻松地训练、验证、调整和部署模型,只需用一小部分数据在短期时间内快速建立人工智能应用。预计Watsonx.ai将在7月全面上市。
01600