AI训练模型

共 33 篇网址

分布式训练框架与超参优化工具，支持大规模数据并行、模型压缩及训练过程可视化。

排序

发布更新浏览点赞

豆包大模型

豆包大模型是什么豆包大模型是字节跳动推出的AI大模型家族，包括豆包PixelDance、豆包Seaweed 视频生成、文生图、图生图、同声传译、角色扮演、语音合成、声音复刻、语音识别、Function Call和向量化等多个模型。豆包大模型具备强大的语言理解、生成和逻辑能力，能进行个性化创作、情绪丰富的语音合成、高精度语音识别、多风格图像生成和顶级的视频生成。豆包大模型通过火山引擎提供服务，支持企业和开发者构建智能化应用，推动AI技术在多种业务场景中的落地。豆包大模型的性能在多个评测中表现优异，例如在包括MMLU、BBH、GSM8K和HumanEval在内的11个业界公认的基准测试集中，Doubao-pro-4k模型的总体得分达到了76.8分，在代码能力、专业知识和指令遵循等方面的显著进步。豆包大模型的主要功能通用模型：字节跳动自研LLM模型，支持128K长文本，全系列可精调，具备更强的理解、生成、逻辑等综合能力，适配问答、总结、创作、分类等丰富场景。视频生成：通过精准语义理解、强大动态及运镜能力创作高质量视频，支持文本和图片生成两种模式。角色扮演：创作个性化角色，具备上下文感知和剧情推动能力，适合虚拟互动和故事创作。语音合成：生成自然生动的语音，能表达多种情绪，适用于文本到语音转换。声音复刻：快速克隆声音，高度还原音色和自然度，支持跨语种迁移，用于个性化语音合成。语音识别：准确识别和转录语音，支持多语种，适用于语音命令和转录服务。文生图：将文本转换为图像，擅长图文匹配和中国文化元素创作，用于图像生成和视觉内容创作。图生图：基于现有图像生成新图像，支持风格变换、扩图、重绘和涂抹等创意操作。同声传译：提供超低延时且自然高质量的实时翻译，支持跨语言同音色翻译，打破沟通中的语言壁垒。Function Call：准确识别和抽取功能参数，适合复杂工具调用和智能交互。向量化：提供向量检索能力，支持LLM知识库的核心理解，适用于多语言处理。豆包大模型的功能特点豆包通用模型Pro：字节跳动自研的高级语言模型，支持128K长文本处理，适用于问答、总结、创作等多种场景。豆包通用模型Lite：轻量级语言模型，提供更低的成本和延迟，适合预算有限的企业使用。豆包·视频生成模型：利用先进的语义理解技术，将文本和图片转化为引人入胜的高质量视频内容。豆包·语言识别模型：具备高准确率和灵敏度，能够快速准确地识别和转写多种语言的语音。豆包·Function Call模型：专为复杂工具调用设计，提供精确的功能识别和参数抽取能力。豆包·文生图模型：将文字描述转化为精美图像，尤其擅长捕捉和表现中国文化元素。豆包·语音合成模型：能够合成自然、生动的语音，表达丰富的情感和场景。豆包·向量化模型：专注于向量检索，为知识库提供核心理解能力，支持多种语言。豆包·声音复刻模型：仅需5秒即可实现声音的1:1克隆，提供高度相似的音色和自然度。豆包·同声传译模型：实现超低延迟的实时翻译，支持跨语言同音色翻译，消除语言障碍。豆包·角色扮演模型：具备个性化角色创作能力，能够根据上下文感知和剧情推动进行灵活的角色扮演。豆包大模型的产品官网产品官网：volcengine.com/product/doubao如何使用豆包大模型确定需求：明确项目或业务需求，比如是否需要文本生成、语音识别、图像创作、视频生成等。选择合适的模型：根据需求选择合适的豆包大模型，例如文生图模型、语音合成、视频生成模型等。注册和访问火山引擎：访问火山引擎官网注册账户，是字节跳动的云服务平台，提供豆包大模型的服务。申请访问权限：在火山引擎平台上申请使用豆包大模型的权限，填写相关信息和使用场景。API接入：获取相应的API接口信息，包括API的端点、请求方法和必要的认证信息。开发和测试：根据API文档开发应用程序，将豆包大模型集成到你的业务流程中。进行充分测试，确保模型的输出符合预期。部署应用：在测试无误后，将集成了豆包大模型的应用部署到生产环境。监控和优化：监控应用的性能和模型的效果，根据反馈进行优化。豆包大模型的产品定价大语言模型按tokens使用量付费：Doubao-lite-4k（包括分支版本lite-character）：上下文长度4K、输入0.0003元/千tokens、输出0.0003元/千tokens、后付费、免费额度50万tokens。Doubao-lite-32k：上下文长度32K、输入0.0003元/千tokens、输出0.0006元/千tokens后付费、免费额度50万tokens。Doubao-lite-128k：上下文长度128K、输入0.0008元/千tokens、输出0.0010元/千tokens后付费、免费额度50万tokens。Doubao-pro-4k（包括分支版本pro-character、pro-functioncall）：上下文长度4K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。Doubao-pro-32k：上下文长度32K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。Doubao-pro-128k：上下文长度128K、输入0.0050元/千tokens、输出0.0090元/千tokens后付费、免费额度50万tokens。按模型单元付费：独占的算力资源，更加独立可控Doubao-lite-4k、Doubao-lite-32k：可承载性能（TPS）3000、按小时60元/个、包月28000元/个。Doubao-lite-128k：可承载性能（TPS）4500、按小时240元/个、包月112000元/个。Doubao-pro-4k、Doubao-pro-32k：可承载性能（TPS）3200、按小时160元/个、包月80000元/个。Doubao-pro-128k：可承载性能（TPS）3500、按小时1200元/个、包月550000元/个。视觉模型豆包-文生图模型-智能绘图：推理服务、0.2元/次、后付费、免费额度200次。语音大模型Doubao-语音合成：推理服务、5元/万字符、后付费、免费额度5000字符。Doubao-声音复刻：推理服务、8元/万字符、后付费、免费额度5000字符。向量模型Doubao-embedding：最长输入长度4K、输入0.0005元/千tokens、后付费、免费50万tokens。模型精调按tokens使用量（训练文本*训练迭代次数）计费，训练完成后出账。Doubao-lite-4k、Doubao-lite-32k、Doubao-lite-128k：LoRA定价0.03元/千tokens、后付费。Doubao-pro-4k、Doubao-pro-32k、Doubao-pro-128k：LoRA定价0.05元/千tokens、后付费。更多模型及定价信息，可访问豆包大模型官网获取最新信息。豆包大模型的应用场景内容创作与媒体：使用文生图、图生图、视频生成模型生成文章配图、漫画、海报、短视频等视觉内容。语音合成模型为视频、动画制作配音。客户服务：通过角色扮演模型提供虚拟客服和聊天机器人服务。使用语音识别和语音合成模型改善语音客服系统。教育与培训：文生图模型辅助教学材料的制作，如生成教学插图。角色扮演模型创建个性化学习体验和虚拟教师。娱乐与游戏：在游戏中使用角色扮演模型创建非玩家角色（NPC）的对话和行为。用语音合成模型为游戏角色提供自然的语言交流。智能助手：结合语音识别和语音合成模型，开发智能个人助理。用文生图模型生成个性化的推荐内容。市场与广告：用文生图模型自动生成广告创意和营销素材。用通用模型分析消费者反馈，优化广告文案。企业自动化：通过Function Call模型自动化复杂的工作流程和工具调用。用向量化模型进行高效的信息检索和知识管理。搜索与推荐：用向量化模型改善搜索引擎的准确性和响应速度。结合通用模型为用户推荐相关内容或产品。法律与金融：用通用模型进行合同分析、案件研究和合规检查。用语音识别模型转录会议记录和访谈内容。

06,2450

AI训练模型抖音大模型 # AI训练模型

OpenBMB：清华团队支持发起的大规模预训练语言模型库与相关工具

OpenBMB：清华团队支持发起的大规模预训练语言模型库与相关工具

OpenBMB全称为Open Lab for Big Model Base，旨在打造大规模预训练语言模型库与相关工具，加速百亿级以上大模型的训练、微调与推理，降低大模型使用门槛，与国内外开发者共同努力形成大模型开源社区，推动大模型生态发展，实现大模型的标准化、普及化和实用化，让大模型飞入千家万户。OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起。发起团队拥有深厚的自然语言处理和预训练模型研究基础，近年来围绕模型预训练、提示微调、模型压缩技术等方面在顶级国际会议上发表了数十篇高水平论文。

06,1900

AI训练模型 # AI训练模型

PaLM 2

PaLM（Pathways Language Model）是一种大型语言模型，即 LLM，类似于OpenAI 创建的 GPT 系列或Meta 的 LLaMA 系列模型。谷歌于 2022 年 4 月首次宣布推出 PaLM，超过了5400亿个训练参数。与其他 LLM 一样，PaLM 是一个灵活的系统，可以执行各种文本生成和编辑任务。例如，你可以将 PaLM 训练成像 ChatGPT 这样的对话式聊天机器人，或者你可以将它用于诸如总结文本甚至编写代码等任务。（这类似于谷歌今天也为其 Workspace 应用程序（如 Google Docs 和 Gmail）宣布的功能。）在 2023 谷歌 I/O 大会上，谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM 2，并正式发布预览版本，改进了数学、代码、推理、多语言翻译和自然语言生成能力。谷歌将为 PaLM 2 提供四种不同大小的版本，从最小到最大：Gecko、Otter、Bison 和 Unicorn。Gecko 非常轻巧，可以在移动设备上工作，并且速度足够快，即使在离线时也能在设备上运行出色的交互式应用程序。这种多功能性意味着可以对 PaLM 2 进行微调，以更多方式支持整个类别的产品，从而帮助更多人。PaLM 2的特性PaLM 2 是谷歌的下一代大语言模型，具有改进的多语言、推理和编码能力。多语言性： PaLM 2 在多语言文本方面接受了更多的训练，涵盖 100 多种语言。这显著提高了它在多种语言中理解、生成和翻译细微差别文本（包括成语、诗歌和谜语）的能力，这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。推理： PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此，它展示了逻辑、常识推理和数学方面的改进能力。编程： PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言，但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。

05,9800

AI训练模型 # AI训练模型

序列猴子：出门问问推出的一款超大规模的语言模型

序列猴子是出门问问推出的一款超大规模的语言模型，具有长序列、多模态、单模型、大数据等特点。利用其通用的表示能力与推理能力，用户能够进行多轮交互，从而在使用中获得更加便捷流畅的体验。

05,9650

AI训练模型 # AI训练模型

Lamini AI是什么？官网、介绍及其主要特色功能

Lamini是一个LLM引擎，可以让不仅仅是机器学习专家的任何开发人员，都能在大型数据集中，把高性能的LLM训练得像ChatGPT一样好。

05,9100

AI训练模型 # AI训练模型

LLaMA

Meta（Facebook）推出的AI大语言模型

05,8000

AI训练模型 # AI训练模型

Auto

Auto-GPT是一个实验性开源应用程序，展示了GPT-4语言模型的真正潜力，GitHub上超10万人星标。该程序由 GPT-4 驱动，将LLM大语言模型思维链接在一起，以自主实现你设定的任何目标。作为GPT-4完全自主运行的首批例子之一，Auto-GPT突破了人工智能的极限，距离AGI通用人工智能又近了一步。大家注意甄别autogpt.net不是其官方网站，agpt.co才是。

05,4250

AI训练模型 # AI训练模型

Codex

OpenAI旗下AI代码生成训练模型

05,3800

AI训练模型 OpenGPT大模型 # AI训练模型

Ollama

Ollama是一个用于在本地计算机上运行大型语言模型的命令行工具，允许用户下载并本地运行像Llama 2、Code Llama和其他模型，并支持自定义和创建自己的模型。该免费开源的项目，目前支持macOS和Linux操作系统，未来还将支持Windows系统。此外，Ollama还提供了官方的Docker镜像，由此使用Docker容器部署大型语言模型变得更加简单，确保所有与这些模型的交互都在本地进行，无需将私有数据发送到第三方服务。Ollama在macOS和Linux上支持GPU加速，并提供了简单的命令行界面（CLI）以及用于与应用程序交互的REST API。该工具对于需要在本地机器上运行和实验大语言模型的开发人员或研究人员来说特别有用，无需依赖外部云服务。Ollama安装包获取获取Ollama安装包，扫码关注回复：OllamaOllama支持的模型Ollma提供一个模型库，用户可以自行选择安装想要运行的模型，目前支持40+的模型，还在持续增加中，以下是可以下载的开源模型示例：模型参数大小文件大小下载运行命令DeepSeek-R11.5B、7B、14B、32B等12-320GBollama run deepseek-r1Neural Chat7B4.1GBollama run neural-chatStarling7B4.1GBollama run starling-lmMistral7B4.1GBollama run mistralLlama 27B3.8GBollama run llama2Code Llama7B3.8GBollama run codellamaLlama 2 Uncensored7B3.8GBollama run llama2-uncensoredLlama 2 13B13B7.3GBollama run llama2:13bLlama 2 70B70B39GBollama run llama2:70bOrca Mini3B1.9GBollama run orca-miniVicuna7B3.8GBollama run vicuna

05,2100

AI训练模型 # AI训练模型

Gemma

Gemma是什么Gemma是由谷歌DeepMind和谷歌的其他团队开发的一系列轻量级、先进的开放AI模型，基于与Gemini模型相同的技术，旨在帮助开发者和研究人员构建负责任的AI应用。Gemma模型系列包括两种权重规模的模型：Gemma 2B 和 Gemma 7B，提供预训练和指令微调版本，支持多种框架，如JAX、PyTorch和TensorFlow，以在不同设备上高效运行。6月28日，第二代模型Gemma 2已发布。Gemma的官方入口Gemma的官网主页：https://ai.google.dev/gemma?hl=zh-cnGemma的Hugging Face模型：https://huggingface.co/models?search=google/gemmaGemma的Kaggle模型地址：https://www.kaggle.com/models/google/gemma/code/Gemma的技术报告：https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf官方PyTorch实现GitHub代码库：https://github.com/google/gemma_pytorchGemma的Google Colab运行地址：https://colab.research.google.com/github/google/generative-ai-docs/blob/main/site/en/gemma/docs/lora_tuning.ipynbGemma的主要特性轻量级架构：Gemma模型设计为轻量级，便于在多种计算环境中运行，包括个人电脑和工作站。开放模型：Gemma模型的权重是开放的，允许用户在遵守许可协议的情况下进行商业使用和分发。预训练与指令微调：提供预训练模型和经过指令微调的版本，后者通过人类反馈强化学习（RLHF）来确保模型行为的负责任性。多框架支持：Gemma支持JAX、PyTorch和TensorFlow等主要AI框架，通过Keras 3.0提供工具链，简化了推理和监督微调（SFT）过程。安全性与可靠性：在设计时，Gemma遵循Google的AI原则，使用自动化技术过滤训练数据中的敏感信息，并进行了一系列安全评估，包括红队测试和对抗性测试。性能优化：Gemma模型针对NVIDIA GPU和Google Cloud TPUs等硬件平台进行了优化，确保在不同设备上都能实现高性能。社区支持：Google提供了Kaggle、Colab等平台的免费资源，以及Google Cloud的积分，鼓励开发者和研究人员利用Gemma进行创新和研究。跨平台兼容性：Gemma模型可以在多种设备上运行，包括笔记本电脑、台式机、物联网设备和云端，支持广泛的AI功能。负责任的AI工具包：Google还发布了Responsible Generative AI Toolkit，帮助开发者构建安全和负责任的AI应用，包括安全分类器、调试工具和应用指南。Gemma的技术要点模型架构：Gemma基于Transformer解码器构建，这是当前自然语言处理（NLP）领域最先进的模型架构之一。采用了多头注意力机制，允许模型在处理文本时同时关注多个部分。此外，Gemma还使用了旋转位置嵌入（RoPE）来代替绝对位置嵌入，以减少模型大小并提高效率。GeGLU激活函数取代了标准的ReLU非线性激活，以及在每个Transformer子层的输入和输出都进行了归一化处理。训练基础设施：Gemma模型在Google的TPUv5e上进行训练，这是一种专为机器学习设计的高性能计算平台。通过在多个Pod（芯片集群）上进行模型分片和数据复制，Gemma能够高效地利用分布式计算资源。预训练数据：Gemma模型在大量英语数据上进行预训练（2B模型大约2万亿个token的数据上预训练，而7B模型则基于6万亿个token），这些数据主要来自网络文档、数学和代码。预训练数据经过过滤，以减少不想要或不安全的内容，同时确保数据的多样性和质量。微调策略：Gemma模型通过监督式微调（SFT）和基于人类反馈的强化学习（RLHF）进行微调。这包括使用合成的文本对和人类生成的提示响应对，以及基于人类偏好数据训练的奖励模型。安全性和责任：Gemma在设计时考虑了模型的安全性和责任，包括在预训练阶段对数据进行过滤，以减少敏感信息和有害内容的风险。此外，Gemma还通过了一系列的安全性评估，包括自动化基准测试和人类评估，以确保模型在实际应用中的安全性。性能评估：Gemma在多个领域进行了广泛的性能评估，包括问答、常识推理、数学和科学问题解答以及编码任务。Gemma模型与同样规模或更大规模的开放模型进行了性能对比，在MMLU、MBPP等18个基准测试中，有11个测试结果超越了Llama-13B或Mistral-7B等模型。开放性和可访问性：Gemma模型以开源的形式发布，提供了预训练和微调后的检查点，以及推理和部署的开源代码库。这使得研究人员和开发者能够访问和利用这些先进的语言模型，推动AI领域的创新。常见问题Gemma一词的含义是什么？Gemma在拉丁语中的意思是“宝石”。Gemma是开源的吗？Gemma是开源开放的大模型，用户可在Hugging Face查看和下载其模型。Gemma模型的参数量是多少？Gemma目前提供20亿和70亿参数量的模型，后续还会推出新的变体。

05,1200

AI训练模型 # AI训练模型

StableLM：Stability AI推出的开源的类ChatGPT大语言模型

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型，该模型目前处于Alpha版本，拥有的参数量分别为30亿和70亿，后续还将推出150亿到650亿参数模型。

05,0900

AI训练模型 # AI训练模型

AgentGPT：免费开源的在浏览器中组装、配置和部署自主人工智能

在浏览器中组装、配置和部署自主人工智能的开源项目

05,0450

AI训练模型 # AI训练模型

Lobe

简单免费的机器学习模型训练工具

05,0400

AI训练模型 # AI训练模型

HuggingFace

AI模型开发社区

05,0000

AI模型库 AI训练模型 # AI训练模型

Gradio

Gradio是一个开源的Python库，用于构建演示机器学习或数据科学，以及web应用程序。你可以使用Gradio基于自己的机器学习模型或数据科学工作流快速创建一个漂亮的用户界面，让用户可以尝试拖放他们自己的图像、输入文本、录制他们自己的声音，并通过浏览器与你的演示程序进行交互。Google、HuggingFace、亚马逊、Meta、思科、VMware等公司都在使用。Gradio适用于:向客户/合伙人/用户/学生演示您的机器学习模型。通过自动共享链接快速部署您的模型，并获得模型性能反馈。在开发过程中使用内置的操作和解释工具交互式地调试模型。

04,6750

AI训练模型 # AI训练模型