什么是监督式微调(Supervised Fine-Tuning, SFT) – AI百科知识 监督式微调(Supervised Fine-Tuning, SFT)是机器学习和自然语言处理(NLP)领域中的一项关键技术,它通过在预训练模型的基础上利用标注好的数据集进行进一步训练,以提升模型在特定... AI知识 2周前4,9600
什么是多智能体系统(Multi-Agent Systems) – AI百科知识 在探索人工智能的前沿领域中,强化学习与多智能体系统(Multi-Agent Systems)的结合开辟了新的研究路径。致力于构建能在复杂环境中自主学习并相互协作的智能体。随着技术的发展,这些系统在自动... AI知识 2周前4,9450
什么是RLHF基于人类反馈的强化学习? – AI百科知识 基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)是人工智能(AI)领域的一个新兴研究领域,它将强化学习技术与人类反馈相结合,以训... AI知识 2周前4,9350
什么是鲁棒性(Robustness) – AI百科知识 鲁棒性(Robustness)在计算机科学及相关领域中,指的是系统或算法在面临输入错误、环境变化、噪声干扰、参数变化等不确定性和异常情况时,仍能保持其性能和稳定性的能力。简而言之,就是系统或算法具有... AI知识 2周前4,9300
什么是Transformer模型(Transformer) – AI百科知识 Transformer模型的主要组成部分包括编码器(Encoder)和解码器(Decoder),由多个层组成。每个编码器层包括多头注意力(Multi-head Attention)和点式前馈网络(Po... AI知识 2周前4,9300
什么是标记(Token) – AI百科知识 标记(Token)在计算机科学中指的是一种用于身份验证和授权的小型数据片段,它代表用户的权限和状态信息。Token可以用于多种用途,包括但不限于用户身份验证、授权控制、会话管理以及跨域资源共享(COR... AI知识 2周前4,9150
什么是草稿链(Chain-of-Draft, CoD) – AI百科知识 草稿链(Chain-of-Draft, CoD)是新型的AI推理范式,通过简洁的中间推理步骤提升推理效率。模仿人类解决问题时的简洁思维,限制每一步输出的关键信息,不超过五个词。与传统的思维链(CoT... AI知识 2周前4,9150
什么是聊天机器人(Chatbot) – AI百科知识 聊天机器人(Chatbot)正逐渐成为我们日常生活中不可或缺的伙伴。通过模拟人类的对话能力,为我们提供了一种全新的交互体验。无论是快速获取信息、享受个性化服务,还是简单地进行日常交流,聊天机器人都能以... AI知识 2周前4,9100
什么是提示工程(Prompt Engineering) – AI百科知识 提示工程(Prompt Engineering)对于充分发挥生成式 AI 基础模型的潜力至关重要。通过精确的提示设计,确保 AI 生成的输出符合预期目标和标准,降低大量后期处理的需求。提示工程师在制作... AI知识 2周前4,9050
什么是弱监督学习(Weakly Supervised Learning) – AI百科知识 在人工智能的宏伟蓝图中,机器学习扮演着至关重要的角色,而监督学习更是其中的核心。传统的监督学习依赖于大量精确标注的数据来训练模型,以期达到对未知数据的准确预测。但在现实世界中的数据往往并非如此理想:标... AI知识 2周前4,8950