什么是RLHF基于人类反馈的强化学习? – AI百科知识 基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)是人工智能(AI)领域的一个新兴研究领域,它将强化学习技术与人类反馈相结合,以训... AI知识# AI百科# AI知识 6个月前2,8950
什么是生成模型(Generative Model) – AI百科知识 生成模型正以其独特的创造力和潜力,引领着人工智能领域的新浪潮。它们不仅是算法的集合,更是开启无限可能性的钥匙,一窥机器如何学会“想象”。从栩栩如生的虚拟画作到个性化的内容创作,生成模型以其卓越的能力... AI知识# AI百科# AI知识 6个月前2,8950
什么是自注意力(Self-Attention) – AI百科知识 在自然语言处理的广阔领域中,自注意力(Self-Attention)捕捉序列数据中的长距离依赖关系的能力备受瞩目。赋予了模型深入理解文本上下文的超凡洞察力,为机器翻译、文本摘要等任务带来了革命性的变革... AI知识# AI百科# AI知识 6个月前2,8950
什么是提示工程(Prompt Engineering) – AI百科知识 提示工程(Prompt Engineering)对于充分发挥生成式 AI 基础模型的潜力至关重要。通过精确的提示设计,确保 AI 生成的输出符合预期目标和标准,降低大量后期处理的需求。提示工程师在制作... AI知识# AI百科# AI知识 6个月前2,8950
什么是实时互动(Real-Time Engagement, RTE) – AI百科知识 实时互动(Real-Time Engagement, RTE)是一种技术集合、产品架构和场景方案,旨在解决远程条件下沟通互动的双方能够实时性的真实、无缝还原线下互动的场景和信息传递体验。RTE技术的兴... AI知识# AI百科# AI知识 6个月前2,8950
什么是策略梯度(Policy Gradients) – AI百科知识 在探索人工智能的未知领域中,强化学习扮演着至关重要的角色。策略梯度(Policy Gradients)以直接优化决策策略的特性,成为解决复杂环境中决策问题的强大工具。通过不断试错,学习如何在多变的情境... AI知识# AI百科# AI知识 6个月前2,8900
什么是指令调优(Instruction Tuning, IT) – AI百科知识 指令调优(Instruction Tuning, IT)是提高大型语言模型能力和可控性的关键技术。通过在特定指令数据集上进行微调,LLMs能够更好地适应特定领域或任务,同时保持计算效率。主要目的是使L... AI知识# AI百科# AI知识 6个月前2,8800
什么是慢感知(slow perception) – AI百科知识 慢感知(Slow Perception)是阶跃多模态团队提出的一种新型视觉感知概念,通过逐步分解和流动的方式,让模型像人类一样更精细地感知复杂的几何图形。实验中,研究人员构建了20万个合成几何图形数据... AI知识# AI百科# AI知识 6个月前2,8800
什么是思维树(Tree of Thought, ToT) – AI百科知识 思维树(Tree of Thought, ToT)是一种用于增强大型语言模型(LLM)推理能力的框架。它通过模拟人类解决问题时的认知策略,使LLM能够以结构化的方式探索多种可能的解决方案,类似于树状分... AI知识# AI百科# AI知识 6个月前2,8700
什么是监督式微调(Supervised Fine-Tuning, SFT) – AI百科知识 监督式微调(Supervised Fine-Tuning, SFT)是机器学习和自然语言处理(NLP)领域中的一项关键技术,它通过在预训练模型的基础上利用标注好的数据集进行进一步训练,以提升模型在特定... AI知识# AI百科# AI知识 6个月前2,8700