Teacher2Task – 谷歌推出的多教师学习框架

Ai项目2周前更新 Agixxw

Teacher2Task什么

Teacher2Task是谷歌团队推出的多教师学习框架，引入教师特定的输入标记和重新构思训练过程，消除对手动聚合启发式方法的需求。框架不依赖聚合标签，将训练数据转化为N+1个任务，包括N个辅助任务预测每位教师的标记风格，及一个主要任务关注真实标签。这种方法提高标签效率，减少对手动启发式方法的依赖，减轻潜在标签不准确性的影响，让模型从多个教师的多样化预测中学习，提高性能和鲁棒性。

Teacher2Task的主要功能

消除手动聚合启发式方法： 基于内部机制自动处理多个教师的预测，无需人工干预决定如何聚合预测。
教师特定输入标记： 框架为每位教师引入特定的输入标记，让模型能区分不同教师的标记风格。
多任务学习： 将训练数据转化为N+1个任务，其中N个辅助任务用于预测每位教师的置信度分数，一个主要任务用于学习真实标签。
提高标签效率： 每个教师的预测都作为额外的训练样本，提高数据利用效率。
减少标签不准确性的影响： 将教师的预测视为辅助任务的目标，而不是绝对的真值，减轻潜在的标签噪声问题。

Teacher2Task的技术原理

教师身份和预测作为输入： 在模型的输入中加入教师身份和预测类别，模型的任务是预测教师的置信度分数。
个性化教师任务： 对于每个输入样本，添加特殊的教师标记训练模型预测该教师的置信度分数。
解决标注冲突： 为每个输入附加唯一的教师特定标记，模型学会区分教师及其各自的标记风格，隐式解决冲突。
减轻标签噪声： 将教师预测作为辅助任务的目标，不直接作为学生模型的伪标签，减少噪声的影响。
提高标签效率： 与需要多个预测的聚合方法相比，Teacher2Task从每位教师的预测中生成多教师训练样本，减少计算开销。

Teacher2Task的项目地址

arXiv技术论文：https://arxiv.org/pdf/2411.12724

Teacher2Task的应用场景

机器翻译：基于不同语言对的教师模型提高翻译的准确性和流畅性。
图像和视频理解：从多个标注者或模型中学习，提高对图像和视频内容的分类和理解能力。
自然语言处理（NLP）：结合不同领域的语言模型提升文本分类、情感分析等任务的性能。
医疗诊断：集成多位医生的诊断结果，提高疾病预测和诊断的准确性。
推荐系统：结合多个推荐模型的输出，提供更准确的个性化推荐。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Flame – 开源的多模态前端代码生成模型

Flame – 开源的多模态前端代码生成模型

12个月前

04,0750

UNO – 字节跳动推出的创新AI图像生成框架

UNO – 字节跳动推出的创新AI图像生成框架

12个月前

05,0400

DreamGen – 英伟达推出的新型机器人学习技术

DreamGen – 英伟达推出的新型机器人学习技术

2周前

5,3650

Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架

Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架

2周前

4,2600