题目
大语言模型的微调阶段,通常使用____数据。A. 无标签数据B. 语音数据C. 有标签数据D. 图像数据
大语言模型的微调阶段,通常使用____数据。
A. 无标签数据
B. 语音数据
C. 有标签数据
D. 图像数据
题目解答
答案
C. 有标签数据
解析
考查要点:本题主要考查对大语言模型微调阶段数据类型的理解,需要区分预训练与微调阶段的关键差异。
解题核心:明确微调阶段的目标是让模型适应特定任务,而这一过程依赖于有监督学习,因此需要有标签数据作为指导。
关键点:
- 预训练阶段使用无标签数据(如海量文本),通过自监督学习掌握语言规律。
- 微调阶段需针对具体任务(如分类、问答),通过有标签数据调整模型参数。
大语言模型的训练分为预训练和微调两个主要阶段:
- 预训练阶段:模型从大规模无标签文本数据中学习语言规律,无需具体任务标签。
- 微调阶段:模型需适应特定任务(如情感分析、机器翻译),此时需要有标签数据作为监督信号,通过对比预测结果与真实标签的差异来优化模型。
选项分析:
- A. 无标签数据:属于预训练阶段,排除。
- B. 语音数据、D. 图像数据:与语言模型的文本处理目标无关,排除。
- C. 有标签数据:微调阶段必须依赖的任务相关数据,正确。