题目
下列关于“集成学习”说法正确的是?A. 个体学习器间相关性较高B. 个体学习器间相关性较低C. 使用“加权平均”而不是“投票法”产生结果D. 个体学习器由相同的学习算法生成
下列关于“集成学习”说法正确的是?
A. 个体学习器间相关性较高
B. 个体学习器间相关性较低
C. 使用“加权平均”而不是“投票法”产生结果
D. 个体学习器由相同的学习算法生成
题目解答
答案
B. 个体学习器间相关性较低
解析
集成学习的核心在于通过组合多个个体学习器(基模型)来提升整体性能。其关键点包括:
- 个体学习器的多样性:个体学习器间应具有较低的相关性,使得它们的错误能够互补,从而降低集成后的泛化误差。
- 组合策略:常见的组合方法包括投票法(分类)和平均法(回归),也可通过加权方式优化结果。
- 个体学习器的生成:通常使用相同算法生成(如随机森林中的决策树),但并非严格要求,不同算法的组合也属于集成学习范畴。
本题需结合上述要点,判断选项中描述是否符合集成学习的核心特性。
选项分析
选项A:个体学习器间相关性较高
- 错误。若个体学习器相关性高,它们的错误可能相似,导致集成效果受限。集成学习强调通过低相关性个体学习器的互补性来提升性能。
选项B:个体学习器间相关性较低
- 正确。低相关性是集成学习的关键,确保个体学习器的预测误差能够相互抵消,从而降低整体模型的泛化误差。
选项C:使用“加权平均”而不是“投票法”产生结果
- 错误。集成学习的组合方法多样,既可使用投票法(如分类中的多数投票),也可使用加权平均(如回归中的加权求和)。题目中“而不是”的表述过于绝对,不符合实际情况。
选项D:个体学习器由相同的学习算法生成
- 错误。虽然常见集成方法(如随机森林)使用相同算法生成个体学习器,但集成学习允许不同算法的组合(如混合专家模型)。因此,个体学习器的算法并非必须相同。