基本信息
文件名称:2025年文本分类不平衡(含答案与解析).docx
文件大小:16.58 KB
总页数:22 页
更新时间:2025-10-22
总字数:约7.42千字
文档摘要
2025年文本分类不平衡(含答案与解析)
一、单选题(共15题)
1.在处理文本分类任务时,以下哪种技术可以有效缓解类别不平衡问题?
A.数据增强
B.重采样
C.标准化处理
D.模型正则化
答案:B
解析:重采样是一种常用的缓解类别不平衡的方法,包括过采样少数类和欠采样多数类,通过调整训练数据集中各类别样本的数量,使得模型在训练过程中不会偏向于多数类。参考《机器学习实践指南》2025版4.2节。
2.以下哪种评估指标最适合用于衡量文本分类模型的泛化能力?
A.精确率
B.召回率
C.F1值
D.ROC曲线
答案:C
解析:F1值是精确率和召回率的调和平均数,综合