基本信息
文件名称:基于构造性覆盖算法的不平衡数据过采样分类方法的深度剖析与创新应用.docx
文件大小:51.01 KB
总页数:28 页
更新时间:2025-08-26
总字数:约3.58万字
文档摘要

基于构造性覆盖算法的不平衡数据过采样分类方法的深度剖析与创新应用

一、引言

1.1研究背景与意义

1.1.1不平衡数据分类问题的普遍性

在现实世界中,不平衡数据分类问题广泛存在于各个领域。在医疗诊断领域,疾病的发生往往具有一定的概率,某些罕见病的病例数量相较于常见疾病而言极为稀少,如亨廷顿舞蹈症、囊性纤维化等遗传性罕见病,其患者样本在大量的医疗数据集中占比极低,形成了典型的不平衡数据分布。这种不平衡性使得在构建疾病诊断模型时,模型容易过度学习常见病例的特征,而对罕见病病例的特征学习不足,从而导致对罕见病的误诊或漏诊。

在金融风险评估方面,正常交易的数量远远超过欺诈交易或违约交易的数量。以