基本信息
文件名称:基于概念瓶颈的数据集偏移检测.docx
文件大小:2.28 MB
总页数:34 页
更新时间:2025-10-27
总字数:约3.56万字
文档摘要

PAGE16

基于概念瓶颈的数据集偏移检测

摘要

在实际模型训练过程中,由于源域分布和目标域分布存在差异而导致最后的模型决策出现偏差。因此,为更好地找出偏差的原因,一般地,利用特征距离来度量源域与目标域的偏移程度已经成为当前常用的方法,但是这类方法很容易受外界因素干扰而变得不稳定,同时这类方法对数据集出现偏移的原因难以解释。因此,本文实现了一种概念瓶颈偏移检测模型(CBSD):该模型通过对图像进行编码并从编码特征中罗列出可理解的高级概念。在这些高级概念中统计模型受这些高级概念的影响程度来提供解释。本文利用两个数据集对本文所实现的CBSD模型进行验证(dSprites和3dshapes),