基于傅里叶特征的对抗样本防御方法的研究.pdf

基本信息

文件名称：基于傅里叶特征的对抗样本防御方法的研究.pdf

文件大小：2.93 MB

总页数：69 页

更新时间：2025-05-22

总字数：约10.29万字

文档摘要

基于傅里叶特征的对抗样本防御方法的研究

摘要

由于深度学习在现实应用中面临着极其复杂的场景和安全问题，特别是在金融和医

疗领域，简单地假设模型的训练环境和预测环境是独立同分布的，可能会导致意想不到

的安全风险。研究人员发现，正常情况下表现良好的深度神经网络很容易受到对抗样本

的影响，这严重阻碍了深度学习应用在安全敏感领域的发展。

关于对抗样本的研究存在两个方面的问题：一方面，对抗样本的生成方式多种多样，

其防御方法需要考虑到多种攻击方式，以保证模型的对抗鲁棒性；另一方面，当前评估

模型的对抗鲁棒性主要以准确率为基础，缺乏与其他领域相结合的可量化指标。本文围

绕以上两个问题，聚焦于图像分类任务，研究对抗样本防御方法和对抗鲁棒性评估问题，

主要的创新性成果如下：

首先，基于傅里叶特征映射提出一种对抗样本防御方法，并将其命名为傅里叶特征

输入变换。该方法将要送入到神经网络训练的样本先进行傅里叶特征映射，再将映射后

的数据送入到神经网络进行训练，用以增强模型的对抗鲁棒性。在对抗环境下，该方法

能够将映射后的数据更容易准确分类。实验结果表明，傅里叶特征输入变换不但能够增

强模型的对抗鲁棒性，而且还会加快模型的收敛速度。

其次，为进一步提升模型的对抗鲁棒性，将傅里叶特征输入变换与对抗训练相结合，

提出一种对抗样本防御方法：基于傅里叶特征输入变换的对抗训练。该方法将要送入到

神经网络进行对抗训练的对抗样本先进行傅里叶特征映射，再将映射后的数据送入到神

经网络中进行对抗训练，用以增强模型的对抗鲁棒性。实验结果表明，使用该方法的模

型能大幅增强模型识别对抗样本的准确率，但是在识别原始样本时存在准确率下降的情

况。

最后，借鉴心理物理学领域内的相关概念，将心理物理学与机器学习相结合，提出

一种对抗鲁棒性评估指标：对抗鲁棒性知觉。该指标把对抗样本视为对神经网络的一种

“刺激”，并通过计算量化出该“刺激”的程度，用以衡量模型的对抗鲁棒性。当比较

两个模型的对抗鲁棒性时，只需比较能够使模型误分类的对抗样本的对抗鲁棒性知觉。

实验结果表明，对抗鲁棒性知觉能够评估模型的对抗鲁棒性，并且攻击能力越强的对抗

样本，对抗鲁棒性知觉越小。即模型的对抗鲁棒性与对抗鲁棒性知觉成反比。

关键字：对抗样本防御；傅里叶特征；对抗训练；对抗鲁棒性

基于傅里叶特征的对抗样本防御方法的研究

Abstract

Duetotheextremelycomplexscenariosandsecurityissuesthatdeeplearningfacesin

practicalapplications,particularlyinthefinanceandhealthcarefields,assumingthatthe

trainingandpredictionenvironmentsofmodelsareindependentlyandidenticallydistributed

mayleadtounexpectedsecurityrisks.Researchershavefoundthatdeepneuralnetworksthat

performwellundernormalconditionsareeasilyinfluencedbyadversarialexamples,which

severelyhindersthedevelopmentofdeeplearninginsecurity-sensitiveareas.

Therearetwomainissueswithresearchonadversarialexamples:ononehand,the

generationmethodsofadversarialexamplesarediverse,anddefensemethodsneedtoconsider

multipleattackmethodstoensuretherobustnessofthem