基于吸收光谱法的多模态深度学习水质COD预测方法研究
摘要
水资源是指可持续利用或有可能被利用的水源。一直以来水资源对于人类的生存来
说都是最重要的资源,对于水资源污染问题特别是海洋船舶污水排放造成的水污染,已
经成为了中国当下的棘手问题。为了加大对海洋环境污染的监测与整治,国家已先后颁
布了相应的立法政策。化学需氧量(COD)是以化学方法测量水样中需要被氧化的还原性
物质的量,用以表示水中有机物的多少,它是反映水体受有机物污染程度的一个重要指
标。
一般传统的COD测量方法有重铬酸钾法和高锰酸钾法,它们或是操作复杂,耗时
长,且会产生二次污染,或是易受干扰,对于含有难氧化物的水样不易测量,都不符合
当前对水质进行实时监测的要求。近年来研究者们提出了光谱法作为一种新的化学需氧
量检测手段,其测量速度快,绿色便捷,克服了传统检测方法的缺点,在水体监测相关
研究中受到了广泛关注。本文基于光谱法对水质COD的吸收光谱进行了建模,重点研
究了多模态深度学习算法,主要的工作内容包括:
采用了SG滤波算法、一阶导数、多元散射校正,傅里叶变换四种方法进行光谱预
处理,处理后的数据形成光谱数据集。采用主成分分析法降维得到特征光谱数据。基于
特征光谱数据建立了基于偏最小二乘(PLS)和BP神经网络的水质COD预测模型。对不
同预处理方法、预测算法模型对预测结果的影响都进行了定性、定量的分析。
考虑在传统算法中需要先提取特征波段完成原始高维数据的降维再建模使得计算
过程较为复杂,且提取特征的方式不够有效,本文引入深度学习模型,用CNN神经网
络直接将原始连续光谱数据作为输入,实际COD值作为输出进行端到端训练,不仅简
化了建模过程而且提高了预测精度。更进一步地引入了多模态融合技术将各预处理数据
的信息进行整合,最终获得了平衡性好,预测更精确更稳定的CNN多模态融合网络模
型。
从神经网络表征原理入手提出了新的网络模型泰勒网络,用泰勒网络替代CNN神
经网络可以提高模型的表示能力,从而得到了高质量的不同输入数据的特征信息,在此
基础上进行多模态融合进一步提高了网络整体的预测能力和稳定性。最终获得了在各项
指标上进一步提升,具有最优COD预测性能的模型。
关键词:化学需氧量;吸收光谱法;神经网络;深度学习;泰勒网络
基于吸收光谱法的多模态深度学习水质COD预测方法研究
Abstract
Waterresourcesarewatersourcesthatcanbeusedorhavethepotentialtobeusedina
sustainableway.Waterresourceshavealwaysbeenafundamentalresourceforhuman
survival,andwaterpollution,especiallywaterpollutioncausedbymarineshipsewage,has
becomeathornyissueinChinatoday.Inordertoincreasethemonitoringandregulationof
marineenvironmentalpollution,thestatehaspromulgatedcorrespondinglegislativepolicies.
Chemicaloxygendemand(COD)isoneoftheimportantindicatorstoevaluatethequalityof
water,andthedevelopmentofaccurateandrapiddetectiontechnologyofCODisofgreat
significancetowaterpollutioncontrol.
Traditionalchemicalmeasurementmethodssuchaspotassiumdichromatemethodand