纯电动汽车剩余续驶里程预测技术分析
摘要:随着电动汽车的不断普及,纯电动汽车剩余续驶里程备受重视,如何对续驶里程进行准确预测尤为关键。本文以驾驶行为量化因子为依托,构建预测模型,用于里程预测。首先选择构建模型所需的指标,并运用随机森林算法赋予指标权重,在此基础上确定量化因子,然后构建预测模型,并通过实车分析的方式,确定预测模型的应用效果。最后得出相应的结论,希望通过本文研究,为相关行业提供借鉴。
关键词:电动汽车剩余续驶里程预测模型
近些年,我国新能源汽车行业快速发展,在查阅相关机构公布的数据后得知,仅2022年1年,我国新能源车辆的销售量就超过680万辆,其中,纯电动汽车的占比接近80%。在纯电动汽车数量持续增加的背景下,剩余续驶里程预测功能备受重视,虽然多数电动汽车均具备此项功能,但由于考虑内容有限,导致预测结果不够精准,使客户体验受到不利影响,为此,需要运用更加精确的技术,以增强用户体验感。
1数据采集和处理
1.1数据采集
本研究所使用的数据来源于某款新能源汽车行驶数据,该款车型向监管平台发送数据时所使用的频率为0.2Hz,主要上传数据分别为整体数据、车辆位置数据和驱动电机数据等。为确保数据能够对驾驶员行为进行准确反馈,本研究随机选择四台车,将其作为研究对象,并在监管平台中导出这些车辆的历史数据,其中,数据时间范围是2022年12月至2023年5月,数据总量[1]。
1.2数据处理
考虑到所采集的数据会受到外界环境因素的影响,导致解码后存在诸多问题,如,异常、重复和缺失值等,为避免此类情况,需要开展预处理,具体流程如下。
处理原始报文。在解析原始报文的过程中,主要将GB/T32960和企业相关标准作为依据,在处理完成后,即可得到里程预测所需的数据信息,之后,需要转换采集时间,使其成为时间错格式,最后,对各时刻车辆加速度予以准确计算。
处理异常和缺失值。通过法则的运用,对异常值进行处理,主要处理方式为剔除和识别。对于缺失值,则运用分段线性法做填充处理。
处理重复值。处理时,需要将重复值删除,并通过分段线性插值法填充所需的值。
在经过上述步骤后,异常数据会被有效处理,接下来,需要采取下述手段,对数据进行深度处理。划分片段,将非行车片段删除,即划分驾驶事件,并以20s为基准,确定短行驶片段,若行驶片段时长小于20s,忽略即可。在处理后,本研究所得到的数据共为6800000条,驾驶事件的数量为3620个。数据分布情况如表1所示。
2基于驾驶行为的评价指标选取
为准确分析驾驶行为与续驶里程之间的关系,保证评价指标的应用效果,本研究以车速加速度影响等方面作为切入点,对评价指标进行量化处理,如表2所示,同时,对急加速时长、能力回收等指标做详细分析[2]。
2.1急加速时长所占比重
本研究所确定的急加速事件判断阈值为和,通常情况下,车速和加速度值之间具有反比关系,即车速越快,加速度值越小,这种关系使高速区间急加速情况的识别难度大幅度增加。考虑到百分位线在划分总数据量时效果显著,但无法有效划分各速度区间,故本研究将90%百分位线作为判断阈值线,所选的分段区间为10kmh-1,单独分析各速度区间,通过上述方法,提高事件识别的准确度。
2.2能量回收所占比重
在纯电动汽车开启能量回收功能后,车辆行驶过程中所产生的制动能量会被回收,本研究统计了C车和D车的能耗占比。在观察后得知,开启能量回收功能的C车和D车,其能耗占比分别为8.8%和7.1%。考虑到不同驾驶人员驾驶行为的影响,故能量回收产生的能耗存在差别。
2.3确定驾驶行为量化因子
赋予各项指标权重,是明确驾驶行为量化因子的前提条件。为消除人为因素的影响,本研究对客观赋权法加以运用。鉴于各项指标之间存在联系和影响,本文通过随机森林法评估指标的重要程度[3]。
2.3.1随机森林法
该算法属于常用的模型,其集成了大量的决策树模型,预测效果极为显著,众多学者研究结果表明,在训练样本时运用此项方法效果良好,与其他算法相比,计算复杂程度较低,且能够实现对复杂数据的快速处理。其中,算法应用步骤如下所述。
(1)建立n棵决策树,并将OBD数据矩阵输入到其中用于后续预测,其中,矩阵由XOBD表示,并得到预测结果,由Yi表示,在此基础上,对预测值和实际值之间的方差进行明确,具体公式如下:
在上述公式中,实际值由Y表示;均方误差由表示。
(2)为确保其他评价指标不会在评估过程中发生改变,本次赋权仅将XP特征值序列进行调整,之后,通过决策树预测打乱后的样本,最后,计算预测值和实际值的均方误差,计算公式如下:
在上述公式中,预测值由表示;实际值由表示;均方误差由表示。
(3)指标对决策树预测精度的影响,计算公式如下:
在上述式子中,指标由表示;决策树由表示;预测精度影响