(2)自相关图检验(判断准则)平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。若时间序列的自相关函数在k3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。*第29页,共51页,星期日,2025年,2月5日若序列无趋势,但是具有季节性,那末对于按月采集的数据,时滞12,24,36……的自相关系数达到最大(如果数据是按季度采集,则最大自相关系数出现在4,8,12,……),并且随着时滞的增加变得较小。*第30页,共51页,星期日,2025年,2月5日若序列是有趋势的,且具有季节性,其自相关函数特性类似于有趋势序列,但它们是摆动的,对于按月数据,在时滞12,24,36,……等处具有峰态;如果时间序列数据是按季节的,则峰出现在时滞4,8,12,……等处。*第31页,共51页,星期日,2025年,2月5日例题例2.1检验1964年——1999年中国纱年产量序列的平稳性例2.2检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性例2.3检验1949年——1998年北京市每年最高气温序列的平稳性*第32页,共51页,星期日,2025年,2月5日例2.1时序图*第33页,共51页,星期日,2025年,2月5日例2.1自相关图*第34页,共51页,星期日,2025年,2月5日例2.2时序图*第35页,共51页,星期日,2025年,2月5日例2.2自相关图*第36页,共51页,星期日,2025年,2月5日时间序列预处理第1页,共51页,星期日,2025年,2月5日时间序列之概念(1)从统计意义上,将某一指标在不同时间上的不同数值,按照时间的先后次序排列而成的数列。各种偶然因素的影响,表现出某种随机性,存在统计上的依赖关系。(2)从系统意义上,某一系统在不同时间(地点,条件等)的响应。(3)从数学意义上,对某一过程中的某一个变量或一组变量X(t)进行观察测量,在一系列时刻t1t2t3等得到的离散有序数集合X(t1),X(t2),称为离散时间序列。*第2页,共51页,星期日,2025年,2月5日第二章时间序列的预处理第3页,共51页,星期日,2025年,2月5日本章结构时间序列的建立(补充)平稳性检验纯随机性检验*第4页,共51页,星期日,2025年,2月5日补充:时间序列的建立要分析时间序列,就必须建立一个时间序列。一般来说,研究者是运用记录仪或通过观察测量来获得所研究系统的真实有限的数据集合。有时也可以直接用二手资料。但是,不论是通过哪一种途径获得的时间序列,在进行分析处理前,必须对所依据的资料进行认真地检查、整理,有时还需要进行适当的预处理。我们把获取时间序列以及对其进行检查、整理和预处理等工作,称为时间序列的建立。*第5页,共51页,星期日,2025年,2月5日一、时间序列数据的采集1采样:按照一定的时间间隔对所研究系统的响应进行记录和观察。2采样间隔(时间频率):记录和观察的时间间隔。一般采样是等间隔的,比如年、月、日等。时间的频率。3采样原则:关键采样间隔的选择,希望所采到的样本没有信息损失,也没有信息冗余。*第6页,共51页,星期日,2025年,2月5日(一)离群点(outier):指在一个时间序列里,远离序列一般水平的极端大值和极端小值。也称奇异值或者野值。(二)离群点产生的原因1、采样中的误差。2、被研究现象本身由于受各种偶然非正常的因素影响而引起的。(三)离群点的主要影响1、影响模型的拟合精度,甚至得到虚假信息;被认为是一个“坏值”。2、同时可以提供重要信息。如关于系统稳定性和灵敏性等信息。二、离群点(outiler)的检验与处理*第7页,共51页,星期日,2025年,2月5日(四)离群点的分类*第8页,共51页,星期日,2025年,2月5日(四)离群点的分类*第9页,共51页,星期日,2025年,2月5日(五)离群点的检验1、确定离群点范围,如果某一时刻数值超出该范围,则说明该点是离群点。2、对数据进行模型分析,然后根据拟合模型后的残差序列计算特定的统计量,测出离群点及其类型,并用相应的模型修正。〈在统计分析中如何识别极端值〉《江苏统计》1999、11郭莉1、四分展步法