关联性测量关联——association相关——correlation第30页,共83页,星期日,2025年,2月5日关联性测量常用测量指标按适用范围分类两个变量之间两组变量之间典型相关系数(Canonical)其他因素不变其他因素可变偏相关系数(Partial)皮尔逊系数(Pearson)数量相关等级相关斯皮尔曼系数(Spearman)部分相关系数(Part)名义关联肯达尔系数(Kendall)列联系数(contingency)第31页,共83页,星期日,2025年,2月5日关联性测量Pearson相关系数(简单相关系数、积矩相关系数)的构造同方向性的一种表现是:一个变量的某个观测值如果高于均值,则另一个变量的相应观测值也高于均值第32页,共83页,星期日,2025年,2月5日关联性测量Pearson相关系数的构造第33页,共83页,星期日,2025年,2月5日关联性测量可以构造如下统计量第34页,共83页,星期日,2025年,2月5日关联性测量第35页,共83页,星期日,2025年,2月5日关联性测量第36页,共83页,星期日,2025年,2月5日关联性测量存在两个问题:1、受样本数据多少的影响2、受计量单位的影响第37页,共83页,星期日,2025年,2月5日关联性测量相关系数第38页,共83页,星期日,2025年,2月5日关联性测量相关系数的取值范围:[-1,1]第39页,共83页,星期日,2025年,2月5日关联性测量如果相关系数越接近于1,意味着X大于均值,则Y也大于均值的可能性越大如果相关系数越接近于-1,意味着X大于均值,则Y小于均值的可能性越大如果相关系数越接近于0,意味着X大于均值,则Y大于均值或小于均值的可能性越接近第40页,共83页,星期日,2025年,2月5日关联性测量相关系数的绝对值越接近于1,意味着X与Y的线性关系越明显,数量关系越确定。相关系数的绝对值越接近于0,意味着X与Y之间越没有明显的线性关系。第41页,共83页,星期日,2025年,2月5日关联性测量相关系数的局限性不能用以测度非线性相关受到异常值的影响第42页,共83页,星期日,2025年,2月5日关联性测量第43页,共83页,星期日,2025年,2月5日关联性测量测度等级以及名义相关的统计量斯皮尔曼等级相关系数(Spearmanrankcorrelationcoefficient)肯达尔t系数(Kendalltcoefficient)第44页,共83页,星期日,2025年,2月5日关联性测量斯皮尔曼等级相关系数第45页,共83页,星期日,2025年,2月5日关联性测量可以通过两种方式计算Spearman系数:专门计算程序将原始数据排序,计算样本的秩,然后对秩计算Pearson系数对于定序数据而言,Spearman系数与Pearson系数是等价的如果一个变量为定量数据,一个变量为定序数据,应计算Spearman系数或将定量数据变为定序数据后使用Pearson系数第46页,共83页,星期日,2025年,2月5日关联性测量肯达尔t系数第47页,共83页,星期日,2025年,2月5日关联性测量第48页,共83页,星期日,2025年,2月5日关联性测量肯达尔系数一个重要优点在于便于解释,如果肯达尔系数等于1/3,意味着:一致情况的出现频率是不一致的两倍第49页,共83页,星期日,2025年,2月5日关联性测量就一个连续总体而言,肯达尔t系数可以定义为:如果没有结点,则从样本计算出来的统计量是总体系数的无偏估计,记为第50页,共83页,星期日,2025年,2月5日关联性测量如果存在结点,则要对统计量进行调整:第51页,共83页,星期日,2025年,2月5日关联性测量第52页,共83页,星期日,2025年,2月5日关联性测量列联系数phi和Cramer也都是基于卡方的名义变量关联程度的测量指标第53页,共83页,星期日,2025年,2月5日关联性测量偏相关系数在控制其他变量的情况下,研究两个变量之间的相关程度,由于去除了其他变量的干扰,能更准确的反映两个变量之间的相关程度第54页,共83页,星期日,2025年,2月5日假设检验第55页,共83页,星期日,2025年,2月5日假设检验sig.或者p-value是一个概率如果这个概率等于0.340,意味着如果两个变量实际独立(原假设),则产生能计算出