荷伊特信度举例第31页,共46页,星期日,2025年,2月5日五、评分者信度定义多个评分者给同一批人的答卷进行评分的一致性程度。计算两个评分者:采用积差相关或等级相关多个评分者:无相同等级情况:肯德尔W系数有相同等级情况:校正之后的肯德尔W系数。W系数的显著性检验:查W表(K:3~20人,N:3~7个);计算χ2值:χ2=K(N-1)W,df=N-1。第32页,共46页,星期日,2025年,2月5日肯德尔W系数校正后的W系数(略)第33页,共46页,星期日,2025年,2月5日关于心理与教育测量第四章第1页,共46页,星期日,2025年,2月5日第四章测量信度信度概述信度的估计方法提高测量信度的方法第2页,共46页,星期日,2025年,2月5日第一节信度概述信度的定义信度的作用第3页,共46页,星期日,2025年,2月5日一、信度的定义信度的描述性定义信度(reliability)指测量结果的稳定性程度,有时也叫测量结果的可靠性。信度系数()是表示测量信度高低的指标,其值域为[0,1]。世界上没有百分之一百可靠的测量。只是理论上的。信度也是多次测量同一对象的一致性程度。第4页,共46页,星期日,2025年,2月5日信度的统计定义(统计等价定义)信度是被试团体真分数方差与实得分数方差之比,即:信度是被试团体真分数与实得分数相关系数的平方,即:信度是一个测验与它的任意一个平行测验的相关系数,即:第5页,共46页,星期日,2025年,2月5日二、信度的作用信度是测量过程中所存在的随机误差大小的反映。测量中随机误差越大,测量的信度越低。(但信度与系统误差无关!)信度可以用来解释个人测验分数的意义。信度可以帮助进行测验分数的比较第6页,共46页,星期日,2025年,2月5日1、解释个人分数的意义测量标准误的作用:估计真实分数的范围;了解实得分数再测时可能的变化情形。真分数的估计,或再测时实得分数的变化范围计算:根据SE=Sx×sqrt(1-rxx),求SE。根据显著性水平α或置信水平(1-α)。则真分数的置信区间或再测时X的变化范围是:X-Zα/2SET≤X+Zα/2SE第7页,共46页,星期日,2025年,2月5日真分数估计举例在一个人格测验中,某个被试的外向性得分为20分,已知该分测验的标准差为10,信度系数为0.91。试问该被试外向性的真实水平处于什么范围(α=0.05)?如果对该被试重新施测,他的分数将不会落在什么范围外?第8页,共46页,星期日,2025年,2月5日2、比较不同测验分数的差异已知X,Y,求X,Y是否差异显著。根据SEd=S(2-rxx-ryy)1/2,求SEd,这里要求两个测验的标准差相同。比较|X-Y|/SEd和Zα/2的大小,如果|X1-X2|/SEdZα/2,则差异显著;反之,则差异不显著。第9页,共46页,星期日,2025年,2月5日不同测验分数的差异比较举例某被试在韦氏成人智力测验中言语智商为100,操作智商为105,已知两个分数都是以100为平均数,15为标准差的标准分数,假设言语分量表和操作分量表的分半信度为0.87和0.88,问言语智商和操作智商是否存在显著性差异(α=0.05)。第10页,共46页,星期日,2025年,2月5日需要注意的问题一个测验可以有多个信度估计值,因而其误差估计值也会有多个。本理论假定同一个团体中所有人的测量误差是相同的,但实际上水平高的人与水平低的人在做测量时会有不同的随机误差。测量的结果不能僵硬地看成是一个点,而应看成是一个以该点为中心,以SE的某个倍数为半径上下波动的一个范围。例如,真正IQ一般在实得IQ±5的范围内波动。第11页,共46页,星期日,2025年,2月5日第二节信度的估计方法重测信度复本信度分半信度同质性信度分半信度和同质性信度也叫内部一致性系数。评分者信度成套测验综合分数的信度第12页,共46页,星期日,2025年,2月5日一、重测信度定义:同一测验对同一批被试先后施测量两次所得结果的一致性程度,其大小为两次分数的积差相关系数。也叫稳定性系数。用于考查测量结果跨时间的稳定性。计算公式:第13页,共46页,星期日,2025年,2月5日举例:假设有一份考试焦虑调查表,先后两次施测于10名学生,时间间隔为半年,结果如表所示,求该测验的重测信度。第14页,共46页,星期日,2025年,2月5日使用条件①所测心理品质相对稳定,否则无法判断是量具信度低,还是品质本身稳定性差。②前后间隔时间要恰当,遗