基本信息
文件名称:分类资料的假设检验.ppt
文件大小:687.39 KB
总页数:10 页
更新时间:2025-04-03
总字数:约1.01万字
文档摘要

分類資料的假設檢驗

6.1分類數據與列聯表分類數據列聯表的構造列聯表的分佈

列聯表的構造

列聯表

(contingencytable)由兩個以上的變數交叉分類的頻數分佈表行變數的類別用r表示,ri表示第i個類別列變數的類別用c表示,cj表示第j個類別每種組合的觀察頻數用fij表示表中列出了行變數和列變數的所有可能的組合,所以稱為列聯表一個r行c列的列聯表稱為r?c列聯表

列聯表的結構

(2?2列聯表)列(cj)合計j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合計f11+f21f12+f22n列(cj)行(ri)

列聯表的結構

(r?c列聯表的一般表示)列(cj)合計j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計c1c2…n列(cj)行(ri)fij表示第i行第j列的觀察頻數

列聯表

(例題分析)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計10012090110420【例6.1】一個集團公司在四個不同的地區設有分公司,現該集團公司欲進行一項改革,此項改革可能涉及到各分公司的利益,故採用抽樣調查方式,從四個分公司共抽取420個樣本單位(人),瞭解職工對此項改革的看法,調查結果如下表

列聯表的分佈

觀察值的分佈邊緣分佈行邊緣分佈行觀察值的合計數的分佈例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分佈列觀察值的合計數的分佈例如,四個分公司接受調查的人數分別為100人,120人,90人,110人條件分佈與條件頻數變數X條件下變數Y的分佈,或在變數Y條件下變數X的分佈每個具體的觀察值稱為條件頻數

觀察值的分佈

(圖示)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計10012090110420行邊緣分佈列邊緣分佈條件頻數

百分比分佈

(概念要點)條件頻數反映了數據的分佈,但不適合對比為在相同的基數上進行比較,可以計算相應的百分比,稱為百分比分佈行百分比:行的每一個觀察頻數除以相應的行合計數(fij/ri)列百分比:列的每一個觀察頻數除以相應的列合計數(fij/cj)總百分比:每一個觀察值除以觀察值的總個數(fij/n)

百分比分佈

(圖示)一分公司二分公司三分公司四分公司合計贊成該方案24.4%26.9%20.4%28.3%66.4%68.0%62.5%63.3571.8%—16.2%17.8%13.6%18.8%—反對該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合計23.8%28.6%21.4%26.2%100%總百分比列百分比行百分比

期望頻數的分佈假定行變數和列變數是獨立的一個實際頻數fij的期望頻數eij,是總頻數的個數n乘以該實際頻數fij落入第i行和第j列的概率,即

期望頻數的分佈

(例題分析)由於觀察頻數的總數為n,所以f11的期望頻數e11應為?例如,第1行和第1列的實際頻數為f11,它落在第1行的概率估計值為該行的頻數之和r1除以總頻數的個數n,即:r1/n;它落在第1列的概率的估計值為該列的頻數之和c1除以總頻數的個數n,即:c1/n。根據概率的乘法公式,該頻數落在第1行和第1列的概率應為

期望頻數的分佈

(例題分析)一分公司二分公司三分公司四分公司贊成該方案實際頻望頻對該方案實際頻望頻6.2擬合優度檢驗一.??統計量擬合優度檢驗

??統計量

??統計量用於檢驗列聯表中變數間擬合優度和獨立性用於測定兩個分類變數之間的相關程度計算公式為

??統計量

(例題分析)實際頻數(fij)期望頻數(eij)fij-eij(fij-eij)2(fij-eij)2f687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計:3.0319

SPSS計算卡方值列聯表

SPSS計算卡方值

擬合優度檢驗

品質數據的假設檢驗品質數據比例檢驗獨立性檢驗Z檢驗一個總體??檢驗Z檢驗??檢驗兩個以上總體兩個總體

擬合優度檢驗

(goodnessoffittest)檢驗多個比例是否相等檢驗的步