分類變數資料的假設檢驗一、u檢驗(一)樣本率與總體率比較(二)兩樣本率比較二、χ2檢驗(一)四格表資料的χ2檢驗(二)行×列(R×C)表資料的χ2檢驗(三)配對計數資料的χ2檢驗(四)行×列表的χ2分割(五)四格表的確切概率法
一、u檢驗
(一)樣本率與總體率比較
樣本率與總體率的假設檢驗的目的是推斷樣本率所代表的未知總體率π與已知總體率π0(一般指理論值、標準值或經大量觀察得到的穩定值)是否相等,其u檢驗公式為:
式中,p為樣本率,π0為已知總體率,為根據總體率求得的率的標準誤。
例5-6由臨床經驗得知,一般潰瘍病患者的胃出血率為20%,現某醫師觀察65歲以上潰瘍病人250例,其中80例發生胃出血症狀,問老年患者胃出血率與一般患者是否不同?
H0:?=?0,即老年患者胃出血率與一
般患者相同;
H1:???0,即老年患者胃出血率與一
般患者不同;
α=0.05
本例?0=20%,n=250,x=80
將數據代入上式:
用絕對值查u界值表(t界值表中v=∞欄):
4.7433.29=u0.001/2
P0.001
按α=0.05,拒絕H0,接受H1,可認為老年患者胃出血率與一般患者不同,老年潰瘍病患者更容易出現胃出血。
(二)兩樣本率比較
兩樣本率比較的假設檢驗的目的是推斷兩樣本所來自的兩總體的總體率是否相等。
其u檢驗公式為:
例5-7為比較工人和農民的高血壓患病率,分別調查了50—59歲男性工人和50—59歲男性農民1281人和387人,其高血壓患者分別為386人(患病率30.13%)和65人(患病率16.80%)。問工人與農民的高血壓患病率有無不同?
H0:?1=?2,即工人和農民高血壓患病
率相同;
H1:?1??2,即工人和農民高血壓患病
率不同;
α=0.05
本例p1=30.13%,x1=386,n1=1281;p2=16.80%,x2=65,n2=387;
將有關數據代入u檢驗公式
查u界值表(雙側,t界值表中=∞欄):
5.1743.29=u0.001/2
P0.001
按α=0.05,拒絕H0,接受H1,可認為50?59歲男性工人和50?59歲男性農民高血壓患病率不同,工人患病率高於農民。
?
二、χ2檢驗
χ2檢驗的基本公式為:
式中A為實際頻數(actualfrequency),
T为理论频数(theoreticalfrequency).
(一)四格表資料的χ2檢驗
例5-8為觀察藥物A、B治療某病的療效,某醫師將100例該病病人隨機分為兩組,一組40人,服用A藥;另一組60人,服用B藥。結果發現:服用A藥40人中有30人治愈;服用B藥的60人中有11人治愈。問A、B兩藥的療效有無差別?
χ2檢驗的基本步驟如下:
H0:?1=?2,即A、B兩藥療效相同;
H1:?1??2,即A、B兩藥療效不同;
α=0.05
計算理論頻數:理論頻數指的是在無效假設成立的前提下,理論上在實際頻數位置上的頻數。本例如無效假設成立,兩藥療效相同,則其合計的治癒率為41%。據此,A藥組理論治癒人數=40×41%=16.4,B藥組理論治癒人數=60×41%=24.6;同理,合計未愈率為59%,依此算得A藥組和B藥組未愈人數分別為23.6和35.4。各理論頻數計算見上表中括弧內的數字。理論頻數的計算過程可用下式表示:
上式中,R(row)表示行,C(column)表示列;表示第R行第C列的理論數;nR和nC分別代表第R行和第C列的合計數;N為總合計數。
例如:第一行第一列的理论数
T12、T21、T22也可仿此算出。
將表5-2中的理論數和實際數代入χ2檢驗公式:
χ2檢驗自由度的計算公式為:
v=(行數-1)(列數-1)=(R-1)(C-1)
本例:(2-1)(2-1)=1
查附表4,χ2界值表:
31.867.88
χ2χ20.005,1
P0.005
P0.005,按α=0