第二節(jié) 計(jì)數(shù)資料的顯著性檢驗(yàn)
作者:徐榮祥 出版社:中國(guó)科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月
對(duì)于計(jì)數(shù)資料這些相對(duì)數(shù)我們只知它們的高低,不知其有無(wú)統(tǒng)計(jì)學(xué)意義,只有通過(guò)相對(duì)數(shù)的顯著性檢驗(yàn)方能明確。常用方法為U檢驗(yàn)與χ2檢驗(yàn)。
一、率的u檢驗(yàn)
率的u檢驗(yàn)是應(yīng)用范圍較為廣的一種顯著性檢驗(yàn)方法,但是在用于樣本率與總體率比較時(shí),或兩個(gè)樣本率比較時(shí),應(yīng)當(dāng)考慮其差異是否由于抽樣誤差所造成的。大樣本的樣本率分布近似正態(tài)分布,可用正態(tài)分布的規(guī)律檢驗(yàn)樣本率與總體率或兩個(gè)樣本率差異的顯著性。其判斷標(biāo)準(zhǔn)為:
(一)樣本率與總體率的比較
樣本率與總體率比較的目的是推斷該樣本所代表的總體率與已知總體率是否相同。公式為:
p為樣本率,π為總體率,σP為率的標(biāo)準(zhǔn)誤,由總體計(jì)算得出
示例343根據(jù)臨床經(jīng)驗(yàn),胃十二指腸潰瘍患者中,一般情況下有20%的病人會(huì)發(fā)生胃出血癥狀,現(xiàn)某醫(yī)院觀察燒傷病人152例,其中48例傷前有過(guò)胃出血病史,問(wèn)傷前患有胃十二指腸潰瘍的燒傷病人是否容易發(fā)生胃出血?
【解題步驟】
可將該例中胃十二指腸潰瘍患者有20%發(fā)生胃出血率視為總體率π(是把人們公認(rèn)或經(jīng)驗(yàn)數(shù)值作為總體率)。
1建立檢驗(yàn)假設(shè):假設(shè)患有胃十二指腸潰瘍病的燒傷病人胃出血率(p)與一般胃十二指腸潰瘍患者的出血率(π)無(wú)差別,即樣本率(P)是由總體率(π)中隨機(jī)抽取的,兩者無(wú)差別。事實(shí)上,實(shí)驗(yàn)研究結(jié)果總是有兩種情況:一種是接受所建立的檢驗(yàn)假設(shè),一種是拒絕建立的檢驗(yàn)假設(shè)。
①設(shè)前者為H0:π=π0;②設(shè)后者為H1:π≠π0。
2確立顯著性水準(zhǔn):α=005
3計(jì)算u值:將示例343中數(shù)據(jù)代入公式(346):
4確定P值:因?yàn)閡=358,而358>258,故P<001。
5推斷結(jié)論:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<001,所以有非常顯著性差異,傷前患有胃十二指腸潰瘍的燒傷病人,其胃出血率與一般胃十二指腸潰瘍患者的出血率有本質(zhì)差異,可認(rèn)為患胃十二指腸潰瘍的燒傷病人較一般胃潰瘍患者容易發(fā)生胃出血。
(二)兩個(gè)樣本率比較的U檢驗(yàn)
兩個(gè)樣本率比較的目的是推斷兩個(gè)樣本各自代表的兩個(gè)總體率是否相同。常用U檢驗(yàn)和χ2檢驗(yàn):
U檢驗(yàn)計(jì)算公式:
示例344如某醫(yī)院對(duì)1 329例燒傷病人進(jìn)行應(yīng)激性潰瘍出血的預(yù)防性治療,有56例發(fā)生了胃出血,發(fā)病率為421%,1 670例傷情相似的病人未進(jìn)行預(yù)防性治療,其出血率達(dá)832%,問(wèn)兩組樣本應(yīng)激性潰瘍出血的發(fā)病率有無(wú)差異?
【解題步驟】
1建立檢驗(yàn)假設(shè):H0:π1=π2,H1:π1≠π2。
2確定顯著性水平:α=005。
3計(jì)算u值:n1=1329,X1=56,P1=00421(56/1329),n2=1670,X2=139,P2=00823(139/1670)。
代入公式(349)、(3410)、(347):
4確定P值:因425>258,故P<001。
5推斷結(jié)論:在α=005的水準(zhǔn)上,拒絕H0,接受H1。因P<001,差異有高度顯著性,故認(rèn)為預(yù)防性治療組與對(duì)照組的應(yīng)激性潰瘍出血率有本質(zhì)不同,預(yù)防組應(yīng)激性潰瘍出血發(fā)生率低于對(duì)照組,預(yù)防治療有效。
二、χ2檢驗(yàn)
χ2檢驗(yàn)是英國(guó)統(tǒng)計(jì)學(xué)家Kpearson提出的,后經(jīng)Yates校正改進(jìn),現(xiàn)已成為專用于兩組百分率的常用顯著性檢驗(yàn)公式。“χ”為希臘字母,讀音為“Kai”,故χ2檢驗(yàn)法又稱“卡方法”。應(yīng)用范圍與U檢驗(yàn)不完全相同,前者主要針對(duì)樣本率與總體率進(jìn)行比較,也可用于兩個(gè)樣本率的比較;而χ2檢驗(yàn)主要用于推斷兩個(gè)及兩個(gè)以上總體率(或構(gòu)成比)之間的檢驗(yàn),檢查兩個(gè)分類變量之間有無(wú)關(guān)系(或關(guān)聯(lián))。
(一)χ2檢驗(yàn)基本公式與計(jì)算方法
χ2檢驗(yàn)的基本公式:
A為實(shí)際觀察數(shù),T為理論計(jì)算值, ∑(希臘字母,讀音Sigma)表示總和。舉例解釋其方法及原理。
示例345某醫(yī)院對(duì)過(guò)去治療的燒傷并發(fā)敗血癥的病例進(jìn)行回顧性總結(jié),205例大面積燒傷病人并發(fā)敗血癥的例數(shù)為43,而134例中等燒傷面積病人并發(fā)敗血癥的例數(shù)為13,問(wèn)敗血癥的發(fā)生與燒傷面積有無(wú)關(guān)系?
【解題步驟】
1將調(diào)查資料列入表(表342)中:
2建立“檢驗(yàn)假設(shè)”(無(wú)效假設(shè)),即假如大面積與中等面積燒傷組的敗血癥發(fā)生率之間沒(méi)有本質(zhì)差別,說(shuō)明敗血癥的發(fā)生率(21%和97%)來(lái)自同一總體,這種差別是由抽樣誤差造成的。根據(jù)這個(gè)假設(shè),可以用兩個(gè)組的合計(jì)發(fā)病率(165%)為假設(shè)的理論總體,并以此作為計(jì)算值的理論基礎(chǔ)。
3計(jì)算各組的理論數(shù)T值:理論數(shù)值是根據(jù)檢驗(yàn)假設(shè)推論的兩組病人數(shù)中應(yīng)有的發(fā)生敗血癥人數(shù),即兩組都按165%患病率計(jì)算,應(yīng)當(dāng)有多少人患病與不患病。大面積燒傷組205人,乘以合計(jì)患病率165%,便是大面積燒傷組理論上應(yīng)當(dāng)發(fā)生敗血癥的人數(shù)(205×165%=3383),即為理論值;而未發(fā)生敗血癥的人數(shù)為(205-3383=17117)17117。同理,再求出中等燒傷面積組病人的理論值為2211,不發(fā)生敗血癥的理論值為(134-2211=11189)11189。
將計(jì)算的理論值匯入表343中。
4代入χ2值公式(3411)計(jì)算χ2值:
χ2值無(wú)單位,與它相應(yīng)的概率為5%的χ2值(χ2 005)和概率為1%的χ2值(χ2001),可由卡方簡(jiǎn)明界值表344中查出。
如果上述檢驗(yàn)正確,A-T差值不會(huì)太小,如A-T相差太大,檢驗(yàn)假設(shè)成立的可能性就不大。
5根據(jù)χ2值與自由度查χ2值表:首先確定自由度(df或n′或r,),因四格表中有四個(gè)理論值,只要先用乘除法求出任何一個(gè),其余三個(gè)可用減法求出。這種必須先用乘除法求出理論值的格子數(shù)叫自由度。計(jì)算方法:
n′=(行數(shù)-1)(列數(shù)-1),四格表中為兩行、兩列,故:
n′=(2-1)(2-1)=1。
查簡(jiǎn)明χ2值表(表344,或查有關(guān)書(shū)籍卡方界值表):當(dāng)n′=1時(shí),χ2005=663,本例χ2=747,大于663,已超過(guò)χ2005=663水平,但小于χ20005=788水平,故P<001。
(二)四格表資料的χ2檢驗(yàn)(兩個(gè)樣本率的比較)
四格表資料的χ2檢驗(yàn)法是應(yīng)用最為廣泛和最為方便的一種方法,它所檢驗(yàn)的僅是兩個(gè)率的比較?;灸J綀D、公式和結(jié)果判斷標(biāo)準(zhǔn)如下:
4計(jì)算步驟:
(1)先將題目中的數(shù)據(jù)按四格表模式圖形式制表排列(用實(shí)際數(shù)字,不用百分率)。
(2)代入公式(3412),計(jì)算χ2值,χ2值是統(tǒng)計(jì)值,數(shù)值越大統(tǒng)計(jì)意義越大。
(3)根據(jù)χ2值的大小,按P值判斷標(biāo)準(zhǔn)確定P值大小。
(4)做出統(tǒng)計(jì)結(jié)論。
示例346用甲法治療大面積燒傷(甲組)71例,有52例并發(fā)全身性感染,用乙法治療的大面積燒傷(乙組)42例,有3例并發(fā)全身性感染。問(wèn)兩組感染發(fā)生率有無(wú)統(tǒng)計(jì)學(xué)差異?
【解題步驟】
1按四格表模式重新制表(表347):
2計(jì)算χ2值(公式342):
3計(jì)算自由度:因?yàn)樽杂啥龋╪′)=1{(行-1)(列-1)=(2-1)(2-1)},故本研究自由度為1(1×1)。
4按表344標(biāo)準(zhǔn)確定P值:因χ2值在384和663之間,故P<005,組間有顯著性差異。
5結(jié)果判斷:因P<005,說(shuō)明乙法治療的大面積燒傷病人并發(fā)全身性感染的機(jī)會(huì)低于甲組。
(三)行×列表資料的χ2檢驗(yàn)
以上講的是兩個(gè)樣本率的檢驗(yàn),用四格表法,但當(dāng)行數(shù)或列數(shù)大于2時(shí),應(yīng)當(dāng)用行×列表資料的χ2檢驗(yàn),又稱R×C表資料?;竟剑?br />
A為各格子的實(shí)際頻數(shù),nR、nC為各實(shí)際頻數(shù)所對(duì)應(yīng)的行的合計(jì)數(shù)和列的合計(jì)數(shù),N為總合計(jì)數(shù)。
該公式是由基本公式轉(zhuǎn)換而來(lái),不需要求理論頻數(shù),方便實(shí)用。
示例337甲乙丙三所醫(yī)院同期對(duì)某藥進(jìn)行抗感染療效觀察,甲院觀察了29例,有效(23例)率為793%,乙院觀察了44例,有效(14例)率為318%,丙醫(yī)院觀察了11例,有效(3例)率為273%(資料見(jiàn)表348)。問(wèn)3所醫(yī)院抗感染治療的總體有效率是否有顯著意義?
【解題步驟】
1建立檢驗(yàn)假設(shè):H0:3所醫(yī)院的有效率相等,π1=π2;H1:3所醫(yī)院的有效率不相等,H1:π1≠π2。
2確定顯著性水平:α=005。
3根據(jù)χ2基本計(jì)算公式(3413)計(jì)算χ2值:
4確定自由度(n′)=(2-1)(3-1)= 2。
5查χ2值表確定P值:查表344可知,χ2005(2)=1060,今χ2=17907,>χ20005(2),故P<0005。
6推斷結(jié)論:在α=005水準(zhǔn)上,拒絕H0,接收H1,故該藥在三所醫(yī)院的抗感染效果存在統(tǒng)計(jì)學(xué)差異(P<0005)。
(四) 二列多格資料χ2值檢驗(yàn)
二列多格資料χ2值檢驗(yàn)也稱多個(gè)樣本率的比較,其目的是推斷它們所代表的總體率是否相等。該類資料的基本數(shù)據(jù)有R行(樣本個(gè)數(shù)),2列(指樣本的陽(yáng)性數(shù)與陰性數(shù)),所以又叫R×2列聯(lián)表或列聯(lián)表(contingency table)。
公式同基本公式(3413),計(jì)算出的資料可以進(jìn)行相關(guān)分析。
示例348(百分比相互比較):某醫(yī)院觀察嚴(yán)重?zé)齻∪嗽缙谘舆t治療對(duì)休克發(fā)生率有無(wú)影響,觀察時(shí)間分別為傷后大于18小時(shí)(甲組)、傷后6~18小時(shí)(乙組)和6小時(shí)以內(nèi)(丙組)3個(gè)接受治療小組,結(jié)果匯于表349中。問(wèn)延遲治療對(duì)燒傷休克的發(fā)生率有無(wú)統(tǒng)計(jì)學(xué)差異,或相互之間有無(wú)關(guān)聯(lián)?
【解題步驟】
1建立檢驗(yàn)假設(shè):設(shè)H0:三種不同治療時(shí)間休克發(fā)生率相等;設(shè)H0:π1=π2;三種不同治療時(shí)間休克發(fā)生率不完全相等,H1:π1≠π2。
2確定顯著性水平:α=005。
3計(jì)算χ2值:將表349中的數(shù)字代入公式3413,得:
4計(jì)算自由度:(n′)=(2-1)(3-1)= 2。
5確定P值:因n′=2,查χ2值表(344),χ20005(2)=1060,本研究χ2=24776>χ20005(2)(1060)水平,P<0005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<0005,差異有高度顯著性,故認(rèn)為嚴(yán)重?zé)齻∪嗽缙诮邮苤委煂?duì)休克發(fā)生率有明顯影響作用,即可降低休克發(fā)生率。
7為了進(jìn)一步說(shuō)明它們之間的密切關(guān)聯(lián)程度,可根據(jù)公式計(jì)算關(guān)聯(lián)系數(shù):
根據(jù)四格表的pearson列聯(lián)系數(shù)值r在0~1之間。r值愈接近0,說(shuō)明兩個(gè)分類變量的關(guān)系愈弱,r值愈接近1,說(shuō)明關(guān)系愈密切。因?yàn)閞=0462,說(shuō)明延遲治療時(shí)間與休克發(fā)生率具有一定的關(guān)聯(lián)性。
示例349(樣本結(jié)構(gòu)比相互比較):某院2004年收治小兒燒傷145例,致傷因素:熱液150例,火焰10例,電流7例,其他23例;成人燒傷188人,致傷因素:熱液50例,火焰48例,電流18例,其他72例(資料見(jiàn)表3410),問(wèn)小兒燒傷原因與成人燒傷原因相互之間是否有關(guān)聯(lián)性?
【解題步驟】
1建立檢驗(yàn)假設(shè)和確定顯著性水平:①設(shè)H0:兩組病人傷因構(gòu)成相等,H0:π1=π2;②設(shè)H1:兩組病人傷因構(gòu)成不完全相等,H1:π1≠π2。
2顯著水平:α=005。
3計(jì)算χ2值:可將表3410中的數(shù)字代入公式(3413),得:
4計(jì)算自由度:(n′)=(2-1)(4-1)= 3。
5確定P值:n′=3,查χ2值表(344),χ20005(3)=1284,今χ2=7014,故P<0005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<0005,差異有非常顯著意義,故認(rèn)為小兒燒傷病人的致傷因素構(gòu)成比與成人不同,說(shuō)明小兒以熱液燙傷多見(jiàn),其他傷因構(gòu)成比低于成人組。
7為了進(jìn)一步說(shuō)明它們之間的密切關(guān)聯(lián)程度,可根據(jù)公式3414計(jì)算關(guān)聯(lián)系數(shù):
因?yàn)閞=0417,說(shuō)明兒童燒傷傷因與成年人燒傷傷因之間具有一定的關(guān)聯(lián)性。由于兒童熱液燙傷發(fā)生率為724%,成人熱液燙傷發(fā)生率為266%,兩者是否存在顯著性差異,需要進(jìn)行兩兩比較方可明確。
(五) 多列多格資料χ2值檢驗(yàn)
臨床經(jīng)常遇到3組或3組以上的多格資料,其計(jì)算方法仍以公式(3413)為基礎(chǔ) 。現(xiàn)舉例說(shuō)明:
示例3410(計(jì)數(shù)資料相關(guān)分析):某燒傷中心觀察了176例吸入性損傷病人的不同傷情與呼吸困難的各自例數(shù),問(wèn)呼吸困難程度與吸入損傷傷情之間有無(wú)關(guān)聯(lián)性(數(shù)據(jù)資料匯于表3411中)?
【解題步驟】
本例的設(shè)計(jì)和分析目的與上述例子不同。它并非是兩個(gè)樣本率與總體率、多個(gè)樣本率與總體率或構(gòu)成比之間的比較,而是單一樣本自身的比較,每個(gè)對(duì)象分別按兩種標(biāo)志分級(jí)(傷情與呼吸困難),屬于雙相率的計(jì)算,目的是推測(cè)兩種標(biāo)志之間有無(wú)相關(guān)性。
1建立檢驗(yàn)假設(shè):①設(shè)H0:呼吸困難程度與吸入性損傷程度無(wú)關(guān);②設(shè)H1:呼吸困難程度與吸入性損傷程度有關(guān)。
2確定顯著水準(zhǔn):α=005。
3計(jì)算χ2值:將表3411中的數(shù)字代入公式3413,得:
4計(jì)算自由度:(n′)=(3-1)(3-1)= 4。
5確定P值:n′=4,查χ2界值表(324),χ20005(4)=1486,本研究χ2=179623,>χ20005(4)(1486)水準(zhǔn),P<0005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<0005,差異有高度顯著性,故認(rèn)為呼吸困難程度與吸入性損傷程度關(guān)聯(lián)密切。
7為了進(jìn)一步說(shuō)明它們之間的密切關(guān)聯(lián)程度,可根據(jù)公式(3414)計(jì)算關(guān)聯(lián)系數(shù):
因?yàn)閞=07316,說(shuō)明呼吸困難程度與吸入損程度具有明顯的關(guān)聯(lián)性,即吸入損傷越重,呼吸困難越嚴(yán)重。
(六) 配對(duì)計(jì)數(shù)資料的χ2檢驗(yàn)
計(jì)數(shù)資料的配對(duì)設(shè)計(jì)常用于兩種檢驗(yàn)方法,如培養(yǎng)方法、診斷方法的比較。其特點(diǎn)是對(duì)樣本中的各觀察單位分別用兩種方法處理,然后觀察兩種方法的結(jié)果。此類資料可用配對(duì)χ2檢驗(yàn),比較兩個(gè)率之間是否有差異。從配對(duì)設(shè)計(jì)來(lái)說(shuō),配對(duì)計(jì)數(shù)資料與前邊所介紹的配對(duì)計(jì)數(shù)資料是相同的,都是把兩種處理因素分別施加于條件相似的受試對(duì)象上,或先后施于同一對(duì)象上。配對(duì)記錄試驗(yàn)結(jié)果如為計(jì)量資料,即屬計(jì)量配對(duì)資料;若結(jié)果為計(jì)數(shù)資料,即屬于計(jì)數(shù)配對(duì)資料。配對(duì)計(jì)數(shù)資料的χ2檢驗(yàn)包括兩個(gè)內(nèi)容:①分析它們的相關(guān)關(guān)系;②分析處理結(jié)果有無(wú)差異。
示例3411:100個(gè)深Ⅱ度燒傷創(chuàng)面,每個(gè)創(chuàng)面分別用兩種方法(甲法與乙法)診斷。結(jié)果:甲法陽(yáng)性者為67個(gè),乙法陽(yáng)性者50個(gè);其中甲乙兩法均陽(yáng)性者(a)39個(gè),甲乙兩法均陰性者(d)22個(gè),甲法陽(yáng)性乙法陰性者(d)28個(gè),乙法陽(yáng)性甲法陰性者(c)11個(gè)(資料見(jiàn)表3412)。問(wèn)甲乙兩種方法的診斷結(jié)果有無(wú)關(guān)聯(lián)及統(tǒng)計(jì)學(xué)差異?
【解題步驟】
第一步:分析兩種診斷結(jié)果有無(wú)相關(guān)關(guān)系,每個(gè)對(duì)象按兩種處理結(jié)構(gòu)分組,故可用四格χ2檢驗(yàn)公式計(jì)算,推斷兩種診斷方法之間有無(wú)相關(guān)關(guān)系:
1建立檢驗(yàn)假設(shè):①設(shè)H0:甲乙診斷方法之間無(wú)關(guān);②設(shè)H1:甲乙診斷方法之間有關(guān)。
2確定顯著水準(zhǔn):α=005。
3計(jì)算χ2值:將表3412中的數(shù)字代入公式3412,得:
4計(jì)算自由度:(n′)=(2-1)(2-1)=1。
5確定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本研究6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<005,差異有顯著性,故認(rèn)為兩種診斷程度關(guān)聯(lián)密切。
第二步:計(jì)算兩種處理結(jié)果有無(wú)差別:計(jì)算公式為(3415):
1建立檢驗(yàn)假設(shè):①設(shè)H0:兩總體b=c;②H1:兩總體b≠c。
2確定顯著水準(zhǔn):α=005
3計(jì)算χ2值:將表3412中的數(shù)字代入公式3415,得:
4自由度:n′=1。
5確定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本研究χ2=6564,介于χ20005和χ2001水準(zhǔn)之間,故P<005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<005,差異有顯著性,故認(rèn)為甲乙兩種診斷方法的確診率不同,甲法的確診率高于乙法。
7關(guān)聯(lián)性分析:根據(jù)公式3414計(jì)算關(guān)聯(lián)系數(shù):
因?yàn)閞=0629,說(shuō)明甲乙兩種方法的診斷結(jié)果關(guān)聯(lián)性較強(qiáng),甲法優(yōu)于乙法。
(七)兩個(gè)小樣本的χ2檢驗(yàn)方法
因?yàn)?chi;2檢驗(yàn)是以一條光滑曲線為基礎(chǔ),大樣本所得的概率與其真正概率很接近。當(dāng)為小樣本時(shí),如n<40(有人認(rèn)為n<50)時(shí),用前邊講的大樣本比較的u檢驗(yàn)或χ2檢驗(yàn)公式計(jì)算結(jié)果都不準(zhǔn)確,或偏倚較大,需要采用小樣本校正公式計(jì)算。兩個(gè)小樣本的檢驗(yàn)方法有兩種:一種是樣本(n)偏??;一種是四格表中有理論頻數(shù)中出現(xiàn)0或1時(shí)?,F(xiàn)舉例說(shuō)明:
1小樣本校正公式(3416):
示例3312:用甲乙兩種藥物治療糖尿病壞疽創(chuàng)面各30個(gè),甲藥組瘢痕發(fā)生率為70%,乙藥組癜痕發(fā)生率為50%。問(wèn)兩組之間的療效有無(wú)統(tǒng)計(jì)學(xué)差異?
【解題步驟】
(1)根據(jù)題中數(shù)據(jù)列表3413:
(2)將表3413中數(shù)字代入公式(3416),得:
(3)結(jié)果判斷:因n′=1,χ2值=7050<χ2001(6635),故P<001。組間有非常顯著差異。
(4)結(jié)論:甲藥治療的創(chuàng)面瘢痕發(fā)生率低于乙藥治療組。
小樣本率的χ2公式計(jì)算結(jié)果優(yōu)于大樣本率的χ2公式,尤其在其他檢驗(yàn)公式所得概率接近檢驗(yàn)水準(zhǔn)時(shí),宜用小樣本率的χ2公式。目前許多統(tǒng)計(jì)學(xué)者認(rèn)為:①小樣本率的χ2公式誤差最小,最為常用;②過(guò)去有一種誤解,只有當(dāng)例數(shù)小于30時(shí),或理論頻數(shù)小于5時(shí),χ2原公式計(jì)算值中有誤差,否則不必進(jìn)行校正。實(shí)踐證明,只要是判斷P=005或P=001的顯著檢驗(yàn),用校正公式肯定優(yōu)于基本公式,即使例數(shù)大于30,或理論頻數(shù)大于5,采用校正公式也比χ2原計(jì)算方法誤差小。
2 兩組數(shù)據(jù)中有1或0的小樣本資料計(jì)算:前邊已敘述了小樣本率的χ2計(jì)算公式與方法,但在實(shí)際工作中,小樣本資料經(jīng)常出現(xiàn)理論頻數(shù)小于1的情況,即T<1。這種資料不宜用小樣本計(jì)算公式計(jì)算,更不能用四格表公式計(jì)算,但宜用四格表確切概率法計(jì)算。確切概率法是由RAFisher提出的,故又稱Fisher確切概率檢驗(yàn)。此法本不屬于χ2檢驗(yàn)范疇,但可作為四格表資料假設(shè)檢驗(yàn)的補(bǔ)充。介紹如下:
確切概率法各種組合概率的計(jì)算公式(3417)為:
式中a、b、c、d的意義同表345,!為階乘符號(hào),N!=1×2×3×4×…×N,數(shù)學(xué)上規(guī)定!=1。一般計(jì)算器不能計(jì)算N≥70的階乘,這種情況下用對(duì)數(shù)計(jì)算。
四格表中|A-T|值的特點(diǎn):①各格相等,如表3414的A-T,a、d兩格均為-14,b、c兩格均為+14,其絕對(duì)值相等。因而計(jì)算某一四格表的|A-T|值時(shí),只需計(jì)算表中任一格的|A-T|值即可;②依次增減四格表中任何一格的數(shù)據(jù),可列出周邊合計(jì)不變條件下各種組合的四格表,如示例3413中的五個(gè)四格表,分別計(jì)算其|A-T|值,列于表下。由此可見(jiàn),兩側(cè)的|A-T|值較大,而中間的較小。
各種組合下累計(jì)概率的計(jì)算:①雙側(cè)檢驗(yàn):按公式3417分別計(jì)算兩側(cè)所有|A-T|值的各四格表的P值,然后相加,即為雙側(cè)檢驗(yàn)的P值;②單側(cè)檢驗(yàn):按研究目的,只計(jì)算一側(cè)的所有|A-T|值等于及大于樣本|A-T|值得四格表的P值,然后相加,即為單側(cè)檢驗(yàn)的P值。
示例3313:某醫(yī)生用新舊兩種方法治療燒傷后貧血病人共計(jì)27例,結(jié)果匯于表3414中,問(wèn)新舊藥物的療效有無(wú)差異?
【解題步驟】
(1)建立檢驗(yàn)假設(shè):H0:新藥與舊藥治愈率相等,即π1=π2;H1:新藥與舊藥治愈率不相等,即π1≠π2。
(2)確定顯著水準(zhǔn):α=005。
(3)計(jì)算概率P:本組N=25<40,且又T<5,故宜用確切概率法。由表3414可見(jiàn),最小周邊合計(jì)數(shù)為4,故所有可能的組合有5種,分別為:
(4)確定P值,做出推斷結(jié)論:P值應(yīng)等于所有小于樣本點(diǎn)的各種概率之和,本例符合樣本點(diǎn)要求者為(1)、(2)、(5),因此,P值的組合為上述三點(diǎn)之和,即P=00166+01423+01079=02668。按α=005水準(zhǔn),P>005。不能認(rèn)為兩種療法的治愈率有統(tǒng)計(jì)學(xué)差異。
3查四格表顯著性檢驗(yàn)用表(C值表)法:此方法簡(jiǎn)便易行,本文不再敘述,可參照有關(guān)資料查詢。