第五節(jié) 顯著性檢驗與顯著性水準

作者:徐榮祥 出版社:中國科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月
一、顯著性檢驗(significance test)
顯著性檢驗又稱假設(shè)檢驗(hypothesis testing)。假設(shè)檢驗是統(tǒng)計學(xué)推斷的另一個領(lǐng)域,其應(yīng)用非常廣泛。醫(yī)學(xué)研究中經(jīng)常比較兩組或各組數(shù)據(jù)均數(shù)(或百分率)的差別在統(tǒng)計學(xué)上是否有顯著意義。這種檢驗方法稱“顯著性檢驗”。由于客觀上存在著生物學(xué)差異及抽樣差異,所以在比較兩組均數(shù)(或百分率)時就不能只看到兩組數(shù)值上的差別,而要分析這種差別是否基本上超過了生物差異及抽樣差異的范圍,是否反映兩組(或多組)總體均數(shù)存在著差別。檢驗的目的是計算由于偶然因素的機遇影響,出現(xiàn)這種差別的可能性有多大。
假設(shè)有兩種:一種是檢驗假設(shè)(也稱無效假設(shè)),符號為H0;一種是備選假設(shè),符號為H1。H1和H0是相聯(lián)系的、對立的假設(shè)。例如,為了檢驗兩個總體均數(shù)是否相等,通常認為,H0為兩個總體均數(shù)相等(μ1= μ2),即兩組處理效果無差別;H1為兩個總體均數(shù)不相等(μ1≠μ2),即兩組處理效果有差別。
按照統(tǒng)計學(xué)的步驟,應(yīng)先做出“無效假設(shè)”,即假設(shè)兩組資料實際上來自同一總體,目前的差別只不過是抽樣誤差所引起的。然后根據(jù)兩組樣本的實測數(shù)據(jù)和例數(shù)(樣本數(shù)),計算出上述“無效假設(shè)”的可能性有多大?如果這種可能性小于5%(或l%),就可以認為兩組數(shù)據(jù)來自同一總體的可能性很小,可以否定“無效假設(shè)”,而承認兩組均數(shù)的差異在統(tǒng)計學(xué)上有顯著(或非常顯著)統(tǒng)計學(xué)意義。統(tǒng)計學(xué)上認為,由抽樣誤差引起的差異是非本質(zhì)性的,是沒有意義的;由于實驗因素引起的差異才是本質(zhì)性的,才是有意義的。統(tǒng)計學(xué)把前者稱為“不顯著”,把后者稱“顯著”。
現(xiàn)舉例說明,無效假設(shè)就是實驗前先假設(shè)給予的條件(如藥物、治療方法等)不起作用,即實驗組給甲藥治療與對照組給乙藥治療的療效一樣,樣本來自同一個總體。最后將實驗結(jié)果進行統(tǒng)計學(xué)處理,如兩組實驗結(jié)果無差別,即接受無效假設(shè),兩組的差異是抽樣造成的;如兩組實驗結(jié)果有差別,即拒絕無效假設(shè),接受備選假設(shè),認為兩組數(shù)值之差代表著幾個規(guī)律不相同的總體(一個為給予條件的總體,一個為對照的總體)。這就是統(tǒng)計學(xué)處理的依據(jù)。
二、顯著性水準
根據(jù)醫(yī)學(xué)統(tǒng)計學(xué)的統(tǒng)傳規(guī)定:P=001及P=005為“顯著性水準”,并作為判斷顯著意義的標準。P值也可通俗地理解為“批(P)駁兩組差別有統(tǒng)計意義的可能性”。
P≤001,批(P)駁的可能性小于或等于1%,即承認兩組間差別有統(tǒng)計意義的可能性大于或等于99%。此時可作統(tǒng)計結(jié)論認為:“兩組間差別有非常顯著的意義”。
P≤005(即001<P≤005),批(P)駁的可能性小于或等于5%,說明有95%以上的概率可認為兩組不是來自同一總體,結(jié)論為:兩組間差別有顯著意義。
P>005,批(p)駁的可能性大于5%,說明兩組均數(shù)盡管不同,但該差別來自抽樣誤差的概率大于5%,結(jié)論為:兩組間差異無顯著意義。
兩組間差異不顯著說明兩數(shù)值之差可能都是由抽樣誤差引起的;差異顯著說明兩數(shù)值之差可由抽樣引起的可能性等于或小于5%,兩組之差很可能代表了兩個規(guī)律不同的總體;差異非常顯著說明兩數(shù)值來自一個總體的可能性等于或小于1%,更有可能來自同一總體。
三、統(tǒng)計結(jié)論與專業(yè)結(jié)論
“有顯著意義”是個統(tǒng)計結(jié)論,表示統(tǒng)計推斷(否定無效假設(shè))的可靠程度,說明兩組總體很可能不同,但不能說明差別的大小,更不能說明差別之間有任何因果關(guān)系?!盁o顯著意義”是說明根據(jù)現(xiàn)有數(shù)據(jù)尚不足于否定無效假設(shè),并不是說沒有差異,更不能說兩組基本相同。
在作專業(yè)結(jié)論時除了考慮統(tǒng)計結(jié)論外,還要結(jié)合專業(yè)知識全面考慮,不能做出脫離實際或脫離本題的結(jié)論。例如,兩組尿量每日只差100mL,或血壓只差0667kPa(5mmHg),這時即使統(tǒng)計結(jié)果差別有顯著意義。實際上,這點細微差別并非有臨床價值,不應(yīng)做出有利尿作用或降壓作用的專業(yè)結(jié)論。再如,甲組創(chuàng)面的愈合時間為125±27天,乙組創(chuàng)面的愈合時間為132±30天,看起來甲組的愈合時間似乎比乙組提前了接近一天,即使有顯著意義但無臨床意義,因為創(chuàng)面的愈合是以晝夜整天為單位計算的。