第四節(jié) 概率與可信限

作者:徐榮祥 出版社:中國(guó)科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月
一、概率
概率又稱幾率,是指總體某事件理論發(fā)生率大小的數(shù)值,或稱作是估計(jì)某事件發(fā)生的可能性大小的一種變量指標(biāo),用符號(hào)P表示。概率這個(gè)名詞雖然在日常工作中直接使用者較少,但是對(duì)于這一概念的應(yīng)用卻非常廣泛,例如,醫(yī)生根據(jù)自己的診治經(jīng)驗(yàn),認(rèn)為“這個(gè)病人十有八九會(huì)死于急性腎功衰竭”。若從概率論的角度分析,就是說(shuō)這個(gè)病人致死的原因80%~90%可能是急性腎功衰竭。有文獻(xiàn)記載,燒傷病人的半數(shù)致死燒傷面積(LD50)為87%,如果統(tǒng)計(jì)的數(shù)量相當(dāng)大,我們就可以把這個(gè)頻率看作概率,是說(shuō)87%燒傷面積者的治愈率在50%左右。又如,某動(dòng)物室存有雌雄各半的一大群動(dòng)物,我們隨意抽取2只,雖然不能預(yù)言其雌雄,但是根據(jù)統(tǒng)計(jì)學(xué)原理可以推算出,取一只為雄性的發(fā)生率為50%(即05);連取兩只均為雄性的發(fā)生率為025(05×05),其規(guī)律性可用05表示,(即連取n只均為雄性的發(fā)生率應(yīng)為05)。一般情況下,總體中某事件的概率是未知的,可以通過(guò)多次重復(fù)觀察樣本,從樣本中的雄性發(fā)生率來(lái)判斷總體的概率。所以,概率也可以認(rèn)為是無(wú)數(shù)次重復(fù)時(shí)該事件的發(fā)生率。
概率可用小數(shù)或百分?jǐn)?shù)表示,如P<05(005),或?qū)懽?0%(5%)。P值波動(dòng)在0~1之間。若某一事件必然不發(fā)生,則該事件發(fā)生的概率為0;某一事件必然發(fā)生,則該事件發(fā)生的概率為1。概率越接近0,表示發(fā)生的可能性越小,概率越接近1,發(fā)生的可能性越大。我們經(jīng)常遇到說(shuō)明概率事件的情況有三種:①必然事件指的是必然發(fā)生的事件,如人體皮膚與100℃沸水接觸1min,必然會(huì)發(fā)生Ⅲ度燒傷,必然事件的概率P=1;②不可能事件如1%燒傷面積的成人患者不會(huì)發(fā)生早期低血容量休克,必定不會(huì)發(fā)生,不可能事件的概率P=0;③隨機(jī)事件指的是在一定條件下可能發(fā)生,也可能不發(fā)生,如病人發(fā)生了條件致病菌感染,是否會(huì)發(fā)生敗血癥?回答是可能發(fā)生,也可能不發(fā)生,隨機(jī)事件的概率P在0與1之間。
概率也是某事件出現(xiàn)的可能性大小的度量,它與頻率不同,概率是對(duì)總體而言,頻率是對(duì)樣本而言。在相同條件下進(jìn)行n次重復(fù)實(shí)驗(yàn),事件發(fā)生數(shù)a小于或等于n(a≤n),則a與n的比(a/n)為事件A的頻率。如n逐漸增大,則事件A的頻率則越來(lái)越接近概率P。統(tǒng)計(jì)學(xué)上常以n充分大時(shí)事件A的頻率作為該事件概率的近似值。
二、可信區(qū)間
前邊已經(jīng)提到,可以用樣本均數(shù)估計(jì)總體均數(shù),樣本率可以估計(jì)總體率。每種估計(jì)如果僅是一個(gè)值,稱為凈值估計(jì),或點(diǎn)估計(jì)。它們都是無(wú)偏估計(jì),因?yàn)樗鼈兊臄?shù)字期望就等于各自的總體值。從變異的意義上講,樣本均數(shù)(或率)僅是對(duì)一份樣本而言,是總體均數(shù)(或率)的最好估計(jì)。樣本均數(shù)包括了一份樣本用于估計(jì)總體均數(shù)的所有信息。因此,樣本均數(shù)或樣本率具有估計(jì)的優(yōu)越性。但是,樣本均數(shù)與在各樣本之間是不一樣的,對(duì)于一個(gè)連續(xù)性的變量來(lái)講,樣本均數(shù)可取無(wú)窮多個(gè)值,即樣本均數(shù)未必恰好等于總體均數(shù)。樣本率也是如此,因?yàn)樵谘芯抗ぷ髦兴^察到的百分率或均數(shù),畢竟是從數(shù)量有限的樣本中得到的,它僅僅是接近而不是等于總體的概率或均數(shù)。為解決這個(gè)問(wèn)題,從而產(chǎn)生了區(qū)間可信限這個(gè)概念:用一個(gè)區(qū)間而不是一個(gè)點(diǎn)來(lái)估計(jì)總體參數(shù)。根據(jù)統(tǒng)計(jì)學(xué)原理,我們可以在百分率或均數(shù)的上下擴(kuò)大一定范圍,使總體均數(shù)(或率)處于該范圍內(nèi)的可能性為95%,這就是“95%的可信限”,或稱95%的可信區(qū)間。
事實(shí)上,我們并未測(cè)定總體的均數(shù)(或率),但是根據(jù)統(tǒng)計(jì)分析原理,有95%甚至99%的把握可以推導(dǎo)出總體均數(shù)所在的范圍。如果樣本例數(shù)很大,重復(fù)次數(shù)又很多,我們推斷總體的準(zhǔn)確性也就愈大。統(tǒng)計(jì)學(xué)常用樣本均數(shù)加減95%可信限,或99%的可信限來(lái)表示總體均數(shù)的預(yù)期范圍。