質(zhì)量檢驗(yàn):卡方檢驗(yàn)
作者: 來(lái)源: 文字大小:[大][中][小]
卡方檢驗(yàn)是一種用途很廣的計(jì)數(shù)資料的假設(shè)檢驗(yàn)方法。它屬于非參數(shù)檢驗(yàn)的范疇,主要是比較兩個(gè)及兩個(gè)以上樣本率( 構(gòu)成比)以及兩個(gè)分類變量的關(guān)聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或擬合優(yōu)度問(wèn)題。
它在分類資料統(tǒng)計(jì)推斷中的應(yīng)用,包括:兩個(gè)率或兩個(gè)構(gòu)成比比較的卡方檢驗(yàn);多個(gè)率或多個(gè)構(gòu)成比比較的卡方檢驗(yàn)以及分類資料的相關(guān)分析等。
在分類資料統(tǒng)計(jì)分析中我們常會(huì)遇到這樣的資料,如兩組大白鼠在不同致癌劑作用下的發(fā)癌率如下表,問(wèn)兩組發(fā)癌率有無(wú)差別?
處理 發(fā)癌數(shù) 未發(fā)癌數(shù) 合計(jì) 發(fā)癌率%
甲組 52 19 71 73.24
乙組 39 3 42 92.86
合計(jì) 91 22 113 80.33
52、19、39、3是表中最基本的數(shù)據(jù),因此,上表資料又被稱之為四格表資料??ǚ綑z驗(yàn)的統(tǒng)計(jì)量是卡方值,它是每個(gè)格子實(shí)際頻數(shù)A與理論頻數(shù)T差值平方與理論頻數(shù)之比的累計(jì)和。每個(gè)格子中的理論頻數(shù)T是在假定兩組的發(fā)癌率相等(均等于兩組合計(jì)的發(fā)癌率)的情況下計(jì)算出來(lái)的,如第一行第一列的理論頻數(shù)為71*91/113=57.18,故卡方值越大,說(shuō)明實(shí)際頻數(shù)與理論頻數(shù)的差別越明顯,兩組發(fā)癌率不同的可能性越大。
1、四格表資料的卡方檢驗(yàn)
四格表資料的卡方檢驗(yàn)用于進(jìn)行兩個(gè)率或兩個(gè)構(gòu)成比的比較。
1)專用公式:
若四格表資料四個(gè)格子的頻數(shù)分別為a,b,c,d,則四格表資料卡方檢驗(yàn)的卡方值=(ad − bc)2 * n/(a+b)(c+d)(a+c)(b+d),自由度v=(行數(shù)-1)(列數(shù)-1)
2)應(yīng)用條件:
要求樣本含量應(yīng)大于40且每個(gè)格子中的理論頻數(shù)不應(yīng)小于5。當(dāng)樣本含量大于40但理論頻數(shù)有小于5的情況時(shí)卡方值需要校正,當(dāng)樣本含量小于40時(shí)只能用確切概率法計(jì)算概率。
2、行X列表資料的卡方檢驗(yàn)
行X列表資料的卡方檢驗(yàn)用于多個(gè)率或多個(gè)構(gòu)成比的比較。
1)專用公式:
r行c列表資料卡方檢驗(yàn)的卡方值=
2)應(yīng)用條件:
要求每個(gè)格子中的理論頻數(shù)T均大于5或1<T<5的格子數(shù)不超過(guò)總格子數(shù)的1/5。當(dāng)有T<1或1<T<5的格子較多時(shí),可采用并行并列、刪行刪列、增大樣本含量的辦法使其符合行X列表資料卡方檢驗(yàn)的應(yīng)用條件。而多個(gè)率的兩兩比較可采用行X列表分割的辦法。
3、列聯(lián)表資料的卡方檢驗(yàn)
同一組對(duì)象,觀察每一個(gè)個(gè)體對(duì)兩種分類方法的表現(xiàn),結(jié)果構(gòu)成雙向交叉排列的統(tǒng)計(jì)表就是列聯(lián)表。
1)R*C 列聯(lián)表的卡方檢驗(yàn):
R*C 列聯(lián)表的卡方檢驗(yàn)用于R*C列聯(lián)表的相關(guān)分析,卡方值的計(jì)算和檢驗(yàn)過(guò)程與行X列表資料的卡方檢驗(yàn)相同。
2)2*2列聯(lián)表的卡方檢驗(yàn):
2*2列聯(lián)表的卡方檢驗(yàn)又稱配對(duì)記數(shù)資料或配對(duì)四格表資料的卡方檢驗(yàn),根據(jù)卡方值計(jì)算公式的不同,可以達(dá)到不同的目的。當(dāng)用一般四格表的卡方檢驗(yàn)計(jì)算時(shí),卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此時(shí)用于進(jìn)行配對(duì)四格表的相關(guān)分析,如考察兩種檢驗(yàn)方法的結(jié)果有無(wú)關(guān)系;當(dāng)卡方值=( | b − c | − 1)2/(b+c)時(shí),此時(shí)卡方檢驗(yàn)用來(lái)進(jìn)行四格表的差異檢驗(yàn),如考察兩種檢驗(yàn)方法的檢出率有無(wú)差別。
列聯(lián)表卡方檢驗(yàn)應(yīng)用中的注意事項(xiàng)同R*C表的卡方檢驗(yàn)相同。