独立性の検定

独立性の検定の概要

独立性の検定カイ二乗検定(χ2検定)の一つで、クロス集計表を作成したとき、二つの項目が独立であるか(関連性があるか)を統計的に判定する方法である。

クロス集計表の各セルについて統計学が定める基準に従い期待度数を算出する。観測された実測度数と期待度数の食い違いを反映し検定統計量を算出する。

実測度数と期待度数が等しいという帰無仮説のもとで、検定統計量が(近似的に)カイ二乗分布に従う。カイ二乗分布を適用し、検定統計量が出現する確率p値を算出し、p値から2項目間の関連性(独立性)があるかを判断する。

クロス集計表の各セルの度数に0の度数がない場合、検出力が高い尤度比による独立性の検定が適用できる。

2項目のカテゴリー数がどちらも2カテゴリーのクロス集計表を2×2分割表という。2×2分割表の4つのセルの期待度数の中の少なくとも一つが5より小さい場合、イエーツの補正による独立性の検定、あるいはフィッシャーの正確確率検定(別名、フィッシャーの直接確率検定)を適用する。

独立性の検定で二つの項目の間に関連があると言えたとき、具体的にどのセルで顕著に高いか(低いか)を検出したい場合、調整残差分析を適用する。

独立性の検定の手順

①帰無仮説を立てる

クロス集計の2項目は独立である。(関連性がない)

②対立仮説を立てる

クロス集計の2項目は独立でない。(関連性がある)

③両側検定のみで片側検定はない

④検定統計量を算出

⑤p値を算出

カイ2乗分布を適用

⑥有意差判定

p値<有意水準0.05 クロス集計の2項目は関連性があるといえる

p値≧有意水準0.05 クロス集計の2項目は関連性があるといえない

独立性の検定の結果

具体例

ある地域に居住する有権者の政党支持率を調べるためにn=100の標本調査を実施した。
所得階層と政党支持とのクロス集計を行った。

所得階層と政党支持の関係は独立であるか、すなわち、所得階層で政党支持に違いがあるかを有意水準5%で検定せよ。

このクロス集計表解釈すると次のようになる。
J政党の支持率は高所得層が75%、中所得層が67%、低所得層は33%で、所得が高い層ほどJ政党の支持率は高くなる傾向がみられる。
M政党の支持率は高所得層が25%、中所得層が33%、低所得層は67%で、所得が低い層ほどM政党の支持率は高くなる傾向がみられる。
このクロス集計表でみられるように、ある特定の所得層である特定の政党支持の割合が高いとき、所得水準と支持政党の項目は関連性があると解釈する。
母集団における所得と政党支持との関連性は独立性の検定で把握できる。

検定結果

p値<0.05より、所得階層で政党支持に違いがあるといる。

※ 所得階層と政党支持に関連性があるともいえる。
無相関でない関連性があるということで、強い関連性があるかまでは分からない。 関連性の強弱はクラメール連関係数で把握できる。

2×2分割表の独立性の検定の結果

具体例

抗がん剤Yを投与したとき、効果がある患者と効果のない患者がいることが分かった。さらに、それには遺伝子のある部分が特殊な型であるかどうかが疑われている。そこで、抗がん剤Yの効果のあるなしとその患者の遺伝子が特殊型であるかどうかを調べた。

抗がん剤Yの効果有無に遺伝子特殊型が影響しているかを有意水準5%で検定せよ。

検定結果

期待度数に5以下があるので、イエーツの補正、もしくは、フィッシャーの正確確率検定を適用する。

フィッシャーの正確確率検定のp値<0.05より
抗がん剤Yの効果有無に遺伝子特殊型が影響しているといえる。

調整残差分析の結果

具体例

あるエリアに在住する120人に、今までに利用したコンビニ3会社についてどのような印象をいだいているかを聞いた。

コンビニ会社がどのような内容で評価されているか、あるいは評価されていないかを明らかにせよ。

検定結果

独立性の検定から、コンビニに対する印象は会社によって違いがあるといえる。

調整残差からp値が算出できる。

p値によって、どのセルで有意に高いか低いかが把握できる。

・商品の豊富さ・新鮮さはS店[**]で高く、L店[/ ]で低い
・店の内装・イメージはL店[**]で高く、S店[//]で低い
・従業員の接客態度は店によって有意に高い/低いはいえない。


データ解析・アンケート分析のご相談ならアイスタット。データ解析のコンサルティングも承っております。見積無料、お気軽にご相談ください。
目次