対応のあるt検定

対応のあるt検定の概要

データは数量データとカテゴリーデータに大別されるが、対応のあるt検定は量的データに適用できる手法である。

対応のあるt検定は、p値による有意差判定と母平均差分の信頼区間から構成される。
p値による有意差判定とは、2つの母集団から無作為抽出した「個々のサンプルのデータ差分」の平均や標準偏差から、その2つ(2群)の母平均が等しいと言えるかをp値によって調べる方法である。

母平均差分の信頼区間とは、標本平均の差分が母集団の差分であると言い切るのは危険であるので標本平均の差分に幅をもたせて推定する方法である。

対応のあるt検定は帰無仮説が正しいと仮定した場合に、「個々のサンプルのデータ差分」の平均や標準偏差から計算された検定統計量がt分布に従うことを利用する統計学的検定法である。

母集団の正規性については、対応のあるt検定は頑健だといわれている。それは、サンプルサイズが十分大きければ母集団が正規分布でなくとも検定統計量はt分布に近づくからである。「サンプルサイズが十分大きい」の目安は30である。
すなわち、サンプルサイズが30以上であれば母集団が正規分布でなくても対応のあるt検定は適用できるということである。サンプルサイズが30に満たない場合の母平均の差の検定はノンパラ検定を適用する。

5件法(5段階評価)などの順序尺度のデータは、対応のあるt検定は適用できないので、ノンパラ検定を適用する。

p値による有意差判定の手順

①帰無仮説を立てる

群1の母平均と群2の母平均値は同じ。

②対立仮説を立てる

次の3つの内のいずれかにする。
(1)群1の母平均は群2の母平均より大きい 
(2)群1の母平均は群2の母平均より小さい
(3)群1の母平均と群2の母平均は異なる

③両側検定、片側検定を決める

対立仮説によって自動的に決まる。
対立仮説(1)→片側検定(右側検定)
対立仮説(2)→片側検定(左側検定)
対立仮説(3)→両側検定

④検定統計量を算出

⑤p値の算出

検定統計量は帰無仮説が正しいと仮定した場合にt分布に従う。
t分布において、横軸の値が検定統計量であるときの上側の面積をp値という。
片側検定におけるp値はt分布における検定統計量の上側確率である。
両側検定におけるp値はt分布における検定統計量の上側確率の2倍。

⑥p値による有意差判定

片側検定(右側検定、左側検定)、両側検定いずれも
p値<有意水準0.05
帰無仮説を棄却し対立仮説を採択 有意差があるといえる。
p値≧有意水準0.05
対立仮説を採択できず、有意差があるといえない。
※有意水準は0.05が一般的であるが、0.01を適用することもある。
※有意差判定を次で示すこともある。

p値<0.01 [**]  有意水準1%で有差がある
0.01≦p値<0.05[* ]  有意水準5%で有意差がある
p値≧0.05 [ ]  有意差があるがあるとはいえない

母平均差分の信頼区間の手順

信頼区間を次式よって算出する。

標準誤差は「p値による有意差判定」の手順の④で示した式で求められる値である。

棄却限界値は信頼度95%(有意水準5%)における定数である。
t分布において、上側と下側を合わせた確率が0.05(5%)となる横軸の値(パーセント点)が棄却限界値である。

信頼区間を適用しての有意差検定を行う

<ケース1>

信頼区間が0をまたがらない。(0より大きい、あるいは、0より小さい)
比較する2群の母平均値は異なる。

<ケース2>

信頼区間が0をまたがる
比較する2群の母平均値は異なるといえない。

対応のあるt検定の結果

具体例

製薬会社が解熱剤を開発した。
その新薬Yの解熱効果を明らかにするために50人の患者を対象に、薬剤の投与前と投与後の体温を調べた。

次の3つについて仮説検証せよ。
(1) 母集団の体温平均値は、投与後は投与前に比べて高いかを調べよ。
(2) 母集団の体温平均値は、投与後は投与前に比べて低いかを調べよ。
(3) 母集団の体温平均値は、投与前と投与後で異なるかを調べよ。

同じ患者の体温の比較なので、対応のあるデータである。
サンプルサイズは50で30より大きい。
具体例は対応のあるt検定で行うのがよい。

検定結果

<1> p値による有意差判定

(1)右側検定

p値>0.05より、
「母集団の体温平均値は、投与後は投与前に比べて高い」はいえない。

(2)左側検定

p値<0.05より、
「母集団の体温平均値は、投与後は投与前に比べて低い」はいえる。

(3)両側検定

※両側検定の差分は-0.53の絶対値0.53である。

p値<0.05より、
「母集団の体温平均値は、投与前と投与後で異なる」がいえる。

具体例の仮説検証は下記の3つであった。

(1)母集団の体温平均値は、投与後は投与前に比べて高いか
(2)母集団の体温平均値は、投与後は投与前に比べて低いか
(3)母集団の体温平均値は、投与前と投与後で異なるか

演習として3つについて仮説検証を行ったが、通常はこの中の一つについて仮説検証する。どれを選定するかは目的によるが、この具体例は「母集団の体温平均値は、投与前と投与後で異なるか」を明らかにすることが目的なので(3)の両側検定がよいと思われる。

<2> 母平均差分の信頼区間

母集団における投与後体温と投与前体温の平均差分の信頼区間は
信頼度95%で、-0.96度~-0.11度の間にあるといえる。
信頼区間は0をまたがらないので、「母集団の体温平均値は、投与前と投与後で異なる」がいえる。


データ解析・アンケート分析のご相談ならアイスタット。データ解析のコンサルティングも承っております。見積無料、お気軽にご相談ください。

目次