t検定(スチューデントのt検定)

t検定の概要

データは数量データとカテゴリーデータに大別されるが、t検定は数量データに適用できる手法である。
t検定は、p値による有意差判定と母平均差分の信頼区間から構成される。

p値による有意差判定とは、2つの母集団から無作為抽出したサンプルの標本平均や標本標準偏差から、その2つ(2群)の母平均が等しいと言えるかをp値によって調べる方法である。
母平均差分の信頼区間とは、標本平均の差分が母集団の差分であると言い切るのは危険であるので標本平均の差分に幅をもたせて推定する方法である。

t検定はスチューデントのt検定とも言われる。検定名にあるスチューデントは、開発者であるゴセット (William Sealy Gosset) が論文執筆時に用いていたペンネーム Student に由来する。

t検定は下記条件の基に帰無仮説が正しいと仮定した場合に、サンプルの標本平均や標本標準偏差から計算された検定統計量がt分布に従うことを利用する統計学的検定法である。

  • 2群のデータは対応していない(対応のないデータ)
  • 2つの母集団は正規分布に従っている(母集団の正規性)
  • 2群の分散が等しい(分散の均一性)

母集団の正規性については、t検定は頑健だといわれている。それは、サンプルサイズが十分大きければ母集団が正規分布でなくとも検定統計量はt分布に近づくからである。「サンプルサイズが十分大きい」の目安は30で、2群合わせると60である。

言い換えれば2群合わせたサンプルサイズが60以上であれば母集団が正規分布でなくてもt検定は適用できるということである。サンプルサイズが60に満たない場合の母平均の差の検定はノンパラ検定を適用する。

5件法(5段階評価)のデータはt検定を適用してよいが、4件法はノンパラ検定を適用するのがよいと思われる。

p値による有意差判定の手順

①帰無仮説を立てる

群1の母平均と群2の母平均値は同じ

②対立仮説を立てる

次の3つの内のいずれかにする
(1)群1の母平均は群2の母平均より大きい 
(2)群1の母平均は群2の母平均より小さい
(3)群1の母平均と群2の母平均は異なる

③両側検定、片側検定を決める

対立仮説によって自動的に決まる
対立仮説(1) → 片側検定(右側検定)
対立仮説(2) → 片側検定(左側検定)
対立仮説(3) → 両側検定

④検定統計量を算出

標本分散s2はs12とs22の加重平均である。

⑤p値の算出

検定統計量は帰無仮説が正しいと仮定した場合にt分布に従う。
t分布において、横軸の値が検定統計量であるときの上側の面積をp値という。
片側検定におけるp値はt分布における検定統計量の上側確率である。
両側検定におけるp値はt分布における検定統計量の上側確率の2倍。

⑥p値による有意差判定

片側検定(右側検定、左側検定)、両側検定いずれも
p値<有意水準0.05
帰無仮説を棄却し対立仮説を採択 有意差があるといえる。
p値≧有意水準0.05
対立仮説を採択できず、有意差があるといえない。
※有意水準は0.05が一般的であるが、0.01を適用することもある。

母平均差分の信頼区間の手順

信頼区間を次式よって算出する。

(X1-X2)±棄却限界値×標準誤差
下限値=(X1-X2)-棄却限界値×標準誤差
上限値=(X1 -X2)+棄却限界値×標準誤差

標準誤差は「p値による有意差判定の手順」の④で示した式で求められる値である。

標本分散s2は群1の分散s12と群2の分散s22の加重平均である。

棄却限界値は信頼度95%(有意水準5%)における定数である。
t分布において、上側と下側を合わせた確率が0.05(5%)となる横軸の値(パーセント点)が棄却限界値である。

信頼区間を適用しての有意差検定を行う

<ケース1>

信頼区間が0をまたがらない(0より大きい、あるいは、0より小さい)
比較する2群の母平均値は異なる。

<ケース2>

信頼区間が0をまたがる
比較する2群の母平均値は異なるといえない。

t検定の結果

具体例

ある小学校について、男子と女子のお年玉金額の平均に違いがあるかを明らかにしたい。
下記はこの小学校のお年玉金額を調べた調査結果である。

この小学校全体(母集団)における男子と女子のお年玉金額の標準偏差は等しいことが分かっている。

<1> 次の3つについて有意水準5%で調べよ。
(1)お年玉金額の平均は、男子の方が女子より高い。
(2)お年玉金額の平均は、男子の方が女子より低い。
(3)お年玉金額の平均は、男子と女子は異なる。

<2> この学校全体の男子と女子のお年玉金額の平均差分の信頼区間を信頼度95%で算出せよ。

男子と女子の比較なので対応のないデータである。
サンプルサイズはn1+n2=190で60より大きい。
母集団における男子と女子のお年玉金額の標準偏差は等しい。
具体例はt検定で行うのがよい。

検定結果

<1> p値による有意差判定

(1)右側検定

p値<0.05より、
お年玉金額の平均は男子の方が女子より高いがいえる。

(2)左側検定

p値>0.05より、
お年玉金額の平均は男子の方が女子より低いがいえない。

(3)両側検定

p値<0.05より、
お年玉金額の平均は男子と女子は異なるがいえる。

具体例の仮説検証は下記の3つであった。
(1)お年玉金額の平均は、男子の方が女子より高いかを調べよ。
(2)お年玉金額の平均は、男子の方が女子より低いかを調べよ。
(3)お年玉金額の平均は、男子と女子は異なるかを調べよ。

演習として3つについて仮説検証を行ったが、通常はこの中の一つについて仮説検証する。
どれを選定するかは目的によるが、この具体例は「お年玉金額の男子と女子の違い」を明らかにすることが目的なので (3) の両側検定がよいと思われる。

<2> 母平均差分の信頼区間

この学校全体の男子と女子のお年玉金額の平均差分の信頼区間は、信頼度95%で、189円~8,411円の間にあるといえる。
信頼区間は0をまたがらないので、お年玉金額の平均は男子と女子は異なるがいえる。


データ解析・アンケート分析のご相談ならアイスタット。データ解析のコンサルティングも承っております。見積無料、お気軽にご相談ください。

目次