効果量、検出力を適用したサンプルサイズの決め方
有意差検定では、サンプルが少なければp値は大きくなり、効果があるといえそうなことでも「有意差なしという結果になること」があります。逆にサンプルを増やせばp値は小さくなり、効果があるといえそうにないことでも「有意差ありという結果になること」があります。そのため、調査は適切なサンプルサイズで行う必要があります。サンプルサイズは効果量、検出量から求め、検出力が80%であるサンプルサイズが適正とされています。
効果量とは
効果量は次式で求められる値です。
割合に関する効果量=2群の割合差 ÷ 標準偏差
平均に関する効果量=2群の平均差 ÷ 標準偏差
検出力とは
有意水準(通常5%)をα、第1種の過誤、Type I エラーといいます。
α(5%)は、実際には帰無仮説が正しいにもかかわらず、それを誤りと判定する確率。差がないのにあると判断してしまう危険の率、と言えます。1-αは帰無仮説が正しいとき、それを棄却せずに採択する確率で、帰無仮説を棄却した場合の信頼率といえます。
平たくいうと、αは「効果がない」のに「効果がある」と判定する確率です。
1-αは「効果がない」のに「効果がない」と判定する確率です。
第2種の過誤(Type Ⅱ エラー)をβで表します。
βは「効果がある」のに「効果がない」とする過誤の確率です。
1-βは検出力で「効果がある」のに「効果がある」とする正しい判断の確率です。
| 1-α:信頼率 「効果ない」のに「効果ない」とする正しい判断の確率 | β:第2種の過誤 「効果ある」のに「効果ない」とする過誤の確率 |
| α:第1種の過誤 「効果ない」のに「効果ある」とする過誤の確率 | 1-β:第2種の検出力 「効果ある」のに「効果ない」とする正しい判断の確率 |
検出力は80%とすることが多いように思われます。実際に効果がある場合に80%の確率でその効果を検出できることを意味します。
検出力が80%であるサンプルサイズが適正
サンプルが少なければp値は大きくなり、統計的に有意になりにくくなります。サンプルが少なければ効果があるといえそうなことでも「有意差なしという結果になること」があります。
逆に、サンプルを増やせば、p値は小さくなり、統計的に有意になりやすくなります。サンプルを増やしすぎると効果があるといえそうにないことでも「有意差ありという結果になること」があります。
したがって、調査は適切なサンプルサイズに対して行う必要があります。そのようなサンプルサイズは、検出力が80%であるサンプルサイズが適正とされています。
サンプルサイズ算出公式

※ 0.84は検出力を80%としたときの定数
※ 効果量は2群の母平均(母比率)の差分を[差分の母標準偏差]で割った値
※ 効果量は分析者が0.2~1の間で設定する値。
具体例(有意差検定で、有意差が認められるサンプルサイズを求める)
男性の保有率は40%、女性の保有率は30%、全体保有率35%となる調査結果を想定した時、男性と女性の保有率に有意な差が認められるサンプルサイズnを求めよ。
<解答>

サンプルサイズは355人が適正である。

「母集団の割合の標準偏差」を求める式のPは、ここでは全体保有率35%(➡0.35)で計算しました。

