共分散分析(ANCOVA) ≪ 1/4 ≫
はじめに
分散分析はAnalysis of varianceを略してANOVA(アノバ)という。
共分散分析はAnalysis of covarianceを略してANCOVA(アンコバ)という。
共分散分析は分散分析と同じように母平均の差の検定(群間比較)を行う解析手法で、帰無仮説、対立仮説は次となる。
帰無仮説 H0:群間の主効果が同じ(母平均に差がない)
対立仮説 H1:群間の主効果に差がある(母平均に差がある)
共分散分析が分散分析と異なる点は共変量の影響を取り除いて母平均の差の検定を行うことである。
2群データの解析
具体例
ここで具体例を示す。A社とB社を取り上げて、20歳から39歳の社員の平均年収はどちらが高いかを調べることにした。A社から15人、B社から10人をランダムに選び年収調査をした。

年収の平均を調べた。A社は722万円、
B社は684万円でA社がB社を上回った。
会社全体(母集団)についても違いがあるかを
U検定で調べた。p値=0.0146<0.05より、
20歳から39歳社員の年収はA社の方がB社より高いといえる。
注.サンプルサイズが小さいのでt検定でなくU検定を適用した。

この結果をみて入社するとした場合、「業務内容が同じとしてどちらの会社を選択するか」と問われれば、平均年収の高いA社を選ぶ人が多いであろう。
だが観察力の鋭い人はもうちょっと詳細な情報がないとA社に行きたいかは分からないと答えるであろう。この人が思う情報には色々あると思うがその内の一つに社員の年齢がある。
A社はB社に比べ年齢の高い人が多くおり、年齢に引っ張られて平均年収が高くなっているからである。
一般的に年齢が高くなれば、年収も上がっていく傾向がある。
つまり、平均年収が高い要因として、2つの可能性がある。
① 本当にその会社の平均年収が高い
② その会社の従業員の年齢が高いためその会社の平均給与が高い
A社の平均年収が高い要因が、①の「本当にその会社の平均年収が高い」であれば、A社に行く。
しかし、A社の平均年収が高い要因が、②の「その会社の従業員の年齢が高いためその会社の平均年収が高い」であれば、A社の選択は別の要因を検討してから決める。
つまり言い換えると下記のようになる。
A社とB社の平均年収の差は、本当にA社とB社の会社の違い(給与水準の違い)によるものなのか、その会社の従業員の年齢の違い(年齢という交絡因子の違い)によるものなのかを明らかにしないと、真実がわからない
なので、「本当にA社とB社の給与水準の違い」なのか「年齢という交絡因子」によるものなのかを解析してみようということになる。
この問題を解決してくれるのが共分散分析である。
共分散分析は「年収に影響を与えていると考えられる、年齢の影響を除いたA社とB社の比較ができる」解析手法である。
共分散分析では交絡因子を共変量とういう。
共分散分析は、説明変数の中に、共変量(平均値に影響を与える変数、この例では年齢)があった場合には、その共変量の影響を取り除いて、「群間比較」(平均値の比較)を行うことができる解析手法である。
<2群データ>共分散分析のデータ
共分散分析のデータ共分散分析に用いる解析データは次の3つである。
① 群データ カテゴリーデータ:この例ではA会社、B会社(3つ以上も可)
② 共変量 数量データ:この例では年齢
③ 目的変数 数量データ:この例では年収
先に示したデータに年齢を加えたデータを示す。
群数2の共分散データ


<2群データ>目的変数と共変量との相関関係及び回帰式
共分散分析を行う前に、共変量と目的変数との相関関係を調べておく必要がある。
両者、この例では年齢と年収の相関係数を調べると0.884である。
相関係数が高い値を示したので年収は年齢の影響を受けているといえる。そこで年齢の影響を除去してA社とB社の平均年収を比較することになる。
仮に年齢と年収の相関が低ければ、年齢の影響を除去することなくA社とB社の平均年収を比較することになる。
言い換えれば共分散分析をすることなく、分散分析でA社とB社の平均年収に違いがあるかを調べればよいということである。
共分散分析をする前に行うこと
① 縦軸に目的変数(年収)、横軸に共変量(年齢)を取り散布図を作成する。
② 相関係数を算出する。
③ 目的変数と共変量は無相関であるかを検定する。
④ 散布図に回帰直線を当てはめる。
⑤ 回帰式の係数は0であるかを検定する。
③と⑤は同じことなのでどちらかをする。
回帰係数0(無相関)の判定が示された場合、分散分析(ANOVA)を行なう。


<2群データ>調整済み平均
共分散分析では年齢(共変量)の影響を除去した年収(目的変数)の平均を算出することを目的としている。
この平均を調整済み平均という。
群別に調整済み平均を算出し、A社とB社で調整済み平均に有意差があるかを検証する。
この例の調整済み平均及び調整済み平均の有意差検定の結果を示す。

年収平均を見ると、A社722.1万円、B社684.2万円で差は37.9万円である。
共変量の影響を取り除いた調整平均をみると、A社703.7万円、B社711.8万円でその差は-8.1万円と差は小さくなった。
p値=0.4015>0.05でA社とB社の平均給与は差がないといえる。