共分散分析

目次

共分散分析(ANCOVA)≪ 4/4 ≫

<3群データ>回帰係数有意性の検定

共分散分析を行う前に、共変量と目的変数との相関関係を調べておく必要がある。
この例では年齢と年収の相関係数を調べると0.825である。
相関係数が高い値を示したので年収は年齢の影響を受けているといえる。
そこで年齢の影響を除去してP社とQ社とR社の平均年収を比較することになる。
仮に年収と年齢の相関が低ければ、年齢の影響を除去することなくA社とB社の平均年収を比較することになる。
言い換えれば共分散分析をすることなく、分散分析で3社間の平均年収に違いがあるかを調べればよいということである。そこで母集団における、年齢と相関は0でない相関があるか(回帰係数は0でないか)を検定することになる。
検定結果を示す。

p値<0.05より、有意水準0.05で「回帰係数は0ではない」といえる。
年収は年齢の影響を受けているので、調整済み平均で3社間を比較しければならない。
注:判定 p値<=0.001 [**]   0.01<p値≦0.05 [ *]   p値>0.05 [ ]

上記表の計算方法を示す。
 自由度 回帰による変動 → 1 固定   
 自由度 水準内変動 → n – (1 + 群数)=31-(1+3)=27
 偏差平方和 回帰による変動 → 群別偏差平方和-共通回帰式残差平方和            
               =28817.5(「共通回帰式」表内赤枠)
                  -7568.56(下表「共通回帰式残差平方和の求め方」赤枠)
               =21248.99
 偏差平方和 水準内変動 → 共通回帰式残差平方和=7568.56下表「共通回帰式残差平方和の求め方」赤枠
 不偏分散 回帰による変動 → 偏差平方和回帰による変動÷自由度回帰による変動
             =21248.99÷1=21248.99
 不偏分散 水準内変動 → 偏差平方和回帰による変動÷自由度水準内変動
            =7568.56÷27=280.32
 分散比 → 不偏分散回帰による変動÷不偏分散水準内変動
      =21218.99÷280.32=75.80
 p値→Excel関数で求られる。
     =FDIST(分散比,自由度回帰による変動, 自由度水準内変動)
     =FDIST (75.80,1,27) Enter 0.0000

共通回帰式残差平方和の求め方
共通回帰式に年齢のデータを代入し理論値を算出する。
残差平方は(年収データ-理論値)の2乗である。

<計算例>
No2 理論値
   群1 P社の共通回帰式 y=5.655x+526.7
               y=5.655×29歳+526.7=690.7
   残差平方=(年収データ-理論値)2
       =(674-690.7)2=278.0

No12
   群2  Q社の共通回帰式 y=5.655x+508.0
y=5.655×31歳+508.0=683.3
残差平方=(年収データ-理論値)2
        =(671-683.3)2=152.3


No22
  群3  R社の共通回帰式 y=5.655x+514.7
              y=5.655×27歳+514.7=667.4
残差平方=(年収データ-理論値)2
             =(666-667.4)2=2.0

<3群データ>回帰係数平行性の検定

前で示した個別回帰式の3本の直線の傾きが同じとみなされた時、共通回帰式の当てははめを行える。
そこで、「個別回帰式の3本の直線の傾きが同じ」→「回帰係数が平行である」かを調べる検定を行う必要がある。
この検定を回帰係数平行性の検定という。
検定結果を示す。

p値>0.05より、有意水準0.05で「平行だ」ということが否定できない。
拡大解釈をして「回帰係数は平行である」といえる。
3本の回帰係数が平行であると言えたので調整済み平均を算出することができる。
注: 回帰係数平行性の検定の場合
注: 判定 p値<=0.01 [ ]    0.01<p値≦0.05 [* ]   p値>0.05 [** ]
上記表の計算方法を示す。
 自由度_非平行性の変動 → 群数-1=3-1=2     
 自由度_残差変動 → n – 2× 群数=31-2×3=25
 偏差平方和_非平行性の変動 → 共通回帰式残差平方和-個別回帰式残差平方和                          
               =7568.6(「共通回帰式残差平方和の求め方」表内赤枠)
                 -7543.96(下表「 個別回帰式残差平方和の求め方」赤枠)=24.60  
 偏差平方和_残差変動 → 個別回帰式残差平方和 =7543.96(下表「 個別回帰式残差平方和の求め方」赤枠)
 不偏分散_非平行性の変動 → 偏差平方和_非平行性の変動÷自由度_非平行性の変動
               =24.60÷2=12.30
 不偏分散_残差変動 → 偏差平方和_残差変動÷自由度_残差変動
           =7543.96÷25=301.76
 分散比 → 不偏分散_非平行性の変動÷不偏分散_残差変動
         =12.30÷301.76=0.0408
 p値→Excel関数で求られる。
     =FDIST(分散比,自由度_非平行性の変動, 自由度_残差変動)
    =FDIST (0.0408,2,25) Enter 0.9601

個別回帰式残差平方和の求め方
個別回帰式に年齢のデータを代入し理論値を算出する。
残差平方は(年収データ-理論値)の2乗である。

<計算例>
No2 理論値
   群1 P社の個別回帰式 y=5.766x+523.1
               y=5.766×29歳+523.1=690.3
残差平方=(年収データ-理論値)2
       =(674-690.3)2=265.6

No12 理論値
    群2  Q社の個別回帰式 y=5.850x+501.3
               y=5.850×31歳+501.3=682.6
   残差平方=(年収データ-理論値)2
       =(671-682.6)2=135.5

No22 理論値
   群3  R社の個別回帰式 y=5.421x+522.5
               y=5.421×27歳+522.5=668.8
残差平方=(年収データ-理論値)2
        =(666-668.8)2=8.1


<3群データ>切片が異なるか否かの検定 (水準間の差の検定)

  後ほど3群間相互の調整済み平均の有意差検定を解説するが、この検定を行う前に実施すべき検定が「切片が異なるか否かの検定」である。
  下記は「別の事例」ページで示した図である。

調整済み平均の差分は、共通回帰式と縦軸切片との交点から作られる差分と同じである。
したがって、切片の差が異なれば、調整済み平均の差も異なるがいえる。

切片が異なるか否かの検定の結果を示す。

p値>0.05より、有意水準0.05で「切片は異なる」といえないので、「3群間相互の調整済み平均の有意差検定の結果」は参考値として見る。
上記表の計算方法を示す。
 自由度_水準間変動 → 群数-1=3-1=2     
 自由度_水準内変動 → n – (1+ 群数)=31-(1+3)=27
 偏差平方和_水準間変動  →  全体回帰式偏差平方和-共通回帰式残差平方和                        
               =9297.9(下表「全体回帰式残差平方和の求め方」赤枠)
                 -7568.6(「共通回帰式残差平方和の求め方」赤枠)                        
               =1729.33     
 偏差平方和_水準内変動 →  共通回帰式残差平方和=7568.6(共通回帰式残差平方和の求め方」赤枠)
 不偏分散_水準間変動 → 偏差平方和_水準間変動÷自由度_水準間変動                       
             =1729.3÷2=864.67     
 不偏分散_水準内変動 →  偏差平方和_水準内変動÷自由度_水準内変動
             =7568.6÷27=280.32
 分散比 → 不偏分散_水準間変動÷不偏分散_水準内変動
             =864.67÷280.32=3.08
 p値 → Excel関数で求られる。
      =FDIST(分散比,自由度_水準間変動, 自由度_水準内変動)
     =FDIST (3.08,2,27) Enter 0.0622

全体回帰式残差平方和の求め方
全体回帰式に年齢のデータを代入し理論値を算出する。
残差平方は(年収データ-理論値)の2乗である。

<計算例>
No2 理論値
  全体回帰式 y=5.366x+526.06
         y=5.366×29歳+526.06=681.7
No2 残差平方
   残差平方=(年収データ-理論値)2
       =(674-681.7)2=59.0


















<3群データ>3群間相互の調整済み平均の有意差検定

調整済み平均の有意差検定の結果を示す

調整済み平均の有意差検定の統計量の求め方を解説する。
  統計量は次に示すデータを作成し、このデータに重回帰分析を行うことによって求められる。
  説明変数、AB、AC、BCの回帰係数を標準誤差で割った値が上表の統計量である。

重回帰分析は(群数-1)ケース行う。この例は3群なので重回帰分析は2ケース行う。
したがって、データも2ケース作成する。
 <ケース1>のデータ
  目的変数 年収データ
  説明変数 群データ(会社)を1,0データに変換した2項目と年齢データ。
                1,0データの項目名はAB、ACとする。
 <ケース2>のデータ
  目的変数 年収データ
  説明変数 群データ(会社)を1,0データに変換した2項目と年齢データ
                1,0データの項目名は、無名、BCとする。

1,0データの作成には次のルールがある。
・ 群数3なので、2ケース
・ 群1をA、群2をB、群3をCとする。
<ケース1>
・ 項目名をAB、ACとする。
・ AB、ACは名前にAがあるので、群1(A)の塊は全て0。(ピンク色)。
・ AB列 → ABは名前にBがあるので、群2(B)の塊は1。(紺色)。
・ AC列 → ACは名前にCがあるので、群3(C)の塊は1。(紺色)
<ケース2>
・ 項目名を無名、BCとする。、
・ 無名、BCは名前にBがあるので、群2(B)の塊は全て0。(ピンク色)。
・ BC列 → BCの名前にCがあるので、群3(C)の塊は1。(紺色)

この例は3群だが4群(A、B、C、D)の場合の1,0データの作成方法を示しておく。

・群数4なので重回帰分析用データは3ケース(群数-1)作成。
・群1をA、群2をB、群3をC、群4をDとする。
<ケース1>
・項目名をAB、AC、ADとする。
・AB、AC、ADは名前にAがあるので、群1(A)の塊は全て0。(ピンク色)。
・ABは名前にBがあるので、群2(B)の塊は1。(紺色) 
・ACは名前にCがあるので、群3(C)の塊は1。(紺色)
・ADは名前にCがあるので、群4(D)の塊は1。(紺色)
<ケース2>
・項目名を無名、BC、BDとする。
・無名、BC、BDは名前にBがあるので、群2(B)の塊は全て0。(ピンク色)。
・BC名前にCがあるので、群3(C)の塊は1。(紺色)
・BD名前にDがあるので、群4(D)の塊は1。(紺色)
<ケース3>
・項目名を無名、無名、CDとする。、
・無名、無名、CDは名前にCがあるので、群3(C)の塊は全て0。(ピンク色)。
・CD名前にDがあるので、群4(D)の塊は1。(紺色)

重回帰分析の結果を示す。

p値
 統計量はt分布に従う。
 p値はExcel関数で求められる。
   =TDIST(統計量、自由度)             
    自由度=個体数-群数-1=31-3-1=27 
ABのp値  =TDIST(2.45、27) Enter 0.0213
ACのp値  =TDIST(1.63、27) Enter 0.1146
BCのp値  =TDIST(0.91、27) Enter 0.3727

1 2 3 4
目次