共分散分析(ANCOVA) ≪ 2/4 ≫
<2群データ>調整済み平均の算出の考え方
調整済み平均の求め方を解説する。
下記図は、縦軸を年収(目的変数)、横軸を年齢(共変量)とした散布図である。
A社(青色)の散布点に回帰直線を引く。(青線)
B社(茶色)の散布点に回帰直線を引く。(橙線)
年齢の全体平均33.6歳の縦線を引く。(緑線)
緑戦と青線の交点から横線を引き縦軸の交点を求める。
緑戦と茶線の交点から横線を引き縦軸の交点を求める。
縦軸との交点が調整済み平均である。
調整済み平均は、B社711.8万円、A社703.7万円である。

下図は、上図を回帰直線が水平になるまで回転したものである。
水平にした2本の比較は年齢の影響を除去した年収の比較となる。

下図は元データのA社とB社の年収平均を示したものである。
A社の年収平均は722.1万円でB社の684.2万円を上回っている。
調整済み平均はA社がB社を下回っている。両者の平均の違いを確認されたい。

【結論】
A社とB社の平均年収を比較するとA社は722.1万円でB社の684.2万円を37.9万円上回っているが、年齢の影響を除去して比較するとA社703.7万円、B社711.8万円でA社とB社の差は-7.9万円である。
年齢の影響を除去するとA社とB社の平均年収差は小さくなった。
<2群データ>個別回帰式
「調整済み平均の算出の考え方」での図は、回帰直線を当てはめたと述べたが、正しくは共通回帰式というものを適用したものである。我々が通常用いる回帰式とは別物である。通常の回帰式を共通回帰式と識別するために 個別回帰式と呼ぶことにする。
個別回帰式を示す。
A社 y=6.235x+494.8
B社 y=6.503x+493.7
直線の傾きはA社がB社をやや下回るがどちらも右肩上がりの傾向を持つ、傾向がほぼ同じ傾きといってよさそうである。

下記の1、2のように個別回帰式の2本の直線の傾きが異なると、共変量(年齢)の影響を正確に除去できない。理想は3のように傾きが同じ(平行)になっていることである。

そこで、共分散分析を行う前に2本の直線の傾きが同じ(平行)であるかの検定をしておく必要がある。

p値>0.05より、有意水準0.05で「平行である」ということが否定できないので(拡大解釈すると母集団では平行である)、共分散分析が行える。
<2群データ>共通回帰式
母集団における個別回帰式の2本の直線は平行といえるので、散布点に最もあてははまりのよい平行である回帰式を当てはめる。これが共通回帰式である。
共通回帰式の算出手順
・偏差データを算出する。

・偏差データの散布図と回帰式
偏差の全データに回帰式を当てはめる。
回帰式はy=6.419xである。



定数項は次によって算出する。
A社定数項=年収平均-回帰係数×年齢平均=722.1-6.419×36.5=488.0
B社定数項=年収平均-回帰係数×年齢平均=684.2-6.419×29.3=496.1
【共通回帰式】
A社 y=6.419x+488.0
B社 y=6.419x+496.1
<2群データ>調整済み平均の算出式
共通回帰式に全体の年齢平均を代入する。
調整済み平均=共通回帰式の回帰係数×共変量(年齢)の全体平均+定数項
A社調整済み平均=6.419×33.6+488.0=703.7
B社調整済み平均=6.419×33.6+496.1=711.8
<2群データ>別の事例
ここまでの事例は、2社の平均差は大きいが調整済み平均の差は小さいというものである。
下記の事例は、2社の平均差は小さいが調整済み平均の差は大きいというものである。
データ


