第5回 2変量解析①

共分散と相関係数とは

データは20日分ありますが、簡単に計算できるように5日分のデータで説明します。

(莉子)これは直線的傾向があるといってよさそうですね。

(先生)そうだね。きっと2つの項目の関係は強いだろう。早速計算をしてみよう。


まずは日にちごとに、平均との差をとります。(=偏差)

これらの値を合計(=偏差の積和)すると123になりました。偏差の積和は人数が多いほど大きい値になるので、人数に影響をうけないように、一人当たりの値を計算します。

123 ÷ 5 = 24.6

この値が共分散です。

共分散が大きいほど2つの項目の関係が強いといえるんだ。

でも24.6は大きいのか小さいのか・・。

そう。そこが共分散の弱点だ。
共分散には上限がないから、24.6がどの程度の大きさなのかわからない。

そう。そこが共分散の弱点だ。
共分散には上限がないから、24.6がどの程度の大きさなのかわからない。

それは不便だわ。何か良い方法はないですか。

共分散をそれぞれの標準偏差で割れば、上限を1とした関係の強さを表すことができる。これが相関係数だよ。標準偏差は既に学習済みだから、僕が計算しておいた値を示そう。

これを用いて相関係数を計算してごらん。相関係数の公式は次の通りだ。

公式に値を代入すると0.94になりました。

相関係数の上限は1だから0.94はかなり強い相関だということがわかるよね。

1 2 3
目次