共分散と相関係数とは
データは20日分ありますが、簡単に計算できるように5日分のデータで説明します。


(莉子)これは直線的傾向があるといってよさそうですね。
(先生)そうだね。きっと2つの項目の関係は強いだろう。早速計算をしてみよう。
まずは日にちごとに、平均との差をとります。(=偏差)

これらの値を合計(=偏差の積和)すると123になりました。偏差の積和は人数が多いほど大きい値になるので、人数に影響をうけないように、一人当たりの値を計算します。
123 ÷ 5 = 24.6
この値が共分散です。
共分散が大きいほど2つの項目の関係が強いといえるんだ。
でも24.6は大きいのか小さいのか・・。
そう。そこが共分散の弱点だ。
共分散には上限がないから、24.6がどの程度の大きさなのかわからない。
そう。そこが共分散の弱点だ。
共分散には上限がないから、24.6がどの程度の大きさなのかわからない。
それは不便だわ。何か良い方法はないですか。
共分散をそれぞれの標準偏差で割れば、上限を1とした関係の強さを表すことができる。これが相関係数だよ。標準偏差は既に学習済みだから、僕が計算しておいた値を示そう。
これを用いて相関係数を計算してごらん。相関係数の公式は次の通りだ。


公式に値を代入すると0.94になりました。

相関係数の上限は1だから0.94はかなり強い相関だということがわかるよね。