時系列相関
解析手法の役割
売上と営業回数などの規定要因とは相関関係があるのに、売上のトレンドは増加、規定要因のトレンドは減少といった場合、単相関係数は低い値となって、両者には相関関係がないといった誤りをすることがあります。
時系列相関は、売上と売上規定要因との関係を見る際、両者のトレンドTの影響を除去して両者の関係を調べる手法です。
適用できるデータ形態と時期数
時系列相関は、月次データ、四半期データ、年次データ、日別データなど全ての時間変数に適用できます。
データの時期数はどのデータ形態も4以上です。
<具体例> 下記表は売上額とGDP(国内総生産)のデータです。

時系列相関とは
下記表の時系列データにおける売上額とGDP(国内総生産)の単相関係数は-0.2346でした。
単相関係数はマイナスなので、GDPが増加すれば売上額は減少するという結果となりました。
両者の時系列比較グラフを描き、このことを確認してみました。
確かに売上額の増加傾向に対しGDPは減少傾向を示しています。しかしながら各月の増分を見ると、GDPが増加すれば売上額も増加(GDPが減少すれば売上額も減少)という月が多く、GDPは売上額に影響を及ぼしていると思われます。

結論から述べますと、GDPは売上額に影響を及ぼす要因といえます。
この事実は時系列相関係数(統計用語でなく解説者が名称)で明らかにできます。
時系列相関係数の求め方
・売上額に直線回帰式を当てはめる。
・売上額の直線回帰式 y=185.21x+1296.14
・直線回帰式に、x=1,2,3,・・・,12 を代入し、直線のトレンドTを算出する。
・売上額とトレンドTの時系列比較グラフを作成する。
・売上額とトレンドTの差(残差という)を求める。

・GDPに直線回帰式を当てはめる。
・GDPの直線回帰式 y=-0.2559(%)+2.2803(%)
・直線回帰式に、x=1,2,3,・・・,12 を代入しトレンドTを算出する。
・GDPとトレンドTの時系列比較グラフを作成する。
・GDPとトレンドTの残差を求める。

売上額残差とGDP残差の比較グラフを作成する。

GDPが増加すれば売上額も増加(GDPが減少すれば売上額も減少)という傾向が、このグラフから読み取れます。
両者の単相関係数を計算すると0.7058となり、GDPは売上額を予測するのに重要な説明変数であるといえます。
この相関係数は、残差相互の関係を見たものです。残差は回帰直線(トレンドT)の影響を除去して求められたものです。この相関係数を解説者は「時系列相関係数」と名付けました。
時系列データの場合、相関を調べる2つの変数にはそれぞれのトレンドがあり、通常単相関係数からは真の相関が見出せません。時系列データの相関は時系列相関係数を適用することを推奨します。
異なるGDPで時系列相関を算出し比較
前節の具体例において、GDPの値を変えた4つのケースで時系列相関係数を算出します。

【GDPの値が「前述例」の場合】

時系列相関は、トレンドの影響を除去して売上とGDPの関係をみる指標です。
このケースは、トレンドTを除去した売上とGDPはほとんどの月で一致しているので時系列相関は高くなっています。
単相関係数は、トレンドTを除去しないで売上とGDPそのままの関係をみる指標です。
このケースは売上額の増加傾向、GDPの減少傾向が起因して単相関係数はマイナスの値を示しています。
このケースのように、時系列相関係数は高い値、単相関係数はマイナス(あるいは小さい)を示す場合、
時系列相関係数を用いて、規定要因(GDP)は売上予測をするのに重要な要因と判断します。
【GDPの値が(b)の場合】

時系列相関は、トレンドの影響を除去して売上とGDPの関係をみる指標です。
このケースは、トレンドTを除去した売上とGDPはほとんどの月で一致しているので時系列相関は高くなっています。
単相関係数は、トレンドTを除去しないで売上とGDPそのままの関係をみる指標です。
このケースは売上額、GDPいずれも増加傾向なので単相関係数はプラスの値を示しています。
このケースのように、時系列相関と単相関係数どちらも高い値を示す場合、
どちらの相関係数を用いても、規定要因(GDP)は売上予測をするのに重要な要因といえます。
【GDPの値が(c)の場合】


時系列相関は、トレンドの影響を除去して売上とGDPの関係をみる指標です。
このケースは、トレンドTを除去した売上とGDPはほとんどの月で一致していませんので時系列相関は低くなっています。
単相関係数は、トレンドTを除去しないで売上とGDPそのままの関係をみる指標です。
このケースは売上額の増加傾向、GDPの減少傾向が起因して単相関係数はマイナスの値を示しています。
このケースのように、時系列相関数と単相関係数どちらも低い(あるいはマイナス)を示す場合、
どちらの相関係数を用いても、規定要因(GDP)は売上予測をするのに重要な要因でないといえます。
【GDPの値が(d)】


時系列相関は、トレンドの影響を除去して売上とGDPの関係をみる指標です。
このケースは、トレンドTを除去した売上とGDPはほとんどの月で一致していませんので時系列相関は低くなっています。
単相関係数は、トレンドTを除去しないで売上とGDPそのままの関係をみる指標です。
このケースは売上額、GDPいずれも増加傾向なので単相関係数はプラスの値を示しています。
このケースのように、時系列相関は低い値、単相関係数はプラス(あるいは大きい)を示す場合、
時系列相関係数を用いて、規定要因(GDP)は売上予測をするのに重要な要因でないと判断します。
具体例における時系列相関
医療機器販売台数を予測するのに広告費、営業回数、マーケティング施策が重要な要因であるかを、時系列相関で調べました。どの説明変数も時系列相関係数は0.2を超えているので、医療機器販売台数を予測するのに適用すべきと判断できます。
