解析事例・予測

目次

予測の事例

月次売上予測モデル式作成、予測値算出

医療機器メーカーの担当者から、「製品告知のための広告費、お客様からの資料請求件数、マーケティング施策有無から自社の医療機器販売台数を予測したい」という相談を受けました。

広告費や資料請求件数、マーケティング施策はすべて量的データです。このように量的データで予測モデル式が作成できるのか、作成できるとすれば以下の条件に示す将来設定で 1 年先の予測値を教えてほしいという相談でした。

適用データとグラフ

適用する解析手法

重回帰分析

※クリックすると「重回帰分析」の解説ページに移動します。

kは2項目のカテゴリー数の小さい方の値

分析

相関分析により売上規定要因の検討

広告費、資料請求件数、マーケティング施策が医療機器販売台数を予測するのに重要な要因であるかを時系列相関係数で調べました。

時系列相関係数は基準としている 0.2 を上回ったので、広告費、資料請求件数、マーケティング施策が医療機器販売台数を予測するのに重要な要因と判断しました。(右表参照)

説明変数の個数は、時系列相関が 0.2 以上であればいくつ用いてもかいません。ただし、説明変数相互の時系列相関が高い(0.5 以上)場合、これらの項目から 1 つだけを用いるというルールがあります。選ぶのは目的変数との時系列相関が最も高いものとします。

右表は目的変数と説明変数の総数 6 変数相互の時系列相関を示したものです。 x2 と x3 との時系列相関は 0.6 で 0.5 より大きいので、両方適用できません。 目的変数との時系列相関をみると、x3 より x2 の方が高いので x2 を用います。 したがって、説明変数は x1、x2、x4、x5 の 4 つです。

医療機器販売台数の季節変動指数Sの作成

EPA法※によって季節変動指数Sを算出しました。また、Sの予測値はEPA法によって算出された予測値を適用しました。季節変動指数Sは下表で示します。
※クリックすると解説ページに移動します。

医療機器販売台数のトレンドTの作成

EPA法※によって医療機器販売台数のTCを算出し、TCに回帰分析を行い、トレンドTを求めました。トレンドTは下表で示します。
※クリックすると解説ページに移動します。

季節変動指数S
トレンドT

予測モデル式

医療機器販売台数を目的変数、トレンドT,季節変動指数S、広告費、資料請求件数、マーケティング施策を説明変数として重回帰分析を行い、予測モデル式を作成します。

実績期間を予測(理論値)

予測モデル式に説明変数のデータを代入し実績期間の予測値(理論値)を算出します。
医療機器販売台数の実績値と理論値の比較グラフを作成しました。

予測モデル式の精度

実績値と理論値はほぼ一致し、予測モデル式は予測に使えそうです。実績値と理論値の一致度を決定係数で調べました。決定係数は 0.9166 で基準の 0.5 を上回っているので予測モデル式は予測に適用できると判断しました。

決定係数0.9166

予測

説明変数の将来値を予測モデル式に代入し 12ヶ月先までを予測しました。
2014 年 3 月を例として予測値算出の手順をにに示します。

2014年3月の予測値算出手順

2014 年3 月の予測値は148 台です。2014 年1 月以降の予測値を以下に示します。

予測値

分析結果

  • 医療機器販売台数は2012 年に欠陥品が発生し雑誌記事で悪評価されるなどで低迷した。
  • 2013 年のモデルチェンジが好評を得たことにより上昇基調に転じた。
  • 2014 年は、3 月のモデルチェンジ、7 月の展示会出展が成功することを想定すると、2013年同様の上昇基調が続くであろう。

日次売上予測モデル式作成、予測値算出

人気ベーカリーショップの担当者に、「日次の売上を予測したい」という相談を受けました。

人気ベーカリーショップの担当者は、経験をたよりに月、日、曜日、降水量などを加味して予測をしていましたが、統計的な手法で精度の高い予測値を算出できないかとの相談でした。

適用データ

適用する解析手法

単相関係数(相関図)、相関比(カテゴリー別平均)、拡張型数量化1類

※クリックすると、解説ページに移動します。

分析

売上実績との相関

売上実績との年、月、日、曜日、降水量との関係を調べます。目的変数である売上実績は数量データ、説明変数である年、月、日、曜日はカテゴリーデータ、降水量は数量データです。

数量データとカテゴリーデータはカテゴリー別平均と相関比、数量データと数量データは相関図と単相関係数で関連があるかどうかを把握できます。

カテゴリー別平均と相関比

売上実績との相関比を見ると、月、日、曜日は基準の0.1を上回りましたが、年は0.008 と0.1を下回りました。

基準を上回った月、日、曜日の3つの項目は予測するのに重要な要因と判断しました。

【年】カテゴリー別平均値
【日]カテゴリー別平均値
【月】カテゴリー別平均値
【曜日】カテゴリー別平均値

相関図と単相関係数

売上実績と降水量との単相関係数の絶対値は、基準の0.3を上回りましたので、降水量は予測するのに重要な要因と判断しました。

売り上げ実績と降水量と相関

説明変数に基準の値を追加

説明変数に月、日別に売上実績を平均した「基準の値」を追加しました。

予測モデル式

売上実績を目的変数、月、日、曜日、降水量、基準の値を説明変数として、拡張型数量化1類を行い、予測モデル式を作成しました。

※拡張型数量化1類は、説明変数が数量データとカテゴリーデータが混在しているときに予測モデル式を作成する方法です。

予測モデル式の精度

実績値と予測値の一致度を決定係数で調べました。決定係数は 0.918 で基準の 0.5 を上回っているので予測モデル式は予測に適用できると判断しました。

予測

説明変数の将来値を予測モデル式に代入し、7日先までを予測しました。

分析結果

拡張型数量化1 類は「カテゴリースコア」という値を算出します。

カテゴリースコアは、売上実績について平均値を算出し、求められた平均値から売上実績全体平均(この例は409.15(千円))を引いた値です。

  • カテゴリースコアから、月の売上貢献度は、”6月”が一番高く10.34(千円)です。
  • 日の売上貢献度は、”1日”が一番高く20.46(千円)です。
  • 曜日の売上貢献度は、”金曜日”が一番高く40.49(千円)です。
  • 降水量が多いほど売上実績は少なくなる傾向が明確となりました。

営業活動と売上額の相関分析、営業活動成果検証

製薬会社の市場調査部担当者から相談を受けたテーマです。

我が社の主力製品A薬剤の売上は、ここ数年減少傾向にあります。減少の理由はいろいろ考えられますが、競合薬剤の市場シェアが増加していること、A薬剤の営業回数が少ないこと、医師へのA薬剤製品説明会の効果があまりないことなどが考えられます。

このことを統計学的に説明できる方法がないか、またこれらの要因は売上を予測するのに重要な要因となり得るかを教えてほしいという相談です。

適用データとグラフ

適用データとグラフ

時系列相関※、タイムラグ関数
※クリックすると解説ページに移動します。

分析

A 薬剤の売上は減少傾向、競合薬剤のシェアは増加傾向で推移しています。競合薬剤の増加に伴い、A 薬剤の売上が減少していると考えられます。両者の関係を時系列相関で見ると、- 0.5849 となりました。

時系列相関の絶対値0.5849 は基準としている0.2 を上回ったので、競合薬剤のシェア増加はA 薬剤の売上減少に影響を及ぼしているといえます。

A 薬剤の営業回数は2012 年3 月に大きく減少しましたが、それ以降少しずつ増やしているものの、2013 年末現在において2011 年の水準には達していません。そのような状況でも営業回数が多い月はA 薬剤の売上は増加する傾向が見られます。

両者の関係を時系列相関で見ると0.2960 となり、基準としている0.2 を上回ったので、営業回数の増減はA 薬剤の増減に影響を及ぼしているといえます。

A 薬剤の売上とA 薬剤製品説明会との関係を時系列相関で調べました。時系列相関の値は0.1157 で基準の0.2 を下回り、製品説明会をしても売上増につながらないということがわかりました。

注. 時系列相関はトレンドTの影響を除去した時系列データ相互の関係を見る方法です。

一生懸命営業しても、その効果(売上増)はその月に現れるとは限りません。もしかしたら効果は1ヶ月後、あるいは2ヶ月後かもしれません。

売上と営業回数との関係を、月数をずらして見る相関を「タイムラグ相関」といいます。

タイムラグ相関もトレンドTの影響を除去した時系列データ相互の関係を見ることができます。この相関を「タイムラグ時系列相関」といいます。運用データのついて時系列タイムラグ関数を算出しました。

タイムラグ1ヶ月の時系列相関係数は0.4366 と0ヶ月の0.2960 より高く、A 薬剤営業回数の効果は1ヶ月後に現れることがわかりました。

競合薬剤シェア、A 薬剤製品説明会の時系列タイムラグ相関を算出しましたが、0ヶ月の相関が最大でした。

競合薬剤シェア
A薬剤製品説明会

分析結果

  • A 薬剤の売上を予測するのに競合薬剤シェア、A 薬剤営業回数は欠かせない要因であることがわかりました。
    A 薬剤製品説明会は重要でありませんでした。
  • A 薬剤の売上予測モデル式を作成する際、A 薬剤営業回数はタイムラグ1ヶ月を考慮することを重要事項として記しておきます。

施設別売上ポテンシャル算出モデル式作成、施設評価

製薬会社の市場調査部の担当者からの相談です。

MR(医薬情報提供者)が医師に面会し、B 薬剤の医薬情報を提供しています。「MR 面会回数」は医師に面会した回数 を、施設ごとに数えた延べ回数です。 

インターネットによってA 薬剤の医薬情報提供を、医師に配信するサービスをしている 会社があります。「医師視聴人数」はそのサービスを視聴している医師を、施設ごとに数え た延べ人数です。

製薬会社はB薬剤を処方採用・増量してもらいたいと考えている施設をターゲット施設、そうでない施設をノンターゲット施設としています。400 の施設(病院・医院・診療所)について、B 薬剤売上及び伸長率、MR 面会回数、医師視聴人数、ターゲット施設有無のデータがあります。

これらのデータを解析し、次の3 つを明らかにしたいという相談です。

MR 面会回数が多い施設ほど、医師視聴人数が多い施設ほど売上伸長率は高いか。ターゲット施設はノンターゲット施設に比べ売上伸長率は高いか。 

MR 面会回数、医師視聴人数、ターゲット施設有無から、施設ごとの売上伸長率を予測するモデル式を作成したいがどうすれば良いか。

MR 活動とインターネットとを組み合わせて営業をした場合、どのような配分で営業をすれば売上伸長率を高くすることができるか。

適用データ

適用する解析手法

基本統計量と度数分布、単相関係数、カテゴリー別平均、拡張型数量化1類
※クリックすると解説ページに移動します。

分析

B 薬剤の売上と売上伸長率の現状

施設別の売上額の基本統計量と分布を調べました。

全施設の2013 年の売上平均値は1,737 万円です。売上額の分布を見ると501~1000 万円以下の施設が最も多く、501~2500 万円以下の施設で7 割を占めます。

2013 年売上の基本統計量と分布

次に、施設別の売上伸長率の基本統計量と分布を調べました。

全施設の2013 年対前年の売上伸長率は24.9%です。売上伸長率の分布を見ると0~10%以下の施設が最多。0%以下(減少)の施設は4%、50%以上伸びた施設はほぼ1 割ありました。

2013年対2012年売上伸長率の基本統計量と分布

売上規定要因の現状

MR 面会回数の平均値は511 回/1 施設です。200 回以下の施設は27%、701 回以上は24%でした。

医師視聴人数の平均値は5.1 人/1 施設です。未視聴(0 人)施設は42%、11 人以上の施設は16%でした。ターゲット施設は25%です。

2013 年データの基本統計量と分布

B 薬剤の売上伸長率と売上規定要因との関係

薬剤の売上伸長率と売上規定要因との関係をカテゴリー別平均で調べました。

  • MR 面会回数が多い施設ほど売上伸長率は高くなる傾向がみられました。
  • 医師視聴人数が多い施設ほど売上伸長率は高くなる傾向がみられました。
  • ターゲット施設はノンターゲット施設に比べ売上伸長率は高い値を示しました。
  • 売上伸長率との単相関係数を見ると、MR 面会回数、ターゲット施設は0.3 を上回りましたが、医師視聴人数は0.25 と0.3 をやや下回りました。
  • 医師視聴人数は弱い相関係数でしたが、これら3 つの項目は予測するのに重要な要因と判断しました。
カテゴリー別平均
単相関係数

予測モデル式

B 薬剤売上伸長率を目的変数、MR 面会回数、医師視聴人数、ターゲット施設有無を説明変数として拡張型数量化1 類を行いました。

拡張型数量化1 類より求められた関係式を施設別のB薬剤の売上伸長率を予測するモデル式としました。以下、予測モデル式の結果を示します。

実績期間を予測(理論値)

400 施設の説明変数のデータを予測モデル式に代入し、400 施設の売上伸長率の予測値(理論値)を算出します。

実績値を縦軸、理論値を横軸に散布図を描いてみると、実績値と理論値はほぼ一致していることがわかり、予測モデル式は予測に使えそうです。

予測モデル式の精度

実績値と理論値の一致度を決定係数で調べました。決定係数は0.8838 で基準の0.5 を上回っているので、予測モデル式は予測に適用できると判断しました。

予測

MR 面会回数が500 回、300 回、0 回の場合、医師視聴人数が8 人、4 人、0 人の場合、ターゲット施設がある場合、ない場合の組み合わせを以下の18 のパターンを設定しました。

18パターンを予測モデル式に代入し予測値を算出しました。

当然ながら、MR 面会回数、医師視聴人数が多いパターンほど売上伸長率は高くなります。だからといって、それぞれを多くすれば経費が嵩みます。そこで経費の上限を決め、その経費内に収まり売上伸長率が最も高いパターンを見出します。

分析結果

「 MR面会回数が多い施設ほど、医師視聴人数が多い施設ほど売上伸長率は高い」、「ターゲット施設はノンターゲット施設に比べ売上伸長率は高い」といえます。

MR 面会回数、医師視聴人数、ターゲット施設有無から、施設ごとの売上伸長率を予測するモデル式は、以下の式となります。決定係数は0.8838 で予測に適用できます。

経費の関係でターゲット施設に対しては、MR 面会活動300 回、医師視聴人数は8回したとします。その設定で見込める売上伸長率は44.8%です。

目次