拡張型数量化2類

目次

拡張型数量化2類の結果の見方、活用方法 ≪ 2/2≫

モデル式とカテゴリースコア、アイテムスコア

 目的変数の群数をG個とすると、モデル式はG個より1つ少ないm個存在します。 例題は、目的変数の群数がG=3なので、m=G-1=2です。
 m個のモデル式を軸1、軸2、・・・、軸mと呼びます。

 モデル式において、カテゴリーデータの項目の係数をカテゴリースコア、数量データ項目の係数をアイテムスコアといいます。各カテゴリーに対してカテゴリースコア、アイテムスコアはm個存在します。

例題のカテゴリースコアを示します。表におけるnは, 各選択肢に対する回答人数です。

カテゴリー化アイテムスコア

 月間走行距離をカテゴリー化し、各カテゴリーの目的変数への影響度を明らかにしたいことがあります。
月間走行距離は量的データなのでカテゴリースコアでは示せませんが、月間走行距離とサンプルスコアとは次の線形関係があることを利用して, カテゴリースコアに類似した値を求めることができます。この値をカテゴリー化アイテムスコアと呼ぶことにします。

 カテゴリー化アイテムスコア=アイテムスコア×( -平均)

ただし、 カテゴリー化は月間走行距離の任意に定めたカテゴリーの階級値、平均は月間走行距離の平均値。
月間走行距離の平均値は630㎞、 最大値1112㎞、 最小値222㎞であることから、 各カテゴリーの階級値を次のように定めました。

モデル式(軸)の解釈

 カテゴリースコア、カテゴリー化アイテムスコアの散布図を描きます。散布点から、軸1は走行距離が”大きい”と”小さい”を、軸2は車使用用途が”レジャー”と”通勤仕事”を判別する軸であることが分かりました。

サンプルスコア

サンプルスコアの求め方を回答者No.1のユーザーを例にとり示します。
① No1の回答データを①に記入。
② カテゴリーデータの場合は[1,0]データに変換し②に記入。
  数量的データの場合は平均値を引いた偏差データを算出し②に記入。
③ 軸1のカテゴリースコア、アイテムスコアを③に記入。
④ ②と③を掛けた値を④に記入。
⑤ 軸2のカテゴリースコア、アイテムスコアを⑤に記入。
⑥ ②と⑤を掛けた値を⑥に記入。
⑦ ④の縦計、⑥の縦計がサンプルスコアです。

全てのユーザーのサンプルスコアを求めます。

サンプルスコア散布図

 サンプルスコアの散布図を描きます。
車種タイプAを嗜好するユーザーは散布図の上側, 車種タイプBは右側, 車種タイプCは下側に位置し, 4つの質問項目で判別されることが分かりました。

各人がどの群に属するかの推定

 各人がどの群に属するかの推定は, モデル式から算出されたサンプルスコアの平面上の位置と群別重心との距離を測ることで調べられます。距離の最も短い群をその人の推定群とします。

 距離を測る方法に、ユークリッド距離とマハラノビス距離があります。
各個体の距離を調べ, どの群に属するかを調べました。 結果を次に示します。
 マハラノビス距離の計算方法は省略します。

判別的中率

 実績群と推定群との判別クロス集計の結果を示します。

ユークリッド距離において実績群と推定群が一致しているのは、8+10+10=28人です。 30人中28人が一致しているので、判別的中率は、28÷30=93.3%です。マハラノビス距離の判別的中率は、(8+11+9)÷30=93.3%です。
 どちらも下記に示す基準の66.7%を上回っているので, 導かれたモデル式は判別の予測に適用できると判断します。


データ解析・アンケート分析のご相談ならアイスタット。データ解析のコンサルティングも承っております。見積無料、お気軽にご相談ください。
1 2
目次