クラスター分析
どのような手法か
クラスター分析は、類似している質問項目や回答者をグルーピングする解析手法です。
回答のされ方が類似している質問項目をグループ化する方法を変数クラスター分析、回答の仕方が類似している人々をグループ化する方法をサンプルクラスター分析といいます。
クラスター分析は、次のようなデータに対して樹形図を作成し、樹形図より項目あるいは回答者がどのグループに属するかを明らかにします。

どのようなデータに適用できるか
クラスター分析で使用するデータは数量データでなければなりません。
数量化3類で求められたサンプルスコアや因子分析で求められた因子得点にもよく用いられます。
クラスター分析における距離
クラスター分析は回答者間、質問項目間の距離を調べ、距離が短い(近い)ものを集めてグループ化します。距離の計算方法は、回答者間と質問項目間で異なります。
① 回答者間の距離
【データ】


② 質問項目間の距離
質問項目間の距離=1-相関係数
前のデータにおける質問項目相互の距離を示します。

例えば「つけめん」と「ラーメン」の距離(0.27)は「つけめん」と「そうめん」の距離(1.32)より短いことがわかります。
樹形図
樹形図は距離が短いものが隣り合うようにして、二つの距離の長短を縦線で表示します。

樹形図より、「つけめん」と「ラーメン」は最も距離が短く、次に「そば」と「うどん」が短いことがわかります。「そうめん」は「つけめん」と「ラーメン」のグループより「そば」と「うどん」のグループに近いことがわかります。
樹形図における横線を上下に移動させたとき、縦線との交点の数がグループ数で、それぞれの交点の下に存在する項目(あるいは人)がそのグループに属します。
この例題では3グループにしたいので、上記のように交点が3つになるように横線を定めました。①「そば」と「うどん」、②「そうめん」、③「つけめん」、「ラーメン」に分けられました。
数量化3類サンプルスコアのクラスター分析
項目数が多いデータで回答者をグルーピングする場合、グループ化がうまくいかないことがあります。このような場合には数量化3類で求められたサンプルスコアにサンプルクラスター分析を適用します。
