数量化3類はどのような解析手法か ≪ 1/3 ≫
数量化3類で明らかにできること
多変量解析の手法は、目的変数が「ある場合」と「ない場合」の二つに分けられます。目的変数のない場合の手法は、説明変数が「数量データの場合」と「カテゴリーデータの場合」の二つに分けられます。説明変数がカテゴリーデータの場合の手法は、数量化3類を適用します。
数量化3類は数多くある観察変数からいくつかの潜在変数を見出す手法です。その潜在変数における各サンプルの得点から、各サンプルの類似度を調べます。潜在変数を見出す関係式における観察変数のウエイトを用い、観察変数の類似度を調べます。数量化3類では、ウエイトをカテゴリースコア、サンプルの得点をサンプルスコアといいます。
次のデータに数量化3類を適用すると、次のようなことが明らかになります。
9つの性格(観察変数)から2つの軸(潜在変数)を見出しました。1番目の軸(潜在変数)は陰的性格と陽的性格を判別、2番目軸は外交的性格と内向的性格を判別するものです。
A図はこの2つの軸で作られる平面に各サンプルの得点をプロットしたもので、この図より、例えば松本と藤沢は類似しているといったことが明らかになります。
各サンプルの血液型別の平均得点を計算し、B図に血液型別平均得点と性格に与えられたカテゴリースコアをプロットしました。この図より、性格の類似度、血液型と性格の関連度が明らかになります。

数量化3類に適用するデータ
下記は血液型と性格に関するアンケートの質問文です。
問1. あなたは他人からどのような性格だと言われていますか。 あてはまるものを全てお知らせください。
問2. あなたの血液型をお知らせください。
下記は回答データです。数量化3類に適用するデータは1,0変換します。

数量化3類を適用する前の基本分析
観察変数はカテゴリーデータなので、基本分析は割合(比率)、クロス集計です。
性格の回答率についてみると、明るいが75%で最多、次に気配り、慎重が45%で続きます。
血液型はA型が最も多く、次にO型、B型、AB型の順で続きます。
どのような血液型の人がどのような性格かをクロス集計で調べました。
A型は気配り、慎重、
O型は明るい、のんびり、ユーモア、
B型は個性的、クール、
AB型は社交的、気分や
が、他の血液型より高い回答率を示しました。

性格におけるカテゴリー相互のクロス集計を行いました。
対角線上の数値(灰色の彩色)は、各性格の回答者人数です。
この数値の全人数に占める割合が小さいと、そのカテゴリーのカテゴリースコアが他のカテゴリーを大きく上回ることがあり、軸の解釈ができなくなることがあります。先生はこの割合が10%以下のものは適用しないことにしています。この例は、全人数が20人、その10%は2人です。2人以下のカテゴリーは存在しないので、全てのカテゴリーを適用します。
対角線上以外の数値、例えば赤色系の彩色部分に着目してください。気配りを回答した9人のうちの5人(半分以上)が慎重を回答、慎重を回答した9人のうち5人が気配りを回答しています。このようなとき、気配りと慎重は似ていると判断します。この観点からクールとユーモアの関係を見ると0人で、クールとユーモアは似ていないということになります。

このような見方で右のクロス集計表を分析することは骨がおれますが、数量化3類を適用すれば、一挙にこの問題を解決してくれます。