目次
正準判別分析
どのような手法か
正準判別分析は、カテゴリーデータである目的変数と数量データである説明変数の関係を調べ、以下のような形の式を複数導き出す解析手法です。判別分析は目的変数が2群であるのに対し、正準判別分析は3群以上です。
右式のことを、統計学では正準判別関数、実務ではモデル式といいます。モデル式は群の個数より一つ少ない数だけ出力されます。予測したい人のデータをモデル式に代入し、どの群に属するかを判別します。

どのような質問、データに適用できるか
正準判別分析に用いるデータは、目的変数がカテゴリーデータ、説明変数は数量データでなければなりません。この手法はオリジナルデータにのみ適用できます。
<具体例>
【質問】ある学校の陸上部に所属する選手に次のアンケートを行いました。


解析の目的と手順

正準判別分析の主な出力内容
- モデル式
- 正準判別係数
- 標準化正準判別係数
- 判別得点、判別得点散布図
- 群別重心
- 予測
出力結果と結果の解釈
① 陸上部に所属する選手の専門種目を判別するモデル式を作成します。

② モデル式について解釈します。

③ モデル式に回答データを代入し選手の判別得点を求めます。

④ 判別得点の散布図を作成します。

⑤ モデル式が予測に適用できるものであるかを吟味します。専門種目を定めていない選手について予測します。

正準判別分析についてよくある質問(Q&A)
Q.ソフトを用いると出力結果に正準相関係数が表示されますが、これは何を示す値でしょうか。
A.正準相関係数はそれぞれのモデル式が適用できるものであるかどうかを調べる尺度です。
統計学的根拠はありませんが0.7以上のモデル式が良いとされています。
*二つのモデル式の両方が0.7以上→このまま分析を続ける
*一つのモデル式のみ0.7以上 → 3群のうち類似した群があると考えられるので、群を2群に統合して判別分析を実行する
*二つのモデル式の両方が0.7を下回る→解析を中止する
例題における正準相関係数を示しました。二つのモデル式で0.7を上回っているので、予測に適用できると判断できます。
