記述統計表はその変数に欠損値があるか確認し、実際にいくつの事例が主成分に使用されているのか知る事ができます。
そこに一つの変数内でいくつかの欠損値があるならば、その行全体を削除することが一般的に行われます。これがリストワイズで除外と呼ばれる手法です。もし2つ以上の変数で欠損値がある場合、ペアワイズで除外するのが一般的に一番良いといわれています。
平均と標準偏差の確認で一変量/分散のグループ間の差異を見つけることもできます。平均や標準偏差が大きく異なる場合、変数が異なるスケールで計測されている可能性があるので、注意が必要です。このような場合は相関行列を分析に使用することをお勧めします。
この表は変数間の関係を明らかにします。PCAは多量の関連する元データセット内の変数の中から、少量の独立した主成分を作ることを目的としています。一般的に大きい値はより有用なので、低い値を分析から除外する方を検討してください。
主成分変数は元の変数と線形の組み合わせ(X1,...,Xk,...,Xm)になるように定義されています。抽出された固有値の表は下記の式の係数を表しています。
ここで
スクリープロットは視覚的に主成分の的確な数を判断するのに適しています。スクリープロットは固有値対要素番号でグラフが書かれています。適当な主成分の数を決めるスクリープロットの”曲がり角”を見つけます。要素数は残りの固有値が比較的小さく、ほぼ同じ大きさになることのポイントとして使用されます。
ローディングプロットは元の値とサブスペースの次元の関係性を示しています。変数間の関係を読み取るのに使用されます。
スコアプロットはデータをサブスペースに投影するものです。観測値間の関係を読み取るのに使用されます。
バイプロットはローディングとスコアの両方のプロットを選択された要素に関して平行に表示しているものです。
このワークシートは各要素に関する主成分スコアを表示しています。