Ergebnisse der Hauptkomponentenanalyse interpretieren
Berichtsblatt der Hauptkomponentenanalyse
Deskriptive Statistik
Die Tabelle der deskriptiven Statistik kann angeben, ob Variablen über fehlende Werte verfügen, und offenbart, wie viele Fälle tatsächlich in den Hauptkomponenten verwendet werden.
Wenn es nur ein paar fehlende Werte für eine einzelne Variable gibt, ist es häufig sinnvoll, eine gesamte Datenzeile zu löschen. Dies wird als listenweises Ausschließen bezeichnet. Wenn es fehlende Werte für zwei und mehr Variablen gibt, ist es im Allgemeinen empfehlenswert, die Methode des paarweisen Ausschlusses zu verwenden.
Die Prüfung von Mittelwerten und Standardabweichungen kann univariate/variate Differenzen zwischen Gruppen aufdecken. Sie sollten beachten, wenn Mittelwerte und Standardabweichungen sich sehr voneinander unterscheiden, da dies ein Hinweis darauf sein kann, dass Variablen auf verschiedenen Skalen gemessen werden. In diesem Fall verwenden wir dieKorrelationsmatrix für die Analyse.
Korrelationsmatrix
Diese Tabelle zeigt die Verhältnisse zwischen Variablen. Die Hauptkomponentenanalyse (PCA) zielt darauf ab, eine kleine Sammlung von unabhängigen Hauptkomponenten aus einer umfangreicheren Reihe von verwandten ursprünglichen Variablen zu erstellen. Im Allgemeinen sind höhere Werte nützlicher. Sie sollten in Betracht ziehen, niedrige Werte aus der Analyse auszuschließen.
Eigenwerte der Korrelations-/Kovarianzmatrix
Eigenwert |
Eigenwerte der Korrelations-/Kovarianzmatrix Dies stellt eine Aufteilung der gesamten Variation dar, jede Hauptkomponente berücksichtigend. |
Anteil |
Der Anteil der Varianz erklärt durch jeden Eigenwert. |
Kumulativ |
Der kumulative Anteil der Varianz bedingt durch die aktuellen und alle vorhergehenden Hauptkomponenten Wenn die i-te Komponente 90% der ürsprünglichen Informationen bewahrt, wird normalerweise empfohlen, i-Komopnenten zu behalten. |
Hinweis: Wenn die Option Kovarianzmatrix unter Analysieren ausgewählt wird, wird das Ergebnis von Bartletts Test, der verwendet wird, um zu testen, ob die Eigenwerte der Hauptkomponenten gleich sind, in den zusätzlichen drei Spalten der Tabelle gezeigt. |
Extrahierte Eigenvektoren
Die Hauptkomponentenvariablen werden als lineare Kombinationen der ursprünglichen Variablen X1,...,Xk,...,Xm definiert. Die Tabelle Extrahierte Eigenwerte enthält Koeffizienten für die Gleichungen unten.
wobei
- Yk die k-te Hauptkomponente k ist
- C's die Koeefizienten in der Tabelle sind
Scree-Diagramm
Das Scree-Diagramm ist eine nützliche visuelle Hilfe, um eine angemessene Anzahl von Hauptkomponenten zu bestimmen. Der Screeplot zeichnet den Eigenwert gegen die Komponentenanzahl. Um die geeignete Anzahl von Komponenten zu bestimmen, suchen wir einem bestimmten Punkt in dem Scree-Diagramm. Die Anzahl der Komponenten richtet sich nach diesem Punkt, an dem die verbleibenden Eigenwerte relativ klein und ungefähr alle gleich groß sind.
Ladungsdiagramm
Das Ladungsdiagramm ist eine Zeichnung der Beziehung zwischen den ursprünglichen Variablen und den Unterraumdimensionen. Es wird verwendet, um Beziehungen zwischen Variablen zu interpretieren.
Scores-Diagramm
Das Score-Diagramm ist eine Projektion von Daten auf den Unterraum. Es wird zum Interpretieren von Beziehungen zwischen den Beobachtungen verwendet.
Biplot
Der Biplot zeigt beides, die Ladungen und die Scores für zwei ausgewählte Komponenten, parallel.
Score-Daten
Das Arbeitsblatt bietet die Scores der Hauptkomponeneten für jede Variable.
|