Ergebnisse der K-Means-Clusteranalyse interpretieren

 

Inhalt

K-Means-Berichtsblatt

Anfängliche Clusterzentren

Der erste Schritt bei der K-Means-Clustermethode ist das Suchen nach den Clusterzentren. Führen Sie die hierarchische Clusteranalyse mit einem kleinen Stichprobenumfang aus, um ein sinnvolles Clusterzentrum für den Anfang zu erhalten. Alternativ können Sie die Anzahl der Cluster festlegen und dann Origin automatisch gut getrennte Werte als erstes Clusterzentrum verwenden lassen. Beachten Sie, dass die automatische Erkennung Ausreißern gegenüber sensibel ist. Daher sollten Sie sicherstellen, die Daten vor der Analyse zu überprüfen.

Finales Clusterzentrum

Die Tabelle der finalen Clusterzentren enthält die Werte des als letztes berechnete Clusterzentrum.

Zusammenfassung der Cluster

Die Tabelle der Clusterzusammenfassung bietet Statistikanalysen zu jedem Cluster.

Distanz zwischen den letzten Clusterzentren

Clusterergebnisse sind gut, wenn alle Zahlen, die nicht Null sind, relativ groß sind.

ANOVA

Aus der ANOVA-Tabelle können Sie ersehen, ob alle Variablen in die Clusteranalyse aufgenommen werden sollten. Wenn der p-Wert für alle vier Variablen größer als 0,05 ist , sollten Sie in Betracht ziehen, sie aus der Analyse auszuschließen.

Zugehörigkeit und Distanz von K-Means-Clustern

Informationen dazu, wie Beobachtungen geclustert sind, finden Sie in der Spalte Zugehörigkeit. Verwenden Sie die Spalte Distanz, um zu sehen, wie weit oder nah die Beobachtungen von dem Clusterzentrum ihrer Gruppe entfernt sind.

Hinweis: Beobachtungen mit großen Distanzen sind möglicherweise Ausreißer. Solche Daten sollten sorgfältig untersucht und, falls notwendig, entfernt werden.