Der Dialog der K-Means-Clusteranalyse
KCA-Dialog
Variablen
Variablen |
Wählen Sie die Daten für die K-Means-Clusteranalyse. Die Daten in jeder Spalte entsprechen einer Variablen und jede Zeile einer Beobachtung. |
Beobachtungsbeschriftungen |
Wählen Sie eine Spalte zum Beschriften von jeder Beobachtung (optional). |
Optionen
Legt die Einstellungen für die K-Means-Clusteranalyse fest.
Variablen standardisieren |
-
- Variablen werden nicht standardisiert.
- Z-Score (Auf N (0,1) standardisieren)
-
- Variablen werden mit einem Mittelwert bei 0 und einer einheitlichen Standardabweichung standardisiert.
-
- Variablen werden in dem Bereich zwischen 0 und 1 standardisiert.
Hinweis: Wenn Sie sich dafür entscheiden, Variablen zu standardisieren, werden Clusterzentren und Distanz aus den normalisierten Daten berechnet. Die deskriptive Statistik und ANOVA werden aber auf Grundlage der ursprünglichen Daten berechnet.
|
Anzahl der Cluster |
Legen Sie die Anzahl der Cluster fest. Diese Option wird nur aktiviert, wenn Anfängliche Clusterzentren festlegen nicht aktiviert ist. Der Wert sollte größer als 0 sein und nicht kleiner als die Anzahl der effektiven Beobachtungen. |
Anfängliche Clusterzentren festlegen |
Bestimmt, ob anfängliche Clusterzentren festgelegt oder Standardanfangswerte verwendet werden sollen. Wenn Anfängliche Clusterzentren festlegen ausgewählt ist, wird die Option Anfängliche Clusterzentren verfügbar, so dass Daten aus einem Blatt als anfängliche Clusterzentren ausgewählt werden können.
Um mehr über die standardmäßigen anfänglichen Clusterzentren zu erfahren, lesen Sie bitte den Abschnitt zum Algorithmus für anfängliche Clusterzentren aus Beobachtungen.
|
Anfängliche Clusterzentren |
Legt die anfänglichen Clusterzentren aus Daten in einem Blatt fest. Diese Option ist nur verfügbar, wenn Anfängliche Clusterzentren festlegen aktiviert ist. Die Anzahl der Cluster ist die Anzahl der effektiven Zeilen die unter Anfängliche Clusterzentren ausgewählt wurden. Die Daten, die unter Anfängliche Clusterzentren ausgewählt sind, sollten die gleiche Anzahl von Variablen enthalten wie unter Variablen. |
Maximale Anzahl von Iterationen |
Legt die maximale Anzahl der Iterationen fest, die in der Analyse erlaubt sind. Der Standardwert ist 10. |
Eigenschaften
Legt die Mengen fest, die für die K-Means-Clusteranalyse berechnet werden sollen.
Anfängliche Clusterzentren |
Legt fest, ob die anfänglichen Clusterzentren in dem Bericht ausgeführt werden sollen. |
ANOVA |
Legt fest, ob die ANOVA für das Clusterergebnis durchgeführt werden soll. |
Clusterzugehörigkeit |
Legt fest, ob die Clusterzugehörigkeit in einem Blatt ausgegeben werden soll. |
Distanz zu Clustern |
Legt fest, ob die Distanz zwischen jeder Beobachtung und dem Zentrum des zugewiesenen Clusters berechnet werden soll. |
Zeichnung
Legt fest, ob das Gruppendiagramm gezeigt werden soll.
Clusterdiagramm |
Erstellen Sie das Clusterdiagramm mit X-Bereich = Hauptkomponente 1 (HK 1) und Y-Bereich = Hauptkomponente 2 (HK 2).
Wenn das Kontrollkästchen aktiviert ist, werden die Eigenschaften HK 1, HK 2, Beobachtungsbeschriftung (optional) und Zugehörigkeit außerdem in das Datenblatt K-Means-Clusterdiagramm ausgegeben. Das sich ergebende Clusterdiagramm hat dann (Details Zeichnung > Registerkarte Zentroid (Pro)) Zentroid für Teildatensatz zeigen, Mit Datenpunkten verbinden und Ellipse zeigen aktiviert.
|
Zusätzliches Gruppendiagramm |
Legt fest, ob das Gruppendiagramm dort gezeigt werden soll, wo Beobachtungen durch die Clusterzugehörigkeit gruppiert sind. Wenn diese Option aktiviert ist, wird der Zweig Variablen für Diagramm auswählen angezeigt. |
Variablen für Diagramm auswählen |
Wählen Sie die Variablen als x und y für das Gruppendiagramm.
-
- Wählen Sie aus dem Blatt die Variable als X-Achse für das Gruppendiagramm.
-
- Wählen Sie aus dem Blatt die Variable als Y-Achse für das Gruppendiagramm.
Beachten Sie, dass Variablen im Gruppendiagramm sich von denen für die K-Means-Clusteranalyse unterscheiden.
|
Ausgabeeinstellungen
Legt das Ziel der Ausgabeergebnisse für die K-Means-Clusteranalyse fest.
K-Means-Bericht |
Legt das Blatt für den Bericht der K-Means-Clusteranalyse fest. Der Standardwert ist ein neues Blatt in der Arbeitsmappe der Eingabedaten. |
Clusterzugehörigkeit |
Legt das Blatt für die Clusterzugehörigkeit und Distanz zum Cluster fest. Der Standardwert ist ein neues Blatt in der Arbeitsmappe der Eingabedaten. Beachten Sie, dass diese Option deaktiviert ist, wenn weder Clusterzugehörigkeit noch Distanz zum Cluster in der Gruppe Eigenschaften deaktiviert ist. |
Neu berechnen
Legen Sie fest, wie das Ergebnis neu berechnet und aktualisiert wird, wenn sich die Eingangsdaten oder Einstellungen ändern.
Kein |
Die Ausgabe wird nicht mit den Quelldaten verbunden, und Änderungen an den Quelldaten führen zu keiner Aktualisierung des Ergebnisses. Ergebnisse werden nicht neu berechnet, wenn die Einstellungen geändert werden. |
Auto |
Das Ergebnis aktualisiert sich automatisch, wenn sich die Quelldaten ändern. Sie können auch die Einstellungen ändern, um das Ergebnis neu zu berechnen. |
Manuell |
Das Ergebnis wird nicht automatisch aktualisiert, wenn sich die Quelldaten ändern. Sie müssen die Aktualisierung manuell durchführen, indem Sie auf die Schaltfläche Neu berechnen auf der Symbolleiste Standard klicken. Sie können auch die Einstellungen ändern, um das Ergebnis neu zu berechnen. |
|