2D-Kernel-Dichte
Create-2D-Kernel-Density
Das 2D-Kernel-Dichtediagramm ist eine geglättete Darstellung der Farbdichte des Punktdiagramms, basierend auf der Kernel-Schätzung, eine nichtparametrische Methode für Wahrscheinlichkeitsfunktionen. Das Ziel der Dichteschätzung besteht darin, eine endliche Stichprobe von Daten zu nehmen und die zugrundeliegende Wahrscheinlichkeitsdichtefunktionen überall abzuleiten, einschließlich dort, wo kein Datenpunkt dargestellt wird. In Kernel-Dichte-Schätzungen wird der Beitrag jedes Datenpunkts von einem einzelnen Punkt aus in den angrenzenden Bereich geglättet. Diese geglätteten Dichtediagramme zeigen einen Durchschnittstrend für das Punktdiagramm.
2D-Kernel-Dichtediagramm erstellen
Um ein 2D-Kernel-Dichtediagramm zu erstellen
- Markieren Sie eine Y-Spalte.
- Öffnen Sie den Dialog des 2D-Kernel-Dichtediagramms, indem Sie auf Zeichnen: Kontur: 2D-Kernel-Dichte klicken.
- Legen Sie im Dialog plot_kde2 Methode, Anzahl der Gitternetzpunkte in X/Y und Anzahl der anzuzeigenden Punkte sowie den Diagrammtyp fest.
- Klicken Sie auf OK, um ein 2D-Kernel-Dichtediagramm zu erstellen.
Der Dialog plot_kde2
-
Eingabedaten
|
Legen Sie den Eingabedatenbereich fest.
|
Einstellungen
|
-
Bandbreitenmethode
-
Legen Sie die Bandbreitenberechnungsmethode des 2D-Kernel-Dichtediagramms fest.
- Bivariater Kerndichteschätzer
- Daumenregel
-
Dichtemethode
-
Legen Sie eine Methode zum Berechnen der Kerneldichte für definierte XY-Gitternetze fest.
- Wählen Sie die Option zum Berechnen der Dichtewerte gemäß der Gleichung Ks2density. Bei einem großen Datensatz kann die Berechnung der genauen Schätzung aus sehr umfassend ausfallen.
- Eingeteilte approximative Schätzung
- Wählen Sie die Option zum Berechnen der Approximation der Dichtewerte. Diese Option wird für eine große Stichprobe empfohlen.
-
Anzahl der anzuzeigenden Punkte
- Legen Sie die ersten N niedrigsten Dichtepunkte fest, die im Dichtebild eingeblendet werden sollen.
-
Dichtepunkte interpolieren
- Legen Sie die Berechnungsmethode fest, um zu entscheiden, welche Punkte im Dichtebild eingeblendet werden sollen (siehe Einzelheiten im Abschnitt Algorithmus unten). Üblicherweise empfehlen wird, wenn die Anzahl der Quelldaten groß ist (d. h. > 50000) die Verwendung dieser Option, um die Geschwindigkeit zu verbessern.
-
Anzahl der Gitternetzpunkte in X/Y
- Legen Sie die Anzahl der äquidistant verteilten Gitternetzpunkte für die Dichteschätzung fest.
-
Anzahl der anzuzeigenden Punkte
- Legen Sie die ersten N niedrigsten Dichtepunkte fest, die im Dichtebild eingeblendet werden sollen, wenn das Kontrollkästchen Alle deaktiviert ist. Standardmäßig ist das Kontrollkästchen Alle aktiviert, und es werden alle Punkte angezeigt.
-
Gitternetzbereich
-
In einem Zwischenschritt wird eine Matrix der Gridding-Werte aus den XY-Daten erzeugt und das Kernel-Dichte-Diagramm aus den Matrixwerten erstellt. Standardmäßig registriert der Gitternetzbereich die minimalen und maximalen X- und Y-Werte in dieser Matrix. Deaktivieren Sie das Kontrollkästchen Auto, um einen Wert manuell einzugeben.
- X-Minimum
- X-Maximum
- Y-Minimum
- Y-Maximum
-
Diagrammtyp
-
Legen Sie den Diagrammtyp fest.
- Verwenden Sie die Dichtematrix, um die Kontur zu zeichnen.
-
-
- Verwenden Sie die Dichtematrix, um ein Bilddiagramm zu erstellen.
|
Daten der Dichteschätzung
|
Diese Option bestimmt, wo die für das Diagramm berechneten Daten gespeichert werden.
|
Daten anzeigen
|
Diese Option bestimmt, wo die Daten des angezeigten Punktdiagramms gespeichert werden. Sie ist nur verfügbar, wenn Anzahl der anzuzeigenden Punkte nicht 0 ist.
|
Algorithmus
Die Kerneldichteschätzung ist eine nichtparametrische Methode zum Schätzen der Dichte von Streupunkten. Das Ziel der Dichteschätzung besteht darin, die zugrundeliegende Wahrscheinlichkeitsdichtefunktion überall in den vorhandenen Streupunkten zu schätzen, einschließlich dort, wo kein Daten beobachtet werden. Eine Kernel-Funktion wird mit dem Bezugswert in ihrer Mitte erstellt – dies stellt sicher, dass der Kernel symmetrisch zum Bezugswert ist. Die Schätzung der Kernel-Dichte glättet den Beitrag der Datenpunkte, um ein Gesamtbild der Dichte der Datenpunkte zu liefern.
Berechnungsmethode der Dichte
Legen Sie eine Methode zum Berechnen der Kerneldichte für definierte XY-Gitternetze fest.
Genaue Schätzung
Die Dichtewerte werden basierend auf der untenstehenden Gleichung berechnet.
wobei n die Anzahl der Elemente in Vektor vX oder vY, das i-te Element in Vector vX und das i-te Element in Vektor vY ist. und sind die optimalen Bandbreitenwerte.
Eingeteilte approximative Schätzung
Beschleunigen Sie die Dichteberechnung durch eine Approximation an die genaue Schätzung der 2D-Kernel-Dichte.
Zuerst wird eine 2D-Einteilung für die (X-, Y-) Punkte durchgeführt, um eine Matrix mit den Klassenanzahlen zu erhalten. Dann wird die 2D-Fast-Fourier-Transformation verwendet, um diskrete Faltungen zum Berechnen der Dichtewerte von jedem Gitternetz durchzuführen.
Die 4. Wurzel der Dichtewerte wird berechnet, um die Dichteskala auf die Farbskala abzubilden.
Bandbreitenmethode
Bivariater Kerndichteschätzer
Berechnen Sie die Bandbreite basierend auf einem linearen Diffusionsprozess.
Daumenregel
Die Schätzung von wx und wy kann einfach mit Folgendem berechnet werden:
wobei n die Größe des Vektors vX oder vY, die Standardstreuung der Stichprobe für den Datensatz vX und diese entsprechend für den Datensatz vY ist.
Dichtepunkte interpolieren
Legen Sie die Berechnungsmethode fest, um zu entscheiden, welche Punkte im Dichtebild eingeblendet werden sollen.
Wenn die Option ausgewählt ist, wird die Kernel-Dichte der Punkte durch die Interpolation der Dichtematrix für definierte XY-Gitternetze berechnet. Wenn die Anzahl der Quelldaten sehr groß ist, kann die Verwendung dieser Option die Geschwindigkeit enorm verbessern.
Sollte die Option nicht ausgewählt sein, werden die Dichtewerte mit der Methode der genauen Schätzung berechnet.
|