Dialog Spaltenstatistik

 

Hilfreiche Informationen

Eingabe

Leeren Datensatz ausschließen

Aktivieren Sie das Kontrollkästchen, um einen leeren Datensatz aus der Berechnung auszuschließen.

Eingabedaten

Legen Sie den Modus der Eingabedaten fest, indiziert oder roh.

Unabhängige Spalten

Jede Spalte wird als separater Datensatz bearbeitet. Es werden für jede von ihnen unabhängig voneinander statistische Operationen durchgeführt.

Kombiniert zu einem einzelnen Datensatz

Alle Spalten werden als ein Ganzes bearbeitet.

Bereich1

Legen Sie den Datenbereich fest, für den diese Analyse durchgeführt werden soll:

Datenbereich
Der Eingabedatenbereich
Gruppe
Mehrere Gruppierungsspalten enthalten Gruppierungsinformationen, die in das Feld Gruppe eingefügt werden können. Verschiedene Gruppierungswerte weisen darauf hin, dass die Daten in den entsprechenden Zellen aus verschiedenen Gruppen sind. Sie können Gruppierungsspalten über Schaltflächen hinzufügen, entfernen und ordnen: Nach oben verschieben Button Group List Move Up.png, Nach unten verschieben Button Group List Move Down.png, Entfernen Button Group List Remove.png, Alle auswählen Button Group List Select All.png, Auswählen Button Group List Add.png auf der Symbolleiste Group List Toolbar.png. Die Gruppierungsspalten sind auf kategorisch gesetzt, falls die meisten Spaltenwerte Text sind. Sie können die Ausgabespalten ganz einfach neu ordnen.
Gewichtungsbereich
Der Bereich, der Gewichtungsinformationen enthält Der Wert in jeder Zelle legt die Gewichtung der entsprechenden Daten fest.

Merkmale

Momente

Angenommen, x_i\, ist die i\,-te Stichprobe und w_i\, die i\,-te Gewichtung.

N gesamt

Gesamtanzahl der Datenpunkte, bezeichnet mit n

N fehlend

Anzahl der fehlenden Werte

Mittelwert

Der (durchschnittliche) Mittelwert

\bar{x}=\frac 1w\sum_{i=1}^n x_iw_i. Wenn es keine Variable Gewichtung gibt, wird die Formel reduziert auf \frac 1n\sum_{i=1}^n x_i.

Standardabweichung

s=\sqrt{\sum_{i=1}^n w_i(x_i-\bar{x})^2/d}

wobei d=n-1 \,

Hinweis: In OriginPro hat d vier Optionen mehr, die im Zweig Varianzdivisor des Moments definiert sind.

SE des Mittelwerts Standardfehler des Mittelwerts

\frac s{\sqrt{w}}

Unteres 95% KI des Mittelwerts

Untere Grenze des 95%-Konfidenzintervalls des Mittelwerts

\bar{x}-t_{(1-\alpha /2)}\frac s{\sqrt{n}}

wobei t_{(1-\alpha /2)} der (1-\alpha /2) kritische Wert der Studenten-t-Statistik mit n-1 Freiheitsgraden ist.

Oberes 95% KI des Mittelwerts

Obere Grenze des 95%-Konfidenzintervalls des Mittelwerts

\bar{x}+t_{(1-\alpha /2)}\frac s{\sqrt{n}}

wobei t_{(1-\alpha /2)} der (1-\alpha /2) kritische Wert der Studenten-t-Statistik mit n-1 Freiheitsgraden ist.

Varianz

 s^2\

Summe \sum_{i=1}^n x_iw_i. Wenn es keine Variable Gewichtung gibt, wird die Formel reduziert auf \sum_{i=1}^n x_i.
Schiefe

Die Schiefe misst den Grad der Asymmetrie einer Verteilung. Sie wird definiert als

\gamma_1=\frac n{(n-1)(n-2)}\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3 ,\mbox{for DF}

\gamma_1=\frac 1n\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3,\mbox{for N}

\gamma_1=\frac 1d\sum_{i=1}^n w_i^{\frac 32}(\frac{x_i-\bar{x}}s)^3,\mbox{for WVR}

Hinweis: Wenn die WDF- oder WS-Methode ausgewählt ist, wird die Schiefe als fehlender Wert angegeben.

Kurtosis

Die Kurtosis zeigt den Grad der Peaks einer Verteilung an.

\gamma_2=\frac{n(n+1)}{(n-1)(n-2)(n-3)}\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4-\frac{3(n-1)^2}{(n-2)(n-3)},\mbox{for DF}

\gamma_2=\frac 1n\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4 -3,\mbox{for N}

\gamma_2=\frac 1d\sum_{i=1}^n w_i^2(\frac{x_i-\bar{x}}s)^4 -3,\mbox{for WVR}

Hinweis: Wenn die WDF- oder WS-Methode ausgewählt ist, wird die Kurtosis als fehlender Wert angegeben.

Unkorrigierte Summe der Quadrate

\sum_{i=1}^n w_ix_i^2

Korrigierte Summe der Quadrate

\sum_{i=1}^n w_i(x_i-\bar{x})^2

Variationskoeffizient

\frac s{\bar{x}}

Mittelwert Absolutabweichung

\frac{ \sum_{i=1}^n w_i|x_i-\bar{x}|}w

SD mal 2

Standardabweichung mal 2

2s \,

SD mal 3

Standardabweichung mal 3

3s \,

Geometrische Mittelwert

\bar{x}_g=\left( \prod_{i=1}^n x_i\right) ^{\frac 1n}

Hinweis: Gewichtungen werden für den geometrischen Mittelwert ignoriert.

Geometrische StAbw

Die geometrische Standardabweichung e^{std(\log x_i)}, wobei std für die ungewichtete Standardabweichung der Stichprobe steht.

Hinweis: Gewichtungen werden für die geometrische Standardabweichung ignoriert.

Modus

Der Modus ist das Element, das am häufigsten im Datenbereich auftaucht. Wenn mehrere Modi gefunden werden, wird das kleinste gewählt.

Summe der Gewichtungen

w=\sum_{i=1}^n w_i

Harmonisches Mittel

Harmonisches Mittel


ohne Gewichtung: \frac n{\frac 1{x_1} + \frac 1{x_2} + ... + \frac 1{x_n}}=\left(\frac {\sum_{i=1}^n (x_i)^{-1}}n\right)^{-1}

mit Gewichtung: \frac {\sum_{i=1}^n w_i}{\sum_{i=1}^n \frac {w_i}{x_i}}=\left(\frac {\sum_{i=1}^n w_i x_i^{-1}}{\sum_{i=1}^n w_i}\right)^{-1}

wenn x_i oder Gewichtung negativ ist, wird Fehlende weitergegeben; wenn x_i oder Gewichtung 0 ist, wird 0 weitergegeben.

Quantile

Quantile sind Werte aus Daten, unter denen sich ein gegebener Anteil der Datenpunkte in einem gegebenen Satz befindet. Zum Beispiel befinden sich 25% der Datenpunkte in einem beliebigen Datensatz unter dem ersten Quartil und 50% der Datenpunkte in einem Satz unter dem zweiten Quartil oder Median.

Sortieren Sie den Eingabedatensatz in aufsteigender Reihenfolge. Angenommenx(i)\, ist das i\,-te Element des neu geordneten Datensatzes

Minimum

x_{(1)}\,

Index des Minimums

Die Indexnummer des Minimums im ursprünglichen (Eingabe-)Datensatz

1. Quartil (Q1)

Erstes (25%) Quantil, Q1 Informationen zu Berechnungsmethoden finden Sie unter Interpolation von Quantilen.

Median

Median oder zweites (50%) Quantil, Q2 Informationen zu Berechnungsmethoden finden Sie unter Interpolation von Quantilen.

3. Quartil (Q3)

Drittes (75%) Quantil, Q3 Informationen zu Berechnungsmethoden finden Sie unter Interpolation von Quantilen.

Maximum

x_{(n)}\,

Index des Maximums

Die Indexnummer des Maximums im ursprünglichen (Eingabe-)Datensatz

Interquartilbereich (Q3-Q1)

Q_3-Q_1\,

Spannweite (Maximum-Minimum)

Maximum - Minimum

Benutzerdefinierte Perzentil(e)

Benutzerdefinierte Perzentile können berechnet werden.

Perzentilliste

Diese Option ist nur verfügbar, wenn Benutzerdefinierte Perzentil(e) aktiviert ist. Perzentile werden für alle aufgeführten Werte berechnet.

Mittlere absolute Abweichung (MAD) Für einen univariaten Datensatz X1, X2, ..., Xn, wird MAD als Median der absoluten Abweichungen vom Median der Daten definiert:

MAD = Median(|{X_i} - Median(X)|)\,

das heißt, angefangen bei den Residuen (Abweichungen) vom Median der Daten, ist die mittlere absolute Abweichung MAD der Median ihrer absoluten Werte.

Robuster Variationskoeffizient

(MAD/norminv(0,75))/Median\,

Extremwerte

Extremwerte werden angegeben. Extremwerte sind der höchste und der niedrigste Wert.
l = \begin{cases} 5,& \mbox{if }\ n\geq 10 \\ n/2, & \mbox{otherwise } \end{cases}

wobei n die Länge des Datensatzes ist.

Steuerung Berechnung

Gewichtungsmethode

Wählen Sie die Gewichtungsmethoden für die Eingabedaten.

Direkte Gewichtung

w_{i}=c_{i}\,\!, wobei c_{i}\,\! der i-te Wert des Gewichtungsdatensatzes ist.

Instrumental

w_{i}=\frac 1{\sigma _{i}^2}\,\!, wobei \sigma_{i}\,\! der Wert in einer zugewiesenen Fehlerbalkenspalte ist.

Statistisch

w_{i}=\frac 1{x_{i}}\,\!, wobei x_{i}\,\! die Eingabedaten sind.

Varianzdivisor des Moments

Die Berechnung des Varianzdivisors d wird gesteuert.

Freiheitsgrade Freiheitsgrade

d=n-1\,

N Anzahl der nicht fehlenden Beobachtungen

d=n\,

WDF Summe der Gewichtungen (DF)

d=w-1\,

WS Summe der Gewichtungen

d=w\,

WVR d=w-\sum_{i=1}^n w_i^2/w

Interpolation der Quantile

Methoden zum Berechnen von Q1, Q2, und Q3:

Angenommen, das i\,-te Perzentil ist y, gesetzt auf p=i/100\,, und angenommen,

\begin{cases} (n+1)p=j+g, & \mbox{for Weighted Average Right } \\ np=(j+g),& \mbox{for other methods } \end{cases}

wobei j der ganzzahlige Teil von np ist und g der Bruchteil von np. Verschiedene Methoden definieren das i^{th}\, Perzentil y wie im Folgenden beschrieben:

Empirische Verteilung mit Durchschnittsberechnung y = \begin{cases} \frac 12(x_{(j)}+x_{(j+1)}),& \mbox{if }\ g=0 \\ x_{(j+1)},& \mbox{if }\ g>0 \end{cases}
Nächster Nachbar Beobachtungszahl liegt am nächsten bei np\,

y = \begin{cases} x_k,& \mbox{if }\ g\neq \frac 12 \\ x_j, & \mbox{if }\ g=\frac 12 \mbox{ and j is even} \\ x_{(j+1)},& \mbox{if }\ g=\frac 12 \mbox{ and j is odd} \end{cases}, wobei k der ganzzahlige Teil ist von np+\frac 12\,

Empirische Verteilung y= \begin{cases} x_{(j)}, & \mbox{if }\ g=0 \\ x_{(j+1)},& \mbox{if }\ g>0 \end{cases}
Gewichteter Durchschnitt rechts Gewichteter Durchschnitt ist gerichtet auf x_{((n+1)p)}\,

y=(1-g)x_{(j)}+gx_{(j+1)}\,, wobei x_{(n+1)}\, angenommen wird als x_{(n)}\,

Gewichteter Durchschnitt links Gewichteter Durchschnitt ist gerichtet auf x_{(np)}\,

y=(1-g)x_{(j)}+gx_{(j+1)}\,, wobei x_0\, angenommen wird als x_1\,

Tukey Hinges Es sei:

m = \begin{cases} \frac n2,& \mbox{if n is even} \\ \frac{(n+1)}2,& \mbox{if n is odd} \end{cases} k = \begin{cases} \frac m2,& \mbox{if m is even} \\ \frac{(m+1)}2,& \mbox{if m is odd} \end{cases}

Dann haben wir:

Minimum=x_{(1)}\,

Q_1= \begin{cases} x_k,& \mbox{if m is odd} \\ \frac 12(x_{(k)}+x_{(k+1)}),& \mbox{if m is even} \end{cases} Q_2= \begin{cases} x_m,& \mbox{if n is odd} \\ \frac 12(x_{(m)}+x_{(m+1)}),& \mbox{if n is even} \end{cases}

Q_3= \begin{cases} x_{(n-k-1)},& \mbox{if m is odd} \\ \frac 12(x_{(n-k)}+x_{(n-k+1)}),& \mbox{if m is even} \end{cases}

Maximum=x_{(n)}\,

Hinweis: Wenn Gewichtungen festgelegt sind, werden gewichtete Perzentile berechnet. Das p-te gewichtete Perzentil y wird mit der Funktion Empirische Verteilung mit Durchschnittsberechnung berechnet: y= \begin{cases} \frac 12(x_{(i)}+x_{(i+1)}),& \mbox{if } \sum_{j=1}^i w_j=pw \\ x_{(i+1)},& \mbox{if } \sum_{j=1}^{i} w_j<pw<\sum_{j=1}^{i+1}w_j\\ x_{(1)},& \mbox{if } \ pw<w_1 \\ x_{(n)},& \mbox{if } \ pw<w_n \\ \end{cases}

Ausgabe

Seit Origin 2022 wird die Eingabespalte Format einer Gruppenspalte im Ausgabeblatt aufbewahrt (z. B. DescStatsQuantities). Wenn zum Beispiel die Spaltenstatistik der Datums-/Zeitdaten ausgegeben wird, wird die Spalte Format im Ausgabeblatt auf Datum-Zeit gesetzt (zuvor würde die Spalte als Text formatiert werden). Sie können das alte Verhalten durch Festlegen von @SCCSF = 0 wiederherstellen. Informationen zum Ändern des Wert einer Systemvariablen finden Sie unter FAQ-708 Wie ändere ich permanent den Wert einer Systemvariablen?.

Diagramm Die Anordnung der sich ergebenden Zeichnungen wird festgelegt.
Diagramme in Spalten anordnen
Legen Sie die Anzahl der Spalten fest, in denen die Ausgabediagramme angeordnet werden.
Diagramme des gleichen Typs in einem Graph anordnen
Aktivieren Sie dieses Kontrollkästchen, um alle Diagramme des gleichen Typs in einem Diagrammfenster zu zeichnen.
Datensatzidentifizierer Wählen Sie einen Identifizierer für die Quelldatensätze.
Identifizierer
Wählen Sie aus der Liste:
  • Bereich
Die Bereichssyntax wird verwendet.
  • Mappenname
Der Langname der Arbeitsmappe wird verwendet.
  • Blattname
Der Arbeitsblattname wird verwendet.
  • Name
Der Spaltenlangname, wenn er existiert, wird verwendet, ansonsten der Kurzname.
  • Kurzname
Der Kurzname der Spalte wird verwendet.
  • Langname
Der Langname der Spalte wird verwendet.
  • Einheiten
Die Einheiten der Spalte werden verwendet.
  • Kommentare
Die Kommentare der Spalte werden verwendet.
  • <Benutzerdefiniert>
Verwenden Sie benutzerdefinierte Formate, um einen Datenidentifizierer zu definieren. Einzelheiten zu seiner Anwendung finden Sie unter Erweiterte Anpassungen des Legendentexts.
Identifizierer im Ergebnisblatt
Der Datensatzidentifizierer wird in dem Ergebnisblatt verwendet.
Berichtstabellen Ziel für Berichtstabellen
Mappe
Die Zielarbeitsmappe
  • <Keine>: Berichtsblatttabellen nicht ausgeben
  • <Quelle>: Die Quelldatenarbeitsmappe
  • <neu>: Eine neue Arbeitsmappe
  • <existiert>: Eine vorhandene Arbeitsmappe
Mappenname
Die Zielarbeitsmappe Muss Quelle (nicht bearbeitbar), neu oder vorhanden sein (bearbeitbar), ansonsten leer.
Blatt
Das Zielarbeitsblatt, immer <neu>
Blattname
Der Name des Zielarbeitsblatts
Ergebnisfenster
Legen Sie fest, dass der Bericht im Ergebnisfenster ausgegeben wird.
Skriptfenster
Legen Sie fest, dass der Bericht im Skriptfenster ausgegeben wird.
Notizfenster
Legen Sie das Ziel des Notizfensters fest:
  • <Keine>: Nicht in einem Notizfenster ausgeben
  • <neu>: In ein neues Notizfenster ausgeben
Merkmale Legen Sie das Ziel der Eigenschaften fest.
Mappe
Legen Sie die Zielarbeitsmappe fest.
  • <Keine>: Keine Eigenschaften ausgeben
  • <Quelle>: Die Quelldatenarbeitsmappe
  • <Bericht>: Die Arbeitsmappe mit den Berichtstabellen
  • <neu>: Eine neue Arbeitsmappe
  • <existiert>: Eine festgelegte existierende Arbeitsmappe
Mappenname
Die Zielarbeitsmappe Muss Quelle (nicht bearbeitbar), neu oder vorhanden sein (bearbeitbar), ansonsten leer.
Blatt
  • <neu>: Ein neues Arbeitsblatt
  • <Quelle>: Das Quelldatenarbeitsblatt
  • <existiert>: Ein festgelegtes existierendes Arbeitsblatt
Blattname
Der Name des Zielarbeitsblatts
Optionale Berichtstabellen Legt fest, was in das Berichtsblatt ausgegeben wird.
Hinweise
Tabelle für Notizen
Eingabedaten
Tabelle für Eingabedaten
Maskierte Daten
Tabelle für maskierte Daten
Fehlende Daten
Tabelle für fehlende Daten

Diagramme

Histogramme In dem Ergebnisblatt wird ein Histogramm ausgegeben.

Wenn dieses Kontrollkästchen aktiviert ist, ist der Zweig erweitert. In diesem Zweig ist das Kontrollkästchen Automatische Einteilung standardmäßig aktiviert. Einteilungsgröße, Anzahl der Einteilungen, Anfang, Ende werden automatisch gezeigt, wenn Automatische Einteilung nicht aktiviert ist.

Hinweis: Wenn die Eingabedaten sich in mehreren Spalten befinden, zeigt Origin nicht bearbeitbare Grenzwerte für jede Spalte an. Wenn das Kontrollkästchen Automatische Einteilung deaktiviert ist, sind diese Elemente mit einem Startwert editierbar.

Auto Binning.png

Wenn Sie den Wert von Einteilungsgröße, Start und/oder Ende bearbeitet haben, wird die Anzahl der Einteilungen automatisch berechnet.

Anzahl der Einteilungen und Einteilungsgröße können unter Schritt nach gewechselt werden.

Anzahl der Einteilungen = (Anfang-Ende) / Einteilungsgröße

Boxdiagramme In dem Ergebnisblatt wird ein Boxdiagramm ausgegeben. Wenn die Eingabedaten eine Gruppenspalte haben, wird das Boxdiagramm entsprechend gruppiert. Wenn die Gruppenspalte auf Kategorisch gesetzt ist, wird das ausgegebene Boxdiagramm entsprechend der kategorialen Ordnung gezeichnet, die auf der Registerkarte Kategorien (Spalteneigenschaften) unter Gruppierungsbereich benutzerdefiniert angepasst wurde.