Deskriptive Statistik

 

Video Image.png Video Text Image.png Website blog icon circle.png Blog Image 33x33px.png

Zusammenfassung

Origin bietet umfassende Optionen zur Deskriptiven Statistik, einschließlich Grundlagen der Statistik (Mittelwert, Median, Varianz etc.), Häufigkeitszählungen und Korrelationskoeffizienten Ihrer Datensätze. Zusätzlich zu den leistungsstarken Zeichenfunktionen helfen Origins statistische Hilfsmittel Ihnen beim Zusammenfassen und Analysieren Ihrer Daten.

Was Sie lernen werden

Dieses Tutorial zeigt Ihnen, wie Sie:

  • den Dialog Spaltenstatistik verwenden, um Berechnungen der deskriptiven Statistik für gruppierte Daten durchzuführen,
  • die statistischen Ergebnisse in ein neues Arbeitsblatt für die weitere Verarbeitung kopieren,
  • Arbeitsblattdaten nach Attributwerten in einer zugewiesenen Spalte sortieren,
  • die Datensätze mit dem Hilfsmittel Korrelationskoeffizient analysieren.

Origin-Version mind. erforderlich: Origin 2015 SR0

Häufigkeitsdaten für Gruppen suchen

Sie können das Hilfsmittel Diskrete Häufigkeit verwenden, um schnell Informationen zur Häufigkeit von Datengruppen zu erhalten.

  1. Öffnen Sie eine neue Arbeitsmappe. Wählen Sie Daten: Aus Datei importieren: Einzelnes ASCII und importieren Sie die Datendatei \Samples\Statistics\automobile.dat.
  2. Markieren Sie die ersten beiden Spalten im Arbeitsblatt automobile. Wählen Sie im Menü Statistik: Deskriptive Statistik: Diskrete Häufigkeit.
  3. Setzen Sie den Modus von Neu berechnen auf Auto. Damit Operationen im Abschnitt Controlling the Categorical Values des Arbeitsblatts der Quelldaten wirksam werden, wählen Sie für Daten sortieren nach die Option Kategoriale Ordnung. Klicken Sie dann auf OK.
    Descriptive Statistics00.png
  4. Das sich ergebende Arbeitsblatt DiscretFreq1 zeigt die Daten und deren Häufigkeit für automobile Year bzw. Make an.

Trotz der Tatsache, dass sich in den Spalten Schlösser befinden, kann das Arbeitsblatt durch Markieren der gewünschten Spalte neu angeordnet werden. Wählen Sie dann im Menü Worksheet: Worksheet sortieren und eine der Optionen Aufsteigend, Absteigend oder Benutzerdefiniert.

Deskriptive Statistik der gruppierten Daten berechnen

Mit dem Hilfsmittel Spaltenstatistik können grundlegende statistische Analysen für die Daten in einzelnen Spalten durchgeführt werden.

  1. Kehren Sie zum Arbeitsblatt automobile zurück. Wählen Sie im Menü Statistik: Deskriptive Statistik: Spaltenstatistik: Dialog öffnen....
  2. Erweitern Sie im Dialog Spaltenstatistik auf der Registerkarte Eingabe den Zweig Bereich 1 und klicken Sie auf die interaktive Schaltfläche Button Select Data Interactive.png rechts vom Datenbereich. Wechseln Sie zurück zum Arbeitsblatt, markieren Sie Spalte C und ziehen Sie Ihre Maus bis Spalte G. Klicken Sie erneut auf die interaktive Schaltfläche, um den Dialog wiederherzustellen. Klicken Sie im Dialog nach Festlegen der Eingabedaten unter Bereich 1 auf die Pfeilschaltfläche oben rechts im Bedienfeld Gruppe und wählen Sie B(Y): Make als Gruppierungsdaten. Setzen Sie den Modus von Neu berechnen auf Auto.
    DOC-2411 Descriptive Statistics on Grouped Data 001aa.png
  3. Aktivieren Sie auf der Registerkarte Ausgabe in der Gruppe Diagramm das Kontrollkästchen Diagramme des gleichen Typs in einem Graph anordnen. Aktivieren Sie auf der Registerkarte Zeichnungen das Kontrollkästchen Boxdiagramme.
    DOC-2411 Descriptive Statistics on Grouped Data 001b.png DOC-2411 Descriptive Statistics on Grouped Data 001c.png
  4. Klicken Sie auf OK, um die Ergebnisse in einem Berichtsblatt zu erhalten.
    Tutorial Descriptive Statistics on Grouped Data 04.png

Um ein eingebettetes Boxdiagramm im Berichtsblatt zu modifizieren, klicken Sie doppelt auf das Diagramm. Das Diagramm wird geöffnet, so dass Sie es benutzerdefiniert anpassen können. Klicken Sie auf die Schaltfläche Zurück in der oberen rechten Ecke, um das modifizierte Diagramm im Berichtsblatt wiederherzustellen.

Statistische Ergebnisse für weitere Operationen verwenden

Es ist möglich, weitere Datenanalysen durchzuführen und die statistischen Ergebnisse zu zeichnen.

Um beispielsweise die durchschnittlichen Attributwerte (d.h. Horsepower, 0-60 mph Time, Weight, Mileage) nach Automarken zwischen 1992 und 2004 zu erhalten, führen Sie folgende Schritte durch:

  1. Kehren Sie zurück zur Arbeitsmappe automobile - automobile.dat und öffnen Sie das Arbeitsblatt DescStatsQuantities1. Markieren Sie die Spalten D(Y2) und E(yEr±) und wählen Sie im Menü Arbeitsblatt: Spalten entstapeln: Dialog öffnen...
  2. Setzen Sie im Dialog wunstackcol den Modus für Neu berechnen auf Auto, wählen Sie Gruppenspalten. Klicken Sie auf die Schaltfläche Context menu button.jpg und wählen Sie A(X1) Data.
  3. Erweitern Sie den Zweig Optionen und aktivieren Sie das Kontrollkästchen Andere Spalten einbinden. Klicken Sie unter Andere Spalten auf die Schaltfläche des Kontextmenüs Context menu button.jpg und wählen Sie B:(X2) Make. Setzen Sie Längste übereinstimmende Gruppe als Extrahierungsregel für Andere Spaltenwerte, erweitern Sie Ausgabeeinstellungen und wählen Sie in Gruppierungsinfo ablegen in die Option Langname. Klicken Sie auf OK.
    DOC-2411 Descriptive Statistics on Grouped Data 006a.png
  4. Um die Ergebnisse zu sehen, öffnen Sie das Arbeitsblatt UnstackCols1, markieren Sie das Arbeitsblatt und wählen Sie im Menü Zeichnen > Mehrere Felder/Achsen: Gestapelt.
  5. Setzen Sie im Dialog Plotting:plotstack den Diagrammtyp auf Punkt. Klicken Sie auf OK.
  6. Nun sollen die Hilfsstrichsbeschriftungen der oberen X-Achse gedreht werden, damit sie besser zu lesen sind. Klicken Sie doppelt auf die Hilfsstrichsbeschriftungen der oberen X-Achse, um den Dialog Achsen zu öffnen, und legen Sie die folgenden Einstellungen bei ausgewähltem Symbol Oben fest. Klicken Sie auf OK.
    Tutorial Descriptive Statistics Axis Dialog.png
    Drehen Sie die Beschriftungen der Hilfsstriche für Unten auf die gleiche Weise.
  7. Das Berichtsblatt und das Diagramm sollten nun folgendermaßen aussehen:
    Tutorial Descriptive Statistics on Grouped Data 0055.png

Verhältnis zwischen verschiedenen Indikatoren analysieren

Verwenden Sie den Korrelationskoeffizienten, um das Verhältnis zwischen den Spalten der Automobildaten zu untersuchen. Als nächstes erstellen Sie Punktdiagramme mit Konfidenzellipsen, um die Korrelationen grafisch darzustellen.

  1. Öffnen Sie das Arbeitsblatt automobile der Arbeitsmappe automobile - automobile.dat und markieren Sie die letzten fünf Spalten.
  2. Wählen Sie im Menü Statistik: Deskriptive Statistik: Korrelationskoeffizient: Dialog öffnen. Erweitern Sie im Dialog corrcoef den Zweig Korrelationstypen und aktivieren Sie das Kontrollkästchen Pearson.
  3. Erweitern Sie den Zweig Diagramme und aktivieren Sie das Kontrollkästchen Konfidenzellipse hinzufügen. Das Kontrollkästchen Punktdiagramme sollte automatisch aktiviert sein. Klicken Sie auf OK.
  4. Die Arbeitsblätter ScatterMatrix1 und CorrCeof1 sollten wie unten aussehen. Sie zeigen die hohe, positive Korrelation zwischen Engine Displacement und Power und die hohe negative Korrelation zwischen Gas Mileage und Engine Displacement.
    Tutorial Descriptive Statistics on Grouped Data 007.png

Kategoriale Werte steuern

  1. Mit den folgenden Schritten wird die Reihenfolge der Werte, wie sie im Diagramm abgebildet wird, benutzerdefiniert angepasst. Es wird dabei keine Änderung an den Quelldaten vorgenommen. Klicken Sie mit der rechten Maustaste auf Spalte B in der Arbeitsmappe, wählen Sie Als Kategorisch setzen im Kontextmenü und klicken Sie doppelt auf die Kategorien-Zelle der Spalte "Unsortiert", um den Dialog Kategorien zu öffnen.
    Desc stats control cat values.png
  2. Deaktivieren Sie das Kontrollkästchen Kategorien benutzerdefiniert anpassen und verwenden Sie Cate-sort-2.png, um die Position von jedem Element dem Bild unten entsprechend festzulegen. Auf diese Weise können Sie die Elemente nach Herkunftsland des Herstellers sortieren, das heißt USA -> Japan/Korea -> Europa. Klicken Sie auf OK, um den Dialog zu schließen.
    Categ Sort-3.png
  3. Sie können zu dem im obigen Abschnitt erstellten Berichtsblatt gehen. Da der Modus Auto für die Neuberechnung verwendet wird, werden das Berichtsblatt für Diskrete Häufigkeiten und Spaltenstatistik, einschließlich der Boxdiagramme, automatisch mit der festgelegten Ordnung der kategorialen Daten aktualisiert.
    Tutorial Descriptive Statistics on Grouped Data 004.png
  4. Die Ergebnisse der Entstapelten Spalten und das gestapelte Diagramm werden ebenfalls automatisch aktualisiert.
    Tutorial Descriptive Statistics on Grouped Data 008.png
Hinweis: Wenn die Operation nicht automatisch aktualisiert wurde, können Sie dies auch manuell tun, indem Sie auf die Schaltfläche Neu berechnen Button Recalculate Manual.png in der Symbolleiste Standard klicken. Die Schaltfläche wird grün Button Recalculate Auto.png, nachdem die Neuberechnung durchgeführt wurde.