Algorithmen (t-Test bei zwei Stichproben)

Inhalt


Der t-Test bei zwei Stichproben berechnet eine studentisierte t-Statistik und die verbundene Wahrscheinlichkeit, um zu testen, ob die Differenz der zwei Stichprobenmittelwerte gleich \mu_d\,\! ist (d.h., zum Testen, ob ihre Mittelwerte gleich sind, können Sie testen, ob ihre Differenz 0, \mu_1-\mu_2=\mu_d=0\,\!, ist ). Die Hypothesen haben folgende Form:

H_0:\mu_1-\mu_2=\mu_d\,\! vs. H_1:\mu_1-\mu_2 \ne \mu_d Beidseitiger Test

H_0:\mu_1-\mu_2 \le \mu_d vs. H_1:\mu_1-\mu_2 > \mu_d Oberer Test

H_0:\mu_1-\mu_2 \ge \mu_d vs. H_1:\mu_1-\mu_2 < \mu_d Unterer Test

Teststatistik

Betrachten Sie zwei unabhängige Stichproben, x_1\,\! und x_2\,\!, des Umfangs n_1\,\! und n_2\,\! aus zwei normalverteilten Grundgesamtheiten mit den Mittelwerten \mu_1\,\! und \mu_2\,\! und den Varianzen \sigma_1^2\,\! bzw. \sigma_2^2\,\!, dann haben wir:

\bar{x}_1=\frac{1}{n_1}\sum_{j=1}^{n_1}x_{1j}, \bar{x}_2=\frac{1}{n_2}\sum_{j=1}^{n_2}x_{2j}, s_1^2=\frac{1}{n_1-1}\sum_{j=1}^{n_1}{(x_{1j}-\bar{x}_1)^2}, s_2^2=\frac{1}{n_2-1}\sum_{j=1}^{n_2}{(x_{2j}-\bar{x}_2)^2}

wobei \bar{x}_1\,\! und \bar{x}_2\,\! Stichprobenmittelwerte und s_1^2\,\! und s_2^2\,\! Stichprobenvarianzen sind. Danach wird die T-Teststatistik berechnet mit:

Für die gleiche Varianz wird angenommen, das ist \sigma_1^2=\sigma_2^2\,\!:

In diesem Fall hat die Teststatistik t

t=\frac{(\bar{x}_1-\bar{x}_2)-\mu_d}{s_p\sqrt{(1/n_1+1/n_2)}}

eine t-Verteilung mit (v = n_1+n_2-2) Freiheitsgraden und

s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

ist die gemeinsame Varianz der zwei Stichproben.

Für die gleiche Varianz wird nicht angenommen:

In diesem Fall hat die herkömmliche t-Statistik bei zwei Stichproben keine t-Verteilung mehr und keine approximative Teststatistik, t'wird verwendet:

t'=\frac{(\bar{x}_1-\bar{x}_2)-\mu_d}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

Und eine t-Verteilung mit v Freiheitsgraden wird verwendet, um die Verteilung von t' zu approximieren, wobei

v=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}

Vergleichen Sie den t- Wert mit dem kritischen Wert. Wir weisen H_0\,\! zurück, wenn:

Für beidseitigen Test: |t| > t_{\sigma/2}\,\!;

Für oberen Test: t > t_\sigma\,\!;

Für unteren Test: t < -t_\sigma\,\!;

Der p-Wert wird auch mit einem benutzerdefinierten Signifikanzniveau \sigma\,\! verglichen, für das im Allgemeinen 0,05 verwendet wird. Die Nullhypothese H_0\,\! wird zurückgewiesen, wenn p < \mu\,\!.

Konfidenzintervalle

Die obere und untere (1-\sigma )\times 100\% Konfidenzgrenze für die Mittelwertdifferenz (\mu_1 - \mu_2)\,\! werden berechnet als:

Für die gleiche Varianz wird angenommen:

Nullhypothese Konfidenzintervall
H_0:\mu_1-\mu_2=\mu_d\,\! \left[(\bar{x}_1-\bar{x}_2)- t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, (\bar{x}_1-\bar{x}_2)+ t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right]
H_0:\mu_1-\mu_2 \le \mu_d \left[(\bar{x}_1-\bar{x}_2)- t_{\alpha}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}},  \infty\right]
H_0:\mu_1-\mu_2 \ge \mu_d \left[-\infty, (\bar{x}_1-\bar{x}_2)+ t_{\alpha}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right]

Für die gleiche Varianz wird nicht angenommen:

Nullhypothese Konfidenzintervall
H_0:\mu_1-\mu_2=\mu_d\,\! \left[(\bar{x}_1-\bar{x}_2)- t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}, (\bar{x}_1-\bar{x}_2)+ t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right]
H_0:\mu_1-\mu_2 \le \mu_d \left[(\bar{x}_1-\bar{x}_2)- t_{\alpha}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}, \infty\right]
H_0:\mu_1-\mu_2 \ge \mu_d \left[-\infty, (\bar{x}_1-\bar{x}_2)+ t_{\alpha}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right]


wobei t_{\sigma/2}\,\! der kritische Wert der t-Verteilung mit v Freiheitsgraden ist.

Analyse der Trennschärfe

Die Trennschärfe eines t-Tests bei zwei Stichproben ist ein Maß für seine Fehlererkennbarkeit. Einzelheiten zu dem Algorithmus zum Berechnen der Trennschärfe lesen Sie im Abschnitt Trennschärfe und Stichprobenumfang.

Referenz

Der t-Test bei zwei Stichproben wird mit einer Nag-Funktion implementiert, nag_2_sample_t_test (g07cac). Bitte lesen Sie weitere Einzelheiten zu dem Algorithmus im entsprechenden NAG-Dokument nach.