Algorithmen (ROC-Kurve)

In diesen Teil werden die folgenden Schreibweisen verwendet.

x_i\,\!: Testergebnis Score für Fall

n_{TP}\,\!: Anzahl der wahren positiven Entscheidungen

n_{FN}\,\!: Anzahl der falschen negativen Entscheidungen

n_{TN}\,\!: Anzahl der wahren negativen Entscheidungen

n_{FP}\,\!: Anzahl der falschen positiven Entscheidungen

n_{-}\,\!: Anzahl der Fälle mit negativem tatsächlichen Zustand

n_{+}\,\!: Anzahl der Fälle mit positivem tatsächlichen Zustand

n_{-=j}\,\!: Anzahl der wahren negativen Fälle mit Testergebnissen, die gleich sind mit

n_{+>j}\,\!: : Anzahl der wahren positiven Fälle mit Testergebnissen größer als

n_{+=j}\,\!: : Anzahl der wahren positiven Fälle mit Testergebnissen, die gleich sind mit

n_{-<j}\,\!: : Anzahl der wahren negativen Fälle mit Testergebnissen kleiner als

 

ROC-Werte

1- Spezifizität (X): 1-\frac{n_{TN}}{n_{TN}+n_{FP}}\,\!

Sensitivität (Y): \frac{n_{TP}}{n_{TP}+n_{FN}}\,\!

Der Bereich unter der ROC-Kurve

Angenommen, x\,\! ist die Skalierung der Testergebnisvariable. Bezeichnen Sie x_{-}\,\! mit den Werten x\,\! für Fälle mit negativem tatsächlichen Zustand und mit den Werten x_{+}\,\! für Fälle mit positivem tatsächlichen Zustand. Die nichtparametrische Approximation der "wahren” Fläche unter der ROC-Kurve \theta \,\! ist

 A_Z=\frac 1{n_{+}n_{-}}\sum_{j=1}^{n_{-}}\sum _{i=1}^{n_{+}}\Psi (x_{+},x_{-})

wobei n_{+}\,\! der Stichprobenumfang von D\,\!+ ist, n_{+}\,\! der Stichprobenumfang von D\,\!- ist und

\Psi (x_{+},x_{-})=\,\! \begin{cases} 1, & \mbox{if }x_{+}>x_{-} \\ 0.5, & \mbox{if }x_{+}=x_{-} \\ 0, & \mbox{if }x_{+}<x_{-} \end{cases}

Beachten Sie, dass A_z\,\! der beobachtete Bereich unter der ROC-Kurve ist, der aufeinander folgende Punte mit einer geraden Linie verbindet. d.h. durch die Trapezregel.

Eine alternative Berechnungsmöglichkeit für A_z\,\! ist folgende:

A_Z=\frac 1{n_{+}+n_{-}}\sum \left\{ n_{-=j}n_{+>j}+\frac{n_{-=j}n_{+=j}}2\right\}

Der SE des Bereichs unter der Statistik der ROC-Kurve

Die Standardabweichung von A_z\,\! wird geschätzt mit:

SE(A_Z)=\sqrt{\frac{A_Z(1-A_Z)+(n_{+}-1)(Q_1-A_Z^2)+(n_{-}-1)(Q_2-A_Z^2)}{n_{+}n_{-}}} \,\!

wobei

Q_{1=\frac 1{n_{-}n_{+}^2}}\sum n\__{=j}[n_{+>j}^2+n_{+>j}n_{+=j}+\frac{n_{+>j}^2}3] \,\!

und

Q_{2=\frac 1{n_{-}^2n_{+}}}\sum n_{+=j}[n_{->j}^2+n_{->j}n_{-=j}+\frac{n_{-=j}^2}3] \,\!

Das asymptotische Konfidenzintervall des Bereichs unter der ROC-Kurve

Ein 2-seitiges asymptotisches c\%=(100-\alpha )\%\,\! Konfidenzintervall für den wahren Bereich unter der ROC-Kurve ist

A_Z\pm SE(A_Z)\,\!

Der asymptotische P-Wert unter der Nullhypothese, dass  \theta=0,5\ \,\!, vs. die Alternativhypothese, dass  \theta \neq 0,5\ \,\!

Da A_z\,\! asymptotisch normal unter der Nullhypothese ist, dass  \theta=0,5\ \,\!, können wir den asymptotischen P-Wert unter der Nullhypothese berechnen, dass  \theta=0,5\ \,\! vs. die Alternativhypothese, dass  \theta \neq 0,5\ \,\!

P\left( \left| Z\right| >\left| \frac{A_Z-0,5}{SD(A_Z)|_{\theta =0,5}}\right| \right) =2P\left( Z>\left| \frac{A_Z-0,5}{SD(A_Z)\mid _{\theta =0,5}}\right| \right)

Im nichtparametrischen Fall

SD(A_Z)|_{\theta =0,5}=\sqrt{\frac{\theta (1-\theta )+(n_{+}-1)(Q_1-\theta ^2)+(n_{-}-1)(Q_2-\theta ^2)}{n_{+}n_{-}}}|_{\theta =0,5}\,\!

=\sqrt{\frac{0,5(1-0,5)+(n_{+}-1)(\frac 13-0,5^2)+(n_{-}-1)(\frac 13-0,5^2)}{n_{+}n_{-}}}

Optimaler Grenzpunktwert

Der Grenzpunktwert wird durch die Gleichheitsmaximierung dieser zwei Größen (SpEqualSe) definiert. Das ist min( abs(1-x-y) ) für die ROC-Kurve.