Wartość predykcyjna

Wartość predykcyjna dodatnia, PPV (od ang. positive predictive value) – miara jakości predykcyjnej testu statystycznego, równa proporcji prawdziwie dodatnich wyników wśród wszystkich wyników dodatnich. Wysoka wartość PPV znamionuje wysoką precyzję testu; nie zależy jednak wyłącznie od jego charakterystyki, ale również od częstości występowania stanu dodatniego w populacji (w przypadku medycyny, od chorobowości). W teorii informacji, PPV odpowiada wskaźnikowi precyzji[1].

W kontekście weryfikacji hipotez statystycznych w podejściu częstościowym, wartość predykcyjna dodatnia pozwala wyrazić prawdopodobieństwo, że wynik istotny statystycznie sygnalizuje wykrycie prawdziwego zjawiska. PPV zależy w tym przypadku od przyjętego poziomu błędu pierwszego i drugiego rodzaju – od krytycznego poziomu istotności, np. α = 0 , 05 , {\displaystyle \alpha =0{,}05,} oraz od mocy statystycznej badania – oraz od odsetka hipotez prawdziwych wśród wszystkich testowanych[1]. Według hiperbolicznego stwierdzenia Ioannidesa, prawdopodobnie „większość opublikowanych odkryć jest fałszywa”, ponieważ PPV jest niewystarczająco wysokie – badania mają przeciętnie niską moc, testują niepewne hipotezy, a badacze dopuszczają się P-hackingu[2].

Wartość predykcyjna ujemna, NPV (od ang. negative predictive value) – proporcja prawdziwie ujemnych wyników wśród wszystkich wyników ujemnych; wyraża prawdopodobieństwo, że ujemny wynik testu jest prawdziwy[1].

Tablica pomyłek przedstawia wzajemne powiązania między różnymi miarami jakości predykcyjnej testu:

Klasa predykowana – wynik testu
Populacja Klasyfikacja pozytywna Klasyfikacja negatywna Częstość występowania, chorobowość

stan pozytywny populacja {\displaystyle {\frac {\scriptstyle \sum {\text{stan pozytywny}}}{\scriptstyle \sum {\text{populacja}}}}}

Klasa
rzeczywista
Stan
pozytywny
prawdziwie dodatnia, TP fałszywie ujemna
(błąd drugiego rodzaju, FN)
czułość, TPR

T P T P + F N {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FN}} }}}

FNR

F N T P + F N {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FN} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FN}} }}}

Stan
negatywny
fałszywie dodatnia
(błąd pierwszego rodzaju, FP)
prawdziwie ujemna, TN FPR

F P F P + T N {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FP} }{\scriptstyle \sum \mathbf {{\color {Red}FP}+\sum {\color {OliveGreen}TN}} }}}

swoistość, SPC, TNR

T N F P + T N {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum \mathbf {{\color {Red}FP}+\sum {\color {OliveGreen}TN}} }}}

dokładność, ACC

T P + T N populacja {\displaystyle {\frac {\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+} \scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum {\text{populacja}}}}}

precyzja, PPV

T P T P + F P {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FP}} }}}

FOR

F N F N + T N {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FN} }{\scriptstyle \sum \mathbf {{\color {Red}FN}+\sum {\color {OliveGreen}TN}} }}}

LR+

T P R F P R {\displaystyle {\frac {\scriptstyle \mathbf {\color {OliveGreen}TPR} }{\scriptstyle \mathbf {\color {OliveGreen}FPR} }}}

DOR

L R + L R {\displaystyle {\frac {\scriptstyle \mathbf {\color {OliveGreen}LR+} }{\scriptstyle \mathbf {\color {OliveGreen}LR-} }}}

FDR

F P T P + F P {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FP}} }}}

NPV

T N F N + T N {\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum \mathbf {{\color {Red}FN}+\sum {\color {OliveGreen}TN}} }}}

LR-

F N R T N R {\displaystyle {\frac {\scriptstyle \mathbf {\color {OliveGreen}FNR} }{\scriptstyle \mathbf {\color {OliveGreen}TNR} }}}


Wartość predykcyjną dodatnią opisuje zależność między liczbą wyników prawdziwie dodatnich (TP), a ogólną liczbą wyników dodatnich: prawdziwie dodatnich (TP) i fałszywie dodatnich (FP)[1]:

PPV = T P T P + F P {\displaystyle {\text{PPV}}=\mathbf {\frac {\sum {\color {OliveGreen}TP}}{\sum {\color {OliveGreen}TP}+\sum {\color {Red}FP}}} }

Wartość predykcyjną ujemną opisuje zależność między liczbą wyników prawdziwie ujemnych (TN), a ogólną liczbą wyników ujemnych: prawdziwie ujemnych (TN) i fałszywie ujemnych (FN)[1]:

NPV = T N T N + F N {\displaystyle {\text{NPV}}=\mathbf {\frac {\sum {\color {OliveGreen}TN}}{\sum {\color {OliveGreen}TN}+\sum {\color {Red}FN}}} }

Wartości predykcyjne można również obliczyć, jeśli znana jest czułość i swoistość testu oraz wcześniejsze prawdopodobieństwo wystąpienia zjawiska (np. współczynnik chorobowości w epidemiologii)[1][3].

PPV = czulosc × chorobowosc czulosc × chorobowosc + ( 1 swoistosc ) × ( 1 chorobowosc ) {\displaystyle {\text{PPV}}={\frac {{\text{czulosc}}\times {\text{chorobowosc}}}{{\text{czulosc}}\times {\text{chorobowosc}}+(1-{\text{swoistosc}})\times (1-{\text{chorobowosc}})}}}
NPV = swoistosc × ( 1 chorobowosc ) ( 1 czulosc ) × chorobowosc + swoistosc × ( 1 chorobowosc ) {\displaystyle {\text{NPV}}={\frac {{\text{swoistosc}}\times (1-{\text{chorobowosc}})}{(1-{\text{czulosc}})\times {\text{chorobowosc}}+{\text{swoistosc}}\times (1-{\text{chorobowosc}})}}}

Przypisy

  1. a b c d e f Douglas G.D.G. Altman Douglas G.D.G., J. MartinJ.M. Bland J. MartinJ.M., Statistics Notes: Diagnostic tests 2: predictive values, „British Medical Journal”, 309 (6947), 1994, s. 102, DOI: 10.1136/bmj.309.6947.102, ISSN 0959-8138, PMID: 8038641 .
  2. John P.A.J.P.A. Ioannidis John P.A.J.P.A., Why Most Published Research Findings Are False, „PLOS Medicine”, 2 (8), 2005, e124, DOI: 10.1371/journal.pmed.0020124, ISSN 1549-1676, PMID: 16060722, PMCID: PMC1182327 [dostęp 2017-02-06] .
  3. Hollis N.H.N. Erb Hollis N.H.N., Prior probability (the pretest best guess) affects predictive values of diagnostic tests, „Veterinary Clinical Pathology”, 40 (2), 2011, s. 154–158, DOI: 10.1111/j.1939-165X.2011.00315.x, ISSN 1939-165X .

Linki zewnętrzne

  • When does a significant p-value indicate a true effect? – symulator PPV w zależności od poziomu istotności, mocy, odsetka prawdziwych hipotez i stopnia P-hackingu.