Wartość predykcyjna

Wartość predykcyjna dodatnia, PPV (od ang. positive predictive value) – miara jakości predykcyjnej testu statystycznego, równa proporcji prawdziwie dodatnich wyników wśród wszystkich wyników dodatnich. Wysoka wartość PPV znamionuje wysoką precyzję testu; nie zależy jednak wyłącznie od jego charakterystyki, ale również od częstości występowania stanu dodatniego w populacji (w przypadku medycyny, od chorobowości). W teorii informacji, PPV odpowiada wskaźnikowi precyzji^[1].

W kontekście weryfikacji hipotez statystycznych w podejściu częstościowym, wartość predykcyjna dodatnia pozwala wyrazić prawdopodobieństwo, że wynik istotny statystycznie sygnalizuje wykrycie prawdziwego zjawiska. PPV zależy w tym przypadku od przyjętego poziomu błędu pierwszego i drugiego rodzaju – od krytycznego poziomu istotności, np. $\alpha =0{,}05,$ oraz od mocy statystycznej badania – oraz od odsetka hipotez prawdziwych wśród wszystkich testowanych^[1]. Według hiperbolicznego stwierdzenia Ioannidesa, prawdopodobnie „większość opublikowanych odkryć jest fałszywa”, ponieważ PPV jest niewystarczająco wysokie – badania mają przeciętnie niską moc, testują niepewne hipotezy, a badacze dopuszczają się P-hackingu^[2].

Wartość predykcyjna ujemna, NPV (od ang. negative predictive value) – proporcja prawdziwie ujemnych wyników wśród wszystkich wyników ujemnych; wyraża prawdopodobieństwo, że ujemny wynik testu jest prawdziwy^[1].

Tablica pomyłek przedstawia wzajemne powiązania między różnymi miarami jakości predykcyjnej testu:

		Klasa predykowana – wynik testu
	Populacja	Klasyfikacja pozytywna	Klasyfikacja negatywna	Częstość występowania, chorobowość ${\frac {\scriptstyle \sum {\text{stan pozytywny}}}{\scriptstyle \sum {\text{populacja}}}}$
Klasa rzeczywista	Stan pozytywny	prawdziwie dodatnia, TP	fałszywie ujemna (błąd drugiego rodzaju, FN)	czułość, TPR ${\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FN}} }}$	FNR ${\frac {\scriptstyle \sum \mathbf {\color {Red}FN} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FN}} }}$
Klasa rzeczywista	Stan negatywny	fałszywie dodatnia (błąd pierwszego rodzaju, FP)	prawdziwie ujemna, TN	FPR ${\frac {\scriptstyle \sum \mathbf {\color {Red}FP} }{\scriptstyle \sum \mathbf {{\color {Red}FP}+\sum {\color {OliveGreen}TN}} }}$	swoistość, SPC, TNR ${\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum \mathbf {{\color {Red}FP}+\sum {\color {OliveGreen}TN}} }}$
	dokładność, ACC ${\frac {\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+} \scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum {\text{populacja}}}}$	precyzja, PPV ${\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FP}} }}$	FOR ${\frac {\scriptstyle \sum \mathbf {\color {Red}FN} }{\scriptstyle \sum \mathbf {{\color {Red}FN}+\sum {\color {OliveGreen}TN}} }}$	LR+ ${\frac {\scriptstyle \mathbf {\color {OliveGreen}TPR} }{\scriptstyle \mathbf {\color {OliveGreen}FPR} }}$	DOR ${\frac {\scriptstyle \mathbf {\color {OliveGreen}LR+} }{\scriptstyle \mathbf {\color {OliveGreen}LR-} }}$
		FDR ${\frac {\scriptstyle \sum \mathbf {\color {Red}FP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FP}} }}$	NPV ${\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum \mathbf {{\color {Red}FN}+\sum {\color {OliveGreen}TN}} }}$	LR- ${\frac {\scriptstyle \mathbf {\color {OliveGreen}FNR} }{\scriptstyle \mathbf {\color {OliveGreen}TNR} }}$

Wartość predykcyjną dodatnią opisuje zależność między liczbą wyników prawdziwie dodatnich (TP), a ogólną liczbą wyników dodatnich: prawdziwie dodatnich (TP) i fałszywie dodatnich (FP)^[1]:

{\text{PPV}}=\mathbf {\frac {\sum {\color {OliveGreen}TP}}{\sum {\color {OliveGreen}TP}+\sum {\color {Red}FP}}}

Wartość predykcyjną ujemną opisuje zależność między liczbą wyników prawdziwie ujemnych (TN), a ogólną liczbą wyników ujemnych: prawdziwie ujemnych (TN) i fałszywie ujemnych (FN)^[1]:

{\text{NPV}}=\mathbf {\frac {\sum {\color {OliveGreen}TN}}{\sum {\color {OliveGreen}TN}+\sum {\color {Red}FN}}}

Wartości predykcyjne można również obliczyć, jeśli znana jest czułość i swoistość testu oraz wcześniejsze prawdopodobieństwo wystąpienia zjawiska (np. współczynnik chorobowości w epidemiologii)^[1]^[3].

{\text{PPV}}={\frac {{\text{czulosc}}\times {\text{chorobowosc}}}{{\text{czulosc}}\times {\text{chorobowosc}}+(1-{\text{swoistosc}})\times (1-{\text{chorobowosc}})}}

{\text{NPV}}={\frac {{\text{swoistosc}}\times (1-{\text{chorobowosc}})}{(1-{\text{czulosc}})\times {\text{chorobowosc}}+{\text{swoistosc}}\times (1-{\text{chorobowosc}})}}

Przypisy

↑ ^a ^b ^c ^d ^e ^f Douglas G.D.G. Altman Douglas G.D.G., J. MartinJ.M. Bland J. MartinJ.M., Statistics Notes: Diagnostic tests 2: predictive values, „British Medical Journal”, 309 (6947), 1994, s. 102, DOI: 10.1136/bmj.309.6947.102, ISSN 0959-8138, PMID: 8038641 .
↑ John P.A.J.P.A. Ioannidis John P.A.J.P.A., Why Most Published Research Findings Are False, „PLOS Medicine”, 2 (8), 2005, e124, DOI: 10.1371/journal.pmed.0020124, ISSN 1549-1676, PMID: 16060722, PMCID: PMC1182327 [dostęp 2017-02-06] .
↑ Hollis N.H.N. Erb Hollis N.H.N., Prior probability (the pretest best guess) affects predictive values of diagnostic tests, „Veterinary Clinical Pathology”, 40 (2), 2011, s. 154–158, DOI: 10.1111/j.1939-165X.2011.00315.x, ISSN 1939-165X .

Linki zewnętrzne

When does a significant p-value indicate a true effect? – symulator PPV w zależności od poziomu istotności, mocy, odsetka prawdziwych hipotez i stopnia P-hackingu.