Senzitivita, specificita a prediktivní hodnoty
Nejběžnější situací, při níž se setkáváme s jednoduchou aplikací podmíněné pravděpodobnosti, je statistické hodnocení správnosti diagnostických testů, kdy jsou diagnostické schopnosti testu validovány proti skutečně verifikovanému stavu testovaných osob. Srovnáváme tedy výsledky testu (pozitivní/negativní) proti skutečně prokazatelné přítomnosti/nepřítomnosti nemoci. Pro tuto situaci byla navržena sada ukazatelů správnosti, které představují číselné ohodnocení testu ve vztahu k jeho chybovosti [1].
Definici těchto ukazatelů provedeme na základě značení, v němž proti sobě sumarizujeme výsledky diagnostického testu, pozitivní výsledek (označen jako A+) a negativní výsledek (označen jako A-), a skutečnou přítomnost nemoci, nemoc přítomna (označeno jako H+) a nemoc nepřítomna (označeno jako H-). Kvantifikovat skutečnou přítomnost onemocnění není vždy jednoduché, zde však tento fakt budeme považovat za bernou minci.
Prvními dvěma ukazateli správnosti testu jsou tzv. senzitivita testu a specificita testu, které definujeme pomocí podmíněné pravděpodobnosti následovně: senzitivita testu (test sensitivity) je jeho schopnost rozpoznat skutečně nemocné osoby, tedy pravděpodobnost, že test bude pozitivní, když je osoba skutečně nemocná; specificita testu (test specificity) je jeho schopnost rozpoznat osoby bez nemoci, tedy pravděpodobnost, že test bude negativní, když osoba není nemocná. Pomocí výše zavedeného značení definujeme senzitivitu a specificitu jako
Senzitivita:
|
Specificita:
|
(2.6) |
Druhými dvěma ukazateli jsou tzv. prediktivní hodnoty, které také definujeme pomocí podmíněné pravděpodobnosti: prediktivní hodnota pozitivního testu (predictive value of positive test) je pravděpodobnost, že osoba je skutečně nemocná, když test vyjde jako pozitivní; a naopak prediktivní hodnota negativního testu (predictive value of negative test) je pravděpodobnost, že osoba skutečně není nemocná, když její test vyjde jako negativní. Pomocí výše zavedeného značení definujeme prediktivní hodnoty jako
Prediktivní hodnota pozitivního testu:
|
Prediktivní hodnota negativního testu:
|
(2.7) |
Příklad 2.1. Hodnotíme přesnost vyšetření jater ultrazvukem, respektive schopnost vyšetření ultrazvukem identifikovat postižené ložisko v pacientových játrech. Přesnost je vztažena k laboratornímu ověření odebrané tkáně. Výsledky jsou dány tabulkou 2.1.
Tab. 2.1: Sumarizace výsledků ultrazvukového vyšetření jater vzhledem k laboratornímu ověření.
Výsledek ultrazvuku
Histologické ověření postižení jater
Celkem
Ložisko přítomno (H+)
Ložisko nepřítomno (H-)
Pozitivní (A+)
32
2
34
Negativní (A-)
3
24
27
Celkem
35
26
61
Výpočet senzitivity a specificity testu je následující:
Senzitivita testu: (2.8)
Specificita testu: (2.9) Obdobně vypočítáme i obě prediktivní hodnoty testu
Prediktivní hodnota pozitivního testu: (2.10)
Prediktivní hodnota negativního testu: (2.11) Z hlediska interpretace je vhodné poznamenat, že senzitivita a specificita jsou spíše populační ukazatele, neboť vycházejí ze znalosti skutečné přítomnosti/nepřítomnosti onemocnění, kterou však u konkrétního testovaného pacienta stojícího v ordinaci s výsledkem testu neznáme. Více než testované osoby (potenciální pacienty) tak senzitivita a specificita zajímají lékaře, kteří mohou tyto dva ukazatele velmi dobře použít pro srovnání diagnostické správnosti dvou různých testů. Naopak prediktivní hodnoty vycházejí z konkrétního výsledku testu (pozitivní/negativní) a jsou tak zajímavé především pro pacienty. Ty totiž v případě konkrétního testu jistě zajímá, jaká je pravděpodobnost, že danou nemoc skutečně mají (respektive nemají) ve chvíli, kdy jim jejich vlastní test vyšel pozitivně (respektive negativně).
Otázkou je, jaké hodnoty senzitivity a specificity jsou dostatečné pro to, abychom označili daný test jako kvalitní nebo ještě lépe jako kvalitnější než testy, které jsou aktuálně dostupné. Odpověď není jednoduchá, neboť do značné míry závisí na stavu poznání dané oblasti a na dosažitelné správnosti dostupných testů. V určité oblasti mohou být hodnoty nad 60 % vítězstvím, v jiné se diagnostika blíží v obou ukazatelích hodnotě 100 %, což znamená, že se téměř nevyskytují falešně pozitivní a falešně negativní výsledky. V každé oblasti existují objektivní limity dané úrovní diagnostiky. Nicméně relevanci odhadu specificity a senzitivity určuje také kvalita experimentu, a to především ve dvou aspektech:
- Dostatečná velikost experimentálního vzorku zvyšuje kvalitu a přesnost provedených odhadů. Při malém n roste pravděpodobnost, že některé specifické pacienty nezachytíme a odhady specificity a senzitivity budou zkreslené.
- Musí být zaručena reprezentativnost vzorku vzhledem k rozdělení četností v tabulce. Je-li například podíl nemocných a zdravých jedinců v obecné populaci 1:4, měl by být takto ideálně zachován i ve výběrovém souboru, získáváme tím realistický základ pro posouzení skutečných ukazatelů testu.
Jednoduchým a přitom v odborné literatuře málo využívaným způsobem, jak vyjádřit kvalitu odhadu senzitivity a specificity, je výpočet jejich intervalu spolehlivosti. Všechny čtyři definované ukazatele totiž představují neznámé parametry, které jsou příslušné danému diagnostickému testu a které mají formu podílu. Jejich bodové odhady vypočtené na základě výběrových souborů tak můžeme jednoduše doplnit 100(1 – α)% intervalem spolehlivosti s pomocí postupu, který je blíže popsán v části Testování hypotéz o kvalitativních proměnných.
Zajímavou vlastností obou prediktivních hodnot je fakt, že úzce souvisí s prevalencí sledované nemoci (nebo obecně vlastnosti) v cílové populaci. Budeme-li jednoduše uvažovat konkrétní časový okamžik (konkrétní datum), lze prevalenci vyjádřit jako procento pacientů s danou nemocí počítané ze všech osob v cílové populaci. Abychom mohli demonstrovat závislost pozitivní a negativní prediktivní hodnoty na prevalenci onemocnění (označme ji jako P(H+), pak 1 – P(H+) = P(H-)), je nutno je nejdříve vyjádřit pomocí Bayesova vzorce a hodnot senzitivity a specificity následovně:
(2.12)
(2.13) Odvození vztahů (2.12) a (2.13) je základním cvičením z podmíněné pravděpodobnosti, necháváme ho proto na laskavém čtenáři jako cvičení. Vliv prevalence nemoci na prediktivní hodnoty nejlépe ukážeme na příkladu.
Příklad 2.2. Vypočtěme pozitivní a negativní prediktivní hodnotu diagnostického testu na HIV pozitivitu, u kterého výrobce garantuje 98% senzitivitu a 99% specificitu. Jako první uvažujme výpočet těchto ukazatelů v zemi s vysokou prevalencí HIV pozitivity (např. jihoafrické země) a předpokládejme P(H+) = 0,2. Prediktivní hodnoty pak jsou následující:
(2.14)
(2.15) Vidíme tedy, že v zemi s relativně vysokou prevalencí HIV pozitivity má kvalitní test (respektive test s vysokou senzitivitou a specificitou) velkou vypovídací hodnotu, tedy osoby s pozitivním testem (respektive negativním testem) mají vysokou pravděpodobnost, že jsou skutečně HIV pozitivní (respektive HIV negativní). Nyní uvažujme výpočet prediktivních hodnot v zemi s nízkou prevalencí HIV pozitivity (např. evropské země) a předpokládejme P(H+) = 0,002. Hodnoty se po přepočtu změní takto:
(2.16)
(2.17) Máme-li zemi s nízkou prevalencí HIV pozitivity, je vidět, že kvalitní test má velmi dobrou vypovídací schopnost pro osoby, jimž vyšel negativní výsledek testu, neboť na 99,9 % jsou tyto osoby opravdu HIV negativní. Na druhou stranu osoba, jíž vyšel pozitivní výsledek testu, má i při použití kvalitního diagnostického testu pravděpodobnost pouze 16,4 %, že je skutečně HIV pozitivní.