Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Vztah pravděpodobnosti, statistiky a biostatistiky Senzitivita, specificita a prediktivní hodnoty

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Úvod do biostatistiky |

Literatura |

Vztah pravděpodobnosti, statistiky a biostatistiky |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Úlohy k procvičení | Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu | Problém násobného testování hypotéz |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Testy o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Testy o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párová t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Welchova korekce pro t-test při nestejných rozptylech | Neparametrický test pro dva výběry (Mannův-Whitneyho test) |

Úlohy k procvičení | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu-Kruskallův -Wallisův test | Úlohy k procvičení | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Úlohy k procvičení | Literatura |

Asociace ve čtyřpolní tabulce |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Úlohy k procvičení | Literatura |

Senzitivita, specificita a prediktivní hodnoty

Nejběžnější situací, při níž se setkáváme s jednoduchou aplikací podmíněné pravděpodobnosti, je statistické hodnocení správnosti diagnostických testů, kdy jsou diagnostické schopnosti testu validovány proti skutečně verifikovanému stavu testovaných osob. Srovnáváme tedy výsledky testu (pozitivní/negativní) proti skutečně prokazatelné přítomnosti/nepřítomnosti nemoci. Pro tuto situaci byla navržena sada ukazatelů správnosti, které představují číselné ohodnocení testu ve vztahu k jeho chybovosti [1].

Definici těchto ukazatelů provedeme na základě značení, v němž proti sobě sumarizujeme výsledky diagnostického testu, pozitivní výsledek (označen jako A⁺) a negativní výsledek (označen jako A^-), a skutečnou přítomnost nemoci, nemoc přítomna (označeno jako H⁺) a nemoc nepřítomna (označeno jako H^-). Kvantifikovat skutečnou přítomnost onemocnění není vždy jednoduché, zde však tento fakt budeme považovat za bernou minci.

Prvními dvěma ukazateli správnosti testu jsou tzv. senzitivita testu a specificita testu, které definujeme pomocí podmíněné pravděpodobnosti následovně: senzitivita testu (test sensitivity) je jeho schopnost rozpoznat skutečně nemocné osoby, tedy pravděpodobnost, že test bude pozitivní, když je osoba skutečně nemocná; specificita testu (test specificity) je jeho schopnost rozpoznat osoby bez nemoci, tedy pravděpodobnost, že test bude negativní, když osoba není nemocná. Pomocí výše zavedeného značení definujeme senzitivitu a specificitu jako

Senzitivita:

Specificita:

(2.6)

Druhými dvěma ukazateli jsou tzv. prediktivní hodnoty, které také definujeme pomocí podmíněné pravděpodobnosti: prediktivní hodnota pozitivního testu (predictive value of positive test) je pravděpodobnost, že osoba je skutečně nemocná, když test vyjde jako pozitivní; a naopak prediktivní hodnota negativního testu (predictive value of negative test) je pravděpodobnost, že osoba skutečně není nemocná, když její test vyjde jako negativní. Pomocí výše zavedeného značení definujeme prediktivní hodnoty jako

Prediktivní hodnota pozitivního testu:

Prediktivní hodnota negativního testu:

(2.7)

Příklad 2.1. Hodnotíme přesnost vyšetření jater ultrazvukem, respektive schopnost vyšetření ultrazvukem identifikovat postižené ložisko v pacientových játrech. Přesnost je vztažena k laboratornímu ověření odebrané tkáně. Výsledky jsou dány tabulkou 2.1.

Tab. 2.1: Sumarizace výsledků ultrazvukového vyšetření jater vzhledem k laboratornímu ověření.

Výsledek ultrazvuku

Histologické ověření postižení jater

Celkem

Ložisko přítomno (H⁺)

Ložisko nepřítomno (H^-)

Pozitivní (A⁺)

32

2

34

Negativní (A^-)

3

24

27

Celkem

35

26

61

Výpočet senzitivity a specificity testu je následující:

Senzitivita testu: (2.8)

Specificita testu: (2.9)

Obdobně vypočítáme i obě prediktivní hodnoty testu

Prediktivní hodnota pozitivního testu: (2.10)

Prediktivní hodnota negativního testu: (2.11)

Z hlediska interpretace je vhodné poznamenat, že senzitivita a specificita jsou spíše populační ukazatele, neboť vycházejí ze znalosti skutečné přítomnosti/nepřítomnosti onemocnění, kterou však u konkrétního testovaného pacienta stojícího v ordinaci s výsledkem testu neznáme. Více než testované osoby (potenciální pacienty) tak senzitivita a specificita zajímají lékaře, kteří mohou tyto dva ukazatele velmi dobře použít pro srovnání diagnostické správnosti dvou různých testů. Naopak prediktivní hodnoty vycházejí z konkrétního výsledku testu (pozitivní/negativní) a jsou tak zajímavé především pro pacienty. Ty totiž v případě konkrétního testu jistě zajímá, jaká je pravděpodobnost, že danou nemoc skutečně mají (respektive nemají) ve chvíli, kdy jim jejich vlastní test vyšel pozitivně (respektive negativně).

Otázkou je, jaké hodnoty senzitivity a specificity jsou dostatečné pro to, abychom označili daný test jako kvalitní nebo ještě lépe jako kvalitnější než testy, které jsou aktuálně dostupné. Odpověď není jednoduchá, neboť do značné míry závisí na stavu poznání dané oblasti a na dosažitelné správnosti dostupných testů. V určité oblasti mohou být hodnoty nad 60 % vítězstvím, v jiné se diagnostika blíží v obou ukazatelích hodnotě 100 %, což znamená, že se téměř nevyskytují falešně pozitivní a falešně negativní výsledky. V každé oblasti existují objektivní limity dané úrovní diagnostiky. Nicméně relevanci odhadu specificity a senzitivity určuje také kvalita experimentu, a to především ve dvou aspektech:

Dostatečná velikost experimentálního vzorku zvyšuje kvalitu a přesnost provedených odhadů. Při malém n roste pravděpodobnost, že některé specifické pacienty nezachytíme a odhady specificity a senzitivity budou zkreslené.

Musí být zaručena reprezentativnost vzorku vzhledem k rozdělení četností v tabulce. Je-li například podíl nemocných a zdravých jedinců v obecné populaci 1:4, měl by být takto ideálně zachován i ve výběrovém souboru, získáváme tím realistický základ pro posouzení skutečných ukazatelů testu.

Jednoduchým a přitom v odborné literatuře málo využívaným způsobem, jak vyjádřit kvalitu odhadu senzitivity a specificity, je výpočet jejich intervalu spolehlivosti. Všechny čtyři definované ukazatele totiž představují neznámé parametry, které jsou příslušné danému diagnostickému testu a které mají formu podílu. Jejich bodové odhady vypočtené na základě výběrových souborů tak můžeme jednoduše doplnit 100(1 – α)% intervalem spolehlivosti s pomocí postupu, který je blíže popsán v části Testování hypotéz o kvalitativních proměnných.

Zajímavou vlastností obou prediktivních hodnot je fakt, že úzce souvisí s prevalencí sledované nemoci (nebo obecně vlastnosti) v cílové populaci. Budeme-li jednoduše uvažovat konkrétní časový okamžik (konkrétní datum), lze prevalenci vyjádřit jako procento pacientů s danou nemocí počítané ze všech osob v cílové populaci. Abychom mohli demonstrovat závislost pozitivní a negativní prediktivní hodnoty na prevalenci onemocnění (označme ji jako P(H⁺), pak 1 – P(H⁺) = P(H^-)), je nutno je nejdříve vyjádřit pomocí Bayesova vzorce a hodnot senzitivity a specificity následovně:

(2.12)

(2.13)

Odvození vztahů (2.12) a (2.13) je základním cvičením z podmíněné pravděpodobnosti, necháváme ho proto na laskavém čtenáři jako cvičení. Vliv prevalence nemoci na prediktivní hodnoty nejlépe ukážeme na příkladu.

Příklad 2.2. Vypočtěme pozitivní a negativní prediktivní hodnotu diagnostického testu na HIV pozitivitu, u kterého výrobce garantuje 98% senzitivitu a 99% specificitu. Jako první uvažujme výpočet těchto ukazatelů v zemi s vysokou prevalencí HIV pozitivity (např. jihoafrické země) a předpokládejme P(H⁺) = 0,2. Prediktivní hodnoty pak jsou následující:

(2.14)

(2.15)

Vidíme tedy, že v zemi s relativně vysokou prevalencí HIV pozitivity má kvalitní test (respektive test s vysokou senzitivitou a specificitou) velkou vypovídací hodnotu, tedy osoby s pozitivním testem (respektive negativním testem) mají vysokou pravděpodobnost, že jsou skutečně HIV pozitivní (respektive HIV negativní). Nyní uvažujme výpočet prediktivních hodnot v zemi s nízkou prevalencí HIV pozitivity (např. evropské země) a předpokládejme P(H⁺) = 0,002. Hodnoty se po přepočtu změní takto:

(2.16)

(2.17)

Máme-li zemi s nízkou prevalencí HIV pozitivity, je vidět, že kvalitní test má velmi dobrou vypovídací schopnost pro osoby, jimž vyšel negativní výsledek testu, neboť na 99,9 % jsou tyto osoby opravdu HIV negativní. Na druhou stranu osoba, jíž vyšel pozitivní výsledek testu, má i při použití kvalitního diagnostického testu pravděpodobnost pouze 16,4 %, že je skutečně HIV pozitivní.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity

Výsledek ultrazvuku	Histologické ověření postižení jater		Celkem
Výsledek ultrazvuku	Ložisko přítomno (H⁺)	Ložisko nepřítomno (H^-)	Celkem
Pozitivní (A⁺)	32	2	34
Negativní (A^-)	3	24	27
Celkem	35	26	61