Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Vztah pravděpodobnosti, statistiky a biostatistiky Podmíněná pravděpodobnost a Bayesův vzorec

Logo Matematická biologie

Podmíněná pravděpodobnost a Bayesův vzorec

Jedním ze základních konceptů v biostatistice, který jednoznačně propojuje teorii pravděpodobnosti, statistiku a biostatistiku, je podmíněná pravděpodobnost, která, jak už název napovídá, vyjadřuje pravděpodobnost jednoho jevu za podmínky nastání jevu druhého. Praktické ukázce použití podmíněné pravděpodobnosti v biostatistice se věnuje další část této kapitoly o vyhodnocování diagnostických testů. Abychom však mohli definovat podmíněnou pravděpodobnost, uvažujme dva jevy A a B s tím, že jev B má nenulovou pravděpodobnost, tedy P(B) > 0. Pak podmíněnou pravděpodobnost jevu A za podmínky nastoupení jevu B definujeme vztahem

(2.1)

S pojmem podmíněná pravděpodobnost úzce souvisí i další důležité pojmy, jako jsou nezávislost dvou jevů a Bayesův vzorec (Bayes’ formula). Nezávislostí dvou jevů jednoduše myslíme skutečnost, kdy výsledek příznivý pro jeden z jevů nijak neovlivňuje pravděpodobnost nastání jevu druhého. Výpočetně to znamená, že pravděpodobnost společného nastoupení obou jevů, opět řekněme označených A a B, lze získat pomocí součinu jednotlivých pravděpodobností. Pro nezávislé jevy A a B tedy platí . S použitím tohoto vztahu, respektive jeho dosazením do (2.1) lze nezávislost mezi jevy A a B vyjádřit následovně:

(2.2)

Zaměníme-li ve vztahu (2.1) jevy A a B, budeme-li tedy chtít vyjádřit pravděpodobnost jevu B za podmínky nastoupení jevu A, dostaneme výraz, kde v čitateli bude opět figurovat pravděpodobnost společného nastoupení jevů A a B, tedy . Pravděpodobnost  následně vyjádříme s pomocí vztahu (2.1) jako , což vede ke vztahu, který je označován jako Bayesův vzorec:

(2.3)

Tento výraz lze dále rozvést vyjádřením pravděpodobnosti jevu A, P(A), s pomocí matematické věty o celkové pravděpodobnosti, která má v případě, že máme úplný systém dvou jevů, označme je B a C, tvar . Využití věty o celkové pravděpodobnosti vede k vyjádření Bayesova vzorce ve tvaru

(2.4)

V biostatistice se nejčastěji setkáváme se situací, kdy jevy B a C představují dvě navzájem se vylučující hypotézy (vždy je v platnosti pouze jedna z těchto hypotéz), což jsou tvrzení, že něco existuje/neexistuje, platí/neplatí, případně že se něco rovná/nerovná. Jev A pak představuje nějaký výsledek experimentu, nejčastěji v podobě dat, na jehož základě se rozhodujeme, zda platí spíše hypotéza B nebo C. Logicky se tedy snažíme kvantifikovat pravděpodobnosti  a . Můžeme-li rozdělit základní prostor dokonce na k po dvou disjunktních podmnožin – tzv. systém hypotéz (Hi, i = 1, …, k), pro které opět platí, že jejich sjednocením je celý základní prostor, pak pravděpodobnost platnosti konkrétní z nich, např. hypotézy Hj, za podmínky nastání jevu A lze pomocí Bayesova vzorce získat jako

(2.5)

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity