Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Klasifikace Klasifikace pomocí diskriminačních funkcí Bayesův klasifikátor – kritérium minimální střední ztráty

Logo Matematická biologie

Bayesův klasifikátor – kritérium minimální střední ztráty

Představme si nyní, že třída  je třída pacientů a třída  představuje třídu zdravých subjektů. Obě předchozí kritéria uvažovala, že chybné zařazení pacienta do třídy zdravých subjektů a zdravého člověka do třídy pacientů pro nás představuje stejně velký problém. V klinické praxi však špatné zařazení pacienta do třídy zdravých subjektů často představuje mnohem závažnější problém, protože nemocného člověka pustíme domů a neléčíme ho, což pro něj může mít fatální následky. V takovém případě bychom chtěli chybné zařazení pacienta do třídy zdravých subjektů penalizovat více než chybné zařazení zdravého člověka do třídy pacientů. Může se vyskytnout i opačná situace, kdy chceme více penalizovat chybné zařazení zdravého jedince do třídy pacientů než pacienta do třídy zdravých subjektů (například nějaký lék je velmi drahý nebo třeba může mít velké nežádoucí účinky, proto si nemůžeme dovolit tímto lékem léčit zdravé subjekty).

Penalizace chybných zařazení do tříd můžeme dosáhnout, když do výpočtu diskriminačních funkcí zahrneme tzv. ztrátu při chybné klasifikaci objektu ze třídy  do třídy , která je definována pomocí ztrátové funkce . Jednotlivé ztrátové funkce pak můžeme zapsat do matice ztrátových funkcí:

(9)

kde  je počet tříd. Například, když  , penalizuji více, když je pacient (D – diseased) nesprávně zařazen do třídy zdravých subjektů (H – healthy), než když je zdravý subjekt nesprávně zařazen do třídy pacientů.

Při odvození kritéria minimální střední ztráty vyjdeme z celkové střední ztráty , což je průměrná hodnota z dílčích středních ztrát:

(10)

Celkovou střední ztrátu chceme minimalizovat, tedy:

(11)

Naším cílem je minimalizovat celkovou střední ztrátu, pokud ale chceme využít principu diskriminačních funkcí, kdy zařadíme subjekt do třídy s maximální hodnotou diskriminační funkce, musíme hledání minima výrazu v rovnici (11) převést na hledání maxima výrazu s opačným znaménkem. V takovém případě pak bude diskriminační funkce ve tvaru:

(12)

Pro dichotomický klasifikátor (v případě klasifikace do dvou tříd) pak získáme následující diskriminační funkce:

(13)

které můžeme použít pro výpočet hranice mezi oběma klasifikačními třídami:

                                                                           

(14)

z čehož získáváme kritérium minimální střední ztráty ve tvaru:

(15)

Na základně tohoto kritéria zařadíme subjekt do třídy , když je věrohodnostní poměr (výraz na levé straně) větší než výraz na pravé straně.

Poznámka: Pokud nastavíme matici ztrátových funkcí ve tvaru , dostáváme kritérium minimální psti chybného rozhodnutí:

 

 

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity