Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Klasifikace Klasifikace pomocí hranic v obrazovém prostoru - FLDA, SVM lineární a nelineární Metoda podpůrných vektorů

Umělá inteligence | Vícerozměrné metody pro analýzu a klasifikaci dat |

Úvod do vícerozměrné analýzy dat |

Výstupy z výukové jednotky | Smysl a cíle vícerozměrné analýzy dat | Vícerozměrná data | Grafické znázornění vícerozměrných dat |

Maticové grafy | Vícenásobné krabicové grafy | Ikonové grafy |

Možné problémy vícerozměrných dat a jejich řešení |

Chybějící hodnoty | Problém dvou nul |

Literatura |

Vícerozměrná rozdělení pravděpodobnosti |

Výstupy z výukové jednotky | Výběrové charakteristiky vícerozměrných dat | Vícerozměrná rozdělení pravděpodobnosti |

Vícerozměrné normální rozdělení | Wishartovo rozdělení | Hotellingovo rozdělení |

Ověření normality vícerozměrných dat | Transformace dat |

Nelineární transformace dat | Standardizace dat | Centrování dat | Odstranění vlivu kovariát |

Literatura |

Vícerozměrné statistické testy |

Výstupy z výukové jednotky | Vícerozměrný dvouvýběrový t-test |

Příklad |

Analýza rozptylu pro vícerozměrná data |

Jednorozměrná analýza rozptylu dvojného třídění | Příklad 2 |

Literatura |

Podobnosti a vzdálenosti ve vícerozměrném prostoru |

Metriky pro určení vzdálenosti mezi dvěma vektory s kvalitativními hodnotami souřadnic | Metriky pro určení podobnosti mezi dvěma obrazy s kvalitativní-mi hodnotami souřadnic | Metriky pro určení vzdálenosti mezi dvěma vektory s kvantitativními hodnotami souřadnic | Metriky pro určení podobnosti dvou obrazů s kvantitativními hodnotami souřadnic |

Metriky pro určení vzdálenosti mezi dvěma množinami vektorů |

Deterministické metriky pro určení vzdálenosti mezi dvěma množinami vektorů |

Metriky pro určení vzdálenosti mezi dvěma množinami vektorů používající jejich pravděpodobnostn |

Praktické příklady | Literatura |

Asociační matice |

Shluková analýza |

Shluková hierarchická analýza |

Výstupy z výukové jednotky | Úvod | Hierarchické shlukování |

Hierarchické aglomerativní shlukování | Hierarchické divizivní shlukování |

Monotetické metody | Polytetické metody |

Literatura |

Shluková nehierarchická analýza |

Validace shlukové analýzy |

Volba a výběr popisných proměnných |

Poměr rozptylů | Algoritmy selekce proměnných |

Extrakce proměnných |

Ordinační analýzy |

Úvodní tříodstavcový textík | Analýza hlavních komponent (PCA) |

Příklad 1 | Příklad 2 | Příklad 3 | Příklad 4 |

Literatura |

Korespondenční analýza |

Vícerozměrné škálování |

Výstupy z výukové jednotky | Úvod | Data pro vícerozměrné škálování | Nemetrické vícerozměrné škálování |

Základní pojmy a ztrátová funkce | Výpočetní algoritmus | Výhody a nevýhody NMDS | Literatura |

Faktorová analýza |

Vztah ordinačních prostorů |

Redundanční analýza (RDA) | Kanonická korespondenční analýza (CCA) | Analýza hlavních koordinát (co-coordinate analysis) | Co-inertia |

Pokročilejší metody extrakce proměnných |

Analýza nezávislých komponent (ICA) |

Výstupy z výukové jednotky | Úvod do analýzy nezávislých komponent | Výpočetní strategie analýzy nezávislých komponent |

Koeficient špičatosti | Negativní entropie |

Omezení analýzy nezávislých komponent | Příklad | Literatura |

Metody varietního učení |

Klasifikace |

Úvod |

Klasifikace pomocí diskriminačních funkcí |

Výstupy z výukové jednotky | Úvod do klasifikace dat pomocí diskriminačních funkcí | Bayesův klasifikátor – kritérium maximální aposteriorní pravděpodobnosti | Bayesův klasifikátor – kritérium minimální pravděpodobnosti chybného rozhodnutí | Bayesův klasifikátor – kritérium minimální střední ztráty | Bayesův klasifikátor – kritérium maximální pravděpodobnosti | Příklad | Literatura |

Klasifikace podle minimální vzdálenosti |

Výstupy z výukové jednotky | Princip klasifikace podle minimální vzdálenosti |

Metoda nejbližšího souseda | Centroidová metoda | Metoda průměrné vazby |

Souvislost klasifikace podle minimální vzdálenosti s dalšími principy klasifikace | Příklad | Literatura |

Klasifikace pomocí hranic v obrazovém prostoru - FLDA, SVM lineární a nelineární |

Výstupy z výukové jednotky | Úvod do klasifikace pomocí hranic | Fisherova lineární diskriminace |

Příklad |

Metoda podpůrných vektorů |

Literatura |

Sekvenční klasifikace |

Hodnocení úspěšnosti klasifikace |

Príloha A - Základy maticové algebry |

Výstupy z výukové jednotky | Úvod | Vektory | Matice |

Základní pojmy | Operace s maticemi | Specifické parametry matic |

Príloha B - Značení |

Príloha C - Seznam pojmů |

Seznam pojmů z úvodních kapitol | Shluková analýza | Ordinační analýza | Klasifikace |

Statistické modelování | Teorie a praxe jádrového vyhlazování | Regresní modelování | Statistické hodnocení biodiverzity |

Lineární verze metody podpůrných vektorů – lineárně neseparabilní třídy

Pokud nejsou třídy lineárně separovatelné, nemohou být podmínky představené v předchozí podkapitole splněny pro všechny body současně. Navíc i v některých případech, kdy jsou třídy lineárně separovatelné, by mohlo být výhodnější pár objektů raději klasifikovat chybně a vytvořit robustnější klasifikátor s větším tolerančním pásem, než vytvořit klasifikátor, který sice všechny trénovací objekty klasifikuje správně, ale bude mít velmi úzké toleranční pásmo a na nová data bude fungovat špatně, protože bude přeučený (případem je situace na Obr. 9 v minulé podkapitole).

Tyto problémy lze vyřešit tak, že zavedeme relaxační proměnné (slack variables) vyjadřující, jak moc každý bod (objekt) porušuje danou podmínku (Obr. 10), tedy:

pokud leží objekt vně tolerančního pásma a je správně klasifikován, pak ;
pokud leží objekt uvnitř tolerančního pásma a je správně klasifikován (na Obr. 10 jsou tyto body ohraničeny čtverečky), pak ;
pokud leží objekt na opačné straně hranice a je tudíž chybně klasifikován (na Obr. 10 jsou tyto body ohraničeny hvězdičkami), pak .

Pomocí relaxačních proměnných tak můžeme podmínky elegantně zapsat ve tvaru

(27)

Obr. 10. Znázornění klasifikace metodou podpůrných vektorů se zavedením relaxačních proměnných. Objekty v tolerančním pásmu (dáno černými čárkovanými čarami) na správné straně hranice (černá čára) jsou vyznačeny čtverečky, chybně klasifikované objekty jsou označeny hvězdičkami.

Když teď chceme najít dělící přímku poskytující co nejrobustnější klasifikaci, musíme se snažit nejen maximalizovat šířku tolerančního pásma, ale také minimalizovat počet subjektů z trénovací množiny, které leží v tolerančním pásmu nebo jsou dokonce špatně klasifikovány (tj. těch, pro které ). To můžeme vyjádřit jako minimalizaci kriteriální funkce:

(28)

kde a C vyjadřuje poměr vlivu obou členů kriteriální funkce, přičemž pro vysoké hodnoty C bude počet trénovacích subjektů v tolerančním pásmu a počet chybně klasifikovaných trénovacích subjektů nízký, ale toleranční pásmo bude úzké, zatímco pro nízké hodnoty C bude toleranční pásmo širší ovšem za cenu vyššího počtu objektů v tolerančním pásmu i počtu chybně klasifikovaných objektů (Obr. 11). Protože bohužel nevíme, jaká hodnota parametru C je pro naše data nejvhodnější, volíme parametr C zpravidla na základě křížové validace]. Z Obr. 11 navíc vyplývá, že podpůrnými vektory jsou u této verze metody podpůrných vektorů nejen ty objekty, které leží na hranici tolerančního pásma, ale i objekty, které leží v tolerančním pásmu a jsou správně klasifikovány ( ), a rovněž objekty, které leží na opačné straně hranice ( ).

Obr. 11. Ilustrace šířky a počtu podpůrných vektorů při různých hodnotách parametru C.

Ve tvaru (28) by však bylo obtížné kriteriální funkci minimalizovat, proto se používá jiný tvar:

(29)

Tuto úlohu za podmínky (27) lze také řešit pomocí metody Lagrangeova součinitele. Zavedeme vektor Lagrangeových součinitelů , kde , a pomocí nich vyjádříme optimalizovanou funkci jako:

(30)

za podmínek

pro

(31)

Toto Lagrangeovu funkci zderivujeme podle proměnných a , a derivace položíme rovny nule, čímž získáme soustavu (tzv. Karushovy – Kuhnovy – Tuckerovy podmínky):

	(32)
	(33)
	(34)
	(35)
	(36)

Po zderivování získáme:

	(37)
	(38)
pro _,	(39)

což je opět soustava (nelineárních) rovnic. Řešením této soustavy získáváme optimální hodnoty pro a .

Obdobně jako u lineárně separabilních tříd můžeme dosadit výrazy (37) a (38) do výrazu (30), čímž dostaneme

(40)

tedy výraz analogický k výrazu (26). U nelineárně separabilních tříd však funkci (40) maximalizujeme za podmínek pro a

. Této formy zápisu opět využijeme v podkapitole o nelineární verzi metody podpůrných vektorů.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity