Umělá inteligence |
Vícerozměrné metody pro analýzu a klasifikaci dat |
Úvod do vícerozměrné analýzy dat |
Statistické modelování |
Teorie a praxe jádrového vyhlazování |
Regresní modelování |
Statistické hodnocení biodiverzity |
Výstupy z výukové jednotky |
Smysl a cíle vícerozměrné analýzy dat |
Vícerozměrná data |
Grafické znázornění vícerozměrných dat |
Možné problémy vícerozměrných dat a jejich řešení |
Literatura |
Vícerozměrná rozdělení pravděpodobnosti |
Výstupy z výukové jednotky |
Výběrové charakteristiky vícerozměrných dat |
Vícerozměrná rozdělení pravděpodobnosti |
Ověření normality vícerozměrných dat |
Transformace dat |
Literatura |
Vícerozměrné statistické testy |
Výstupy z výukové jednotky |
Vícerozměrný dvouvýběrový t-test |
Podobnosti a vzdálenosti ve vícerozměrném prostoru |
Příklad |
Analýza rozptylu pro vícerozměrná data |
Literatura |
Základní informace |
Výstupy z výuky |
Úvod |
Základní vymezení pojmů |
Metriky pro určení vzdálenosti a podobnosti mezi dvěma vektory |
Asociační matice |
Metriky pro určení vzdálenosti mezi dvěma vektory s kvalitativními hodnotami souřadnic |
Metriky pro určení podobnosti mezi dvěma obrazy s kvalitativní-mi hodnotami souřadnic |
Metriky pro určení vzdálenosti mezi dvěma vektory s kvantitativními hodnotami souřadnic |
Metriky pro určení podobnosti dvou obrazů s kvantitativními hodnotami souřadnic |
Metriky pro určení vzdálenosti mezi dvěma množinami vektorů |
Deterministické metriky pro určení vzdálenosti mezi dvěma množinami vektorů |
Praktické příklady |
Literatura |
Metoda nejbližšího souseda |
Metoda k nejbližších sousedů |
Metoda nejvzdálenějšího souseda |
Metoda průměrné vazby |
Centroidová metoda |
Wardova metoda |
Metriky pro určení vzdálenosti mezi dvěma množinami vektorů používající jejich pravděpodobnostn |
Výstupy z výukové jednotky |
Výpočet asociační matice |
Vizualizace asociační matice |
Meansim (MSA) |
Mantelův test |
Prokrustova analýza |
Vícenásobná regrese na asociačních maticích |
Literatura |
Shluková analýza |
Shluková hierarchická analýza |
Volba a výběr popisných proměnných |
Výstupy z výukové jednotky |
Úvod |
Hierarchické shlukování |
Literatura |
Shluková nehierarchická analýza |
Výstupy z výukové jednotky |
Úvod |
Metoda k-průměrů |
Metoda x-průměrů |
Metoda k-medoidů |
Literatura |
Validace shlukové analýzy |
Výstupy z výukové jednotky |
Úvod |
Volba popisných proměnných |
Výběr popisných proměnných |
Selekce proměnných |
Extrakce proměnných |
Ordinační analýzy |
Úvodní tříodstavcový textík |
Analýza hlavních komponent (PCA) |
Vztah ordinačních prostorů |
Výstupy z výukové jednotky |
Princip |
Odvození |
Geometrická interpretace |
Vlastnosti |
Zobecnění pro více tříd |
Příklady |
Literatura |
Korespondenční analýza |
Výstupy z výukové jednotky |
Základní pojmy u korespondenční analýzy |
Vzdálenost u korespondenční analýzy |
Výpočetní algoritmus |
Korespondenční mapa |
Hodnocení modelu |
Požadavky na data a omezení korespondenční analýzy |
Použití korespondenční analýzy v ekologii |
Literatura |
Vícerozměrné škálování |
Výstupy z výukové jednotky |
Úvod |
Data pro vícerozměrné škálování |
Nemetrické vícerozměrné škálování |
Faktorová analýza |
Redundanční analýza (RDA) |
Kanonická korespondenční analýza (CCA) |
Analýza hlavních koordinát (co-coordinate analysis) |
Co-inertia |
Pokročilejší metody extrakce proměnných |
Analýza nezávislých komponent (ICA) |
Klasifikace |
Výstupy z výukové jednotky |
Úvod do analýzy nezávislých komponent |
Výpočetní strategie analýzy nezávislých komponent |
Omezení analýzy nezávislých komponent |
Příklad |
Literatura |
Metody varietního učení |
Úvod |
Príloha A - Základy maticové algebry |
Príloha B - Značení |
Úvod do klasifikace dat |
Výstupy z výukové jednotky |
Klasifikace dat |
Typy klasifikátorů podle reprezentace vstupních dat |
Typy klasifikátorů podle jednoznačnosti zařazení do skupin |
Typy klasifikátorů podle typů klasifikačních a učících algoritmů |
Typy klasifikátorů podle způsobu učení |
Typy klasifikátorů podle principu klasifikace |
Literatura |
Klasifikace pomocí diskriminačních funkcí |
Výstupy z výukové jednotky |
Úvod do klasifikace dat pomocí diskriminačních funkcí |
Bayesův klasifikátor – kritérium maximální aposteriorní pravděpodobnosti |
Bayesův klasifikátor – kritérium minimální pravděpodobnosti chybného rozhodnutí |
Bayesův klasifikátor – kritérium minimální střední ztráty |
Bayesův klasifikátor – kritérium maximální pravděpodobnosti |
Příklad |
Literatura |
Klasifikace podle minimální vzdálenosti |
Výstupy z výukové jednotky |
Princip klasifikace podle minimální vzdálenosti |
Souvislost klasifikace podle minimální vzdálenosti s dalšími principy klasifikace |
Příklad |
Literatura |
Klasifikace pomocí hranic v obrazovém prostoru - FLDA, SVM lineární a nelineární |
Výstupy z výukové jednotky |
Úvod do klasifikace pomocí hranic |
Fisherova lineární diskriminace |
Sekvenční klasifikace |
Příklad |
Metoda podpůrných vektorů |
Lineární verze metody podpůrných vektorů – lineárně separabilní třídy |
Lineární verze metody podpůrných vektorů – lineárně neseparabilní třídy |
Nelineární verze metody podpůrných vektorů |
Příklad 1 |
Příklad2 |
Literatura |
Výstupy z výukové jednotky |
Úvod do sekvenční klasifikace |
Waldovo kritérium |
Reedovo kritérium |
Modifikované Waldovo kritérium |
Modifikované Reedovo kritérium |
Literatura |
Hodnocení úspěšnosti klasifikace |
Výstupy z výukové jednotky |
Úvod do hodnocení úspěšnosti klasifikace |
Rozdělení souboru na trénovací a testovací data |
Resubstituce |
Náhodný výběr s opakováním |
Predikční testování externí validací |
k-násobná křížová validace |
Obecné poznámky k rozdělení souboru na trénovací a testovací data |
Srovnání úspěšnosti klasifikace s náhodnou klasifikací |
Srovnání úspěšnosti klasifikace dvou klasifikátorů |
Srovnání úspěšnosti klasifikace třech a více klasifikátorů |
Literatura |
Vícerozměrná data a jejich popisné statistiky |
Asociační matice |
Podobnosti a vzdálenosti ve vícerozměrném prostoru |
Ordinační analýza |
Klasifikace |
Maticový počet |
Príloha C - Seznam pojmů |
Centroidová metoda
U centroidové metody na rozdíl od metody nejbližšího souseda a metody k nejbližších sousedů nebývá problém při nevyváženém počtu subjektů ve skupinách. Tato metoda totiž vychází z výpočtu centroidů pro jednotlivé skupiny, přičemž subjekt (či objekt) je zařazen do skupiny s nejbližším centroidem od tohoto subjektu (Obr. 3).
Postup centroidové metody lze jednoduše popsat na příkladu klasifikace do skupiny pacientů a kontrol následujícím způsobem:
- Výpočet centroidu skupiny pacientů pomocí , kde je počet pacientů a je vektor hodnot proměnných u -tého pacienta; a výpočet centroidu skupiny kontrol pomocí , kde je počet kontrolních subjektů a je vektor hodnot proměnných u -tého kontrolního subjektu.
- Zařazení klasifikovaného subjektu do skupiny, jejímuž centroidu má tento klasifikovaný subjekt nejmenší vzdálenost (např. Euklidovskou), tedy hledá se .
Obr. 3. Ilustrace klasifikace pomocí centroidové metody. Testovací subjekt zatřídíme do skupiny pacientů, protože má kratší Euklidovskou vzdálenost k centroidu pacientů než k centroidu kontrol.