Umělá inteligence |
Vícerozměrné metody pro analýzu a klasifikaci dat |
Úvod do vícerozměrné analýzy dat |
Statistické modelování |
Teorie a praxe jádrového vyhlazování |
Regresní modelování |
Statistické hodnocení biodiverzity |
Výstupy z výukové jednotky |
Smysl a cíle vícerozměrné analýzy dat |
Vícerozměrná data |
Grafické znázornění vícerozměrných dat |
Možné problémy vícerozměrných dat a jejich řešení |
Literatura |
Vícerozměrná rozdělení pravděpodobnosti |
Výstupy z výukové jednotky |
Výběrové charakteristiky vícerozměrných dat |
Vícerozměrná rozdělení pravděpodobnosti |
Ověření normality vícerozměrných dat |
Transformace dat |
Literatura |
Vícerozměrné statistické testy |
Výstupy z výukové jednotky |
Vícerozměrný dvouvýběrový t-test |
Podobnosti a vzdálenosti ve vícerozměrném prostoru |
Příklad |
Analýza rozptylu pro vícerozměrná data |
Literatura |
Základní informace |
Výstupy z výuky |
Úvod |
Základní vymezení pojmů |
Metriky pro určení vzdálenosti a podobnosti mezi dvěma vektory |
Asociační matice |
Metriky pro určení vzdálenosti mezi dvěma vektory s kvalitativními hodnotami souřadnic |
Metriky pro určení podobnosti mezi dvěma obrazy s kvalitativní-mi hodnotami souřadnic |
Metriky pro určení vzdálenosti mezi dvěma vektory s kvantitativními hodnotami souřadnic |
Metriky pro určení podobnosti dvou obrazů s kvantitativními hodnotami souřadnic |
Metriky pro určení vzdálenosti mezi dvěma množinami vektorů |
Deterministické metriky pro určení vzdálenosti mezi dvěma množinami vektorů |
Praktické příklady |
Literatura |
Metoda nejbližšího souseda |
Metoda k nejbližších sousedů |
Metoda nejvzdálenějšího souseda |
Metoda průměrné vazby |
Centroidová metoda |
Wardova metoda |
Metriky pro určení vzdálenosti mezi dvěma množinami vektorů používající jejich pravděpodobnostn |
Výstupy z výukové jednotky |
Výpočet asociační matice |
Vizualizace asociační matice |
Meansim (MSA) |
Mantelův test |
Prokrustova analýza |
Vícenásobná regrese na asociačních maticích |
Literatura |
Shluková analýza |
Shluková hierarchická analýza |
Volba a výběr popisných proměnných |
Výstupy z výukové jednotky |
Úvod |
Hierarchické shlukování |
Literatura |
Shluková nehierarchická analýza |
Výstupy z výukové jednotky |
Úvod |
Metoda k-průměrů |
Metoda x-průměrů |
Metoda k-medoidů |
Literatura |
Validace shlukové analýzy |
Výstupy z výukové jednotky |
Úvod |
Volba popisných proměnných |
Výběr popisných proměnných |
Selekce proměnných |
Extrakce proměnných |
Ordinační analýzy |
Úvodní tříodstavcový textík |
Analýza hlavních komponent (PCA) |
Vztah ordinačních prostorů |
Výstupy z výukové jednotky |
Princip |
Odvození |
Geometrická interpretace |
Vlastnosti |
Zobecnění pro více tříd |
Příklady |
Literatura |
Korespondenční analýza |
Výstupy z výukové jednotky |
Základní pojmy u korespondenční analýzy |
Vzdálenost u korespondenční analýzy |
Výpočetní algoritmus |
Korespondenční mapa |
Hodnocení modelu |
Požadavky na data a omezení korespondenční analýzy |
Použití korespondenční analýzy v ekologii |
Literatura |
Vícerozměrné škálování |
Výstupy z výukové jednotky |
Úvod |
Data pro vícerozměrné škálování |
Nemetrické vícerozměrné škálování |
Faktorová analýza |
Redundanční analýza (RDA) |
Kanonická korespondenční analýza (CCA) |
Analýza hlavních koordinát (co-coordinate analysis) |
Co-inertia |
Pokročilejší metody extrakce proměnných |
Analýza nezávislých komponent (ICA) |
Klasifikace |
Výstupy z výukové jednotky |
Úvod do analýzy nezávislých komponent |
Výpočetní strategie analýzy nezávislých komponent |
Omezení analýzy nezávislých komponent |
Příklad |
Literatura |
Metody varietního učení |
Úvod |
Príloha A - Základy maticové algebry |
Príloha B - Značení |
Úvod do klasifikace dat |
Výstupy z výukové jednotky |
Klasifikace dat |
Typy klasifikátorů podle reprezentace vstupních dat |
Typy klasifikátorů podle jednoznačnosti zařazení do skupin |
Typy klasifikátorů podle typů klasifikačních a učících algoritmů |
Typy klasifikátorů podle způsobu učení |
Typy klasifikátorů podle principu klasifikace |
Literatura |
Klasifikace pomocí diskriminačních funkcí |
Výstupy z výukové jednotky |
Úvod do klasifikace dat pomocí diskriminačních funkcí |
Bayesův klasifikátor – kritérium maximální aposteriorní pravděpodobnosti |
Bayesův klasifikátor – kritérium minimální pravděpodobnosti chybného rozhodnutí |
Bayesův klasifikátor – kritérium minimální střední ztráty |
Bayesův klasifikátor – kritérium maximální pravděpodobnosti |
Příklad |
Literatura |
Klasifikace podle minimální vzdálenosti |
Výstupy z výukové jednotky |
Princip klasifikace podle minimální vzdálenosti |
Souvislost klasifikace podle minimální vzdálenosti s dalšími principy klasifikace |
Příklad |
Literatura |
Klasifikace pomocí hranic v obrazovém prostoru - FLDA, SVM lineární a nelineární |
Výstupy z výukové jednotky |
Úvod do klasifikace pomocí hranic |
Fisherova lineární diskriminace |
Sekvenční klasifikace |
Příklad |
Metoda podpůrných vektorů |
Lineární verze metody podpůrných vektorů – lineárně separabilní třídy |
Lineární verze metody podpůrných vektorů – lineárně neseparabilní třídy |
Nelineární verze metody podpůrných vektorů |
Příklad 1 |
Příklad2 |
Literatura |
Výstupy z výukové jednotky |
Úvod do sekvenční klasifikace |
Waldovo kritérium |
Reedovo kritérium |
Modifikované Waldovo kritérium |
Modifikované Reedovo kritérium |
Literatura |
Hodnocení úspěšnosti klasifikace |
Výstupy z výukové jednotky |
Úvod do hodnocení úspěšnosti klasifikace |
Rozdělení souboru na trénovací a testovací data |
Resubstituce |
Náhodný výběr s opakováním |
Predikční testování externí validací |
k-násobná křížová validace |
Obecné poznámky k rozdělení souboru na trénovací a testovací data |
Srovnání úspěšnosti klasifikace s náhodnou klasifikací |
Srovnání úspěšnosti klasifikace dvou klasifikátorů |
Srovnání úspěšnosti klasifikace třech a více klasifikátorů |
Literatura |
Vícerozměrná data a jejich popisné statistiky |
Asociační matice |
Podobnosti a vzdálenosti ve vícerozměrném prostoru |
Ordinační analýza |
Klasifikace |
Maticový počet |
Príloha C - Seznam pojmů |
Centrování dat
Další úpravou dat, která se před použitím vícerozměrných analýz občas používá, je centrování dat. Při centrování je od původní hodnoty odečítán průměr proměnné, tj. od prvků sloupce se odečte jejich sloupcový průměr:
(31)
|
Získáme tedy nové proměnné, jejichž průměry jsou rovny nule (Obr. 8). Centrování se používá například u vícenásobné lineární regrese, kdy nemusíme uvažovat intercept, pokud jsou proměnné vstupující do modelu centrované.