Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Pokročilejší metody extrakce proměnných Metody varietního učení Úvod do varietního učení

Logo Matematická biologie

Úvod do varietního učení

Analýza hlavních komponent (PCA), nemetrické vícerozměrné škálování (MDS) či analýza nezávislých komponent (ICA), které byly představeny v předešlých kapitolách, jsou založené na lineární transformaci dat. V praxi se však vyskytují i data, která ve vícerozměrném prostoru vytvářejí složité nelineární struktury (příkladem je „švýcarská rolka“ (anglicky swiss roll) na Obr. 3), jež výše uvedené metody extrakce nedokáží efektivně transformovat. Proto byly vytvořeny metody varietního učení (anglicky manifold learning), které umožňují nelineární reprezentaci a redukci dat.

Obr. 3. Ukázka dat tvořících nelineární strukturu (tzv. „švýcarskou rolku“). Čárkovaně je uvedena vzdálenost, se kterou by počítaly lineární metody extrakce proměnných, tato vzdálenost však neodpovídá struktuře dat. Správnější je u takovýchto nelineárních dat použít vzdálenost, jež je vyznačena plnou čárou. Obrázek převzat z [1].

Metod varietního učení existuje velké množství, lze sem zařadit například metodu ISOMAP, metodu lokálně lineárního vnoření (Locally Linear Embedding), Laplacianovy vlastní mapy (Laplacian Eigenmaps), analýzu křivkových vzdáleností (Curvilinear Distance Analysis), jádrovou analýzu hlavních komponent (Kernel Principal Component Analysis), difúzní zobrazení (Diffusion Maps), lokální metrické škálování (Local Multidimensional Scaling) apod. V těchto učebních materiálech se podrobněji seznámíme s prvními dvěma zmíněnými metodami.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity