Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Pokročilejší metody extrakce proměnných Metody varietního učení Metoda ISOMAP

Logo Matematická biologie

Metoda ISOMAP

Metoda ISOMAP, což je zkratka z Isometric Feature Mapping, vychází z nemetrického vícerozměrného škálování, přičemž snahou je zachovat vnitřní geometrii dat, jež je zachycena pomocí geodézních vzdáleností (geodesis distance). Geodézní vzdálenosti jsou založeny na hledání nejkratších cest v grafu s hranami spojujícími sousední body resp. objekty (viz. Obr. 4). Existují dvě varianty této metody (-ISOMAP a -ISOMAP), které budou představeny níže.

Obr. 4: Vizualizace aproximace geodézní vzdálenosti (vyznačeny červeně) dvou bodů (označeny kolečky) – a) v původním trojrozměrném prostoru; b) v redukovaném dvourozměrném prostoru (přičemž modře je vyznačena nejkratší skutečná vzdálenost mezi danými body – vidíme, že geodézní vzdálenost je dobrou aproximací skutečné vzdálenosti). Obrázek převzat z [1].

Metoda ISOMAP má tři kroky:

  1. Vytvoření grafu spojujícího sousední objekty – nejprve je nutno vypočítat vzdálenosti  mezi všemi objekty (nejčastěji se používá Euklidova metrika vzdáleností, je však možné použít i jinou metriku vzdáleností); poté dojde ke spojení objektů tak, že se j-tý objekt spojí s těmi objekty, jejichž vzdálenost je menší než ε (v případě ε-ISOMAP), nebo s jeho k nejbližšími sousedy (v případě k-ISOMAP), přičemž v obou případech délky hran ve výsledném grafu odpovídají vzdálenosti .
  2. Výpočet geodézních vzdáleností  mezi všemi objekty nalezením nejkratší cesty v grafu mezi danými objekty – iniciální nastavení  závisí na tom, jestli jsou objekty spojené hranou či nikoliv (pokud jsou objekty spojeny hranou: ; pokud ne: ); poté je pro každé  nahrazena vzdálenost  hodnotou .
  3. Aplikace nemetrického vícerozměrného škálování (MDS) na matici geodézních vzdáleností – tzn. transformace dat do Euklidovského prostoru tak, aby byly co nejlépe zachovány geodézní vzdálenosti.

Ukázka použití metody ISOMAP pro nalezení nových komponent v datech obrazů tváří je na Obr. 5. Vstupem do algoritmu -ISOMAP (s =6) bylo 698 obrazů tváří o rozměru 64 x 64 pixelů (tedy počet proměnných byl 4096). Výsledkem je redukce původních proměnných na pouze tři komponenty, které lze interpretovat jako pravolevé natočení tváře, vertikální pozice tváře a směr osvětlení.

Obr. 5: Výsledek analýzy obrazů tváří pomocí metody ISOMAP – a)dvourozměrná vizualizace všech vstupních tváří (modré tečky) s ukázkami vybraných obrazů tváří (vyznačeny červenými kolečky), přičemž osy odpovídají dvěma nově vytvořeným komponentám (pravolevému natočení tváře a vertikální pozici tváře) a posuvník pod obrázkem reprezentuje třetí komponentu (směr osvětlení); b) interpolace podél os v podprostoru obrazů tváří (horní řada ukazuje otáčení hlavy zprava doleva, spodní řada ukazuje pohyb hlavy shora dolů). Obrázky převzaty z [1].

Na závěr shrňme výhody a nevýhody metody ISOMAP oproti dalším metodám varietního učení. Výhodou této metody je, že zachovává globální strukturu dat a vyžaduje nastavení malého množství parametrů. Mezi hlavní nevýhody patří výpočetní náročnost a citlivost k šumu.

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict