Metoda ISOMAP
Metoda ISOMAP, což je zkratka z Isometric Feature Mapping, vychází z nemetrického vícerozměrného škálování, přičemž snahou je zachovat vnitřní geometrii dat, jež je zachycena pomocí geodézních vzdáleností (geodesis distance). Geodézní vzdálenosti jsou založeny na hledání nejkratších cest v grafu s hranami spojujícími sousední body resp. objekty (viz. Obr. 4). Existují dvě varianty této metody (-ISOMAP a -ISOMAP), které budou představeny níže.
Metoda ISOMAP má tři kroky:
- Vytvoření grafu spojujícího sousední objekty – nejprve je nutno vypočítat vzdálenosti mezi všemi objekty (nejčastěji se používá Euklidova metrika vzdáleností, je však možné použít i jinou metriku vzdáleností); poté dojde ke spojení objektů tak, že se j-tý objekt spojí s těmi objekty, jejichž vzdálenost je menší než ε (v případě ε-ISOMAP), nebo s jeho k nejbližšími sousedy (v případě k-ISOMAP), přičemž v obou případech délky hran ve výsledném grafu odpovídají vzdálenosti .
- Výpočet geodézních vzdáleností mezi všemi objekty nalezením nejkratší cesty v grafu mezi danými objekty – iniciální nastavení závisí na tom, jestli jsou objekty spojené hranou či nikoliv (pokud jsou objekty spojeny hranou: ; pokud ne: ); poté je pro každé nahrazena vzdálenost hodnotou .
- Aplikace nemetrického vícerozměrného škálování (MDS) na matici geodézních vzdáleností – tzn. transformace dat do Euklidovského prostoru tak, aby byly co nejlépe zachovány geodézní vzdálenosti.
Ukázka použití metody ISOMAP pro nalezení nových komponent v datech obrazů tváří je na Obr. 5. Vstupem do algoritmu -ISOMAP (s =6) bylo 698 obrazů tváří o rozměru 64 x 64 pixelů (tedy počet proměnných byl 4096). Výsledkem je redukce původních proměnných na pouze tři komponenty, které lze interpretovat jako pravolevé natočení tváře, vertikální pozice tváře a směr osvětlení.
Na závěr shrňme výhody a nevýhody metody ISOMAP oproti dalším metodám varietního učení. Výhodou této metody je, že zachovává globální strukturu dat a vyžaduje nastavení malého množství parametrů. Mezi hlavní nevýhody patří výpočetní náročnost a citlivost k šumu.