Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Klasifikace Klasifikace podle minimální vzdálenosti Princip klasifikace podle minimální vzdálenosti

Logo Matematická biologie

Princip klasifikace podle minimální vzdálenosti

Jak již název napovídá, klasifikace podle minimální vzdálenosti je založena na zařazení objektu či subjektu do té skupiny (klasifikační třídy), ke které má nejmenší vzdálenost. Klasifikace podle minimální vzdálenosti (resp. ekvivalentně klasifikace podle maximální podobnosti) je úzce spojena s klasifikací pomocí etalonů klasifikačních tříd. Již v úvodní kapitole o klasifikaci bylo zmíněno, že počet etalonů může být různý, od jednoho reprezentativního vzorku dané třídy (např. u metody nejbližšího souseda či u centroidové metody), přes několik vzorků dané třídy (např. u metody k nejbližších sousedů), až po všechny vzorky dané třídy (např. u metody průměrné vazby).

U klasifikace podle minimální vzdálenosti je nutno zvolit:

Obdobnou volbu je třeba provést i při shlukování. Na rozdíl od shlukování jsou tu však metriky vzdálenosti (či podobnosti) skupin objektů použity pro zjištění vzdálenosti jednoho objektu (u něhož nevíme, do jaké skupiny patří) od etalonů daných skupin objektů.

Z metrik vzdáleností skupin objektů si pro účely klasifikace podle minimální vzdálenosti představíme použití metody nejbližšího souseda a jejího zobecnění (což je metoda  nejbližších sousedů), centroidové metody a metody průměrné vazby. Metoda nejvzdálenějšího souseda je pro klasifikaci obtížně použitelná a Wardova metoda je pro klasifikaci používána zřídka, proto tyto metody nebudou v následujících podkapitolách rozebírány.

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict