Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Podobnosti a vzdálenosti ve vícerozměrném prostoru Metriky pro určení vzdálenosti mezi dvěma množinami vektorů

Logo Matematická biologie

Metriky pro určení vzdálenosti mezi dvěma množinami vektorů

Dosud probrané algoritmy pro výpočet vzdálenosti či podobnosti dvou vektorů umožňují srovnat tyto dva vektory, nic víc, nic míň. Máme-li ale zařadit vektor do nějaké množiny (skupiny; shluku, klasifikační třídy), je potřeba umět posoudit, jak se tento vektor s touto množinou shoduje. Množina, reprezentující skupinu objektů či subjektů (tj. vektory určitých specifických vlastností), může být dána jednak jedním či více reprezentativními vektory (vzory, etalony) nebo může být zadána výčtem všech vektorů, které do ní patří, a to nějakým obecnějším souhrnným popisem, např. hustotou pravděpodobnosti výskytu vektorů patřících do dané množiny v této množině, funkcí příslušnosti vektoru k dané množině apod. Při klasifikaci (klasifikovaný vektor se zařazuje do již nějak pevně definovaných klasifikačních tříd), stejně jako i v jiných podobných disciplínách (např. při shlukování, což je postup vytvářející ze vstupních vektorů podobné množiny pouze na základě znalosti o vzdálenostech mezi vektory, resp. vektory a shluky), je třeba k posouzení vzdálenosti či podobnosti dvou vektorů přidat schopnost určit i vzdálenost mezi vektorem a množinou vektorů, představující určitou klasifikační třídu, případně vzdálenost mezi dvěma různými množinami vektorů. Oba problémy lze vyřešit zavedením metrik pro dvě množiny – za předpokladu, že samotný vektor považujeme za jednoprvkovou množinu.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity