Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Asociační matice Meansim (MSA)

Logo Matematická biologie

Meansim (MSA)

Pomocí metody Meansim je možné testovat asociační matice vůči kategoriální proměnné, tato metoda tedy představuje jistou obdobu analýzy rozptylu na asociačních maticích. Metoda Meansim se hojně využívá při určování optimálního počtu shluků při shlukové analýze, kde právě přiřazení objektů do shluků reprezentuje kategoriální proměnnou.

Tuto metodu můžeme použít například v případě, kdy máme datový soubor obsahující data jak o složení společenstva, tak o parametrech prostředí. Objekty (lokality) zde shlukujeme na základě proměnných prostředí a následně nás zajímá, jak dobře nám tyto shluky oddělují společenstva ve vzorcích na základě asociační matice.

Metoda Meansim hodnotí sílu klasifikace (Classification strength – CS). Byla speciálně navržena pro mnoho vzorků a relativně málo shluků. Klasifikační síla je stanovena tím, do jaké míry si jsou objekty ve stejném shluku průměrně navzájem podobné oproti podobnosti objektů s objekty z jiných shluků.

Analýza je založena na matici podobnosti mezi vzorky. CS je počítána jako rozdíl mezi průměrem všech podobností uvnitř shluků (W) a průměrem všech podobností mezi shluky (B) podle vzorce

(2)

Hodnoty CS se pohybují mezi nulou a jedničkou. Hodnoty blízké jedné indikují dobrou klasifikaci mezi skupinami (tj. uvnitř skupin je vysoká podobnost a mezi skupinami nízká).

 

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict