Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Asociační matice Výpočet asociační matice

Logo Matematická biologie

Výpočet asociační matice

Z dat lze odvodit dva typy asociačních matic: asociační matice mezi objekty (Q mód) a asociační matice mezi proměnnými (R mód). Ukažme si nyní odvození asociační matice mezi objekty. Asociační matici si označme a její objekty . Použijeme-li datovou matici , můžeme zde sledovat vztah prvních dvou objektů a , což jsou první dva řádky této matice. Pro tyto dva řádky spočítáme míru asociace pomocí vybrané metriky podobností či vzdáleností , která nám stanoví podobnost či vzdálenost těchto dvou objektů. Tuto míru, která stanovuje sílu asociace mezi těmito objekty, si označíme . Podle stejného principu jsme dále schopni spočítat asociaci objektu 1 s objektem 3 (tzn. ), objektem 4 () a všemi ostatními ; obdobně pak vypočítáme asociaci pro všechny možné páry objektů v datové matici . Následně můžeme všechny koeficienty asociace zapsat do tabulky, kterou lze označit jako asociační matici , jež má tvar

.

(1)

Důležitými vlastnostmi typických asociačních matic jsou:

  1. Počet řádků se rovná počtu sloupců, což se rovná počtu objektů v datech (v případě mód analýzy) či počtu proměnných (v případě mód analýzy) – tzn. asociační matice jsou čtvercové.
  2. Asociační matice jsou symetrické podle diagonály.
  3. Asociační matice na diagonále zpravidla obsahují 0 nebo 1, podle použité míry asociace.

Asociační matice mohou být jednak vstupem do vícerozměrných analýz, ale i vstupem pro klasické jednorozměrné statistické výpočty, kdy základní jednotkou není jeden objekt, ale podobnost/vzdálenost dvojice objektů.

Jak již bylo zmíněno výše, je možné definovat mód analýzu a mód analýzu. Pro výpočet asociační matice vycházíme z datové matice rozměru [objekty x proměnné], ze které lze získat dva typy asociačních matic: = [objekty x objekty] a = [proměnné x proměnné]. Matici využijeme při výpočtu mód analýzy a matici v případě R mód analýzy.

Obr.  1: Definice Q mód a R mód analýzy

Příklad 1

Výpočet asociační matice v  i módu si představíme na konkrétním případu – jako vstupní data použijeme data z Tabulky 1, kde máme pro šest objektů uvedeny hodnoty čtyř proměnných. Pro ukázku výpočtu asociační matice použijeme Euklidovu metriku vzdálenosti.

Tabulka 1: Ukázka výpočtu asociační matice v Q i R módu pro šest objektů popsaných pomocí čtyř proměnných. Asociační matice je založena na výpočtu Euklidovy metriky vzdálenosti.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity