Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Ordinační analýzy Korespondenční analýza Hodnocení modelu

Logo Matematická biologie

Hodnocení modelu

Pro model korespondenční analýzy definujeme míru rozptýlení bodů, tj. řádkových a sloupcových kategorií, kterou je tzv. celková inerce. Pojem inerce je převzatý z mechaniky, kde je určen jako součet součinu hmotnosti a čtvercových vzdáleností od centroidu všech částic objektu. Geometricky vyjadřuje inerce stupeň rozptýlení bodů ve vícerozměrném prostoru a můžeme ji chápat jako analogii rozptylu známému ze statistického modelování.

V korespondenční analýze je celková inerce (I) rovna váženému průměru (s váhami ) chí-kvadrát vzdálenosti řádkových profilů od svého průměru (vektoru )

(21)

stejně jako váženému průměru (s váhami ) chí-kvadrát vzdálenosti sloupcových profilů od svého průměru (vektoru )

(22)

Podstatnou část celkové inerce původní tabulky vysvětluje zpravidla několik málo prvních os. Proto většinou postačuje znázornit výsledek korespondenční analýzy do prostoru prvních dvou nebo tří ordinačních os. Pro celkovou inerci platí, že je rovna součtu všech vlastních čísel matice. Je proto možné určit přesněji, kolik ordinačních os je rozumné interpretovat. Můžeme rozhodnout dvěma způsoby. 1) Zvolíme hraniční hodnotu (např. 80 %) a zjistíme, kolik os má kumulativní inerci větší než námi zvolená hraniční hodnota. 2) Interpretujeme ordinační osy, jejichž vlastní číslo je nadprůměrné, tj. větší než průměr všech vlastních čísel.

Příspěvky řádkových bodů k inerci v odpovídajícím rozměru definujeme podílem

(23)

kde odpovídá prvkům matice (skóre -té řádkové kategorie v -tém rozměru), prvkům vektoru řádkových zátěží a je inerce vyjadřená -tým rozměrem (jde o vlastní číslo matice). Příspěvek řádkových bodů k inerci vyjadřuje relativní míru vlivu dané kategorie na konečnou orientaci hlavních os.

Podobně vyjadřujeme příspěvky sloupcových bodů k inerci v odpovídajícím rozměru

(24)

Pro každou řádkovou kategorii můžeme vypočítat celkovou řádkovou inerci, definovanou vztahem

(25)

Obdobně pro sloupcové kategorie je celková sloupcová inerce definována jako

(26)

Hodnoty inerce jednotlivých sloupců a řádků nám poskytují obraz o důležitosti jednotlivých kategorií na výsledné ordinaci.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity