Použití korespondenční analýzy v ekologii
Korespondenční analýza nachází časté uplatnění při sledování vztahů druhů k prostředí v ekologii společenstev. Byla v tomto oboru velice populární v 80.-90. letech. Ve stejném období byla ke zpracování dat ekologických společenstev často používána i analýza hlavních komponent. Použití korespondenční analýzy a analýzy hlavních komponent při zpracování ekologických dat má jedno důležité pravidlo týkající se odpovědí druhu na gradient prostředí. Pod gradientem si můžeme představit například vlhkost a dále uvažujme vztah nějakého rostlinného druhu k vlhkosti prostředí. Z ekologie je známé, že druhy mají při určité hodnotě vlhkosti své optimum a při snižující či zvyšující se vlhkosti se jejich početnost, resp. pravděpodobnost výskytu snižuje. Při určitých hodnotách, které jsou pro daný druh suboptimální, se tento již nevyskytuje. Odpověď daného druhu na vlhkostní gradient je unimodální. V ordinačních metodách můžeme pracovat buď s lineární odpovědí druhu na gradient prostředí, nebo s unimodální. Lineární model předpokládá, že abundance nebo pravděpodobnost výskytu každého druhu buď roste, nebo klesá s hodnotami každé environmentální proměnné nebo gradientu. Unimodální model předpokládá, že abundance nebo pravděpodobnost výskytu každého druhu má v rámci rozpětí hodnot každého gradientu optimum. Unimodální modely jsou mnohem obecnější než modely monotónní (Obr. 4), proto se doporučuje použít unimodální model a rozhodnout se později, zda si můžeme tento model zjednodušit na lineární. Doplňme, že při zpracovávání ekologických dat předpokládá analýza hlavních komponent lineární odpověď druhů ke gradientu a korespondenční analýza pracuje s předpokladem unimodálního modelu.
a b |
Obr. 4: Unimodální křivka může být na krátkém gradientu dobře odhadnuta lineárním vztahem (a). Na delším gradientu lineární aproximace není účinná (b) (podle [5]).
Poznámka: Abychom mohli rozhodnout o použití lineárního anebo unimodálního modelu, musíme odměřit délku nejdelšího gradientu a tedy gradient první ordinační osy. Délka gradientu se měří v násobcích směrodatné odchylky (s.d.). Druhová data jsou standardizována tak, že unimodální křivka probíhá přes 4 s.d. Proto u vzorků, které jsou od sebe vzdáleny 4 s.d., můžeme předpokládat, že nemají společný žádný druh. Doporučená volba mezi unimodálním a lineárním modelem je následující. Unimodální model volíme tehdy, když je délka nejdelšího gradientu větší nebo rovna 4 s.d.. Lineární model volíme tehdy, když je délka nejdelšího gradientu menší než 3 s.d., není ovšem ani v tomto případě nutnost použít lineární model. Když je ovšem délka gradientu menší než 2 s.d., většina druhových křivek je monotónní a můžeme použít analýzu hlavních komponent.
Výhodou použití PCA je, že zobrazení druhů a vzorků poskytuje víc kvantitativních informací než korespondenční analýza. Nevýhodou analýzy hlavních komponent je předpoklad lineárních dat. Zpravidla platí, že techniky váženého průměrování (korespondenční analýza) jsou lepší pro heterogenní data naznačující silný environmentální gradient (jde zejména o kontingenční tabulky obsahujících mnoho nulových hodnot). Techniky založené na modelu lineární odpovědi (analýza hlavních komponent) jsou vhodné pro homogenní datové soubory.