Korespondenční analýza – CA, Detrendovaná korespondenční analýza – DCA
Korespondenční analýza, také reciproké vážení, je v podstatě analýzou kontingenčních tabulek. Zkoumá vztah mezi dvěma proměnnými. Kontingenční tabulka je frekvenční tabulka, kde stav jedné proměnné v řádcích je porovnáván se stavem druhé proměnné ve sloupcích. Data v každé buňce jsou frekvence, počet objektů, který kombinuje obě proměnné.
CA se používá na data dimenzionálně homogenní (všechny proměnné mají stejnou dimenzi) a obsahují pouze pozitivní hodnoty nebo nuly. Pro stanovení vztahu mezi sloupci a řádky se používá koeficient (chí-kvadrát). V ekologii se tato metoda používá nejvíce na analýzu druhových dat (přítomnost/nepřítomnost nebo abundance). Je založena na unimodálním modelu a dá se použít na dlouhém gradientu.
Jedná se o problém vlastní analýzy, kde vlastní hodnoty asociační matice udávají stupně korespondence (indexy) mezi objekty a parametry. Pomocí těchto „indexů“ jsme schopni určit, která sloupcová kategorie má větší nebo menší váhu. Vysoká vlastní hodnota ukazuje na dlouhý a důležitý gradient. Může být také použita pro jednoduché vážené průměrování. Hodnotí rozdíl daného rozložení objektů proti rozložení objektů, které by nastalo, kdyby objekty byly vzhledem ke všem parametrům umístěny náhodně.
Výpočet korespondenční analýzy zahrnuje tři kroky: (1) Kontingenční tabulka je transformovaná na tabulku příspěvku pomocí Pearsonovy statistiky, (2) pomocí metodiky rozkladu na singulární hodnoty se vypočítají vlastní hodnoty a vlastní vektory asociační matice, (3) následně jsou pomocí těchto maticových operací vykresleny ordinační diagramy. Kromě toho, že CA můžeme použít jako ordinační metodu, lze pomocí CA zkoumat blízkost vztahu mezi řádky (nebo sloupci) kontingenčních tabulek.
Grafické znázornění vztahů, které obdržíme z CA, je založeno na myšlence, jak prezentovat všechny sloupce a řádky a interpretovat relativní pozice bodů, jako jsou váhy patřící k danému sloupci a řádku. Systém takto získaných indexů nám bude poskytovat souřadnice každého sloupce a řádku, které následně vykreslíme do grafu. Z něj pak můžeme odvodit, které sloupcové kategorie jsou důležité vůči řádkovým kategoriím a naopak.
Problémem CA je takzvaný podkovovitý efekt (arch efekt) vycházející z vazby taxonů na prostředí. Taxony mívají podél gradientu unimodální rozložení, efekt gradientů na vzdálenosti vztahu mezi objekty bývá počítán na druhových datech a je nevyhnutelně nelineární. Ordinační metody usilují o překlad této nelinearity do euklidovského dvourozměrného prostoru. Tím vzniká tento artefakt výpočtu. Tvar této křivky záleží na použité vzdálenosti mezi objekty. Uvedený problém můžeme odstranit pomocí zbavení se trendu CA (detrendováním), to znamená použít její detrendovanou formu (DCA). Detrendování je operace prováděná na ordinační ose CA, jejíž pomocí se eliminuje podkovovitý efekt na gradientu tak, že vyjde najevo lineární uspořádání lokalit.