Analýza kontingenčních tabulek
V předchozí části jsme se zabývali problematikou binárních znaků (přítomnost nebo nepřítomnost určité vlastnosti), což vede na hodnocení binomických náhodných veličin. Nejméně stejně tak četné jako binární znaky jsou však v přírodě i znaky s více možnými hodnotami, tedy znaky nominální a ordinální [1]. Matematicky reprezentujeme hodnoty daného znaku jako náhodnou veličinu, v případě dvou nominálních nebo ordinálních znaků pak mluvíme např. o náhodných veličinách X a Y.
K frekvenční sumarizaci jedné nominální nebo ordinální veličiny nám slouží tabulka četností, v případě frekvenční sumarizace kombinací dvou nominálních nebo ordinálních veličin pak mluvíme o tzv. kontingenční tabulce (contingency table). Kontingenční tabulky umožňují testování různých hypotéz:
- Testování nezávislosti – pomocí testu nezávislosti můžeme rozhodnout, zda spolu souvisí výskyt dvou nominálních či ordinálních znaků, měřených na souboru n nezávislých experimentálních jednotek. Můžeme např. hodnotit nezávislost pohlaví dítěte a měsíce narození nebo již zmiňovanou souvislost modré barvy očí a období studia u studentů matematické biologie. Hlavním testem nezávislosti pro kontingenční tabulku je Pearsonův chí-kvadrát test (Pearson chi-squared test).
- Testování shody struktury neboli testování homogenity – o testování homogenity mluvíme v situaci, kdy nás zajímá výskyt nominálního nebo ordinálního znaku u r nezávislých výběrů z r různých populací. Příkladem je hodnocení typologie zaznamenaných nežádoucích účinků u pacientů s infarktem myokardu v několika (r) nemocnicích. Hodnocení shodnosti struktury formálně provádíme pomocí stejné testové statistiky jako testování nezávislosti, tedy také s použitím Pearsonova chí-kvadrát testu.
- Testování symetrie – v případě, že uvažujeme opakované měření jedné náhodné veličiny na jednom výběrovém souboru n subjektů a zajímá nás hodnocení změny v jejích hodnotách, mluvíme o testování symetrie. Jedná se o obdobu párového testování u kvantitativních náhodných veličin a příkladem může být hodnocení stavu stromů (lesa) ve dvou po sobě jdoucích sezónách. Pro testování o symetrii kvalitativních náhodných veličin byl odvozen McNemarův test.