Neparametrický test pro dva výběry (Mannův-Whitneyho test)
Mannův-Whitneyho test je neparametrickou alternativou t-testu pro dva výběry ve chvíli, kdy není splněn některý z jeho předpokladů, respektive máme-li o platnosti některého z jeho předpokladů pochyby. Nulová hypotéza Mannova-Whitneyho testu není zaměřena na střední hodnoty, ale místo toho předpokládáme stejné rozdělení pravděpodobnosti náhodné veličiny v obou souborech, což je slabší předpoklad než normalita dat. Nulová hypotéza se tak týká srovnatelnosti dvou distribučních funkcí, kterou zapíšeme jako
(7.31) |
Mějme realizaci prvního náhodného výběru o rozsahu n1: x1, x2, … , xn1, a na ní nezávislou realizaci druhého náhodného výběru o rozsahu n2: y1, y2, … , yn2. Pointa výpočtu Mannova-Whitneyho testu je následující: pokud pozorování xi a yj (i = 1, ... , n1; j = 1, ... , n2) pochází ze stejného rozdělení pravděpodobnosti, pak by pravděpodobnost toho, že náhodně vybraná hodnota xi bude větší než náhodně vybraná hodnota yj (P(xi > yj)) měla být 50 %. To je ekvivalentní tomu, že při srovnání všech dostupných dvojic xi a yj bude v případě cca 50 % těchto dvojic větší hodnota xi a naopak.
Pro výpočet nejprve seřadíme všechna pozorování od nejmenšího po největší tak, jako by byly z jednoho vzorku, a přiřadíme jednotlivým hodnotám jejich pořadí. Symbolem T1 označíme součet pořadí hodnot příslušných první skupině. Testovými statistikami pak jsou statistiky U a U´, definované jako
(7.32) |
Pro rozhodnutí o platnosti nulové hypotézy srovnáme větší z hodnot U a U´ s kritickou hodnotou z tabulek (v případě oboustranného testu). Je-li kritická hodnota menší, H0 zamítáme. Pro jednostranný test uvažujeme dle nulové hypotézy pouze buď statistiku U nebo U´. Pro výběrové soubory o velikosti n1 > 10 a zároveň n2 > 10 lze rozdělení pravděpodobnosti testové statistiky U aproximovat normálním rozdělením s charakteristikami
(7.33) |
což znamená, že pro ověření nulové hypotézy lze dosadit uvedené hodnoty do statistiky Z a její realizaci srovnat s příslušným kvantilem standardizovaného normálního rozdělení N(0,1).
Příklad 7.5. Opět uvažujme dvě skupiny dětí s hypotyreózou z příkladu 7.4. První skupina jsou děti s mírnými symptomy, druhá skupina jsou děti s výraznými symptomy, naším cílem je srovnat u těchto dvou skupin hladinu tyroxinu v séru. T-test pro dva výběry není pro tento účel vhodný, neboť obě skupiny vykazují různý rozptyl sledované náhodné veličiny. Seřadíme-li všechna pozorování podle velikosti a přiřadíme jednotlivým hodnotám jejich pořadí, dojdeme k tomu, že součet pořadí v první skupině, tedy hodnota statistiky T1, je roven 84,5. Toto číslo dosadíme do vztahu (7.32) a vypočteme
(7.34) Jako realizace testové statistiky slouží větší z vypočtených U a U´, tedy číslo 39,5, které srovnáme s kritickou hodnotou ze statistických tabulek příslušnou hladině významnosti testu α. Vzhledem k tomu, že platí
(7.35) nezamítáme nulovou hypotézu o shodě distribučních funkcí, z nichž pochází měření tyroxinu v séru u dvou skupin dětí s hypotyreózou. Tento výsledek je na první pohled relativně překvapivý, nicméně je třeba si uvědomit, že oba výběrové soubory jsou velmi malé a test tak zřejmě nemá dostatečnou sílu na to, aby odhalil rozdíl v hodnotách tyroxinu mezi oběma skupinami.