
Neparametrický test pro jeden výběr (Wilcoxonův test)
Oba předchozí testy o střední hodnotě, -test i
-test, jsou parametrické testy vyžadující předpoklad normality dat, který se následně odráží v nulové i alternativní hypotéze. Tento předpoklad je však velmi silný a v praxi často není splněn. V řadě případů, spojených zejména s malou velikostí výběrového souboru, dokonce ani nejsme schopni normalitu dat korektně ověřit. Neparametrickou alternativou
-testu a
-testu pro jeden výběr je Wilcoxonův test, který není testem o střední hodnotě, ale testem o mediánu, a jeho jediným předpokladem je symetrie rozdělení náhodné veličiny
, z něhož pochází náhodný výběr. Nulová hypotéza Wilcoxonova testu se týká mediánu rozdělení sledované náhodné veličiny a spolu s oboustrannou alternativou ji lze zapsat jako
|
|
(7)
|
Princip Wilcoxonova testu je velmi jednoduchý, test v podstatě hodnotí, zda je přibližně polovina hodnot menších než předpokládaná hodnota
a přibližně polovina hodnot
větších než tato konstanta s tím, že předpokládá obdobné kolísání hodnot nalevo i napravo od mediánu (předpoklad symetrie). Při samotném výpočtu Wilcoxonův test převádí pozorované hodnoty
na diference od
, tedy na hodnoty
,
definované jako
|
(8) |
které jsou následně seřazeny podle velikosti absolutních hodnot od nejmenší diference po největší:
|
(9)
|
Jednotlivým diferencím je potom na základě tohoto seřazení přiřazeno pořadí, označme ho jako
. Samotná testová statistika Wilcoxonova testu je založena pouze na těchto pořadích a je definována jako
, kde veličiny
a
spočítáme jako součty pořadí
|
|
(10)
|
V případě, že pozorované hodnoty jsou symetricky rozděleny kolem předpokládané hodnoty , bude přibližně jedna polovina diferencí kladná a druhá záporná. Navíc absolutní hodnoty kladných diferencí nebudou systematicky větší než absolutní hodnoty záporných diferencí a naopak, což ve výsledku znamená, že součet pořadí příslušný kladným diferencím bude přibližně stejný jako součet pořadí příslušný záporným diferencím. Za platnosti
tak lze předpokládat, že hodnoty
a
budou zhruba vyrovnané. Na druhou stranu, ve chvíli, kdy
nebude platit, bude mezi hodnotami
a
rozdíl, kdy jedna z těchto statistik bude malé číslo a druhá velké číslo (pojem malé a velké číslo je zde závislý na velikosti souboru).
Pro rozhodnutí o platnosti je pak testová statistika Wilcoxonova testu,
, srovnána s kritickou hodnotou příslušnou dané velikosti výběrového souboru a zvolené hladině významnosti testu
. Je-li hodnota
menší nebo rovna kritické hodnotě, zamítáme
o rovnosti mediánu sledované náhodné veličiny předpokládané hodnotě
(spadne-li hodnota minima obou statistik pod určitou mez, ukazuje to na statisticky významný rozdíl mezi
a
a tudíž i na neplatnost
). Pro malá
(cca do 30) lze kritickou hodnotu pro statistiku
odpovídající zvolené hladině významnosti
najít v tabulkách, pro větší
lze rozdělení testové statistiky
aproximovat normálním rozdělením s následující střední hodnotou a rozptylem:
|
|
(11)
|
Jak je vidět z výpočtu, Wilcoxonův test pracuje místo pozorovaných hodnot s pořadími, což je postup robustní vůči odlehlým hodnotám, které by v případě použití -testu nebo
-testu pro jeden výběr mohly zásadním způsobem ovlivnit hodnotu výběrového průměru. Obecně samozřejmě platí, že parametrické a neparametrické testy nemusí vycházet stejně. Důvody mohou být především nesplnění předpokladů parametrického testu nebo menší síla neparametrického testu. Na druhou stranu, je-li dobře specifikován pravděpodobnostní model a máme-li k dispozici dostatek dat, výsledky parametrických i neparametrických testů budou stejné.
Příklad 2. Stejně jako v příkladu 1 budeme srovnávat denní energetický příjem skupiny 11 žen ve věku 22 – 30 let s doporučenou hodnotou 7725 kJ s tím, že pro srovnání použijeme Wilcoxonův test. Nulová a alternativní hypotéza jsou vyjádřeny následovně
|
|
(12)
|
Pozorované hodnoty, diference od referenční hodnoty 7725 kJ a příslušná pořadí jsou znázorněna v tabulce 3 (hodnoty převzaty z [1]). Na základě pořadí absolutních hodnot kladných a záporných diferencí vypočítáme následující hodnoty pomocných statistik a testové statistiky
|
|
|
(13)
|
Výslednou hodnotu testové statistiky srovnáme s kritickou hodnotou příslušnou velikosti souboru,
= 11, a hladině významnosti testu
= 0,05, která je v tomto případě
= 10. Vzhledem k tomu, že realizace testové statistiky, číslo 8, je menší než hodnota 10, zamítáme nulovou hypotézu o tom, že medián energetického příjmu žen ve věku 22 – 30 let je roven 7725 kJ za den.
Žena |
Denní energetický příjem v kJ |
Diference od hodnoty 7725 kJ |
Pořadí absolutní hodnoty diference |
1 |
5260 |
-2465 |
11 |
2 |
5470 |
-2255 |
10 |
3 |
5640 |
-2085 |
9 |
4 |
6180 |
-1545 |
8 |
5 |
6390 |
-1335 |
7 |
6 |
6515 |
-1210 |
6 |
7 |
6805 |
-920 |
4 |
8 |
7515 |
-210 |
1,5 |
9 |
7515 |
-210 |
1,5 |
10 |
8230 |
505 |
3 |
11 |
8770 |
1045 |
5 |