
P-hodnota a její interpretace
Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami lze pro rozhodování o platnosti či neplatnosti nulové hypotézy použít i tzv. -hodnotu (
-value).
-hodnota vyjadřuje pravděpodobnost za platnosti
, s níž bychom, vzhledem k jednostrannosti nebo oboustrannosti testu získali stejnou nebo extrémnější (ještě méně pravděpodobnou) hodnotu testové statistiky. Formálně lze
-hodnotu definovat i jako nejmenší hladinu významnosti testu, při níž na daných datech ještě zamítneme nulovou hypotézu. Platí tedy, že čím nižší
-hodnota testu je, tím menší nám tento test indikuje pravděpodobnost, že platí nulová hypotéza. Jinak řečeno, vyjde-li nám při vyhodnocení statistického testu
-hodnota „blízká nule“ (standardně jsou opět přijímány dvě hranice: 5 % a 1 %), znamená to, že naše nulová hypotéza má velmi malou oporu v pozorovaných datech a můžeme ji zamítnout.
Rozhodování o platnosti či neplatnosti nulové hypotézy tedy probíhá tak, že výslednou -hodnotu testu srovnáme se zvolenou hladinou významnosti
s tím, že nulová hypotéza je zamítána ve chvíli, kdy
-hodnota testu klesne pod tuto hladinu. Dá se tedy říci, že ve chvíli, kdy riziko falešně pozitivního výsledku v souvislosti se zamítnutím nulové hypotézy klesne pod vybranou hladinu (např. 5 % nebo 1 %), pak ji zamítáme. Je-li tedy např.
-hodnota menší než 0,05, nulovou hypotézu zamítáme a hovoříme o statisticky významném výsledku na hladině významnosti
= 0,05. Rozhodujeme-li o platnosti nulové hypotézy pomocí
-hodnoty, lze
-hodnotu chápat jako číselný indikátor platnosti nebo neplatnosti nulové hypotézy vyjádřený na pravděpodobnostní škále. A jako každý indikátor, může i
-hodnota indikovat špatný výsledek, neboť si stále musíme uvědomovat, že nám hrozí jak chyba I. druhu, tak chyba II. druhu.
Příklad 2. Vraťme se k příkladu 1, kde jsme získali výslednou hodnotu testové statistiky = 2,14. Otázkou je, jaká jí odpovídá
-hodnota? Musíme si uvědomit, že máme oboustrannou alternativní hypotézu, což znamená, že extrémnější (méně pravděpodobné) hodnoty testové statistiky v rámci rozdělení pravděpodobnosti odpovídajícího nulové hypotéze jsou jak hodnoty vyšší než 2,14, tak hodnoty nižší než -2,14. Do pravděpodobnosti, kterou
-hodnota představuje tak musíme načíst jak pravděpodobnost výskytu vysokých hodnot testové statistiky, tak pravděpodobnost výskytu nízkých hodnot testové statistiky. Výslednou
-hodnotu pro oboustrannou alternativu lze tedy vyjádřit následovně
|
(12) |
kde je pozorovaná hodnota testové statistiky a
označuje hodnotu distribuční funkce standardizovaného normálního rozdělení v bodě
. Výpočet
-hodnoty pro hodnotu testové statistiky
= 2,14 z příkladu 1 je
|
(13) |
Výsledná hodnota 0,032 je menší než zvolené a opět tudíž můžeme říci, že na hladině významnosti
= 0,05 zamítáme nulovou hypotézu o rovnosti objemu prostaty u mužů nad 70 let populační hodnotě 32,73 ml.