Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech
Základním testem pro srovnávání středních hodnot dvou nezávislých výběrů je v biostatistice t-test pro dva výběry, který testuje, zda náhodné výběry pochází z rozdělení se středními hodnotami, jejichž rozdíl je daná konstanta c. Umožňuje nám tak posoudit, zda se hodnoty náhodné veličiny v jedné populaci statisticky významně liší od hodnot této náhodné veličiny v populaci druhé. Jedná se o parametrický test, jehož hlavním předpokladem je normalita rozdělení pravděpodobnosti obou náhodných výběrů. Máme-li realizaci prvního náhodného výběru o rozsahu n1: x1, x2, …, xn1, a na ní nezávislou realizaci druhého náhodného výběru o rozsahu n2: y1, y2, …, yn2, předpokládáme, že jak realizace xi, tak realizace yj pocházejí z normálního rozdělení, tedy že platí Xi ~ N(μ1,σ2), i = 1, …, n1, a Yj ~ N(μ2,σ2), j = 1, …, n2. Nulová hypotéza, předpokládající rozdíl mezi středními hodnotami roven c (nejčastěji volíme c = 0), a příslušné alternativní hypotézy (oboustranná a jednostranné) mají tvar
(7.18) |
Je důležité si uvědomit, že jsme opět v situaci, kdy neznáme skutečnou hodnotu parametru σ2, pouze předpokládáme, že je stejná pro oba výběry. Tento neznámý parametr odhadujeme pomocí váženého průměru odhadů rozptylu (výběrových rozptylů) v jednotlivých skupinách, a :
(7.19) |
Z vlastností normálního rozdělení pravděpodobnosti plyne, že rozdíl průměrů normálních náhodných veličin X a Y je také normální náhodná veličina. Platí tedy
(7.20) |
Vzhledem k neznámému parametru σ2 nelze použít pro testování statistiku s normálním rozdělením pravděpodobnosti, proto obdobně jako v případě t-testu pro jeden výběr i zde hraje roli testové statistiky statistika T se Studentovým t rozdělením (s n1 + n2 – 2 stupni volnosti). Pro dva výběry je statistika T definována jako
(7.21) |
Nulovou hypotézu opět zamítáme na hladině významnosti α ve chvíli, kdy realizace statistiky T překročí určitou hranici, kterou je kvantil Studentova rozdělení t(n1 + n2 – 2) příslušný hladině α a zvolené alternativě. Souhrn pravidel pro zamítnutí nulové hypotézy platných pro t-test pro dva výběry dle zvolené alternativy je uveden v tabulce 7.5. Kromě pravidel pro rozhodnutí o platnosti H0 je třeba mít na paměti, že použití t-testu pro dva výběry má dva velmi silné předpoklady, kterým bychom měli před výpočtem vždy věnovat adekvátní pozornost. Těmito předpoklady jsou
- Normalita pozorovaných hodnot, a to v rámci obou náhodných výběrů. Předpoklad normality musíme předem otestovat adekvátním testem nebo alespoň graficky ověřit pomocí dostupných vizualizačních nástrojů (histogram, krabicový graf).
- Homogenní (stejný) rozptyl náhodné veličiny, opět v rámci obou srovnávaných výběrů. Předpoklad homogenity rozptylu lze stejně jako normalitu testovat příslušným statistickým testem (tomuto tématu je věnována část o tzv. F-testu: Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů), možné je i grafické ověření pomocí výše zmíněných nástrojů (histogram, krabicový graf).
Tab. 7.5: Pravidla pro zamítnutí H0 pro t-test pro dva výběry dle zvolené alternativy.
Alternativa | → Zamítáme H0, když | ||
Alternativa | → Zamítáme H0, když | ||
Alternativa | → Zamítáme H0, když |
Příklad 7.3. Uvažujme léčbu pacientů se špatně kontrolovanou hypertenzí, pro kterou je dostupná léčba tzv. ACE inhibitory (ACE-I) a antagonisty pro angiotensin II receptor (AIIA). Účinnost léčby ACE-I u pacientů se špatně kontrolovanou hypertenzí reprezentujeme náhodnou veličinou X, zatímco účinnost léčby AIIA u těchto pacientů popíšeme náhodnou veličinou Y. Nulová hypotéza pak vyjadřuje stejný účinek obou léků (ve smyslu střední hodnoty) na snížení diastolického tlaku (TKd) těchto pacientů měřený v milimetrech rtuti po šesti měsících od zahájení léčby. Tedy
(7.22) U pacientů léčených ACE-I (skupina 1), respektive AIIA (skupina 2), byly pozorovány následující výběrové charakteristiky:
(7.23) Dále byl na základě hodnot s1 a s2 vypočten vážený odhad parametru σ, . Víme, že za platnosti H0 platí , což znamená, že můžeme pro testování použít statistiku T definovanou v (7.24). Po dosazení získáme
(7.24) Absolutní hodnotu výsledné realizace testové statistiky srovnáme s kvantilem Studentova t rozdělení s 3811 stupni volnosti (vzhledem k platnosti centrální limitní věty zde již můžeme použít kvantil rozdělení N(0,1)). Absolutní hodnota testové statistiky je menší než hodnota kvantilu z1-α/2 = z0,975 = 1,96 a tedy nulovou hypotézu nezamítáme. Závěrem tedy lze říci, že na hladině významnosti α = 0,05 nelze prokázat rozdíl mezi léčbou ACE-I a AIIA vzhledem ke snížení diastolického tlaku u pacientů se špatně kontrolovanou hypertenzí.