Základní statistické testy v regresním modelu
Klíčovou úlohou v biostatistice představuje testování statistických hypotéz. V této kapitole se seznámíme se dvěma základními třídami hypotéz, které můžeme v regresních modelech testovat.
Příklad: Nejjednodušší (a zřejmě nejčastěji testovanou) nulovou hypotézou je rovnost některého z regresních koeficientů 0. Tak můžeme například testovat klinickou hypotézu, že se koncentrace vitaminu D v krevním séru mění s rostoucím indexem tělesné hmotnosti. Nulová (H0) a alternativní (H1) hypotézy tedy vypadají následovně:
Tento jednoduchý příklad reprezentuje první třídu hypotéz, kdy testujeme rovnost lineární kombinace regresních koeficientů a libovolné konstanty. To lze v případě modelu s jedním prediktorem (dvěma parametry včetně absolutního členu) zapsat jako vektorový součin , kde
Obecně můžeme zkonstruovat testovou statistiku T pro regresní model s k parametry, v tomto případě mají oba vektory c, velikost k ×1. Statistika vypadá následovně:
(2.10) |
a má studentovo rozdělení s n – k stupni volnosti. Pokud testujeme hypotézu
pak nulovou hypotézu zamítáme na hladině významnosti α, pokud
kde je 1 - α/2 kvantil studentova rozdělení s n – k stupni volnosti.
Uvedený test nám však nepomůže, pokud chceme otestovat rovnost celého vektoru parametrů proti nulovému vektoru. Takovýto test nám pomůže s rozhodnutím, zda model jako celek dokáže vysvětlit významnou část variability výsledkové veličiny, případně zda umí významnou míru variability vysvětlit kategoriální výsledková proměnná, která je v matici plánu reprezentována několika sloupci (viz dále) a tedy je popsána několika parametry ve vektoru β.
Zavedeme nejprve blokové značení pro následující vektory a matice:
|
Můžeme testovat následující hypotézu
kde x je vektor reálných čísel.
Testovou statistikou je
(2.11) |