
Testování hypotézy o shodě středních hodnot
Definujme nejprve obecně základní model, kterým se řídí pozorované náhodné veličiny. Z tohoto modelu budeme vycházet v dalších úvahách.
Definice 2.1. Náhodné veličiny se řídí modelem
:
pro a
, přičemž
jsou stochasticky nezávislé náhodné veličiny s rozložením
je společná část střední hodnoty proměnné veličiny,
je efekt faktoru
na úrovni
Při zkoumání vlivu jednoho faktoru testujeme hypotézu
|
proti alternativě
|
|
Jinými slovy hypotéza říká, že tvoří jeden náhodný výběr, alternativa znamená, že táž pozorování představují obecně
náhodných výběrů lišících se střední hodnotou. To odpovídá situaci, kdy pozorování byla pořízena za
různých podmínek, jejichž vliv, pokud existuje, se dá vyjádřit aditivní změnou střední hodnoty.
Pokud hypotézu zamítneme, považujeme vliv zkoumaného faktoru za významný, v opačném případě za bezvýznamný.
Pokud tedy platí nulová hypotéza , dostáváme následující minimální submodel.
Definice 2.2. Náhodné veličiny se řídí modelem
:
pro a
, přičemž
jsou stochasticky nezávislé náhodné veličiny s rozložením
Poznámka 2.3. (odvození pro zvídavé). Vyjděme ze základního modelu .
Matice plánu je
|
|
a vektor parametrů
|
|
vektor značí sloupcový vektor složený z
jedniček. Matice
má
sloupců a není plné hodnosti, neboť první sloupec dostaneme, pokud sečteme zbývajících
sloupců.
Vyjádřeme nejprve systém normálních rovnic
Jednou z pseudoinverzních matic k matici je matice
kde je matice typu
samých jedniček. Odtud
takže odhad střední hodnoty je tvaru Přidáním dodatečné podmínky
, dostaneme odhad společné střední hodnoty
a pro
odhad příspěvku j-té skupiny
Pokud platí nulová hypotéza , dostáváme minimální submodel
, který vznikne ze základního modelu vypuštěním posledních
sloupců matice plánu, takže pokud vše vyjádříme maticově, máme
Vidíme, že jde o model plné hodnosti, ve kterém
a |
Pak
a | |
Tedy součty kvadrátů odchylek
takže pokud platí model , pak statistika
Definice 2.4. Zavedeme součty čtverců:
(a) |
Celkový součet čtverců (charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru), počet stupňů volnosti |
(b) |
Skupinový součet čtverců (charakterizuje variabilitu mezi jednotlivými náhodnými výběry), počet stupňů volnosti |
(c) |
Reziduální součet čtverců (charakterizuje variabilitu uvnitř jednotlivých výběrů), počet stupňů volnosti |
Věta 2.5. Lze dokázat, že
Věta 2.6. Rozdíl mezi modely a
ověřujeme pomocí testové statistiky
která se řídí rozložením , je-li model
správný.
Předcházející pojmy se shrnují v tabulce analýzy rozptylu
Je-li konkrétní realizace statistiky (značíme malými písmeny
) větší než
- kvantil
-rozdělení se stupni volnosti
a
, tj.
, pak zamítáme nulovou hypotézu na hladině významnosti
Bývá zvykem označovat v tabulce překročení kvantilu (tj.
) označovat jednou hvězdičkou, dvě hvězdičky u
a tři hvězdičky u
. Někdy se přidává sloupec s p-hodnotou, což je