Testování hypotézy o shodě středních hodnot
Definujme nejprve obecně základní model, kterým se řídí pozorované náhodné veličiny. Z tohoto modelu budeme vycházet v dalších úvahách.
Definice 2.1. Náhodné veličiny se řídí modelem :
pro a , přičemž jsou stochasticky nezávislé náhodné veličiny s rozložením je společná část střední hodnoty proměnné veličiny, je efekt faktoru na úrovni
Při zkoumání vlivu jednoho faktoru testujeme hypotézu
proti alternativě
|
Jinými slovy hypotéza říká, že tvoří jeden náhodný výběr, alternativa znamená, že táž pozorování představují obecně náhodných výběrů lišících se střední hodnotou. To odpovídá situaci, kdy pozorování byla pořízena za různých podmínek, jejichž vliv, pokud existuje, se dá vyjádřit aditivní změnou střední hodnoty.
Pokud hypotézu zamítneme, považujeme vliv zkoumaného faktoru za významný, v opačném případě za bezvýznamný.
Pokud tedy platí nulová hypotéza , dostáváme následující minimální submodel.
Definice 2.2. Náhodné veličiny se řídí modelem :
pro a , přičemž jsou stochasticky nezávislé náhodné veličiny s rozložením
Poznámka 2.3. (odvození pro zvídavé). Vyjděme ze základního modelu .
Matice plánu je
|
|
a vektor parametrů
|
|
vektor značí sloupcový vektor složený z jedniček. Matice má sloupců a není plné hodnosti, neboť první sloupec dostaneme, pokud sečteme zbývajících sloupců.
Vyjádřeme nejprve systém normálních rovnic
Jednou z pseudoinverzních matic k matici je matice
kde je matice typu samých jedniček. Odtud
takže odhad střední hodnoty je tvaru Přidáním dodatečné podmínky , dostaneme odhad společné střední hodnoty a pro odhad příspěvku j-té skupiny
Pokud platí nulová hypotéza , dostáváme minimální submodel , který vznikne ze základního modelu vypuštěním posledních sloupců matice plánu, takže pokud vše vyjádříme maticově, máme Vidíme, že jde o model plné hodnosti, ve kterém
a |
Pak
a |
Tedy součty kvadrátů odchylek
takže pokud platí model , pak statistika
Definice 2.4. Zavedeme součty čtverců:
(a) |
Celkový součet čtverců (charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru), počet stupňů volnosti : |
(b) |
Skupinový součet čtverců (charakterizuje variabilitu mezi jednotlivými náhodnými výběry), počet stupňů volnosti : |
(c) |
Reziduální součet čtverců (charakterizuje variabilitu uvnitř jednotlivých výběrů), počet stupňů volnosti : |
Věta 2.5. Lze dokázat, že
Věta 2.6. Rozdíl mezi modely a ověřujeme pomocí testové statistiky
která se řídí rozložením , je-li model správný.
Předcházející pojmy se shrnují v tabulce analýzy rozptylu
Je-li konkrétní realizace statistiky (značíme malými písmeny ) větší než - kvantil -rozdělení se stupni volnosti a , tj. , pak zamítáme nulovou hypotézu na hladině významnosti
Bývá zvykem označovat v tabulce překročení kvantilu (tj. ) označovat jednou hvězdičkou, dvě hvězdičky u a tři hvězdičky u . Někdy se přidává sloupec s p-hodnotou, což je