Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Analýza rozptylu Testování hypotézy o shodě středních hodnot

Logo Matematická biologie

Testování hypotézy o shodě středních hodnot

Definujme nejprve obecně základní model, kterým se řídí pozorované náhodné veličiny. Z tohoto modelu budeme vycházet v dalších úvahách.

Definice 2.1. Náhodné veličiny  se řídí modelem :

pro  a , přičemž  jsou stochasticky nezávislé náhodné veličiny s rozložením  je společná část střední hodnoty proměnné veličiny,  je efekt faktoru  na úrovni

 

Při zkoumání vlivu jednoho faktoru testujeme hypotézu 

proti alternativě

Jinými slovy hypotéza říká, že  tvoří jeden náhodný výběr, alternativa znamená, že táž pozorování představují obecně náhodných výběrů lišících se střední hodnotou. To odpovídá situaci, kdy pozorování byla pořízena za různých podmínek, jejichž vliv, pokud existuje, se dá vyjádřit aditivní změnou střední hodnoty.

Pokud hypotézu zamítneme, považujeme vliv zkoumaného faktoru za významný, v opačném případě za bezvýznamný.

Pokud tedy platí nulová hypotéza , dostáváme následující minimální submodel.

 

Definice 2.2. Náhodné veličiny  se řídí modelem :

pro  a , přičemž  jsou stochasticky nezávislé náhodné veličiny s rozložením 

 

Poznámka 2.3. (odvození pro zvídavé). Vyjděme ze základního modelu .

Matice plánu je
a vektor parametrů

vektor  značí sloupcový vektor složený z jedniček. Matice  má  sloupců a není plné hodnosti, neboť  první sloupec dostaneme, pokud sečteme zbývajících sloupců.

Vyjádřeme nejprve systém normálních rovnic 

 

Jednou z pseudoinverzních matic k matici  je matice

kde  je matice typu  samých jedniček. Odtud

takže odhad střední hodnoty je tvaru   Přidáním dodatečné podmínky , dostaneme odhad společné střední hodnoty  a pro  odhad příspěvku j-té skupiny  

Pokud platí nulová hypotéza , dostáváme minimální submodel ,  který vznikne ze základního modelu vypuštěním posledních  sloupců matice plánu, takže pokud vše vyjádříme maticově, máme  Vidíme, že jde o model plné hodnosti, ve kterém

 a 

Pak

 a   

Tedy součty kvadrátů odchylek

takže pokud platí model , pak statistika 

 

Definice 2.4. Zavedeme součty čtverců:

(a)

Celkový součet čtverců (charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru), počet stupňů volnosti :

(b)

Skupinový součet čtverců (charakterizuje variabilitu mezi jednotlivými náhodnými výběry), počet stupňů volnosti :

(c)

Reziduální součet čtverců (charakterizuje variabilitu uvnitř jednotlivých výběrů), počet stupňů volnosti :

 

 

Věta 2.5. Lze dokázat, že

 

Věta 2.6. Rozdíl mezi modely a  ověřujeme pomocí testové statistiky

která se řídí rozložením , je-li model správný.

 

Předcházející pojmy se shrnují v tabulce analýzy rozptylu 

Je-li konkrétní realizace statistiky  (značíme malými písmeny ) větší než  - kvantil -rozdělení se stupni volnosti  a , tj. , pak zamítáme nulovou hypotézu na hladině významnosti 

Bývá zvykem označovat v tabulce překročení kvantilu  (tj. ) označovat jednou hvězdičkou, dvě hvězdičky u  a tři hvězdičky u . Někdy se přidává sloupec s p-hodnotou, což je 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity