
Testování hypotéz o podílech
Nejjednodušší formou kvalitativní náhodné veličiny je alternativní (binární) náhodná veličina, nabývající pouze dvou hodnot, např. 0 a 1. Nezávislá opakování alternativní náhodné veličiny pak vedou k binomické náhodné veličině, která je logicky v medicíně i biologii relativně častá, neboť popisuje situace, kdy sledujeme např. výskyt nějaké vlastnosti v dané populaci pacientů nebo výskyt živočišného druhu na daných lokalitách. Hodnocení binomické veličiny vede na tzv. testování hypotéz o podílech, kdy naším cílem je hodnocení tvrzení o parametru π binomického rozdělení, který odpovídá pravděpodobnosti výskytu uvažované vlastnosti ve sledované populaci. Kromě bodového odhadu parametru π nás tedy může zajímat následující:
- Konstrukce intervalu spolehlivosti pro parametr π
- Test o parametru π proti konstantě π0
- Test o parametru π ve dvou souborech
Při rozhodování o parametru π vycházíme z náhodné veličiny X s binomickým rozdělením pravděpodobnosti, která reprezentuje počet výskytů sledované vlastnosti (úspěchů) v posloupnosti n nezávislých experimentů (subjektů). Nás však zajímá pravděpodobnost výskytu, proto budeme uvažovat transformovanou náhodnou veličinu X / n. Její realizaci značíme malým p s tím, že se vlastně jedná o odhad parametru π, tedy
|
(9.1) |
Odhad p má jako transformovaná náhodná veličina také svoje rozdělení pravděpodobnosti, kterému odpovídají následující charakteristiky
|
|
(9.2) |
Obecně je rozdělení pravděpodobnosti binomické náhodné veličiny jednoznačně dáno pravděpodobnostní funkcí, jejíž výpočet je však pro větší počet nezávislých experimentů, n, nepraktický. V praxi se pro aproximaci rozdělení pravděpodobnosti binomické náhodné veličiny používá normální rozdělení, což nám umožňuje platnost centrální limitní věty. Pouze pro připomenutí, centrální limitní věta platí pro součet n nezávislých, stejně rozdělených náhodných veličin (samozřejmě pro n jdoucí do nekonečna), což je zde splněno, neboť binomická náhodná veličina je součtem n nezávislých náhodných veličin s alternativním rozdělením. Aproximace však neplatí paušálně, podmínkou dobré aproximace normálním rozdělením je hodnota součinu np(1 – p) větší než 5, nebo ještě lépe hodnota součinu np(1 – p) větší než 10. Tato podmínka souvisí s množstvím informace nutné pro dosažení přibližného tvaru normálního rozdělení, tedy s množstvím informace nutné pro přesnost aproximace. Je-li podmínka dobré aproximace splněna, pak pro náhodnou veličinu Z jako transformaci X platí
|
(9.3) |
zatímco pro Z jako transformaci p, respektive X / n platí
|
(9.4) |