Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Bodové a intervalové odhady Teoretické pozadí intervalových odhadů Vlastnosti výběrového průměru

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Úvod do biostatistiky |

Literatura |

Vztah pravděpodobnosti, statistiky a biostatistiky |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Úlohy k procvičení | Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu | Problém násobného testování hypotéz |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Testy o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Testy o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párová t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Welchova korekce pro t-test při nestejných rozptylech | Neparametrický test pro dva výběry (Mannův-Whitneyho test) |

Úlohy k procvičení | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu-Kruskallův -Wallisův test | Úlohy k procvičení | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Úlohy k procvičení | Literatura |

Asociace ve čtyřpolní tabulce |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Úlohy k procvičení | Literatura |

Vlastnosti výběrového průměru

Nejen průměr, ale jakákoliv statistika je jako transformace náhodných veličin také náhodnou veličinou a má tudíž i vlastní rozdělení pravděpodobnosti. Vzhledem k tomu, že jednotlivé realizace náhodné veličiny X vykazují variabilitu (popsanou směrodatnou odchylkou, SD(X), pak i jednotlivé realizace statistiky nad různými náhodnými výběry vykazují variabilitu, která je úměrná SD(X).

Co se týče výběrového průměru, má tento odhad dvě zajímavé vlastnosti, které jsou stěžejní nejen pro konstrukci intervalů spolehlivosti, ale i pro řadu dalších biostatistických úloh:

Rozdělení pravděpodobnosti výběrového průměru má tím menší rozptyl (variabilitu), čím více pozorování je v průměru zahrnuto, tedy čím větší je výběrový soubor (větší n). Jinými slovy, máme-li více informací, jsme schopni odhadovat s větší přesností. Tato vlastnost průměru plyne z vlastností rozptylu transformované náhodné veličiny.
Rozdělení pravděpodobnosti výběrového průměru se s rostoucí velikostí souboru (rostoucím n) přestává podobat rozdělení původní náhodné veličiny X a začíná se podobat rozdělení normálnímu. Tato vlastnost plyne z centrální limitní věty, která je klíčovým tvrzením teoretické statistiky.

Nejprve se věnujme rozptylu průměru jako transformované náhodné veličiny. Mějme posloupnost X₁,…, X_n nezávislých náhodných veličin se stejným rozdělením pravděpodobnosti, které má konečnou střední hodnotu μ a rozptyl σ². Pak z pravidel pro výpočet rozptylu platí, že rozptyl výběrového průměru má tvar

(5.12)

Pro praktické počítání je třeba pracovat se stejnými jednotkami, jako má původní náhodná veličina, což znamená vyjádřit i směrodatnou odchylku výběrového průměru:

(5.13)

Výraz (5.13), tedy směrodatná odchylka výběrového průměru, se nejčastěji označuje pojmem standardní chyba (standard error), zkráceně značeno SE. Platí tedy

(5.14)

Je velmi důležité si uvědomit, že směrodatná odchylka náhodné veličiny, tedy SD(X), je odrazem variability náhodné veličiny ve sledované populaci a souvisí tak s variabilitou biologického procesu (nelze ji tudíž ovlivnit). Na druhou stranu, směrodatná odchylka výběrového průměru, tedy standardní chyba , je odrazem přesnosti výběrového průměru jako odhadu střední hodnoty náhodné veličiny a jako taková souvisí nejen s variabilitou biologického procesu, ale zejména s velikostí vzorku, která hodnotu standardní chyby ovlivňuje zásadním způsobem. Rozdíl mezi rozdělením pravděpodobnosti náhodné veličiny a výběrového průměru pro velikost výběru n = 10 je uveden na obrázku 5.1. Z obrázku je vidět i to, že zatímco realizace náhodné veličiny z rozdělení N(4,1) v blízkosti čísla 5 je očekávatelná, realizace průměru deseti pozorování této veličiny v blízkosti čísla 5 je již velmi málo pravděpodobná.

Obr. 5.1: Srovnání hustoty rozdělení původní veličiny a výběrového průměru pro n=10.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity