Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Bodové a intervalové odhady Teoretické pozadí intervalových odhadů Vlastnosti výběrového průměru

Logo Matematická biologie

Vlastnosti výběrového průměru

Nejen průměr, ale jakákoliv statistika je jako transformace náhodných veličin také náhodnou veličinou a má tudíž i vlastní rozdělení pravděpodobnosti. Vzhledem k tomu, že jednotlivé realizace náhodné veličiny X vykazují variabilitu (popsanou směrodatnou odchylkou, SD(X), pak i jednotlivé realizace statistiky nad různými náhodnými výběry vykazují variabilitu, která je úměrná SD(X).

Co se týče výběrového průměru, má tento odhad dvě zajímavé vlastnosti, které jsou stěžejní nejen pro konstrukci intervalů spolehlivosti, ale i pro řadu dalších biostatistických úloh:

  1. Rozdělení pravděpodobnosti výběrového průměru má tím menší rozptyl (variabilitu), čím více pozorování je v průměru zahrnuto, tedy čím větší je výběrový soubor (větší n). Jinými slovy, máme-li více informací, jsme schopni odhadovat s větší přesností. Tato vlastnost průměru plyne z vlastností rozptylu transformované náhodné veličiny.
  2. Rozdělení pravděpodobnosti výběrového průměru se s rostoucí velikostí souboru (rostoucím n) přestává podobat rozdělení původní náhodné veličiny X a začíná se podobat rozdělení normálnímu. Tato vlastnost plyne z centrální limitní věty, která je klíčovým tvrzením teoretické statistiky.

Nejprve se věnujme rozptylu průměru jako transformované náhodné veličiny.  Mějme posloupnost X1,…, Xn nezávislých náhodných veličin se stejným rozdělením pravděpodobnosti, které má konečnou střední hodnotu μ a rozptyl σ2. Pak z pravidel pro výpočet rozptylu platí, že rozptyl výběrového průměru má tvar

(5.12)

Pro praktické počítání je třeba pracovat se stejnými jednotkami, jako má původní náhodná veličina, což znamená vyjádřit i směrodatnou odchylku výběrového průměru:

(5.13)

Výraz (5.13), tedy směrodatná odchylka výběrového průměru, se nejčastěji označuje pojmem standardní chyba (standard error), zkráceně značeno SE. Platí tedy

(5.14)

Je velmi důležité si uvědomit, že směrodatná odchylka náhodné veličiny, tedy SD(X), je odrazem variability náhodné veličiny ve sledované populaci a souvisí tak s variabilitou biologického procesu (nelze ji tudíž ovlivnit). Na druhou stranu, směrodatná odchylka výběrového průměru, tedy standardní chyba , je odrazem přesnosti výběrového průměru jako odhadu střední hodnoty náhodné veličiny a jako taková souvisí nejen s variabilitou biologického procesu, ale zejména s velikostí vzorku, která hodnotu standardní chyby ovlivňuje zásadním způsobem. Rozdíl mezi rozdělením pravděpodobnosti náhodné veličiny a výběrového průměru pro velikost výběru n = 10 je uveden na obrázku 5.1. Z obrázku je vidět i to, že zatímco realizace náhodné veličiny z rozdělení N(4,1) v blízkosti čísla 5 je očekávatelná, realizace průměru deseti pozorování této veličiny v blízkosti čísla 5 je již velmi málo pravděpodobná.

Obr. 5.1: Srovnání hustoty rozdělení původní veličiny a výběrového průměru pro n=10.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity