Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Náhodná veličina, rozdělení pravděpodobnosti a reálná data Charakteristiky náhodných veličin

Logo Matematická biologie

Charakteristiky náhodných veličin

Výše definovaný popis pravděpodobnostního chování náhodné veličiny pomocí distribuční funkce, hustoty a pravděpodobnostní funkce je sice úplný, ale trochu složitý a velmi nepraktický. Často se tak pro popis jednotlivých rozdělení pravděpodobnosti používají číselné charakteristiky, které shrnují vlastnosti rozdělení pravděpodobnosti do jednoho čísla, které je snadno interpretovatelné a lze s ním pracovat jednodušeji než s funkčním vyjádřením. Dvě nejznámější a nejpoužívanější charakteristiky, které odráží vlastnosti rozdělení pravděpodobnosti náhodné veličiny, jsou střední hodnota (mean value) a rozptyl (dispersion, variance). Střední hodnota náhodné veličiny X, značíme ji E(X), je mírou polohy a popisuje tak oblast reálné osy, kde má náhodná veličina X „tendenci“ se realizovat, zatímco rozptyl náhodné veličiny X, značíme ho D(X), je mírou variability, který ukazuje, jak moc jednotlivé možné hodnoty náhodné veličiny X kolísají kolem její střední hodnoty.

Vzhledem k tomu, že střední hodnota i rozptyl charakterizují rozdělení pravděpodobnosti, není překvapivé, že jsou definovány pomocí odpovídajících funkcí, tedy střední hodnota spojité náhodné veličiny X s hustotou f(x) je definována jako integrál

(4.7)

zatímco střední hodnota diskrétní náhodné veličiny X s pravděpodobnostní funkcí p(x) a oborem možných hodnot R je definována jako suma

(4.8)

Výraz pro výpočet střední hodnoty může vypadat složitě, ale nejedná se o nic jiného než o formu váženého průměru, kde jednotlivé možné hodnoty, x, jsou váženy jejich pravděpodobností výskytu, p(x). Jinak řečeno, reálné hodnoty s větší pravděpodobností výskytu v rámci realizace náhodné veličiny X mají větší vliv na její výslednou střední hodnotu než hodnoty s menší pravděpodobností výskytu.

Rozptyl náhodné veličiny X, D(X), je definován stejně pro spojitou i diskrétní náhodnou veličinu, a to jako střední hodnota kvadrátu odchylky náhodné veličiny od její střední hodnoty:

(4.9)

kde výraz E(X 2) představuje střední hodnotu transformované náhodné veličiny X 2 [1]. Stejně jako v případě výběrového rozptylu není ani rozptyl náhodné veličiny v týchž jednotkách jako střední hodnota a hodnoty náhodné veličiny, a proto se jako míra variability používá spíše jeho odmocnina, tzv. směrodatná odchylka (standard deviation) náhodné veličiny, kterou značíme SD(X):

(4.10)

Střední hodnota a rozptyl náhodné veličiny představují teoretický ekvivalent (ve smyslu pravděpodobnosti) popisných ukazatelů, které nás zajímaly u popisné analýzy pozorovaných dat, tedy střední hodnota, E(X), je teoretickým ekvivalentem průměru a rozptyl, D(X), je teoretickým ekvivalentem výběrového rozptylu. Střední hodnota a rozptyl náhodné veličiny X představují klíčové parametry jejího rozdělení pravděpodobnosti a při statistickém zpracování dat jsou většinou hlavním předmětem našeho zájmu. U spojitých náhodných veličin mají výše definované charakteristiky většinou jasnou interpretaci, v případě diskrétních náhodných veličin však mohou být i lehce zavádějící, neboť diskrétní náhodná veličina vůbec nemusí nabývat své střední hodnoty. Jako příklad lze uvést náhodnou veličinu X, která nabývá hodnot −1 a 1, obou s pravděpodobností 0,5. Je zřejmé, že její střední hodnota je 0, což je ale hodnota, které tato náhodná veličina nikdy nemůže nabývat.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity