Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Náhodná veličina, rozdělení pravděpodobnosti a reálná data Charakteristiky náhodných veličin

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Úvod do biostatistiky |

Literatura |

Vztah pravděpodobnosti, statistiky a biostatistiky |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Úlohy k procvičení | Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu | Problém násobného testování hypotéz |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Testy o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Testy o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párová t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Welchova korekce pro t-test při nestejných rozptylech | Neparametrický test pro dva výběry (Mannův-Whitneyho test) |

Úlohy k procvičení | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu-Kruskallův -Wallisův test | Úlohy k procvičení | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Úlohy k procvičení | Literatura |

Asociace ve čtyřpolní tabulce |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Úlohy k procvičení | Literatura |

Charakteristiky náhodných veličin

Výše definovaný popis pravděpodobnostního chování náhodné veličiny pomocí distribuční funkce, hustoty a pravděpodobnostní funkce je sice úplný, ale trochu složitý a velmi nepraktický. Často se tak pro popis jednotlivých rozdělení pravděpodobnosti používají číselné charakteristiky, které shrnují vlastnosti rozdělení pravděpodobnosti do jednoho čísla, které je snadno interpretovatelné a lze s ním pracovat jednodušeji než s funkčním vyjádřením. Dvě nejznámější a nejpoužívanější charakteristiky, které odráží vlastnosti rozdělení pravděpodobnosti náhodné veličiny, jsou střední hodnota (mean value) a rozptyl (dispersion, variance). Střední hodnota náhodné veličiny X, značíme ji E(X), je mírou polohy a popisuje tak oblast reálné osy, kde má náhodná veličina X „tendenci“ se realizovat, zatímco rozptyl náhodné veličiny X, značíme ho D(X), je mírou variability, který ukazuje, jak moc jednotlivé možné hodnoty náhodné veličiny X kolísají kolem její střední hodnoty.

Vzhledem k tomu, že střední hodnota i rozptyl charakterizují rozdělení pravděpodobnosti, není překvapivé, že jsou definovány pomocí odpovídajících funkcí, tedy střední hodnota spojité náhodné veličiny X s hustotou f(x) je definována jako integrál

(4.7)

zatímco střední hodnota diskrétní náhodné veličiny X s pravděpodobnostní funkcí p(x) a oborem možných hodnot R je definována jako suma

(4.8)

Výraz pro výpočet střední hodnoty může vypadat složitě, ale nejedná se o nic jiného než o formu váženého průměru, kde jednotlivé možné hodnoty, x, jsou váženy jejich pravděpodobností výskytu, p(x). Jinak řečeno, reálné hodnoty s větší pravděpodobností výskytu v rámci realizace náhodné veličiny X mají větší vliv na její výslednou střední hodnotu než hodnoty s menší pravděpodobností výskytu.

Rozptyl náhodné veličiny X, D(X), je definován stejně pro spojitou i diskrétní náhodnou veličinu, a to jako střední hodnota kvadrátu odchylky náhodné veličiny od její střední hodnoty:

(4.9)

kde výraz E(X²) představuje střední hodnotu transformované náhodné veličiny X² [1]. Stejně jako v případě výběrového rozptylu není ani rozptyl náhodné veličiny v týchž jednotkách jako střední hodnota a hodnoty náhodné veličiny, a proto se jako míra variability používá spíše jeho odmocnina, tzv. směrodatná odchylka (standard deviation) náhodné veličiny, kterou značíme SD(X):

(4.10)

Střední hodnota a rozptyl náhodné veličiny představují teoretický ekvivalent (ve smyslu pravděpodobnosti) popisných ukazatelů, které nás zajímaly u popisné analýzy pozorovaných dat, tedy střední hodnota, E(X), je teoretickým ekvivalentem průměru a rozptyl, D(X), je teoretickým ekvivalentem výběrového rozptylu. Střední hodnota a rozptyl náhodné veličiny X představují klíčové parametry jejího rozdělení pravděpodobnosti a při statistickém zpracování dat jsou většinou hlavním předmětem našeho zájmu. U spojitých náhodných veličin mají výše definované charakteristiky většinou jasnou interpretaci, v případě diskrétních náhodných veličin však mohou být i lehce zavádějící, neboť diskrétní náhodná veličina vůbec nemusí nabývat své střední hodnoty. Jako příklad lze uvést náhodnou veličinu X, která nabývá hodnot −1 a 1, obou s pravděpodobností 0,5. Je zřejmé, že její střední hodnota je 0, což je ale hodnota, které tato náhodná veličina nikdy nemůže nabývat.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity