Aplikovaná analýza klinických a biologických datAnalýza a management dat pro zdravotnické obory, Analýza klinických dat Úvod do statistické analýzy dat pro zdravotnické obory Typy biostatistických úloh

Analýza a management dat pro zdravotnické obory, Analýza klinických dat |

Úvod do statistické analýzy dat pro zdravotnické obory |

Literatura |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Výstupy z výukové jednotky | Nestranné odhady | Srovnání průměru a mediánu | Teoretické pozadí intervalových odhadů |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Test o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Test o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párový t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech (t-test pro dva | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Neparametrický test pro dva výběry (Mannův-Whitneyho test) | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu – Kruskalův-Wallisův test | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Literatura |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Literatura |

Řešené příklady |

Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Typy biostatistických úloh

Existuje několik typů biostatistických úloh, čtyři z nich jsou však základní (v našem textu se budeme věnovat zejména prvním dvěma a částečně třetí z nich):

Popis cílové populace (description) – Popisem myslíme sumarizaci sledovaných znaků (veličin) cílové populace. Jde o grafické a početní techniky vedoucí k vyjádření informace z dat v srozumitelné, korektní a rozsahem akceptovatelné podobě. Přesněji řečeno, často nepřehledné záznamy o jednotlivých subjektech hodnocení (primární data) jsou nahrazeny vypočítanými hodnotami, které nazýváme sumární statistiky (summary statistics). Ty představují odhady parametrů (parameter estimates) modelu cílové populace. Popis musí pravdivě odpovídat primárním datům bez ztráty podstatné informace. Přínos popisné analýzy je ale podmíněn adekvátně zvolenou sumarizací, špatná volba sumární statistiky může znehodnotit celou práci.
Srovnání skupin (comparison) – Na rozdíl od popisné statistiky, u srovnávacích postupů většinou vycházíme z nějaké hypotézy nebo předpokladu o sledovaném znaku (veličině), který měřením a následným testováním ověřujeme. Jinak řečeno, testování hypotéz o sledovaných veličinách se zabývá rozhodováním o platnosti stanovených hypotéz na základě pozorovaných dat. Platnost hypotéz ověřujeme pomocí statistického testu (statistical test) – rozhodovacího pravidla, které každému náhodnému výběru přiřadí právě jedno ze dvou možných rozhodnutí – hypotézu nezamítáme nebo hypotézu zamítáme.
Regresní analýza (regression) – Velmi často zaznamenáváme u sledovaných subjektů více znaků zároveň s tím, že nás zajímá, jestli mezi nimi existuje nějaký vztah. Regresní metody slouží k modelování a kvantifikaci tohoto vztahu. Hlavním cílem je vysvětlit pozorovanou variabilitu ve sledovaných znacích a odhalení případné společné tendence ve výskytu jednotlivých hodnot těchto znaků. Klíčovou roli v regresní analýze hrají stochastické modely, jejichž nejjednodušším příkladem je korelační analýza.
Predikce a klasifikace (prediction and classification) – Cílem prediktivního modelování a klasifikačních algoritmů je předpovědět neznámé hodnoty, které jsou v případě prediktivního modelování většinou kvantitativního charakteru, zatímco v případě klasifikace jsou to většinou kategorie. Hlavní pointa je stejná jako v případě regresního modelování, tedy primárně je třeba modelovat pozorovanou variabilitu v datovém souboru. Výsledkem je ale vytvoření rozhodovacího pravidla, které lze následně po zadání vstupních hodnot použít pro předpověď. Pro úplnost je nutno dodat, že problematika klasifikace nemusí být vůbec spojena s použitím statistických metod.

Biostatistika se však netýká pouze závěrečné fáze zpracování nebo modelování dat, obecně lze říci, že se biostatistik nebo analytik dat účastní téměř všech fází experimentu, ať už na nich pracuje sám nebo ve spolupráci s biologem či klinikem.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity