Typy biostatistických úloh
Existuje několik typů biostatistických úloh, čtyři z nich jsou však základní:
- Popis cílové populace (description) – Popisem myslíme sumarizaci sledovaných znaků (veličin) cílové populace. Jde o grafické a početní techniky vedoucí k vyjádření informace z dat v srozumitelné, korektní a rozsahem akceptovatelné podobě. Přesněji řečeno, často nepřehledné záznamy o jednotlivých subjektech hodnocení (primární data) jsou nahrazeny vypočítanými hodnotami, které nazýváme sumární statistiky (summary statistics). Ty představují odhady parametrů (parameter estimates) modelu cílové populace. Popis musí pravdivě odpovídat primárním datům bez ztráty podstatné informace. Přínos popisné analýzy je ale podmíněn adekvátně zvolenou sumarizací, špatná volba sumární statistiky může znehodnotit celou práci.
- Srovnání skupin (comparison) – Na rozdíl od popisné statistiky, u srovnávacích postupů většinou vycházíme z nějaké hypotézy nebo předpokladu o sledovaném znaku (veličině), který měřením a následným testováním ověřujeme. Jinak řečeno, testování hypotéz o sledovaných veličinách se zabývá rozhodováním o platnosti stanovených hypotéz na základě pozorovaných dat. Platnost hypotéz ověřujeme pomocí statistického testu (statistical test) – rozhodovacího pravidla, které každému náhodnému výběru přiřadí právě jedno ze dvou možných rozhodnutí – hypotézu nezamítáme nebo hypotézu zamítáme.
- Regresní analýza (regression) – Velmi často zaznamenáváme u sledovaných subjektů více znaků zároveň s tím, že nás zajímá, jestli mezi nimi existuje nějaký vztah. Regresní metody slouží k modelování a kvantifikaci tohoto vztahu. Hlavním cílem je vysvětlit pozorovanou variabilitu ve sledovaných znacích a odhalení případné společné tendence ve výskytu jednotlivých hodnot těchto znaků. Klíčovou roli v regresní analýze hrají stochastické modely, jejichž nejjednodušším příkladem je korelační analýza.
- Predikce a klasifikace (prediction and classification) – Cílem prediktivního modelování a klasifikačních algoritmů je předpovědět neznámé hodnoty, které jsou v případě prediktivního modelování většinou kvantitativního charakteru, zatímco v případě klasifikace jsou to většinou kategorie. Hlavní pointa je stejná jako v případě regresního modelování, tedy primárně je třeba modelovat pozorovanou variabilitu v datovém souboru. Výsledkem je ale vytvoření rozhodovacího pravidla, které lze následně po zadání vstupních hodnot použít pro předpověď. Pro úplnost je nutno dodat, že problematika klasifikace nemusí být vůbec spojena s použitím statistických metod.
Biostatistika se však netýká pouze závěrečné fáze zpracování nebo modelování dat, obecně lze říci, že se biostatistik nebo analytik dat účastní téměř všech fází experimentu, ať už na nich pracuje sám nebo ve spolupráci s biologem či klinikem.