Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Úvod do testování hypotéz Poznámky k testování hypotéz Problém násobného testování hypotéz

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Úvod do biostatistiky |

Literatura |

Vztah pravděpodobnosti, statistiky a biostatistiky |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Úlohy k procvičení | Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu | Problém násobného testování hypotéz |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Testy o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Testy o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párová t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Welchova korekce pro t-test při nestejných rozptylech | Neparametrický test pro dva výběry (Mannův-Whitneyho test) |

Úlohy k procvičení | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu-Kruskallův -Wallisův test | Úlohy k procvičení | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Úlohy k procvičení | Literatura |

Asociace ve čtyřpolní tabulce |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Úlohy k procvičení | Literatura |

Problém násobného testování hypotéz

V klinickém výzkumu se často setkáváme se situací, kdy potřebujeme testovat více hypotéz zároveň. Nemusí to nutně znamenat hodnocení různých výběrových souborů nebo náhodných veličin, ale např. i hodnocení stejné veličiny v rámci různých podskupin celého výběrového souboru. Když např. sledujeme rozdíl v nějaké veličině u souboru pacientů se skupinami A, B, C a D, a zjistíme, že se v celkovém pohledu sledované skupiny liší, je samozřejmě z jakéhokoliv hlediska zajímavé podívat se na tento rozdíl i mezi jednotlivými podskupinami, tedy podívat se, jak se liší skupina A od B, B od C, apod. Tento fenomén však v praxi vede k tzv. problému násobného testování hypotéz (multiple testing problem). Ten spočívá v tom, že s narůstajícím počtem testovaných hypotéz nám roste také pravděpodobnost získání falešně pozitivního výsledku, tedy pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na statisticky významný rozdíl tam, kde ve skutečnosti žádný neexistuje.

Můžeme si představit modelovou situaci, kdy provedeme zároveň 60 testů, což v době běžného provádění biochemických a genetických experimentů není zase tolik. Použijeme-li standardní hladinu významnosti α = 0,05, máme pro každý test 5% riziko získání falešně pozitivního výsledku. Vynásobíme-li 60 a 0,05, vyjde nám, že zhruba u 3 testů bychom měli dospět k falešně statisticky významnému závěru. V případě genomických analýz, kde jsou často různé testy pouze formou exploratorní a popisné analýzy, nemusí být přítomnost falešně pozitivních výsledků fatální, v klinické praxi to však může vést k zavádějícím výsledkům a mylným interpretacím. Z tohoto důvodu je nutné při násobném statistickém testování uvažovat tzv. korekční procedury (correction for multiple testing), které by měly brát v úvahu celkový počet provedených testů.

Nejznámější korekční procedurou pro násobné testování hypotéz je Bonferroniho procedura [1], která zamítá nulovou hypotézu ve chvíli, kdy je její p-hodnota menší nebo rovna hodnotě α/m, kde α je zvolená hladina významnosti testu (obvykle 0,05 nebo 0,01), a m je počet zároveň provedených testů. Použití Bonferroniho procedury je poměrně konzervativní, což znamená, že je při jejím použití relativně obtížné dosáhnout statistické významnosti (zvláště když je počet provedených testů větší než 10). Korekčních procedur však existuje celá řada, z metod pro parametrické testy lze jmenovat např. Scheffého metodu či Tukeyho metodu, pro neparametrické testy pak např. metodu dle Steela a Dwasse [2].

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity