Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Úvod do testování hypotéz Poznámky k testování hypotéz Problém násobného testování hypotéz

Logo Matematická biologie

Problém násobného testování hypotéz

V klinickém výzkumu se často setkáváme se situací, kdy potřebujeme testovat více hypotéz zároveň. Nemusí to nutně znamenat hodnocení různých výběrových souborů nebo náhodných veličin, ale např. i hodnocení stejné veličiny v rámci různých podskupin celého výběrového souboru. Když např. sledujeme rozdíl v nějaké veličině u souboru pacientů se skupinami A, B, C a D, a zjistíme, že se v celkovém pohledu sledované skupiny liší, je samozřejmě z jakéhokoliv hlediska zajímavé podívat se na tento rozdíl i mezi jednotlivými podskupinami, tedy podívat se, jak se liší skupina A od B, B od C, apod. Tento fenomén však v praxi vede k tzv. problému násobného testování hypotéz (multiple testing problem). Ten spočívá v tom, že s narůstajícím počtem testovaných hypotéz nám roste také pravděpodobnost získání falešně pozitivního výsledku, tedy pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na statisticky významný rozdíl tam, kde ve skutečnosti žádný neexistuje.

Můžeme si představit modelovou situaci, kdy provedeme zároveň 60 testů, což v době běžného provádění biochemických a genetických experimentů není zase tolik. Použijeme-li standardní hladinu významnosti α = 0,05, máme pro každý test 5% riziko získání falešně pozitivního výsledku. Vynásobíme-li 60 a 0,05, vyjde nám, že zhruba u 3 testů bychom měli dospět k falešně statisticky významnému závěru. V případě genomických analýz, kde jsou často různé testy pouze formou exploratorní a popisné analýzy, nemusí být přítomnost falešně pozitivních výsledků fatální, v klinické praxi to však může vést k zavádějícím výsledkům a mylným interpretacím. Z tohoto důvodu je nutné při násobném statistickém testování uvažovat tzv. korekční procedury (correction for multiple testing), které by měly brát v úvahu celkový počet provedených testů.

Nejznámější korekční procedurou pro násobné testování hypotéz je Bonferroniho procedura [1], která zamítá nulovou hypotézu ve chvíli, kdy je její p-hodnota menší nebo rovna hodnotě α/m, kde α je zvolená hladina významnosti testu (obvykle 0,05 nebo 0,01), a m je počet zároveň provedených testů. Použití Bonferroniho procedury je poměrně konzervativní, což znamená, že je při jejím použití relativně obtížné dosáhnout statistické významnosti (zvláště když je počet provedených testů větší než 10). Korekčních procedur však existuje celá řada, z metod pro parametrické testy lze jmenovat např. Scheffého metodu či Tukeyho metodu, pro neparametrické testy pak např. metodu dle Steela a Dwasse [2].

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity