Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Testování hypotéz o kvantitativních proměnných Testy o parametrech dvou rozdělení Neparametrický test pro dva výběry (Mannův-Whitneyho test)

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Úvod do biostatistiky |

Literatura |

Vztah pravděpodobnosti, statistiky a biostatistiky |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Úlohy k procvičení | Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu | Problém násobného testování hypotéz |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Testy o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Testy o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párová t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Welchova korekce pro t-test při nestejných rozptylech | Neparametrický test pro dva výběry (Mannův-Whitneyho test) |

Úlohy k procvičení | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu-Kruskallův -Wallisův test | Úlohy k procvičení | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Úlohy k procvičení | Literatura |

Asociace ve čtyřpolní tabulce |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Úlohy k procvičení | Literatura |

Neparametrický test pro dva výběry (Mannův-Whitneyho test)

Mannův-Whitneyho test je neparametrickou alternativou t-testu pro dva výběry ve chvíli, kdy není splněn některý z jeho předpokladů, respektive máme-li o platnosti některého z jeho předpokladů pochyby. Nulová hypotéza Mannova-Whitneyho testu není zaměřena na střední hodnoty, ale místo toho předpokládáme stejné rozdělení pravděpodobnosti náhodné veličiny v obou souborech, což je slabší předpoklad než normalita dat. Nulová hypotéza se tak týká srovnatelnosti dvou distribučních funkcí, kterou zapíšeme jako

(7.31)

Mějme realizaci prvního náhodného výběru o rozsahu n₁: x₁, x₂, … , x_n₁, a na ní nezávislou realizaci druhého náhodného výběru o rozsahu n₂: y₁, y₂, … , y_n₂. Pointa výpočtu Mannova-Whitneyho testu je následující: pokud pozorování x_i a y_j (i = 1, ... , n₁; j = 1, ... , n₂) pochází ze stejného rozdělení pravděpodobnosti, pak by pravděpodobnost toho, že náhodně vybraná hodnota x_i bude větší než náhodně vybraná hodnota y_j (P(x_i > y_j)) měla být 50 %. To je ekvivalentní tomu, že při srovnání všech dostupných dvojic x_i a y_j bude v případě cca 50 % těchto dvojic větší hodnota x_i a naopak.

Pro výpočet nejprve seřadíme všechna pozorování od nejmenšího po největší tak, jako by byly z jednoho vzorku, a přiřadíme jednotlivým hodnotám jejich pořadí. Symbolem T₁ označíme součet pořadí hodnot příslušných první skupině. Testovými statistikami pak jsou statistiky U a U´, definované jako

(7.32)

Pro rozhodnutí o platnosti nulové hypotézy srovnáme větší z hodnot U a U´ s kritickou hodnotou z tabulek (v případě oboustranného testu). Je-li kritická hodnota menší, H₀ zamítáme. Pro jednostranný test uvažujeme dle nulové hypotézy pouze buď statistiku U nebo U´. Pro výběrové soubory o velikosti n₁ > 10 a zároveň n₂ > 10 lze rozdělení pravděpodobnosti testové statistiky U aproximovat normálním rozdělením s charakteristikami

(7.33)

což znamená, že pro ověření nulové hypotézy lze dosadit uvedené hodnoty do statistiky Z a její realizaci srovnat s příslušným kvantilem standardizovaného normálního rozdělení N(0,1).

Příklad 7.5. Opět uvažujme dvě skupiny dětí s hypotyreózou z příkladu 7.4. První skupina jsou děti s mírnými symptomy, druhá skupina jsou děti s výraznými symptomy, naším cílem je srovnat u těchto dvou skupin hladinu tyroxinu v séru. T-test pro dva výběry není pro tento účel vhodný, neboť obě skupiny vykazují různý rozptyl sledované náhodné veličiny. Seřadíme-li všechna pozorování podle velikosti a přiřadíme jednotlivým hodnotám jejich pořadí, dojdeme k tomu, že součet pořadí v první skupině, tedy hodnota statistiky T₁, je roven 84,5. Toto číslo dosadíme do vztahu (7.32) a vypočteme

(7.34)

Jako realizace testové statistiky slouží větší z vypočtených U a U´, tedy číslo 39,5, které srovnáme s kritickou hodnotou ze statistických tabulek příslušnou hladině významnosti testu α. Vzhledem k tomu, že platí

(7.35)

nezamítáme nulovou hypotézu o shodě distribučních funkcí, z nichž pochází měření tyroxinu v séru u dvou skupin dětí s hypotyreózou. Tento výsledek je na první pohled relativně překvapivý, nicméně je třeba si uvědomit, že oba výběrové soubory jsou velmi malé a test tak zřejmě nemá dostatečnou sílu na to, aby odhalil rozdíl v hodnotách tyroxinu mezi oběma skupinami.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity