Aplikovaná analýza klinických a biologických datBiostatistika pro matematickou biologii Testování hypotéz o kvantitativních proměnných Testy o parametrech dvou rozdělení Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití | Biostatistika pro matematickou biologii |

Úvod do biostatistiky |

Literatura |

Vztah pravděpodobnosti, statistiky a biostatistiky |

Data, jejich popis a vizualizace |

Výstupy z výukové jednotky | Typy dat | Význam popisu a vizualizace dat |

Popis a vizualizace kvalitativních dat | Popis a vizualizace kvantitativních dat |

Identifikace odlehlých hodnot | Literatura |

Náhodná veličina, rozdělení pravděpodobnosti a reálná data |

Literatura |

Bodové a intervalové odhady |

Vlastnosti výběrového průměru | Centrální limitní věta |

Intervalové odhady |

Konstrukce intervalů spolehlivosti pro parametry normálního rozdělení | Interpretace intervalu spolehlivosti | Šířka intervalu spolehlivosti |

Úlohy k procvičení | Literatura |

Úvod do testování hypotéz |

Spojitost testování hypotéz s intervaly spolehlivosti | Statistická a praktická významnost | Faktory ovlivňující sílu testu | Problém násobného testování hypotéz |

Literatura |

Testování hypotéz o kvantitativních proměnných |

Výstupy z výukové jednotky | Postup statistického testování | Testy o parametrech jednoho rozdělení |

Testy o střední hodnotě při známém rozptylu (z-test pro jeden výběr) | Testy o střední hodnotě při neznámém rozptylu (t-test pro jeden výběr) | Neparametrický test pro jeden výběr (Wilcoxonův test) | Test o rozdílu párových (závislých) pozorování (párová t-test) |

Testy o parametrech dvou rozdělení |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech | Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů (F-test) | Welchova korekce pro t-test při nestejných rozptylech | Neparametrický test pro dva výběry (Mannův-Whitneyho test) |

Úlohy k procvičení | Literatura |

Analýza rozptylu (ANOVA) |

Výstupy z výukové jednotky | Přínos analýzy rozptylu | Variabilita výběrových souborů a princip výpočtu | Předpoklady analýzy rozptylu a jejich ověření |

Hodnocení normality pozorovaných hodnot |

Neparametrická alternativa analýzy rozptylu-Kruskallův -Wallisův test | Úlohy k procvičení | Literatura |

Testování hypotéz o kvalitativních proměnných |

Výstupy z výukové jednotky | Úvod | Testování hypotéz o podílech |

Interval spolehlivosti pro parametr π binomického rozdělení | Test pro podíl u jednoho výběru |

Analýza kontingenčních tabulek |

Testování nezávislosti (Pearsonův chí-kvadrát test) | Test hypotézy o symetrii – McNemarův test |

Fisherův exaktní test | Testy o rozdělení náhodné veličiny |

Chí-kvadrát test dobré shody |

Úlohy k procvičení | Literatura |

Asociace ve čtyřpolní tabulce |

Základy korelační analýzy |

Výstupy z výukové jednotky | Úvod | Pearsonův korelační koeficient |

Výpočet Pearsonova korelačního koeficientu | Interval spolehlivosti pro Pearsonův korelační koeficient | Test hypotézy o nulové korelaci dvou náhodných veličin |

Spearmanův korelační koeficient | Úlohy k procvičení | Literatura |

Test o rozdílu středních hodnot dvou nezávislých výběrů při stejných rozptylech

Základním testem pro srovnávání středních hodnot dvou nezávislých výběrů je v biostatistice t-test pro dva výběry, který testuje, zda náhodné výběry pochází z rozdělení se středními hodnotami, jejichž rozdíl je daná konstanta c. Umožňuje nám tak posoudit, zda se hodnoty náhodné veličiny v jedné populaci statisticky významně liší od hodnot této náhodné veličiny v populaci druhé. Jedná se o parametrický test, jehož hlavním předpokladem je normalita rozdělení pravděpodobnosti obou náhodných výběrů. Máme-li realizaci prvního náhodného výběru o rozsahu n₁: x₁, x₂, …, x_n₁, a na ní nezávislou realizaci druhého náhodného výběru o rozsahu n₂: y₁, y₂, …, y_n₂, předpokládáme, že jak realizace x_i, tak realizace y_j pocházejí z normálního rozdělení, tedy že platí X_i ~ N(μ₁,σ²), i = 1, …, n₁, a Y_j ~ N(μ₂,σ²), j = 1, …, n₂. Nulová hypotéza, předpokládající rozdíl mezi středními hodnotami roven c (nejčastěji volíme c = 0), a příslušné alternativní hypotézy (oboustranná a jednostranné) mají tvar

(7.18)

Je důležité si uvědomit, že jsme opět v situaci, kdy neznáme skutečnou hodnotu parametru σ², pouze předpokládáme, že je stejná pro oba výběry. Tento neznámý parametr odhadujeme pomocí váženého průměru odhadů rozptylu (výběrových rozptylů) v jednotlivých skupinách, a :

(7.19)

Z vlastností normálního rozdělení pravděpodobnosti plyne, že rozdíl průměrů normálních náhodných veličin X a Y je také normální náhodná veličina. Platí tedy

(7.20)

Vzhledem k neznámému parametru σ² nelze použít pro testování statistiku s normálním rozdělením pravděpodobnosti, proto obdobně jako v případě t-testu pro jeden výběr i zde hraje roli testové statistiky statistika T se Studentovým t rozdělením (s n₁ + n₂ – 2 stupni volnosti). Pro dva výběry je statistika T definována jako

(7.21)

Nulovou hypotézu opět zamítáme na hladině významnosti α ve chvíli, kdy realizace statistiky T překročí určitou hranici, kterou je kvantil Studentova rozdělení t(n₁ + n₂ – 2) příslušný hladině α a zvolené alternativě. Souhrn pravidel pro zamítnutí nulové hypotézy platných pro t-test pro dva výběry dle zvolené alternativy je uveden v tabulce 7.5. Kromě pravidel pro rozhodnutí o platnosti H₀ je třeba mít na paměti, že použití t-testu pro dva výběry má dva velmi silné předpoklady, kterým bychom měli před výpočtem vždy věnovat adekvátní pozornost. Těmito předpoklady jsou

Normalita pozorovaných hodnot, a to v rámci obou náhodných výběrů. Předpoklad normality musíme předem otestovat adekvátním testem nebo alespoň graficky ověřit pomocí dostupných vizualizačních nástrojů (histogram, krabicový graf).
Homogenní (stejný) rozptyl náhodné veličiny, opět v rámci obou srovnávaných výběrů. Předpoklad homogenity rozptylu lze stejně jako normalitu testovat příslušným statistickým testem (tomuto tématu je věnována část o tzv. F-testu: Test o shodnosti (homogenitě) rozptylů dvou nezávislých výběrů), možné je i grafické ověření pomocí výše zmíněných nástrojů (histogram, krabicový graf).

Tab. 7.5: Pravidla pro zamítnutí H₀ pro t-test pro dva výběry dle zvolené alternativy.

Alternativa		→ Zamítáme H₀, když
Alternativa		→ Zamítáme H₀, když
Alternativa		→ Zamítáme H₀, když

Příklad 7.3. Uvažujme léčbu pacientů se špatně kontrolovanou hypertenzí, pro kterou je dostupná léčba tzv. ACE inhibitory (ACE-I) a antagonisty pro angiotensin II receptor (AIIA). Účinnost léčby ACE-I u pacientů se špatně kontrolovanou hypertenzí reprezentujeme náhodnou veličinou X, zatímco účinnost léčby AIIA u těchto pacientů popíšeme náhodnou veličinou Y. Nulová hypotéza pak vyjadřuje stejný účinek obou léků (ve smyslu střední hodnoty) na snížení diastolického tlaku (TKd) těchto pacientů měřený v milimetrech rtuti po šesti měsících od zahájení léčby. Tedy

(7.22)

U pacientů léčených ACE-I (skupina 1), respektive AIIA (skupina 2), byly pozorovány následující výběrové charakteristiky:

(7.23)

Dále byl na základě hodnot s₁ a s₂ vypočten vážený odhad parametru σ, . Víme, že za platnosti H₀ platí , což znamená, že můžeme pro testování použít statistiku T definovanou v (7.24). Po dosazení získáme

(7.24)

Absolutní hodnotu výsledné realizace testové statistiky srovnáme s kvantilem Studentova t rozdělení s 3811 stupni volnosti (vzhledem k platnosti centrální limitní věty zde již můžeme použít kvantil rozdělení N(0,1)). Absolutní hodnota testové statistiky je menší než hodnota kvantilu z_1-_α_/2 = z_0,975 = 1,96 a tedy nulovou hypotézu nezamítáme. Závěrem tedy lze říci, že na hladině významnosti α = 0,05 nelze prokázat rozdíl mezi léčbou ACE-I a AIIA vzhledem ke snížení diastolického tlaku u pacientů se špatně kontrolovanou hypertenzí.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity