E-learningová učebnice

Matematická biologie

Slovník | Vyhledávání | Mapa webu

Analýza a hodnocení biologických datRegresní modelování Logistický regresní model a jiné zobecněné lineární modely Nadměrný rozptyl – overdispersion

Umělá inteligence | Vícerozměrné metody pro analýzu a klasifikaci dat | Statistické modelování | Teorie a praxe jádrového vyhlazování | Regresní modelování |

Opakování základů biostatistiky |

Výstupy z výukové jednotky | Motivace kurzu - účel regresního modelování | Data, jejich popis a vizualizace | Náhodná veličina, rozdělení pravděpodobnosti a reálná data | Bodové a intervalové odhady | Statistická inference | Literatura |

Lineární regresní model |

Výstupy z výukové jednotky | Motivace | Jak definujeme lineární regresní model? |

Lineární regresní model | Normálně rozdělený výsledek | Odhady parametrů regresního modelu | Základní statistické testy v regresním modelu | Koeficient determinace |

Předpoklady regresních modelů | Prediktory různých datových typů |

Konstanta | Spojitý prediktor | Kategoriální prediktor |

Příklady základních biostatistických modelů |

T-test | Analýza rozptylu |

Řešený praktický příklad: závislost koncentrace vitamínu na BMI | Problémy k řešení | Literatura |

Praktické otázky vícenásobné lineární regrese |

Výstupy z výukové jednotky | Interakce proměnných |

Interakce kategoriální a spojité proměnné | Interakce dvou kategoriálních proměnných |

Multikolinearita | Chybějící data |

Možnosti zpracování souboru s chybějícími daty |

Problémy k řešení | Literatura |

Modelovací strategie a ověření předpokladů modelu |

Problémy k řešení | Výstupy z výukové jednotky | Kauzalita |

Zavádějící faktor | Modelové diagramy, znázornění mediátoru |

Modelovací strategie |

Obecně | Stavění lineárního prediktoru |

Ověření předpokladů modelu |

Hledání zvláštních pozorování: odlehlá nebo vlivná |

Řešený praktický příklad: Spotřeba automobilů | Literatura |

Logistický regresní model a jiné zobecněné lineární modely |

Základní informace | Výstupy z výukové jednotky | Vztah dvou binárních proměnných – měření účinku | Proč používáme zobecněné lineární modely? | Logistický regresní model |

Definice logistického regresního modelu | Interpretace koeficientů logistického regresního modelu | Ověření správnosti logistického regresního modelu | Řešený praktický příklad: Rizikové faktory srdeční choroby |

Analýza deviance | Poissonův regresní model |

Definice Poissonova regresního modelu | Interpretace koeficientů Poissonova regresního modelu | Ověření správnosti Poissonova regresního modelu |

Nadměrný rozptyl – overdispersion | Problémy k řešení | Literatura |

Statistické hodnocení biodiverzity |

Nadměrný rozptyl – overdispersion

V této výukové jednotce jsme se věnovali Poissonově a logistické regresi. U obou těchto rozdělení platí, že střední hodnota a rozptyl spolu pevně souvisejí:

v Poissonově rozdělení platí
je li střední hodnota 1,5, je rozptyl rovněž 1,5
(návštěv na urgentním příjmu, moučných červů v objemu mouky,...)
v Binomickém rozdělení platí
je li střední hodnota 1,5, je rozptyl 0,75
(za předpokladu, že pracujeme se třemi „experimenty“, tedy v situaci, kdy např. odhadujeme počet chlapců mezi třemi potomky)

Problém je, že se v praxi dostáváme často do situace, kdy rozdělení výsledku zcela neodpovídá těm modelovým. Důvodem je jistá korelace mezi výsledky, která je v rozporu s předpoklady obou zmíněných rozdělení. Může se to například stát v situaci, kdy jsou v datech nějaké zřejmé shluky (například různé nemocnice, lékaři, laboratoře, přístroje) v rámci kterých spolu výsledky korelují více než napříč shluky.

Na nadměrný rozptyl nás může upozornit vysoká reziduální deviance, a tedy značná významnost příslušného statistického testu. Řešením může být přidání dalšího prediktoru (pokud jej máme naměřen). V rámci definice modelu pro odhad parametrů je to možné řešit uvolněním předpokladů o vztahu mezi střední hodnotou a rozptylem. V tomto případě odhadujeme zvlášť tzv. disperzní parametr (je to vlastně analogie odhadu rozptylu z lineárního statistického modelu). Například v software R je možné uvolnit předpoklady prostřednictvím nastavení argumentu family=quasibinomial nebo family=quasipoisson.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity