E-learningová učebnice

Matematická biologie

Slovník | Vyhledávání | Mapa webu

Analýza a hodnocení biologických datRegresní modelování Lineární regresní model Prediktory různých datových typů Kategoriální prediktor

Umělá inteligence | Vícerozměrné metody pro analýzu a klasifikaci dat | Statistické modelování | Teorie a praxe jádrového vyhlazování | Regresní modelování |

Opakování základů biostatistiky |

Výstupy z výukové jednotky | Motivace kurzu - účel regresního modelování | Data, jejich popis a vizualizace | Náhodná veličina, rozdělení pravděpodobnosti a reálná data | Bodové a intervalové odhady | Statistická inference | Literatura |

Lineární regresní model |

Výstupy z výukové jednotky | Motivace | Jak definujeme lineární regresní model? |

Lineární regresní model | Normálně rozdělený výsledek | Odhady parametrů regresního modelu | Základní statistické testy v regresním modelu | Koeficient determinace |

Předpoklady regresních modelů | Prediktory různých datových typů |

Konstanta | Spojitý prediktor | Kategoriální prediktor |

Příklady základních biostatistických modelů |

T-test | Analýza rozptylu |

Řešený praktický příklad: závislost koncentrace vitamínu na BMI | Problémy k řešení | Literatura |

Praktické otázky vícenásobné lineární regrese |

Výstupy z výukové jednotky | Interakce proměnných |

Interakce kategoriální a spojité proměnné | Interakce dvou kategoriálních proměnných |

Multikolinearita | Chybějící data |

Možnosti zpracování souboru s chybějícími daty |

Problémy k řešení | Literatura |

Modelovací strategie a ověření předpokladů modelu |

Problémy k řešení | Výstupy z výukové jednotky | Kauzalita |

Zavádějící faktor | Modelové diagramy, znázornění mediátoru |

Modelovací strategie |

Obecně | Stavění lineárního prediktoru |

Ověření předpokladů modelu |

Hledání zvláštních pozorování: odlehlá nebo vlivná |

Řešený praktický příklad: Spotřeba automobilů | Literatura |

Logistický regresní model a jiné zobecněné lineární modely |

Základní informace | Výstupy z výukové jednotky | Vztah dvou binárních proměnných – měření účinku | Proč používáme zobecněné lineární modely? | Logistický regresní model |

Definice logistického regresního modelu | Interpretace koeficientů logistického regresního modelu | Ověření správnosti logistického regresního modelu | Řešený praktický příklad: Rizikové faktory srdeční choroby |

Analýza deviance | Poissonův regresní model |

Definice Poissonova regresního modelu | Interpretace koeficientů Poissonova regresního modelu | Ověření správnosti Poissonova regresního modelu |

Nadměrný rozptyl – overdispersion | Problémy k řešení | Literatura |

Statistické hodnocení biodiverzity |

Kategoriální prediktor

Neméně užitečný model zahrnuje prediktor kategoriální. Ukažme si takový model na příkladu, ve kterém se snažíme modelovat podíl tukové tkáně v procentech v závislosti na kategorii dle indexu tělesné hmotnosti (podváha, normální váha, nadváha, obezita). Příslušná data jsou znázorněna na obrázku 2.5.

Do matice plánu samozřejmě není možné vložit přímo kategoriální proměnnou. Proto musíme tuto kategoriální proměnnou před použitím v regresním modelu převést na sadu indikátorových (dummy) proměnných. Pro jednotlivé kategorie původní proměnné (s výjimkou první) zavedeme indikátorové proměnné, které nabývají hodnoty 1, pokud původní proměnná nabývá příslušné hodnoty, a 0 jinak. První kategorie původní proměnné je pak reprezentována nulovou hodnotou všech indikátorových proměnných zároveň. Situace je na příkladu ukázána v tabulce 2.1.

Tab. 2.1: Příklad převodu kategoriální proměnné na sadu nových indikátorových proměnných. V posledním sloupci je uveden vztah pro očekávanou hodnotu výsledku pro příslušné pozorování.

Původní proměnná kategorie BMI	Nové proměnné
Původní proměnná kategorie BMI	Indikátor: Normální váha	Indikátor: Nadváha	Indikátor: Obezita
Podváha	0	0	0
Normální váha	1	0	0
Nadváha	0	1	0
Obezita	0	0	1

Příslušný řádek matice plánu pak pro jednotlivá pozorování obsahuje jedničku ve druhém, třetím, nebo čtvrtém sloupci pro pacienty s normální váhou, nadváhou a obezitou. Pacienti s podváhou mají tedy očekávanou hodnotu výsledku rovnu koeficientu β₀, u pacientů s normální váhou, nadváhou nebo obezitou se přidává ještě regresní koeficient β₁, β₂ nebo β₃.

                    Podváha
                    Normální váha
                    Nadváha
                    Obezita

Obr. 2.5: Závislost podílu tukové tkáně na kategorii tělesné hmotnosti: znázornění odhadnutých koeficientů v modelu s kategoriálním prediktorem.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity