E-learningová učebnice

Matematická biologie

Slovník | Vyhledávání | Mapa webu

Analýza a hodnocení biologických datRegresní modelování Logistický regresní model a jiné zobecněné lineární modely Logistický regresní model Definice logistického regresního modelu

Umělá inteligence | Vícerozměrné metody pro analýzu a klasifikaci dat | Statistické modelování | Teorie a praxe jádrového vyhlazování | Regresní modelování |

Opakování základů biostatistiky |

Výstupy z výukové jednotky | Motivace kurzu - účel regresního modelování | Data, jejich popis a vizualizace | Náhodná veličina, rozdělení pravděpodobnosti a reálná data | Bodové a intervalové odhady | Statistická inference | Literatura |

Lineární regresní model |

Výstupy z výukové jednotky | Motivace | Jak definujeme lineární regresní model? |

Lineární regresní model | Normálně rozdělený výsledek | Odhady parametrů regresního modelu | Základní statistické testy v regresním modelu | Koeficient determinace |

Předpoklady regresních modelů | Prediktory různých datových typů |

Konstanta | Spojitý prediktor | Kategoriální prediktor |

Příklady základních biostatistických modelů |

T-test | Analýza rozptylu |

Řešený praktický příklad: závislost koncentrace vitamínu na BMI | Problémy k řešení | Literatura |

Praktické otázky vícenásobné lineární regrese |

Výstupy z výukové jednotky | Interakce proměnných |

Interakce kategoriální a spojité proměnné | Interakce dvou kategoriálních proměnných |

Multikolinearita | Chybějící data |

Možnosti zpracování souboru s chybějícími daty |

Problémy k řešení | Literatura |

Modelovací strategie a ověření předpokladů modelu |

Problémy k řešení | Výstupy z výukové jednotky | Kauzalita |

Zavádějící faktor | Modelové diagramy, znázornění mediátoru |

Modelovací strategie |

Obecně | Stavění lineárního prediktoru |

Ověření předpokladů modelu |

Hledání zvláštních pozorování: odlehlá nebo vlivná |

Řešený praktický příklad: Spotřeba automobilů | Literatura |

Logistický regresní model a jiné zobecněné lineární modely |

Základní informace | Výstupy z výukové jednotky | Vztah dvou binárních proměnných – měření účinku | Proč používáme zobecněné lineární modely? | Logistický regresní model |

Definice logistického regresního modelu | Interpretace koeficientů logistického regresního modelu | Ověření správnosti logistického regresního modelu | Řešený praktický příklad: Rizikové faktory srdeční choroby |

Analýza deviance | Poissonův regresní model |

Definice Poissonova regresního modelu | Interpretace koeficientů Poissonova regresního modelu | Ověření správnosti Poissonova regresního modelu |

Nadměrný rozptyl – overdispersion | Problémy k řešení | Literatura |

Statistické hodnocení biodiverzity |

Definice logistického regresního modelu

Cílem logistického regresního modelu je modelování náhodného výběru proměnných s binárním výsledkem. Rozdělení takového výsledku je možné popsat binomickým rozdělením. Binomické rozdělení je diskrétní rozdělení, které popisuje počet výskytů sledované události (ve formě nastala/nenastala) v sérii nezávislých experimentů, kdy v každém experimentu je stejná pravděpodobnost výskytu události .

Binomické rozdělení má následující pravděpodobnostní funkci:

Známe-li parametr , pak podle počtu experimentů známe střední hodnotu a rozptyl

Abychom logistický regresní model nadefinovali, uvažujme jeden z nezávislých experimentů (jedno pozorování). Výsledek tohoto experimentu je rozdělený alternativně (nabývající hodnoty 1 s pravděpodobností , jinak nabývá hodnoty 0):

Srovnejme lineární regresi (vlevo) s logistickou regresí (vpravo)

modelujeme spojitý výsledek

hodnota parametru (střední hodnoty) je rovna lineárnímu prediktoru

modelujeme nastání náhodného jevu

hodnota parametru (střední hodnoty) je rovna transformovanému prediktoru

hodnota lineárního prediktoru odpovídá střední hodnotě transformované linkovací funkcí logit

Proč ale vůbec tuto linkovací funkci používáme?

Pokud bychom linkovací funkci nepoužili (tedy použili jako linkovací funkci identitu, tak jako v lineární regresi), pak bychom jako hodnotu pravděpodobnosti dostávali různá reálná čísla. Nepochybně ale nechceme jako modelovanou pravděpodobnost čísla menší než 0 nebo větší než 1.

Uvažujme tedy zmíněnou funkci logit:

a její inverzi (někteří autoři ji označují jako „expit“):

Za komplikovanými vztahy se skrývají velmi užitečné vlastnosti této funkce. Ukažme si je na následujících grafech (obr. 1). Podíváme-li se na pravý obrázek, vidíme, že zatímco lineární prediktor může nabývat libovolných hodnot na reálné ose, transformace expit nám zajistí, že výsledek bude v oboru hodnot od nuly do jedné (asymptoty jsou opravdu v 0 a 1).

Obr. 1: Linkovací funkce a její inverze (expit) v logistickém regresním modelu

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity