Ověření správnosti logistického regresního modelu
Pro ověření správnosti logistického regresního modelu je vhodné ověřit celkovou shodu modelu s pozorováními (overall goodness of fit) a také provést analýzu reziduí stejně jako u lineárních modelů.
Zatímco u lineárního modelu lze graficky znázornit celkovou shodu modelu s pozorováními poměrně jednoduše, situace je u logistické regrese komplikována tím, že výsledek je binární. Problém a nastíněný princip řešení je ukázán na obrázku 2. Celkovou shodu modelu s pozorováními lze i formálně testovat (např. s využitím Hosmer-Lemeshow testu [1] nebo testu založeného na neparametrických jádrových odhadech [2]).
Obr. 2: Znázornění shody modelu (spojitá čára) s pozorovanými výsledky (kolečka). Informativnější obrázek dostáváme při rozdělení sledovaného souboru na 8 částí (podle červených čárkovaných čar) a spočítání podílu (odhadu pravděpodobnosti) nastání jevu v rámci těchto podskupin (symboly diamantu).
Rovněž u analýzy reziduí můžeme vyjít z principů ukázaných v předchozích výukových jednotkách. Konkrétní veličiny – rezidua – se ale od lineárního modelu liší. V následující tabulce naleznete definici běžně používaných reziduí pro logistický model:
Pearsonova rezidua
|
Devianční rezidua
|
Vedle analýzy reziduí, která nám umožňuje najít odlehlé hodnoty, je vhodné prozkoumat u pozorování Cookovu vzdálenost, která nás upozorní na vlivná pozorování.