
Deviace
Deviace v zobecněných lineárních modelech je obdobou rozptylu u klasických lineárních regresních modelů. Deviace je tedy kritériem vhodnosti zobecněného lineárního modelu. Jak bude patrné z definice, metoda maximální věrohodnosti totiž odpovídá hledání minima deviace modelu.
Definice 6.6. Mějme modely a
Nechť náhodný výběr
se řídí modelem
Škálovou deviací modelu
(scaled deviance) rozumíme statistiku
kde jsou odpovídající maximálně věrohodné odhady.
Lemma 6.7. Nechť je dán model a náhodný výběr
se řídí tímto modelem. Dále nechť
(i) |
existují druhé parciální derivace hustoty |
(ii) |
platí |
(iii)
|
a existuje |
Pak asymptoticky lze statistiku
aproximovat kvadratickou formou
a rozdělení statistiky lze aproximovat rozdělením
přičemž
je maximálně věrohodný odhad parametru
Věta 6.8. Mějme modely a
Nechť náhodný výběr
se řídí modelem
Dále nechť
(i) |
existují druhé parciální derivace hustoty |
(ii) |
platí |
(iii)
|
a existuje |
Platí-li hypotéza, že model je vhodný, pak asymptoticky lze rozdělení škálové deviace modelu
aproximovat rozdělením
tj.
Poznámka 6.9. Škálovou deviaci lze užít k testování hypotézy o vhodnosti modelu
Jestliže platí
pak považujeme model za nevhodný.
Věta 6.10. Mějme základní model s
a jeho submodel
s
přičemž
Dále nechť náhodný výběr
se řídí modelem
a platí
(i) |
existují druhé parciální derivace hustoty |
(ii) |
platí |
(iii) |
a existuje |
Platí-li hypotéza, že submodel je vhodný, pak asymptoticky lze rozdělení statistiky
aproximovat rozdělením
tj.
Poznámka 6.11. Statistiky se užívá při porovnání dvou modelů, přičemž jeden je submodelem druhého.
Definujme diagonální matici na jejíž hlavní diagonále budou nuly a jedničky, tj.
Počet jedniček na hlavní diagonále je roven číslu
Předpokládáme, že základní model s vektorem neznámých parametrů, který tentokrát označíme
dobře popisuje chování náhodného výběru.
Uvažujme hypotézu
a alternativní hypotézu odpovídající základnímu modelu
Test hypotézy vůči
provedeme s využitím statistiky
Má-li statistika
hodnotu
pak považujeme submodel za nevhodný a pro popis chování sledovaného náhodného výběru použijeme model základní. V opačném případě jsou oba dva modely dobré a vybereme jednodušší model odpovídající
Je nutné zdůraznit, že pojem „dobře popisuje chování náhodného výběru“ je zde použit pouze relativně z důvodu srovnání dvou modelů, kdy je třeba zjistit, zda obecnější model je výrazně lepší, či jsou oba modely přibližně srovnatelné. Neznamená ještě, když přijmeme hypotézu že jsou oba modely pro daná data (absolutně) dobré, ale například jen to, že jsou oba stejně špatné.
Proto při praktických úlohách se volí matice plánu obecnějšího modelu se všemi potencionálními vysvětlujícími veličinami a předpokládá se, že tento model popisuje data dobře. Následuje odstraňování jednotlivých vysvětlujících veličin a testování, zda vzniklý jednodušší model nepopisuje data na určité hladině významnosti stejně dobře, jako složitější model základní.