Deviace
Deviace v zobecněných lineárních modelech je obdobou rozptylu u klasických lineárních regresních modelů. Deviace je tedy kritériem vhodnosti zobecněného lineárního modelu. Jak bude patrné z definice, metoda maximální věrohodnosti totiž odpovídá hledání minima deviace modelu.
Definice 6.6. Mějme modely a Nechť náhodný výběr se řídí modelem Škálovou deviací modelu (scaled deviance) rozumíme statistiku
kde jsou odpovídající maximálně věrohodné odhady.
Lemma 6.7. Nechť je dán model a náhodný výběr se řídí tímto modelem. Dále nechť
(i) | existují druhé parciální derivace hustoty podle složek |
(ii) |
platí |
(iii)
|
a existuje |
Pak asymptoticky lze statistiku
aproximovat kvadratickou formou
a rozdělení statistiky lze aproximovat rozdělením přičemž je maximálně věrohodný odhad parametru
Věta 6.8. Mějme modely a Nechť náhodný výběr se řídí modelem Dále nechť
(i) | existují druhé parciální derivace hustoty podle složek |
(ii) |
platí |
(iii)
|
a existuje |
Platí-li hypotéza, že model je vhodný, pak asymptoticky lze rozdělení škálové deviace modelu aproximovat rozdělením tj.
Poznámka 6.9. Škálovou deviaci lze užít k testování hypotézy o vhodnosti modelu Jestliže platí
pak považujeme model za nevhodný.
Věta 6.10. Mějme základní model s a jeho submodel s přičemž Dále nechť náhodný výběr se řídí modelem a platí
(i) | existují druhé parciální derivace hustoty podle složek |
(ii) |
platí |
(iii) | a existuje |
Platí-li hypotéza, že submodel je vhodný, pak asymptoticky lze rozdělení statistiky aproximovat rozdělením tj.
Poznámka 6.11. Statistiky se užívá při porovnání dvou modelů, přičemž jeden je submodelem druhého.
Definujme diagonální matici na jejíž hlavní diagonále budou nuly a jedničky, tj. Počet jedniček na hlavní diagonále je roven číslu Předpokládáme, že základní model s vektorem neznámých parametrů, který tentokrát označíme dobře popisuje chování náhodného výběru.
Uvažujme hypotézu
a alternativní hypotézu odpovídající základnímu modelu
Test hypotézy vůči provedeme s využitím statistiky Má-li statistika hodnotu
pak považujeme submodel za nevhodný a pro popis chování sledovaného náhodného výběru použijeme model základní. V opačném případě jsou oba dva modely dobré a vybereme jednodušší model odpovídající
Je nutné zdůraznit, že pojem „dobře popisuje chování náhodného výběru“ je zde použit pouze relativně z důvodu srovnání dvou modelů, kdy je třeba zjistit, zda obecnější model je výrazně lepší, či jsou oba modely přibližně srovnatelné. Neznamená ještě, když přijmeme hypotézu že jsou oba modely pro daná data (absolutně) dobré, ale například jen to, že jsou oba stejně špatné.
Proto při praktických úlohách se volí matice plánu obecnějšího modelu se všemi potencionálními vysvětlujícími veličinami a předpokládá se, že tento model popisuje data dobře. Následuje odstraňování jednotlivých vysvětlujících veličin a testování, zda vzniklý jednodušší model nepopisuje data na určité hladině významnosti stejně dobře, jako složitější model základní.