Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Zobecněné lineární modely Ověřování vhodnosti modelu Deviace

Logo Matematická biologie

Deviace

Deviace v zobecněných lineárních modelech je obdobou rozptylu u klasických lineárních regresních modelů. Deviace je tedy kritériem vhodnosti zobecněného lineárního modelu. Jak bude patrné z definice, metoda maximální věrohodnosti totiž odpovídá hledání minima deviace modelu.

Definice 6.6. Mějme modely a Nechť náhodný výběr se řídí modelem  Škálovou deviací modelu  (scaled deviance) rozumíme statistiku

kde jsou odpovídající maximálně věrohodné odhady.

Lemma 6.7. Nechť je dán model  a náhodný výběr  se řídí tímto modelem. Dále nechť

(i) existují druhé parciální derivace hustoty podle složek
(ii)

platí

(iii)
a existuje

Pak asymptoticky lze statistiku

aproximovat kvadratickou formou

a rozdělení statistiky lze aproximovat rozdělením přičemž je maximálně věrohodný odhad parametru 

Věta 6.8. Mějme modely  a  Nechť náhodný výběr  se řídí modelem  Dále nechť

(i) existují druhé parciální derivace hustoty podle složek
(ii)

platí

(iii)
a existuje

Platí-li hypotéza, že model  je vhodný, pak asymptoticky lze rozdělení škálové deviace modelu  aproximovat rozdělením  tj.

Poznámka 6.9. Škálovou deviaci lze užít k testování hypotézy o vhodnosti modelu  Jestliže platí

pak považujeme model  za nevhodný.

Věta 6.10. Mějme základní model  s a jeho submodel  s přičemž Dále nechť náhodný výběr  se řídí modelem  a platí

(i) existují druhé parciální derivace hustoty podle složek  
(ii)

platí

(iii) a existuje 

Platí-li hypotéza, že submodel je vhodný, pak asymptoticky lze rozdělení statistiky aproximovat rozdělením tj.

Poznámka 6.11. Statistiky se užívá při porovnání dvou modelů, přičemž jeden je submodelem druhého.

Definujme diagonální matici na jejíž hlavní diagonále budou nuly a jedničky, tj. Počet jedniček na hlavní diagonále je roven číslu  Předpokládáme, že základní model s vektorem neznámých parametrů, který tentokrát označíme dobře popisuje chování náhodného výběru.

Uvažujme hypotézu

a alternativní hypotézu odpovídající základnímu modelu

Test hypotézy vůči provedeme s využitím statistiky  Má-li statistika  hodnotu

pak považujeme submodel za nevhodný a pro popis chování sledovaného náhodného výběru použijeme model základní. V opačném případě jsou oba dva modely dobré a vybereme jednodušší model odpovídající 

Je nutné zdůraznit, že pojem „dobře popisuje chování náhodného výběru“ je zde použit pouze relativně z důvodu srovnání dvou modelů, kdy je třeba zjistit, zda obecnější model je výrazně lepší, či jsou oba modely přibližně srovnatelné. Neznamená ještě, když přijmeme hypotézu že jsou oba modely pro daná data (absolutně) dobré, ale například jen to, že jsou oba stejně špatné.

Proto při praktických úlohách se volí matice plánu obecnějšího modelu se všemi potencionálními vysvětlujícími veličinami a předpokládá se, že tento model popisuje data dobře. Následuje odstraňování jednotlivých vysvětlujících veličin a testování, zda vzniklý jednodušší model nepopisuje data na určité hladině významnosti stejně dobře, jako složitější model základní.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity