
Omezení klasického lineárního regresního modelu
Mějme klasický lineární regresní model plné hodnosti
kde |
|
je vektor závisle proměnných, |
|
je matice plánu, |
|
|
je vektor chyb, přičemž |
Když se podíváme na tento model blíže, zjistíme, že se skládá ze dvou částí:
Systematická (signální) část vyjadřuje lineární vztah pro střední hodnotu a neznámé parametry tj.
Tato část je obvykle cílem zkoumání, snažíme se pomocí ní maximálně možně vysvětlit chování náhodné veličiny a zjistit skrze parametry
velikost a znaménko závislosti na vysvětlujících veličinách
V reálném světě má mnoho procesů jiný, než lineární vztah závislosti. Např. v ekonomii se ukazuje, že mnoho vztahů má logaritmickou závislost, k vysvětlení procesů v přírodních vědách se užívají reciproké, mocninné i další vztahy. Vysvětlovaná veličina popisující pravděpodobnost přežití člověka, v případě určité nemoci a určitého způsobu léčby, může z definice pravděpodobnosti nabývat hodnot pouze z intervalu což by v případě klasického lineárního modelu bylo možné zajistit jen za přijetí omezení na estimátor
Náhodná část je reprezentovaná náhodnými chybami které shrnují v sobě všechny ostatní vlivy, působící na
kromě již uvedených v systematické části. Rozdělení náhodných veličin
je závislé na rozdělení
a má tvar
kde jsou nezávislé. Právě normalita chyb je často nesplněným předpokladem klasického lineárního regresního modelu. Připomeňme, že normalita se vyznačuje nezávislosti střední hodnoty a rozptylu. Typicky např. u ekonomických veličin s rostoucí střední hodnotou obvykle roste rozptyl náhodné veličiny, přičemž náhodné chyby mají v těchto případech často nesymetrická, kladně sešikmená rozdělení.
Shrneme-li předchozí, můžeme říci, že klasický lineární regresní model je sice velmi důležitým stochastickým modelem, avšak má celou řadu omezení:
-
Je omezen pouze na třídu normálních rozdělení:
kde
tvoří náhodný výběr.
-
Předpokládá striktní rovnost mezi střední hodnotou náhodné veličiny
a lineární kombinací prediktorů:
kde
|
je vektor prediktorů a |
|
je vektor neznámých parametrů. |
Je však možné provést zobecnění tohoto klasického lineárního modelu dvěma směry:
(1) | Zobecnění na nenormální rozdělení, a to na tzv. třídu exponenciálních rozdělení. |
(2) |
Zobecnění na nelineární funkce, které spojují neznámé střední hodnoty výchozího rozdělení náhodné veličiny |