Omezení klasického lineárního regresního modelu
Mějme klasický lineární regresní model plné hodnosti
kde | je vektor závisle proměnných, | |
je matice plánu, | ||
je vektor chyb, přičemž |
Když se podíváme na tento model blíže, zjistíme, že se skládá ze dvou částí:
Systematická (signální) část vyjadřuje lineární vztah pro střední hodnotu a neznámé parametry tj.
Tato část je obvykle cílem zkoumání, snažíme se pomocí ní maximálně možně vysvětlit chování náhodné veličiny a zjistit skrze parametry velikost a znaménko závislosti na vysvětlujících veličinách
V reálném světě má mnoho procesů jiný, než lineární vztah závislosti. Např. v ekonomii se ukazuje, že mnoho vztahů má logaritmickou závislost, k vysvětlení procesů v přírodních vědách se užívají reciproké, mocninné i další vztahy. Vysvětlovaná veličina popisující pravděpodobnost přežití člověka, v případě určité nemoci a určitého způsobu léčby, může z definice pravděpodobnosti nabývat hodnot pouze z intervalu což by v případě klasického lineárního modelu bylo možné zajistit jen za přijetí omezení na estimátor
Náhodná část je reprezentovaná náhodnými chybami které shrnují v sobě všechny ostatní vlivy, působící na kromě již uvedených v systematické části. Rozdělení náhodných veličin je závislé na rozdělení a má tvar
kde jsou nezávislé. Právě normalita chyb je často nesplněným předpokladem klasického lineárního regresního modelu. Připomeňme, že normalita se vyznačuje nezávislosti střední hodnoty a rozptylu. Typicky např. u ekonomických veličin s rostoucí střední hodnotou obvykle roste rozptyl náhodné veličiny, přičemž náhodné chyby mají v těchto případech často nesymetrická, kladně sešikmená rozdělení.
Shrneme-li předchozí, můžeme říci, že klasický lineární regresní model je sice velmi důležitým stochastickým modelem, avšak má celou řadu omezení:
- Je omezen pouze na třídu normálních rozdělení: kde tvoří náhodný výběr.
- Předpokládá striktní rovnost mezi střední hodnotou náhodné veličiny a lineární kombinací prediktorů: kde
je vektor prediktorů a | |
je vektor neznámých parametrů. |
Je však možné provést zobecnění tohoto klasického lineárního modelu dvěma směry:
(1) | Zobecnění na nenormální rozdělení, a to na tzv. třídu exponenciálních rozdělení. |
(2) | Zobecnění na nelineární funkce, které spojují neznámé střední hodnoty výchozího rozdělení náhodné veličiny s prediktivními proměnnými. |