Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Zobecněné lineární modely Definice jednorozměrného GLM Omezení klasického lineárního regresního modelu

Logo Matematická biologie

Omezení klasického lineárního regresního modelu

Mějme klasický lineární regresní model plné hodnosti

 
kde  je  vektor závisle proměnných,
   je  matice plánu, 
  je  vektor chyb, přičemž 

Když se podíváme na tento model blíže, zjistíme, že se skládá ze dvou částí:

Systematická (signální) část vyjadřuje lineární vztah pro střední hodnotu a neznámé parametry tj.

Tato část je obvykle cílem zkoumání, snažíme se pomocí ní maximálně možně vysvětlit chování náhodné veličiny a zjistit skrze parametry velikost a znaménko závislosti na vysvětlujících veličinách

 V reálném světě má mnoho procesů jiný, než lineární vztah závislosti. Např. v ekonomii se ukazuje, že mnoho vztahů má logaritmickou závislost, k vysvětlení procesů v přírodních vědách se užívají reciproké, mocninné i další vztahy. Vysvětlovaná veličina popisující pravděpodobnost přežití člověka, v případě určité nemoci a určitého způsobu léčby, může z definice pravděpodobnosti nabývat hodnot pouze z intervalu což by v případě klasického lineárního modelu bylo možné zajistit jen za přijetí omezení na estimátor

Náhodná část je reprezentovaná náhodnými chybami  které shrnují v sobě všechny ostatní vlivy, působící na kromě již uvedených v systematické části. Rozdělení náhodných veličin  je závislé na rozdělení a má tvar

kde  jsou nezávislé. Právě normalita chyb je často nesplněným předpokladem klasického lineárního regresního modelu. Připomeňme, že normalita se vyznačuje nezávislosti střední hodnoty a rozptylu. Typicky např. u ekonomických veličin s rostoucí střední hodnotou obvykle roste rozptyl náhodné veličiny, přičemž náhodné chyby mají v těchto případech často nesymetrická, kladně sešikmená rozdělení.

Shrneme-li předchozí, můžeme říci, že klasický lineární regresní model je sice velmi důležitým stochastickým modelem, avšak má celou řadu omezení:

  • Je omezen pouze na třídu normálních rozdělení: kde tvoří náhodný výběr.
  • Předpokládá striktní rovnost mezi střední hodnotou náhodné veličiny a lineární kombinací prediktorů: kde
 je vektor prediktorů a
  je vektor neznámých parametrů.

Je však možné provést zobecnění tohoto klasického lineárního modelu dvěma směry:

(1) Zobecnění na nenormální rozdělení, a to na tzv. třídu exponenciálních rozdělení.
(2) Zobecnění na nelineární funkce, které spojují neznámé střední hodnoty výchozího rozdělení náhodné veličiny s prediktivními proměnnými.
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity