Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Lineární regresní model Lineární regresní model

Logo Matematická biologie

Lineární regresní model

Předpokládejme, že mezi nějakými nenáhodnými veličinami  platí lineární vztah

ve kterém  jsou neznáméparametry. Informace o neznámých parametrech budeme získávat pomocí experimentu, a to tak, že opakovaně budeme měřit hodnoty veličiny při vybraných hodnotách proměnných  Při měřeních však vznikají chyby, což lze modelovat takto

kde  je náhodná chyba měření.

Opakované hodnoty sledovaných veličin budeme pro  značit  obdobně také náhodné chyby
Celkově jsme dostali model

O náhodných chybách  budeme předpokládat, že jsou

  • nesystematické, což lze matematicky vyjádřit požadavkem, že   , tj.  a tedy 
  • homogenní v rozptylu, tj. že   pro
  • jednotlivé náhodné chyby jsou nekorelované, tj. že   pro  tj.  takže i měření jsou nekorelovaná.

Používá se následující terminologie a značení

  • parametry  se nazývají regresní koeficienty,
  • matice  obsahuje nenáhodné prvky  a nazývá se regresní maticí nebo maticí plánu (Design Matrix),
  • popsaný model souhrnně zapíšeme jako 

Takto zavedený model budeme nazývat lineární regresní model. Dále budeme předpokládat, že   a o hodnosti matice  budeme předpokládat, že je rovna tj.   Bude-li tento přepoklad splněn, budeme říkat, že jde lineární regresní model plné hodnosti. V tom případě  jsou sloupce matice  nezávislé.

V opačném případě, by bylo možné daný sloupec matice  napsat jako lineární kombinaci ostatních sloupců, což je možné interpretovat tak, že proměnná odpovídající danému sloupci je nadbytečná, protože ji lze vyjádřit jako lineární funkci ostatních proměnných.

 

Příklad 2.1. REGRESNí PŘÍMKA V KLASICKÉM LINEÁRNÍM REGRESNÍM MODELU

Klasickým speciálním případem lineárního modelu je jednoduchá lineární regrese, kdy předpokládáme, že nezávislé náhodné veličiny 

mají normální rozdělení

 

 

kde   jsou dané konstanty, které nejsou všechny stejné. Rozptyly  jsou stejné, kdežto střední hodnoty lze vyjádřit jako lineární funkci známých konstant  pomocí neznámých parametrů 

V tomto případě

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity