Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datRegresní modelování Lineární regresní model Motivace

Logo Matematická biologie

Motivace

Lineární regresní modely využíváme pro modelování (vysvětlení pozorovaných hodnot) spojité výsledkové proměnné (výsledku, závisle proměnné). Výsledek se snažíme vysvětlit prostřednictvím jednoho nebo více prediktorů (nezávisle proměnných, vysvětlujících proměnných). Prediktory mohou být buď rovněž spojité, nebo kategoriální. Uvažujme nejprve nejjednodušší situaci, kdy se snažíme určit vztah mezi dvěma spojitými proměnnými.

Příklad: Našim úkolem je vysvětlit u pacientů sérovou koncentrací 25-hydroxyvitaminu D (pro jednoduchost dále značíme jako vitamin D) prostřednictvím indexu tělesné hmotnosti (body mass index, BMI). Údaje pacientů pocházejí z datového souboru [vitaminD]. Situace je znázorněna na obrázku 2.1. Pro každého pacienta máme změřeny obě zmíněné veličiny, které poté znázorníme na x-y grafu. Takovou sadou bodů můžeme proložit (v tomto jednoduchém případě i intuitivně) přímku, která co nejlépe reprezentuje vztah koncentrace vitaminu D a BMI. Je přirozené volit přímku tak, aby byla vzdálenost jednotlivých bodů od přímky co nejmenší.

V praxi se jako výpočetní metoda pro určení koeficientů takové přímky uplatňuje takzvaná metoda nejmenších čtverců, která minimalizuje součet druhých mocnin vzdáleností mezi jednotlivými body (naměřenými pozorováními) a hledanou přímkou. Běžný statistický software nám tedy umožňuje najít „ideální“ polohu přímky, kterou lze popsat následovně:

koncentrace vitaminu D = 111,1 – 2,4·BMI

Regresní koeficient odhadnutý jako 111,1 se nazývá absolutní člen (posun, anglicky intercept) regresní přímky. Druhý koeficient této jednoduché rovnice se nazývá směrnice (sklon, anglicky slope). V této výukové jednotce se seznámíme se základní definicí lineárního regresního modelu a s jeho předpoklady. Ukážeme si principy odhadů koeficientů tohoto modelu a testování hypotéz založených na parametrech tohoto modelu.

 

Obr. 2.1: Znázornění vztahu mezi indexem tělesné hmotnosti (BMI) a sérovou koncentrací vitaminu D.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity