Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datRegresní modelování Praktické otázky vícenásobné lineární regrese Interakce proměnných Interakce kategoriální a spojité proměnné

Logo Matematická biologie

Interakce kategoriální a spojité proměnné

Příklad: Hodnotíme soubor s daty o typech automobilů a jejich charakteristikách [automobile]. Zkoumaným výsledkem je spotřeba vozu (uvedená v litrech na 100 km). Zajímá nás, jak se vyvíjí spotřeba s ohledem na hmotnost automobilu (v librách, spojitý prediktor) a zemi původu automobilu (americký automobil vs. zahraniční automobil, kategoriální prediktor). Do vícenásobného regresního modelu zahrneme právě tyto dva prediktory (zemi původu jako indikátorovou proměnnou s hodnotou 1 pro zahraniční vozy). Pozorovaná data a predikce tímto regresním modelem je znázorněna na obrázku 3.1.


Obr. 3.1: Závislost spotřeby na hmotnosti a zemi původu auta: aditivní model

Z tohoto regresního modelu vyplývá, že spotřeba narůstá s každou librou o 0,003 l/100 km. Dále je zřetelné, že pro libovolnou hmotnost vozu očekáváme, že zahraniční auto spotřebuje o 1,279 l/100 km více. Z těchto informací vyplývá, a je to zřejmé i z obrázku, že jednotlivé regresní přímky pro americká a zahraniční auta jsou v aditivním modelu vzájemně rovnoběžné. Podívejme se nyní na matici plánu a odpovídající regresní rovnici (pro jednotlivá pozorování indexovaná i = 1,...,n):

Rovnice 3.1:

Americká auta  
                                       na 1 libru hmotnosti poroste o

Zahraniční auta 
                                       na 1 libru hmotnosti poroste o 

Pro americká i zahraniční auta platí, že na 1 libru hmotnosti roste spotřeba o hodnotu . Odlišnost v obou regresních rovnicích je pouze v koeficientu , který odpovídá rozdílu absolutních členů obou rovnic. Absolutní člen je tedy pro americká auta, avšak pro auta zahraniční.

Sestavme nyní flexibilnější model, který připouští odlišné sklony obou regresních přímek pro různé země původu automobilu. Toho dosáhneme velmi jednoduše – přidáme interakční člen do matice plánu. Ten je velmi jednoduše tvořen součinem hodnot ve sloupcích matice plánu odpovídajícím hmotnosti aut a indikátoru zahraničních vozů. Dostáváme tedy čtvrtý sloupec, který má hodnoty hmotnosti v řádcích odpovídajícím americkým vozům a nuly ve sloupcích odpovídajícím zahraničním vozům. Snadno odvodíme, že nyní uvažujeme sklon regresní přímky pro americká auta a pro auta zahraniční.

Rovnice 3.2:


 

 

Americká auta  
                                       na 1 libru hmotnosti poroste o

Zahraniční auta 
                      
                                       na 1 libru hmotnosti poroste o 

Tato změna se promítne i do grafického znázornění regresních přímek (obrázek 3.2). Vidíme, že zatímco spotřeba aut s hmotností okolo 2000 liber se mezi americkými a zahraničními výrazně neliší, s rostoucí hmotností se rozdíl mezi auty zvýrazňuje.


Obr. 3.2: Závislost spotřeby na hmotnosti a zemi původu auta: model s interakcí

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity