Interakce kategoriální a spojité proměnné
Příklad: Hodnotíme soubor s daty o typech automobilů a jejich charakteristikách [automobile]. Zkoumaným výsledkem je spotřeba vozu (uvedená v litrech na 100 km). Zajímá nás, jak se vyvíjí spotřeba s ohledem na hmotnost automobilu (v librách, spojitý prediktor) a zemi původu automobilu (americký automobil vs. zahraniční automobil, kategoriální prediktor). Do vícenásobného regresního modelu zahrneme právě tyto dva prediktory (zemi původu jako indikátorovou proměnnou s hodnotou 1 pro zahraniční vozy). Pozorovaná data a predikce tímto regresním modelem je znázorněna na obrázku 3.1.
Obr. 3.1: Závislost spotřeby na hmotnosti a zemi původu auta: aditivní model
Z tohoto regresního modelu vyplývá, že spotřeba narůstá s každou librou o 0,003 l/100 km. Dále je zřetelné, že pro libovolnou hmotnost vozu očekáváme, že zahraniční auto spotřebuje o 1,279 l/100 km více. Z těchto informací vyplývá, a je to zřejmé i z obrázku, že jednotlivé regresní přímky pro americká a zahraniční auta jsou v aditivním modelu vzájemně rovnoběžné. Podívejme se nyní na matici plánu a odpovídající regresní rovnici (pro jednotlivá pozorování indexovaná i = 1,...,n):
Rovnice 3.1:
|
Americká auta
Zahraniční auta |
Pro americká i zahraniční auta platí, že na 1 libru hmotnosti roste spotřeba o hodnotu . Odlišnost v obou regresních rovnicích je pouze v koeficientu , který odpovídá rozdílu absolutních členů obou rovnic. Absolutní člen je tedy pro americká auta, avšak pro auta zahraniční.
Sestavme nyní flexibilnější model, který připouští odlišné sklony obou regresních přímek pro různé země původu automobilu. Toho dosáhneme velmi jednoduše – přidáme interakční člen do matice plánu. Ten je velmi jednoduše tvořen součinem hodnot ve sloupcích matice plánu odpovídajícím hmotnosti aut a indikátoru zahraničních vozů. Dostáváme tedy čtvrtý sloupec, který má hodnoty hmotnosti v řádcích odpovídajícím americkým vozům a nuly ve sloupcích odpovídajícím zahraničním vozům. Snadno odvodíme, že nyní uvažujeme sklon regresní přímky pro americká auta a pro auta zahraniční.
Rovnice 3.2:
|
Americká auta
Zahraniční auta |
Tato změna se promítne i do grafického znázornění regresních přímek (obrázek 3.2). Vidíme, že zatímco spotřeba aut s hmotností okolo 2000 liber se mezi americkými a zahraničními výrazně neliší, s rostoucí hmotností se rozdíl mezi auty zvýrazňuje.
Obr. 3.2: Závislost spotřeby na hmotnosti a zemi původu auta: model s interakcí