Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datRegresní modelování Praktické otázky vícenásobné lineární regrese Interakce proměnných Interakce dvou kategoriálních proměnných

Logo Matematická biologie

Interakce dvou kategoriálních proměnných

Interagovat spolu mohou nejen proměnná kategoriální s proměnnou spojitou, ale rovněž dvě proměnné kategoriální. Tento vztah a význam koeficientů v takovém regresním modelu si osvětlíme na příkladu.

Příklad. Uvažuje vzorek mužů z jihoafrické epidemiologické studie zaznamenané v datovém souboru [heartdisease]. Výsledkovou proměnnou je zde systolický krevní tlak (v milimetrech rtuťového sloupce, mm Hg), tuto proměnnou se snažíme vysvětlit krevními hodnotami nízkodenzitního lipoproteinu (LDL). Jako další faktor, který ovlivňuje hodnoty krevního tlaku je uvažován věk pacienta. Tabulka 3.1 uvádí průměrné hodnoty výsledkové proměnné s ohledem na dvě vysvětlující proměnné. Tabulka 3.2 pak uvádí vztahy pro predikované hodnoty krevního tlaku pro aditivní regresní model zahrnující věk (regresní koeficient ) a vysoký LDL cholesterol (regresní koeficient ).

Tabulka 3.1: Průměrné hodnoty krevního tlaku (v mm Hg) dle věku a
hodnoty nízkodenzitního lipoproteinu (LDL)

 

Nízký LDL
(< 3 mmol/l)

Vysoký LDL
(≥ 3 mmol/l)
Rozdíl

Mladší
(< 50 let)

128 133 5

Starší
(≥ 50 let)

136 148 12

 

Tabulka 3.2: Predikované hodnoty krevního tlaku (v mm Hg) dle věku a
hodnoty nízkodenzitního lipoproteinu (LDL
)

 

Nízký LDL
(< 3 mmol/l)

Vysoký LDL
(≥ 3 mmol/l)

Rozdíl

Mladší
(< 50 let)

Starší
(≥ 50 let)

Tomuto regresnímu modelu odpovídá následující vztah pro výsledkovou proměnnou:

Je zřejmé, že v tomto aditivním modelu se předpokládá, že vliv vysokého LDL se neliší dle věku. V praxi to ovšem nemusí být pravda a může být přínosné modelovat i interakci obou zmíněných kategoriálních proměnných. Vztah pro výsledkovou proměnnou v takto formulovaném regresním modelu je zde:

V tabulce 3.3 jsou pak uvedené predikované hodnoty krevního tlaku pro regresní model s interakcí. Nyní již formulace modelu připouští rozdílný efekt LDL dle věku a model tedy umožňuje popsat silnější efekt u starších osob, který naznačovala prohlídka průměrných hodnot ve zkoumaných datech.

Tabulka 3.3: Predikované hodnoty krevního tlaku (v mm Hg) dle věku a
hodnoty nízkodenzitního lipoproteinu (LDL)

 

Nízký LDL
(< 3 mmol/l)

Vysoký LDL
(≥ 3 mmol/l)

Rozdíl

Mladší
(< 50 let)

Starší
(≥ 50 let)

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity