E-learningová učebnice

Matematická biologie

Slovník | Vyhledávání | Mapa webu

Analýza a hodnocení biologických datRegresní modelování Lineární regresní model Jak definujeme lineární regresní model? Lineární regresní model

Umělá inteligence | Vícerozměrné metody pro analýzu a klasifikaci dat | Statistické modelování | Teorie a praxe jádrového vyhlazování | Regresní modelování |

Opakování základů biostatistiky |

Výstupy z výukové jednotky | Motivace kurzu - účel regresního modelování | Data, jejich popis a vizualizace | Náhodná veličina, rozdělení pravděpodobnosti a reálná data | Bodové a intervalové odhady | Statistická inference | Literatura |

Lineární regresní model |

Výstupy z výukové jednotky | Motivace | Jak definujeme lineární regresní model? |

Lineární regresní model | Normálně rozdělený výsledek | Odhady parametrů regresního modelu | Základní statistické testy v regresním modelu | Koeficient determinace |

Předpoklady regresních modelů | Prediktory různých datových typů |

Konstanta | Spojitý prediktor | Kategoriální prediktor |

Příklady základních biostatistických modelů |

T-test | Analýza rozptylu |

Řešený praktický příklad: závislost koncentrace vitamínu na BMI | Problémy k řešení | Literatura |

Praktické otázky vícenásobné lineární regrese |

Výstupy z výukové jednotky | Interakce proměnných |

Interakce kategoriální a spojité proměnné | Interakce dvou kategoriálních proměnných |

Multikolinearita | Chybějící data |

Možnosti zpracování souboru s chybějícími daty |

Problémy k řešení | Literatura |

Modelovací strategie a ověření předpokladů modelu |

Problémy k řešení | Výstupy z výukové jednotky | Kauzalita |

Zavádějící faktor | Modelové diagramy, znázornění mediátoru |

Modelovací strategie |

Obecně | Stavění lineárního prediktoru |

Ověření předpokladů modelu |

Hledání zvláštních pozorování: odlehlá nebo vlivná |

Řešený praktický příklad: Spotřeba automobilů | Literatura |

Logistický regresní model a jiné zobecněné lineární modely |

Základní informace | Výstupy z výukové jednotky | Vztah dvou binárních proměnných – měření účinku | Proč používáme zobecněné lineární modely? | Logistický regresní model |

Definice logistického regresního modelu | Interpretace koeficientů logistického regresního modelu | Ověření správnosti logistického regresního modelu | Řešený praktický příklad: Rizikové faktory srdeční choroby |

Analýza deviance | Poissonův regresní model |

Definice Poissonova regresního modelu | Interpretace koeficientů Poissonova regresního modelu | Ověření správnosti Poissonova regresního modelu |

Nadměrný rozptyl – overdispersion | Problémy k řešení | Literatura |

Statistické hodnocení biodiverzity |

Lineární regresní model

Předpokládejme na chvilku, že existuje pro všechna pozorování přesný vztah mezi dvěma (nenáhodnými) veličinami y (výsledek) a x (prediktor):

Takto definovaný vztah mezi veličinami však na reálných datech (zejména z biologie nebo medicíny) v praxi pozorujeme stěží. Pro regresní modelování se proto využívá následujícího vztahu, který v sobě již zahrnuje náhodnou veličinu ε (reziduum) reprezentující odchylku od uvedeného ideálního vztahu. Y označuje výsledek (náhodnou veličinu), x označuje prediktor (nenáhodnou, přesně změřenou veličinu). Předpokládejme tedy, že pro jednotlivá pozorování (např. pacienty, lokality, apod.) číslované prostřednictvím indexu i od 1 do n (celkový počet pozorování) platí:

(2.1)

O reziduích budeme předpokládat, že jsou

nesystematické – střední hodnota reziduí je rovna 0: pro i = 1,...,n
homogenní v rozptylu – rozptyl reziduí je pro všechna pozorování stejný: pro i = 1,...,n
jsou vzájemně nekorelované: pro i ≠ j; i, j = 1,...,n

Pro jeden prediktor x se regresní koeficienty značí β₀a β₁, jedná se o zmíněný absolutní člen a směrnici regresní přímky. Uvedený vztah lze jednoduše rozšířit na větší počet (p) prediktorů (pak máme celkem k = p + 1 parametrů včetně β₀, absolutního členu). Dostáváme definici vícenásobného regresního modelu (multiple regression):

(2.2)

Rozepsáno do vztahů pro očekávané hodnoty (predikce) jednotlivých pozorování i = 1,...,n:

.

.

Tuto soustavu vztahů můžeme zapsat jako následující vztah využívající násobení matic:

Vektor výsledků, matici plánu, vektor regresních koeficientů a vektor reziduí označíme po řadě Y, X, β a ε. Maticový zápis regresních rovnic nám umožní zjednodušit definice potřebných statistik.

(2.3)

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity