
Modely pro alternativní a binomická data
Předpokládejme, že sledovaná náhodná veličina
nabývá pouze dvou hodnot
a
tj. má alternativní rozdělení:
|
|
Předpokládejme, že náhodná veličina závisí na
veličinách
tzv. kovariáty. Data můžeme mít zadána různým způsobem:
-
jednotlivá pozorování
-
skupinově, tj. pro každou kombinaci kovariát známe absolutní četnosti úspěchů
a celkový počet pokusů
tedy máme k dispozici binomická data
kde
a data můžeme zapsat formou tabulky
-
skupinově, tj. pro každou kombinaci kovariát máme relativní četnost úspěchů
a celkový počet pokusů
kde
Data lze zapsat do tabulky
- pro nominální či ordinální kovariáty můžeme data psát do tzv. kontingenčních tabulek. Uvažujme jednoduchý příklad:
V dalším se soustřeďme na relativní četnosti úspěchů
Hlavním úkolem statistické analýzy je pak nalézt vztah mezi (tj. i
) a
tj. funkci
Protože chceme použít GLM modely, modelujeme pravděpodobnosti pomocí linkovacích funkcí
Nejjednodušším modelem je lineární model
Avšak tento model má řadu nevýhod, především je třeba zajistit, aby nabývala hodnot mezi
a
tedy je třeba přidat nějaké dodatečné podmínky. Proto, abychom tuto podmínku dodrželi, využijeme nějakou distribuční funkci
s odpovídající hustotou která se v tomto případě nazývá toleranční funkce (toleranční distribuce). Nyní si ukážeme několik modelů, které využívají různé toleranční distribuce.