Modely pro alternativní a binomická data
Předpokládejme, že sledovaná náhodná veličina nabývá pouze dvou hodnot a tj. má alternativní rozdělení:
Předpokládejme, že náhodná veličina závisí na veličinách tzv. kovariáty. Data můžeme mít zadána různým způsobem:
- jednotlivá pozorování
- skupinově, tj. pro každou kombinaci kovariát známe absolutní četnosti úspěchů a celkový počet pokusů tedy máme k dispozici binomická data
kde
a data můžeme zapsat formou tabulky
- skupinově, tj. pro každou kombinaci kovariát máme relativní četnost úspěchů a celkový počet pokusů
kde
Data lze zapsat do tabulky
- pro nominální či ordinální kovariáty můžeme data psát do tzv. kontingenčních tabulek. Uvažujme jednoduchý příklad:
V dalším se soustřeďme na relativní četnosti úspěchů
Hlavním úkolem statistické analýzy je pak nalézt vztah mezi (tj. i ) a tj. funkci
Protože chceme použít GLM modely, modelujeme pravděpodobnosti pomocí linkovacích funkcí
Nejjednodušším modelem je lineární model
Avšak tento model má řadu nevýhod, především je třeba zajistit, aby nabývala hodnot mezi a tedy je třeba přidat nějaké dodatečné podmínky. Proto, abychom tuto podmínku dodrželi, využijeme nějakou distribuční funkci
s odpovídající hustotou která se v tomto případě nazývá toleranční funkce (toleranční distribuce). Nyní si ukážeme několik modelů, které využívají různé toleranční distribuce.