Statistické modelování
Autor: Mgr. Jan Koláček, Ph.D. (kolacek@math.muni.cz)
Tento text je určen zejména pro studenty předmětu „M5VM05 Statistické modelování“. Jde o nadstavbovou část základního kurzu pravděpodobnosti a matematické statistiky „Spojité modely a statistika B“, který je výchozím pro další teoretické i aplikačně zaměřené stochastické předměty.
Kurz nejprve obsahuje základy popisné statistiky a průzkumovou analýzu dat. Zabývá se vlastnostmi bodových odhadů, zejména nestranností a konzistencí. Zmínka je též o intervalových odhadech parametrů, především normálního rozdělení a také o odhadech založených na centrální limitní větě. V návaznosti na tuto problematiku kurz pokračuje testováním hypotéz. V další části jsou probrány obecné základy regresní a korelační analýzy. Na ty pak kurz navazuje klasickým lineárním regresním modelem, kde je kladen důraz zejména na odhad neznámých parametrů a testování hypotéz o těchto parametrech. Jako speciální příklad lineárních regresních modelů je dále podrobněji studována analýza rozptylu. V další části jsou úvahy rozšířeny na zobecněné lineární modely (tzv. „GLM modely“). Zejména se jedná o popis základních komponent modelů a aplikací GLM modelů v konkrétních případech. Závěr kurzu se ještě věnuje modelování závislosti mezi kvalitativními proměnnými.
Podstatná část textu byla převzata ze zdrojů [3, 5, 6] a také z výukových materiálů dr. Forbelské k předmětům „Lineární statistické modely I, II“ a „Zobecněné lineární modely“. Většina tvrzení je uvedena bez důkazů, ty lze nalézt ve výše uvedených zdrojích. Zkoumaná problematika je demonstrována na příkladech se snahou o lepší srozumitelnost textu. Pro více příkladů odkazujeme studenty na cvičení k tomuto kurzu.Závěrem bych rád poděkoval RNDr. Marii Budíkové, Dr. a RNDr. Marii Forbelské, Ph.D. za poskytnuté studijní materiály a za cenné rady a připomínky k tomuto textu.