Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Základy regresní a korelační analýzy Motivace

Logo Matematická biologie

Motivace

V předcházejících kapitolách jsme zkoumali jednotlivé jevy (statistické znaky) izolovaně; zabývali jsme se tzv. jednorozměrnými soubory, tj. soubory popisujícími pouze jeden statistický znak a nezajímaly nás jeho vazby a vztahy k jiným jevům. V reálném světě (v přírodě, společnosti, ekonomice,...) se ovšem jevy nacházejí ve více nebo méně složitých vzájemných vztazích - navzájem na sobě závisí a podmiňují se. Proto se statistická analýza nemůže omezit pouze na zkoumání izolovaných jevů, ale musí se také zabývat analýzou jejich vzájemných vztahů. Tato analýza se dá obecně rozdělit na dvě části: regresní a korelační. Popišme si podrobněji podstatu obou typů analýz.

Úloha regresní analýzy

Hlavní úlohou regresní analýzy je provést predikci nějaké závisle proměnné náhodné veličiny na základě informace, kterou poskytují měření nějakých jiných náhodných veličin, řekněme . Veličinám    se potom říká nezávisle proměnné nebo též doprovodné proměnné, nebo také kovariáty. Měření nezávislých proměnných jsou pro experimentátora snáze dostupné než měření závisle proměnné .

Predikce spočívá v nalezení nějaké funkce , která vhodně aproximuje závisle proměnnou . Kvalita predikce se obvykle posuzuje pomocí tzv. střední kvadratické chyby predikce . Za optimální se považuje volba takové predikční funkce , která uvedenou střední kvadratickou chybu minimalizuje.

Úloha korelační analýzy

Vedle průběhu sledované závislosti na  dané funkcí je také třeba se zaměřit na měření těsnosti tohoto vztahu, tedy je nutné zavést nějaké míry velikosti statistické vazby (závislosti) závisle proměnné na nezávisle proměnných  s ohledem na vybranou funkci a případně také s ohledem na závislosti mezi náhodnými veličinami . Tato problematika je hlavní úlohou korelační analýzy. K tomuto účelu byly zkonstruovány různé koeficienty, které nabývají hodnot od 0 do 1 (resp. od -1 do 1). Čím je takový koeficient bližší 1 (resp. -1), tím je závislost mezi danými dvěma veličinami silnější a čím je bližší 0, tím je slabší.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity