Interval spolehlivosti pro koeficient korelace
V praxi bývá velice užitečný také interval spolehlivosti pro koeficient korelace, který nám poskytuje názornou představu o závislosti dvou normálně rozdělených náhodných veličin.
Věta 4.12. Jestliže dvourozměrný náhodný výběr rozsahu pochází z dvourozměrného normálního rozložení, jehož koeficient korelace se příliš neliší od nuly a rozsah výběru je dostatečně velký lze odvodit, že interval spolehlivosti pro má meze
Nejsou-li uvedené podmínky splněny, pak nelze tento vzorec použít, protože rozložení výběrového korelačního koeficientu je příliš zešikmené. V takovém případě využijeme následujícího tvrzení.
Věta 3.13. Náhodná veličina
má i při malém rozsahu výběru přibližně normální rozložení se střední hodnotou
(2. sčítanec lze při větším zanedbat) a rozptylem
Standardizací veličiny dostaneme veličinu
která má asymptoticky rozložení
Tudíž asymptotický interval spolehlivosti pro bude mít meze Interval spolehlivosti pro pak dostaneme zpětnou transformací.
Poznámka 4.14. Jelikož dostáváme a meze intervalu spolehlivosti pro můžeme psát ve tvaru
Příklad 4.15. Pracovník personálního oddělení určité firmy zkoumá, zda existuje vztah mezi počtem dní absence za rok (veličina ) a věkem pracovníka (veličina ). Proto náhodně vybral údaje o 10 pracovnících.
Za předpokladu, že uvedené údaje tvoří číselné realizace náhodného výběru rozsahu 10 z dvourozměrného normálního rozložení, vypočtěte výběrový koeficient korelace a na hladině významnosti 0,05 testujte hypotézu, že a jsou nezávislé náhodné veličiny. Sestrojte 95% asymptotický interval spolehlivosti pro skutečný koeficient korelace
Řešení. Předpoklad o dvourozměrné normalitě dat ověříme orientačně pomocí dvourozměrného tečkového diagramu:
Obr. 2. Dvourozměrný tečkový diagramVzhled diagramu svědčí o tom, že předpoklad je oprávněný.
Testujeme proti Vypočítáme tedy mezi věkem pracovníka a počtem dnů pracovní neschopnosti existuje silná nepřímá lineární závislost. Testová statistika: kvantil kritický obor
Jelikož zamítáme na hladině významnosti 0,05 hypotézu o nezávislosti veličin a Vypočítáme
Meze 95% asymptotického intervalu spolehlivosti pro jsou tedy s pravděpodobností přibližně 0,95.