Výpočet Pearsonova korelačního koeficientu
Teoretický výpočet je podmíněn znalostí konkrétního rozdělení pravděpodobnosti náhodného vektoru , což se v praxi stává velmi zřídka. Lineární vztah náhodných veličin a tak kvantifikujeme na základě výběrového souboru. Výběrový Pearsonův korelační koeficient standardně značíme a při jeho výpočtu vycházíme z realizace dvourozměrného náhodného vektoru o rozsahu , tedy dvojic pozorovaných hodnot náhodných veličin a pro první až -tou experimentální jednotku:
. |
(2) |
Výpočet výběrového Pearsonova korelačního koeficientu je pak následující:
, |
(3) |
kde a jsou výběrové průměry, a jsou výběrové směrodatné odchylky. Na obrázku 2 jsou zobrazeny realizace náhodných veličin a a k nim příslušné výběrové korelační koeficienty pro čtyři různé situace: graf vlevo nahoře odpovídá úplné lineární závislosti; graf vpravo nahoře ukazuje příklad relativně silné záporné korelace; vlevo dole pak vidíme slabě kladně korelované veličiny; vpravo dole jsou nakonec zobrazeny veličiny nekorelované.
Příklad 1 . Vypočítejme výběrový Pearsonův korelační koeficient kvantifikující korelaci mezi výškou a hmotností studentů předmětu Biostatistika v jarním semestru 2010. Pozorované hodnoty (realizace náhodného vektoru o rozsahu = 13) jsou uvedeny v tabulce 1, navíc jsou předmětem obrázku 1.
Tabulka 1: Pozorované hodnoty výšky a hmotnosti 13 studentů.
175 |
166 |
170 |
169 |
188 |
175 |
176 |
171 |
173 |
175 |
173 |
174 |
169 |
69 |
55 |
67 |
52 |
90 |
53 |
57 |
57 |
68 |
73 |
62 |
90 |
63 |
Výpočet výběrových statistik pro jednoduchost vynecháme (laskavý čtenář si je může jednoduše dopočítat na základě dat v tabulce 1), dosazením do vztahu (3) získáme následující hodnotu výběrového Pearsonova korelačního koeficientu:
. |
(4) |
Hodnota =0,64 ukazuje na silnou korelaci, kdy s vyšší výškou roste i hmotnost, což odpovídá očekávání, nicméně je třeba si uvědomit malou velikost výběrového souboru a dvě odlehlé hodnoty na obrázku 1 odpovídající hmotnosti 90 kg, které úplně nekorespondují se zbytkem souboru. Obě tyto skutečnosti ovlivňují výslednou hodnotu .
Obr. 2: Ukázky realizací náhodných veličin a a vypočtené výběrové korelační koeficienty.