Ověření předpokladů modelu
Jak jsme si ukázali v kapitole Lineární regresní model , lineární regresní model musí splňovat několik předpokladů, které se přímo vztahují k reziduím: ta musí mít střední hodnotu rovnu 0, rozptyl musí být pro všechna pozorování stejný, pokud využíváme předpokladu o normálním rozložení (statistické testy), musí platit, že rezidua jsou normálně rozdělená. Ukážeme si nyní, jak se používají grafické nástroje pro zhodnocení těchto předpokladů – analýza reziduí.
Vektor reziduí, se kterým budeme pracovat, je definován následovně, jako rozdíl mezi hodnotami výsledku skutečně pozorovanými () a predikovanými naším statistickým modelem ():
Ukážeme si nyní, jaké grafy lze pro hodnocení jednotlivých předpokladů použít:
Předpoklad: Střední hodnota reziduí je rovna 0
- sestrojte x-y graf: rezidua vs. jednotlivé nezávisle proměnné
- body musí být symetrické podle nulové hodnoty, pokud je v datech patrný trend (ať už lineární nebo jakékoliv zahnutí), znamená to patrně, že zvolená lineární forma pro závislost mezi prediktorem a výsledkem není adekvátní. Zkuste vstupní prediktor transformovat (např. polynom, logaritmus, aj.)
Předpoklad: Rezidua mají homogenní rozptyl
- sestrojte x-y graf: rezidua vs. jednotlivé nezávisle proměnné nebo rezidua vs. predikovaný výsledek
- rezidua by měla být stále stejně rozptýlena okolo nulové hodnoty, pokud tomu tak není („obálka“ reziduí má trychtýřovitý tvar), zkuste transformovat prediktor nebo výsledek
Předpoklad: Rezidua mají normální rozdělení
- sestrojte graf, ze kterého posoudíte rozdělení reziduí: histogram nebo N-P diagram reziduí
- pokud je porušen předpoklad o normálním rozložení reziduí, opět můžete vyzkoušet transformovat prediktor nebo výsledek