Metoda křížového ověřování
Metoda křížového ověřování patří mezi nejužívanější metody pro odhad vyhlazovacího parametru. Myšlenka této metody je založena na minimalizaci jak je zřejmé z následující úvahy:
Definujme funkci křížového ověřování
(18) |
kde je odhad v bodě bez použití tohoto bodu.
Věta 5.8. Platí
tj. je nevychýleným odhadem
Důkaz. Spočítejme střední hodnotu funkce tj.
Dále upravme druhý člen tohoto vyjádření:
Odtud
Odhad je dán vztahem
Odtud plyne, že je pro každé nevychýleným odhadem Protože nezávisí na minimalizace odpovídá minimalizaci Jestliže předpokládáme, že dostaneme dobrou aproximaci optimální hodnoty
Obr. 9. Porovnání minima MISE (modrá, čárkovaná) a minima funkce křížového ověřování CV (červená, plná) pro simulovaná data z příkladu Jádrové odhady hustoty 2.1
|
Otázka. Jak hodnotu bude mít odhad vyhlazovacího parametru pomocí metody křížového ověřování pro hustotu z ukázkového příkladu Jádrové odhady hustoty 3.5?
Poznámka 5.9. Předpokládejme, že k=2. Pak vychýlení odhadu může být velké, jestliže nabývá velkých hodnot, tj. křivost hustoty je velká. Při vyhlazování se tato objevuje ve „vrcholech“, kde je vychýlení záporné, nebo v „údolích“, kde je vychýlení kladné. Odhad má tendenci „vyhladit“ tyto jevy, jak je patrné z následujícího obrázku.
Obr. 10. Zahlazení vrcholů a údolí při odhadu hustoty směsi normálních rozdělení, odhad (červená, plná), původní funkce (modrá, čárkovaná)
|
Příklad 5.10. Jádrový odhad hustoty dat z příkladu Jádrové odhady hustoty 2.1 je zobrazen na dalším obrázku. Pro rekonstrukci bylo použito Epanečnikovo jádro a vyhlazovací parametr určený metodou křížového ověřování
Obr. 11. Odhad hustoty s hCV =0,5628, odhad (červená, plná), původní funkce (modrá, čárkovaná)
|