Statistické vlastnosti jádrových odhadů hustoty
Stejně jako u jádrových odhadů jednorozměrných hustot můžeme kvalitu jádrového odhadu hustoty popsat lokálně pomocí střední kvadratické chyby:
nebo globálně pomocí střední integrální kvadratické chyby
Optimální vyhlazovací matice minimalizuje MISE. Je zřejmé, že tyto optimální hodnoty vyhlazovacích parametrů není možné z MISE přímo vyjádřit. Stejně jako u odhadu jednorozměrných hustot se budeme zabývat asymptotickou střední integrální kvadratickou chybou AMISE.
Výpočty pro matici třídy jsou velmi náročné, a proto se v dalších úvahách omezíme na odhady s diagonální maticí.
Věta 3.1. Předpokládejme, že funkce jádro a diagonální matice vyhlazovacích parametrů
splňují následující předpoklady:
-
Nechť je posloupnost matic takových, že a prvky a konvergují k nule pro
-
Dále nechť všechny druhé parciální derivace funkce jsou ohraničené, spojité a integrovatelné se čtvercem.
- Jádro splňuje
Pak platí
kde
(2) |
přičemž označení je ve shodě s předchozími kapitolami, tj.
Důkaz věty o tvaru AMISE je založen na Taylorově rozvoji funkce a lze jej nalézt např. v knize [14].
Hodnoty parametrů pro které AMISE nabývá minimální hodnoty, jsou dány vztahy:
|
|
(3) |
(4) |
Z těchto vztahů plyne, že množina přípustných vyhlazovacích parametrů je tvaru pro vhodné konstanty
Příklad 3.2. Předpokládejme, že známe tvar hustoty pro Vypočítejme hodnoty optimálních vyhlazovacích parametrů pro odhad se součinovým Epanečnikovým jádrem.
Podle vztahů Jádrové odhady dvourozměrných hustot 3 a Jádrové odhady dvourozměrných hustot 4 potřebujeme spočítat výrazy1
Pak pro optimální vyhlazovací parametry máme
Tedy
Oba parametry jsou totožné, což se dalo očekávat, protože hustota je symetrická jak podle osy tak podle osy
Tedy pro soubor o 100 prvcích bude vyhlazovací matice rovna Odhad s optimální vyhlazovací maticí pro tento datový soubor (viz tabulku Datové soubory Tabulka 7) jsou na obrázku Jádrové odhady dvourozměrných hustot 5.
Obr. 5. Odhad hustoty z ukázkového příkladu Jádrové odhady dvourozměrných hustot 3.2, odhad (červená, plná) a původní funkce (modrá, čárkovaná) při použití součinového Epanečnikova jádra
|
1Použili jsme metodu „per partes“ pro vícerozměrné integrály.