Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datTeorie a praxe jádrového vyhlazování Jádrové odhady distribuční funkce Statistické vlastnosti odhadu

Logo Matematická biologie

Statistické vlastnosti odhadu

Kvalitu jádrového odhadu lze lokálně popsat pomocí střední kvadratické chyby

 

Spočítejme nejdříve hodnotu v bodě

 

Předpokládejme dále, že Označme první integrál a druhý Integrál počítáme metodou per partes a využijeme vlastnosti funkce

 
   
   
  (2)

Dále použijeme Taylorův rozvoj tedy

 
   

Počítejme nyní integrál

 
uvažujeme-li substituce dostaneme  
  (3)

Vychýlení odhadu je tedy tvaru

Poznámka 3.1. Vztahy Jádrové odhady distribuční funkce (2) a Jádrové odhady distribuční funkce (3) dávají zajímavý vztah pro vychýlení

Odtud plyne

A dále (z Taylorova vzorce)

 
 

 

Nyní dokážeme tvar rozptylu.

Zde Počítáme tedy jen integrál (označme jej ):

 
 

První integrál počítáme metodou per partes a máme

 
použijeme nyní Taylorův rozvoj funkce
 
 
užitím vlastností funkce a dostaneme
 

Rozptyl je tedy tvaru

 

Výše uvedené výsledky můžeme nyní zformulovat v následující větě:

Věta 3.2. Nechť pro Pak

(4)
 

 

Globální pohled na kvalitu odhadu lze získat prostřednictvím střední integrální kvadratické chyby

 

Věta 3.3. Nechť a Pak

(5)

kde


Naším cílem je nalézt takovou hodnotu vyhlazovacího parametru, pro kterou bude nabývat minimální hodnoty. Ale uvedený tvar není pro takovou analýzu vhodný, a proto (stejně jako při odhadu hustoty a regresní funkce) budeme uvažovat asymptotickou střední integrální kvadratickou chybu která v tomto případě je tvaru:

(6)

Nyní už lze standardními metodami matematické analýzy nalézt takovou hodnotu pro kterou nabývá minimální hodnoty. Je snadné ukázat, že

(7)

a pak

(8)

Poznámka 3.4. Optimální hodnota vyhlazovacího parametru pro odhad distribuční funkce je řádu zatímco pro odhad hustoty s jádrem je vyhlazovací parametr řádu

Příklad 3.5. Předpokládejme, že známe tvar distribuční funkce pro Vypočítejme hodnotu optimálního vyhlazovacího parametru pro odhad s jádrem řádu 2.

Podle vztahu Jádrové odhady distribuční funkce (7) potřebujeme spočítat hodnoty a S Epanečnikovým jádrem je

Pak

Na následujícím obrázku je odhad s optimálním vyhlazovacím parametrem pro náhodný výběr o 50 pozorování, která pochází z rozdělení s uvedenou distribuční funkcí (data jsou v tabulce Datové soubory Tabulka 4).

Obr. 5. Odhad distribuční funkce z ukázkového příkladu Jádrové odhady distribuční funkce 3.5, odhad (červená, plná) a původní funkce (modrá, čárkovaná) za použití Epanečnikova jádra a hopt,0,2=0,3432
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity