Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Základní pojmy matematické statistiky Bodové odhady

Logo Matematická biologie

Bodové odhady

Bodovým odhadem parametrické funkce  budeme rozumět nějakou statistiku , která bude pro různé náhodné výběry kolísat kolem .

 

Statistika závisí na parametru prostřednictvím distribuční funkce rozdělení, z něhož výběr pochází. Také rozdělení této statistiky, tj. náhodné veličiny, závisí na parametru . Proto střední hodnotu a rozptyl této statistiky budeme značit  a .

Za lepší odhad se považuje ten, jehož rozdělení je více koncentrované okolo neznámé hodnoty parametru. Tento přirozený požadavek koncentrace rozdělení okolo skutečné hodnoty parametru vyjadřujeme pomocí střední hodnoty a rozptylu.

 

Definice 3.1. Nechť  je náhodný výběr z rozdělení pravděpodobnosti , kde je  vektor neznámých parametrů.  Nechť je daná parametrická funkce.

Řekneme, že statistika  je

nestranným (nevychýleným)
odhadem parametrické
funkce 

pokud pro  platí 

kladně vychýleným  
záporně vychýleným  
asymptoticky nestranným  
(slabě) konzistentním  

pokud pro  platí 

tj.  

 

Poznámka 3.2. Vlastnost nestrannosti (tj. nevychýlenosti) ještě neposkytuje záruku dobrého odhadu, pouze vylučuje systematickou chybu. 

 

Poznámka 3.3. (polopatě). Používání konzistentních odhadů zaručuje

  • malou pravděpodobnost velké chyby v odhadu parametru, pokud rozsah výběru dostatečně roste;
  • volbou dostatečně velkého počtu pozorování lze učinit chybu odhadu libovolně malou.

 

Příklad 3.4. GEOMETRICKÉ ROZDĚLENÍ.

Nechť náhodná veličina  má geometrické rozdělení,

Veličina  udává počet neúspěchů při výběru z alternativního rozdělení před výskytem prvního úspěchu. Nalezněte nestranný odhad pro .

Řešení. Je-li takový nestranný odhad, musí pro něj platit

Odtud dostáváme

takže musí platit

Tento odhad však není pokládán za vhodný, protože jen minimálně přihlíží k počtu neúspěchů před prvním úspěchem. Závisí jen na tom, zda úspěch nastal hned v prvním pokusu či nikoli.

Může se také stát, že nestranný  odhad neexistuje, viz následující příklad.

Příklad 3.5. Parametrická funkce  v případě BINOMICKÉHO ROZDĚLENÍ.

Nechť náhodná veličina  má binomické rozdělení, tj.  a

Ukažte, že neexistuje nestranný odhad pro parametrickou funkci

Řešení. Dokážeme sporem. Nechť existuje taková funkce , že pro každé  platí

Na levé straně je však polynom proměnné   nejvýše stupně , který samozřejmě nemůže být identicky roven  na intervalu (0,1).

 

Nyní vyšetříme případ, kdy odhadovanými parametry jsou střední hodnota a rozptyl rozdělení, ze kterého náhodný výběr pochází.

 

Věta 3.6. Nechť je náhodný výběr z rozdělení, které má střední hodnotu  pro . Pak výběrový průměr je nestranným odhadem střední hodnoty, tj.

Věta 3.7. Nechť je náhodný výběr z rozdělení, které má rozptyl pro . Pak výběrový rozptyl je nestranným odhadem rozptylu, tj.

 
Následující věta udává postačující podmínku pro konzistentní odhad.
 
Věta 3.8. Nechť statistika je nestranný nebo asymptoticky nestranný odhad parametrické funkce a platí
 
 
Pak je statistika konzistentním odhadem parametrické funkce .
 
Využitím této věty se dají ukázat následující vlastnosti výběrového průměru a výběrového rozptylu.
 
Důsledek 3.9. Nechť je náhodný výběr z rozdělení, které má pro střední hodnotu a rozptyl , tj
 
Potom je-li , pak výběrový průměr  je slabě konzistentním odhadem .
 
 
Důsledek 3.10. Nechť je náhodný výběr z rozdělení, které má pro  střední hodnotu a rozptyl , tj.
 
Potom je-li , pak výběrový rozptyl  je slabě konzistentním odhadem .
 
 
Poznámka 3.11. VÍCE NESTRANNÝCH ODHADŮ. Obecně může existovat více nestranných odhadů. Například nejen výběrový průměr je nestranným odhadem střední hodnoty , ale i každé jednotlivé pozorování nebo každá jeho lineární kombinace , pro kterou platí
Pokud tedy existuje více nestranných odhadů je přirozenou otázkou, který z nich je nejlepší. Za nejlepší můžeme považovat ten, který má nejmenší rozptyl mezi všemi nestrannými odhady.
Rozdělení každé statistiky však závisí na parametru , z čehož vyplývá, že i rozptyl nestranné statistiky závisí na parametru Může se stát, že odhad minimalizující rozptyl při určité hodnotě parametru není vhodný pro jinou hodnotu parametru - existuje jiný nestranný (nevychýlený) odhad, který má při této hodnotě parametru menší rozptyl. Pokud taková situace nenastane, mluvíme o rovnoměrně nejlepším nestranném odhadu.
 
Definice 3.12. Nechť je nestranný odhad parametrické funkce a pro všechna  platí 
 
 
kde  je libovolný nestranný odhad parametru Potom odhad nazveme (rovnoměrně) nejlepším nestranným odhadem parametrické funkce
 
Příklad 3.13. Nalezněte nejlepší nestranný lineární odhad střední hodnoty
 
Řešení. Jak jsme již dříve spočítali, pro náhodný výběr 
 platí, ž střední hodnota výběrového průměru je rovna
 
a rozptyl výběrového průměru je roven
 
Tedy variabilita této statistiky je  krát menší než variabilita jednotlivých pozorování  a tedy hodnoty statistiky jsou více koncentrovány kolem odhadované střední hodnoty než jednotlivá pozorování . Navíc je statistika je lineární funkcí náhodných veličin .
Uvažujme všechny lineární statistiky tvaru , kde , které jsou nestrannými odhady střední hodnoty  tj. pro musí platit
 
 
Tím jsme dostali první podmínku, která se týká nestrannosti odhadu. Nyní budeme hledat taková  která minimalizují rozptyl
 
 
a pro něž platí , tedy hledáme vázaný extrém, takže použijeme Lagrangeovu1 funkci s multiplikátorem  tj.
 
 
Pak pro 
 
 
Prvních  rovnic implikuje, že
 
Označme společnou hodnotu symbolem  Díky poslední rovnici dostaneme
 
 
tedy výběrový průměr je nejlepším nestranným lineárním odhadem střední hodnoty
 
Zkusme provést důkaz ještě jiným způsobem. Nechť  je libovolný nestranný lineární odhad pro (tj. nutně musí platit
 
Položíme-li pro
je minimalizace výrazu za podmínky
ekvivalentní s úlohou minimalizovat za podmínky

Za této podmínky je však

což je minimální pro

Tedy nejlepším nestranným lineárním odhadem je lineární kombinace  s koeficienty .

 

 
 

1Joseph Louis Lagrange (1736-1813) – italsko–francouzský matematik a astronom
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity