Bodové odhady
Bodovým odhadem parametrické funkce budeme rozumět nějakou statistiku , která bude pro různé náhodné výběry kolísat kolem .
Statistika závisí na parametru prostřednictvím distribuční funkce rozdělení, z něhož výběr pochází. Také rozdělení této statistiky, tj. náhodné veličiny, závisí na parametru . Proto střední hodnotu a rozptyl této statistiky budeme značit a .
Za lepší odhad se považuje ten, jehož rozdělení je více koncentrované okolo neznámé hodnoty parametru. Tento přirozený požadavek koncentrace rozdělení okolo skutečné hodnoty parametru vyjadřujeme pomocí střední hodnoty a rozptylu.
Definice 3.1. Nechť je náhodný výběr z rozdělení pravděpodobnosti , kde je vektor neznámých parametrů. Nechť je daná parametrická funkce.
Řekneme, že statistika je
nestranným (nevychýleným) |
odhadem parametrické
funkce
|
pokud pro platí
|
kladně vychýleným | ||
záporně vychýleným | ||
asymptoticky nestranným | ||
(slabě) konzistentním |
pokud pro platí tj. |
Poznámka 3.2. Vlastnost nestrannosti (tj. nevychýlenosti) ještě neposkytuje záruku dobrého odhadu, pouze vylučuje systematickou chybu.
Poznámka 3.3. (polopatě). Používání konzistentních odhadů zaručuje
- malou pravděpodobnost velké chyby v odhadu parametru, pokud rozsah výběru dostatečně roste;
- volbou dostatečně velkého počtu pozorování lze učinit chybu odhadu libovolně malou.
Příklad 3.4. GEOMETRICKÉ ROZDĚLENÍ.
Nechť náhodná veličina má geometrické rozdělení,
Veličina udává počet neúspěchů při výběru z alternativního rozdělení před výskytem prvního úspěchu. Nalezněte nestranný odhad pro .
Řešení. Je-li takový nestranný odhad, musí pro něj platit
Odtud dostáváme
takže musí platit
Tento odhad však není pokládán za vhodný, protože jen minimálně přihlíží k počtu neúspěchů před prvním úspěchem. Závisí jen na tom, zda úspěch nastal hned v prvním pokusu či nikoli.
Může se také stát, že nestranný odhad neexistuje, viz následující příklad.
Příklad 3.5. Parametrická funkce v případě BINOMICKÉHO ROZDĚLENÍ.
Nechť náhodná veličina má binomické rozdělení, tj. a
Ukažte, že neexistuje nestranný odhad pro parametrickou funkci
Řešení. Dokážeme sporem. Nechť existuje taková funkce , že pro každé platí
Na levé straně je však polynom proměnné nejvýše stupně , který samozřejmě nemůže být identicky roven na intervalu (0,1).
Nyní vyšetříme případ, kdy odhadovanými parametry jsou střední hodnota a rozptyl rozdělení, ze kterého náhodný výběr pochází.
Věta 3.6. Nechť je náhodný výběr z rozdělení, které má střední hodnotu pro . Pak výběrový průměr je nestranným odhadem střední hodnoty, tj.
Věta 3.7. Nechť je náhodný výběr z rozdělení, které má rozptyl pro . Pak výběrový rozptyl je nestranným odhadem rozptylu, tj.
Příklad 3.13. Nalezněte nejlepší nestranný lineární odhad střední hodnotyŘešení. Jak jsme již dříve spočítali, pro náhodný výběrplatí, ž střední hodnota výběrového průměru je rovnaa rozptyl výběrového průměru je rovenTedy variabilita této statistiky je krát menší než variabilita jednotlivých pozorování a tedy hodnoty statistiky jsou více koncentrovány kolem odhadované střední hodnoty než jednotlivá pozorování . Navíc je statistika je lineární funkcí náhodných veličin .Uvažujme všechny lineární statistiky tvaru , kde , které jsou nestrannými odhady střední hodnoty tj. pro musí platitTím jsme dostali první podmínku, která se týká nestrannosti odhadu. Nyní budeme hledat taková která minimalizují rozptyla pro něž platí , tedy hledáme vázaný extrém, takže použijeme Lagrangeovu1 funkci s multiplikátorem tj.Pak pro
Prvních rovnic implikuje, žeOznačme společnou hodnotu symbolem Díky poslední rovnici dostanemetedy výběrový průměr je nejlepším nestranným lineárním odhadem střední hodnotyZkusme provést důkaz ještě jiným způsobem. Nechť je libovolný nestranný lineární odhad pro (tj. nutně musí platit
Položíme-li pro je minimalizace výrazu za podmínky ekvivalentní s úlohou minimalizovat za podmínky Za této podmínky je však
což je minimální pro
Tedy nejlepším nestranným lineárním odhadem je lineární kombinace s koeficienty .