Intervalové odhady
Odhady, jimiž jsme se doposud zabývali, se někdy nazývají bodové odhady parametrické funkce . Je tomu tak proto, že pro danou realizaci náhodného výběru představuje odhad daný statistikou jediné číslo (bod), které je v jistém smyslu přiblížením ke skutečné hodnotě parametrické funkce .
Úlohu odhadu však lze formulovat i jiným způsobem. Jde o to, sestrojit na základě daného náhodného výběru takový interval, jehož hranice jsou statistiky, a který se s dostatečně velkou přesností pokryje skutečnou hodnotu parametrické funkce V tomto případě mluvíme o intervalovém odhadu parametrické funkce
Podobná je úloha zkonstruovat na základě náhodného výběru statistiku, o níž lze s dostatečně velkou spolehlivostí prohlásit, že skutečná hodnota parametrické funkce je větší než tato statistika. V tomto případě mluvíme o dolním odhadu parametrické funkce Analogicky lze zavést pomocí opačné nerovnosti pojem horního odhadu
Potom intervaly nazveme intervalem spolehlivosti pro parametrickou funkci jestliže
Jestliže
pak statistiku nazýváme dolním odhadem parametrické funkce se spolehlivostí (nebo s rizikem ).
Jestliže
pak statistiku nazýváme horním odhadem parametrické funkce se spolehlivostí (nebo s rizikem ).
Poznámka 4.2. (polopatě). Vysvětleme si nyní smysl pojmu spolehlivost intervalových odhadů.
Konkrétní data (tj. realizace náhodného výběru ) nejsou náhodnými veličinami, nýbrž jsou to výsledky určitého pokusu , tj.
Sestrojíme-li tedy na jejich základě intervalový odhad, řekněme , parametrické funkce , pak nemá smysl mluvit o pravděpodobnosti , protože všechny tři symboly jsou reálná čísla (třebaže neznáme) a nerovnost buď platí nebo neplatí, tj. náš intervalový odhad je buď správný nebo nesprávný.
Budeme-li však sestrojovat intervalové odhady vícekrát po sobě, pak poměrná četnost případů, kdy intervalový odhad bude správný, bude přibližně rovna .
Číslo se volí poměrně malé, nejčastěji
Kromě dostatečné spolehlivosti bychom chtěli, aby interval byl co možná nejkratší.
Tyto požadavky jsou však (při pevném rozsahu výběru ) protichůdné. Žádáme-li větší spolehlivost, musíme se smířit s delším intervalem; žádáme-li naopak kratší interval, musíme se smířit s nižší spolehlivostí.
Návod 4.3. Popíšeme nyní jednu metodu konstrukce intervalových odhadů, která je použitelná ve většině případů.
(1) |
Najdeme nějakou tzv. PIVOTOVOU STATISTIKU, tj. funkci náhodného výběru a parametrické funkce , tedy náhodnou veličinu tak aby její rozdělení již nezáviselo na parametru |
|
(2) |
Nechť a jsou kvantily rozdělení statistiky Pak pro všechna platí |
|
(3) |
Jestliže lze nerovnosti v závorce převést ekvivalentními úpravami na tvar, kde mezi nerovnostmi stojí jen , pak jsme sestrojili intervalový odhad o spolehlivosti Tedy, je-li ryze monotónní funkce, pak existuje inverzní funkce
|
|
(a) |
Pokud je rostoucí funkce, pak platí |
|
(b) |
Pokud je klesající funkce, pak platí |
Při konstrukci intervalových odhadů hrají důležitou roli kvantily. Tabulka Základní pojmy matematické statistiky 1 udává jejich značení pro některá rozdělení. Navíc je dobré si uvědomit následující vlastnost.
Je-li distribuční funkce absolutně spojitá a ryze monotónní a je-li příslušná hustota sudá funkce, pak platí
a odtud
což speciálně platí pro normální a Studentovo rozdělení.