Testování statistických hypotéz
Mějme náhodný výběr rozsahu z rozdělení o distribuční funkci kde Množina nechť je neprázdná a otevřená.
Předpokládejme, že o parametru existují dvě konkurující si hypotézy:
Předpokládejme, že o parametru existují dvě konkurující si hypotézy: |
Tvrzení |
Je-li | jednobodová, nazývá se jednoduchou, v opačném případě složenou hypotézou. |
O platnosti této hypotézy se má rozhodnout na základě náhodného výběru ,
a to tak, že | platnost hypotézy |
Na testování použijeme statistiku , kterou nazýváme testovací statistikou. Množinu hodnot, které může testovací statistika nabýt, rozdělíme na dvě disjunktní oblasti. Jednu označíme , a nazveme ji kritickou oblastí (nebo také oblastí zamítnutí hypotézy) a druhá je doplňkovou oblastí ( oblast nezamítnutí testované hypotézy).
Na základě realizace náhodného výběru vypočítáme hodnotu testovací statistiky .
- Pokud hodnota testovací statistiky nabude hodnoty z kritické oblasti, tj. , pak nulovou hypotézu zamítáme.
- Pokud hodnota testovací statistiky nabude hodnoty z oblasti nezamítnutí, tj. , tak nulovou hypotézu nezamítáme, což ovšem neznamená že přijímáme alternativu.
Toto rozhodnutí nemusí však být správné. V následující tabulce jsou uvedeny možné situace
PLATÍ | NEPLATÍ | |
ZAMÍTAME
|
chyba 1. druhu ( je hladina testu)
|
O.K. (tzv. síla testu či silofunkce)
pro
|
NEZAMÍTAME
|
O.K.
|
chyba 2. druhu
pro
|
Volba kritického oboru se řídí požadavky: | |
(1) |
Chceme, aby pravděpodobnost chyby 1. druhu byla menší nebo rovna předem zvolenému malému (obvykle se volí nebo , tj. aby platilo pro Pro spojitá rozdělení je vždy možné (i když ne nutné) zvolit test, jehož hladina je právě rovna . U diskrétních rozdělení jsou možnými hladinami testu jen některé diskrétní hodnoty. Není-li zvolená hladina mezi nimi, rozhodneme se pro hladinu, která je nejbližší nižší (nebo nejbližší vyšší). |
(2) | Mezi testy na hladině se pak snažíme zvolit test s co nejmenší pravděpodobností chyby druhého druhu, tj. co nejsilnější test. |
Vidíme, že postavení obou hypotéz je nesymetrické. Za nulovou hypotézu volíme tu, jejíž neoprávněné zamítnutí (chyba 1. druhu) je závažnější.
Definice 7.1. Chybu, která spočívá v nesprávném zamítnutí nulové hypotézy, i když je správná, budeme nazývat chybou prvého druhu, pravděpodobnost
nazveme hladinou významnosti (též hladinou testu).
Chybu, která spočívá v nesprávném přijetí nulové hypotézy, i když neplatí, budeme nazývat chybou druhého druhu a její pravděpodobnost pro