Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické modelování Základní pojmy matematické statistiky Testování statistických hypotéz

Logo Matematická biologie

Testování statistických hypotéz

Mějme náhodný výběr  rozsahu z rozdělení o distribuční funkci  kde  Množina  nechť je neprázdná a otevřená.

 Předpokládejme, že o parametru   existují dvě konkurující si hypotézy:

Předpokládejme, že o parametru   existují dvě konkurující si hypotézy:
Tvrzení
Je-li jednobodová, nazývá se jednoduchou, v opačném případě složenou hypotézou.

O platnosti této hypotézy se má rozhodnout na základě náhodného výběru ,

a to tak, že platnost hypotézy 

Na testování použijeme statistiku , kterou nazýváme testovací statistikou. Množinu hodnot, které může testovací statistika nabýt, rozdělíme na dvě disjunktní oblasti. Jednu označíme  , a nazveme ji kritickou oblastí (nebo také oblastí zamítnutí hypotézy) a druhá je doplňkovou oblastí ( oblast nezamítnutí testované hypotézy).

Na základě realizace náhodného výběru  vypočítáme hodnotu testovací statistiky .

  • Pokud hodnota testovací statistiky  nabude hodnoty z kritické oblasti, tj. , pak nulovou hypotézu zamítáme.
  • Pokud hodnota testovací statistiky nabude hodnoty z oblasti nezamítnutí, tj. , tak nulovou hypotézu nezamítáme, což ovšem neznamená že přijímáme alternativu.

Toto rozhodnutí nemusí však být správné. V následující tabulce jsou uvedeny možné situace

PLATÍ NEPLATÍ

ZAMÍTAME

chyba 1. druhu ( je hladina testu)

O.K. (tzv. síla testu či silofunkce)
 pro 

NEZAMÍTAME

O.K.
chyba 2. druhu
pro 

 

  Volba kritického oboru  se řídí požadavky:
(1)

Chceme, aby pravděpodobnost chyby 1. druhu byla menší nebo rovna předem zvolenému malému  (obvykle se volí  nebo , tj. aby platilo pro 

 

Pro spojitá rozdělení je vždy možné (i když ne nutné) zvolit test, jehož hladina je právě rovna . U diskrétních rozdělení jsou možnými hladinami testu jen některé diskrétní hodnoty. Není-li zvolená hladina mezi nimi, rozhodneme se pro hladinu, která je nejbližší nižší (nebo nejbližší vyšší).

(2) Mezi testy na hladině  se pak snažíme zvolit test s co nejmenší pravděpodobností chyby druhého druhu, tj. co nejsilnější test.

 

Vidíme, že postavení obou hypotéz je nesymetrické. Za nulovou hypotézu volíme tu, jejíž neoprávněné zamítnutí (chyba 1. druhu) je závažnější.

Definice 7.1. Chybu, která spočívá v nesprávném zamítnutí nulové hypotézy, i když je správná, budeme nazývat chybou prvého druhu, pravděpodobnost

nazveme hladinou významnosti (též hladinou testu).

Chybu, která spočívá v nesprávném přijetí nulové hypotézy, i když neplatí, budeme nazývat chybou druhého druhu a její pravděpodobnost pro

Pravděpodobnost  nazýváme silou testu (též silou kritické oblasti ) a jakožto funkci  ji také nazveme silofunkcí testu.
 
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity