Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Vícerozměrné statistické testy Vícerozměrný dvouvýběrový t-test

Logo Matematická biologie

Vícerozměrný dvouvýběrový t-test

Představme si, že máme dvě skupiny objektů či subjektů (např. pacienty se schizofrenií a zdravé subjekty), u nichž byly naměřeny hodnoty celé řady proměnných (např. objemy mozkových struktur, výsledky kognitivních testů apod.), a chtěli bychom zjistit, zda se tyto dvě skupiny od sebe liší. Srovnání těchto skupin podle každé proměnné zvlášť pomocí klasického jednorozměrného dvouvýběrového t-testu nám v tomto případě nestačí, protože bychom se na data nedívali globálně a mohly by nám tak uniknout některé souvislosti, vztahy atd. Vhodnou volbou je v tomto případě použití vícerozměrného dvouvýběrového t-testu.  

Při odvozování vícerozměrného dvouvýběrového t-testu začneme od stručného popisu jednorozměrného dvouvýběrového t-testu. Cílem jednorozměrného dvouvýběrového t-testu je srovnání dvou skupin dat popsaných jednou proměnnou, přičemž skupiny jsou na sobě nezávislé, tedy mezi objekty neexistuje vazba (Obr. 1). Předpokladem tohoto testu je normalita dat v obou skupinách a shodnost (homogenita) rozptylů ve skupinách.

Obr. 1: Ilustrace srovnání dvou skupin subjektů – pacientů (označeni červeně) a zdravých kontrol (označeni šedě) – na základě jedné proměnné (objem hipokampu). Skupiny jsou znázorněny pomocí hustot normálního rozdělení pravědpodobnosti s vyznačenými výběrovými průměry.

Testová statistika jednorozměrného dvouvýběrového t-testu je  , kde  je Studentovo t rozdělení pravděpodobnosti s  stupni volnosti,  jsou výběrové průměry hodnot dané proměnné u pacientů a kontrol,  je vážený rozptyl vypočtený jako , přičemž   jsou rozptyly dané proměnné u pacientů a kontrol, a c je konstanta, o kterou se má rozdíl průměrů lišit (zpravidla ). Nulová hypotéza o shodě středních hodnot  je zamítnuta, pokud .

Využijeme nyní toho, že jednorozměrný dvouvýběrový t-test se statistikou T je ekvivalentní testu

(1)

 

kde , tedy  se řídí Fisherovým F rozdělením pravděpodobnosti se stupni volnosti 1 a . Nulová hypotéza o shodě středních hodnot  je zamítnuta v případě, že .

Jak už bylo naznačeno výše, vícerozměrný dvouvýběrový t-test použijeme v případě, že chceme srovnat dvě skupiny dat, které jsou popsány více proměnnými (Obr. 2). Při odvození vícerozměrného dvouvýběrového t-testu vyjdeme ze vztahu (1), přičemž výběrové průměry  nahradíme za vektory výběrových průměrů  a  a vážený rozptyl  nahradíme za váženou kovarianční matici , kde  a  jsou výběrové kovarianční matice pacientů a kontrol. Získáváme tak dvouvýběrovou Hotellingovu  testovou statistiku

(2)

kde c je vektor konstant, o kterou se mají rozdíly vektorů výběrových průměrů lišit (zpravidla nulový vektor) a  má Hotellingovo rozdělení s parametry , , kde . Předpoklady jsou analogické jako při použití jednorozměrného dvouvýběrového t-testu, tedy předpokladem je vícerozměrná normalita dat v obou skupinách a shodnost kovariančních matic.

 

Obr. 2: Ilustrace srovnání dvou skupin subjektů – pacientů (označeni červeně) a zdravých kontrol (označeni šedě) – na základě dvou proměnných (objem hipokampu a objem mozkových). Skupiny jsou znázorněny pomocí hustot normálního rozdělení pravědpodobnosti s vyznačenými vektory výběrových průměrů.

Hotellingovu  testovou statistiku můžeme transformovat na F statistiku se stejnými parametry jako testová statistika  pomocí

(3)

Nulová hypotéza o shodě vektorů středních hodnot  je zamítnuta, pokud , což je vnější část p-rozměrného elipsoidu se středem v   . Pokud by sestrojený elipsoid obsahoval bod daný vektorem c (pokud je c nulový vektor, jedná se o počátek souřadnic), nezamítáme nulovou hypotézu o shodě vektorů středních hodnot. V opačném případě (tzn., leží-li bod c mimo elipsoid), zamítáme nulovou hypotézu.

Poznámka: Analogickým způsobem je možné odvodit vícerozměrný párový t-test z jednorozměrného párového t-testu.

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict