Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datAplikovaná analýza přežití Metody pro srovnání odhadů přežití Mantelův-Haenszelův log-rank test

Logo Matematická biologie

Mantelův-Haenszelův log-rank test

Log-rank test, který se stejně jako Kaplanův-Meierův odhad funkce přežití stal standardem v hodnocení klinických studií, byl navržen v roce 1959 Mantelem a Haenszelem jako modifikace testu pro analýzu stratifikovaných kontingenčních tabulek. Důvodem pro označení log-rank test je fakt, že testovou statistiku lze odvodit z pořadí (ranks) hodnot pozorovaných časů přežití v jednotlivých skupinách subjektů. My zde však odvodíme testovou statistiku pomocí principu využívaného v analýze kontingenčních tabulek, jmenovitě v případě Pearsonova chí-kvadrát testu. Odvoďme nejprve log-rank test pro dvě skupiny subjektů. Předpokládejme v obou skupinách celkem různých časů přežití takových, že platí . V každém z těchto časů přežití můžeme sestavit kontingenční tabulku shrnující pozorované přežití v obou skupinách. Označme a počty subjektů v riziku v čase ve skupině 1 a 2 a obdobně a počty sledovaných událostí v čase ve skupině 1 a 2. Pak příkladem kontingenční tabulky shrnující pozorované přežití ve skupinách 1 a 2 v čase je tabulka 5.1. Předpokládejme, že obě skupiny jsou na začátku sledování stejně početné. Pak bychom za platnosti nulové hypotézy o tom, že mezi skupinami 1 a 2 není rozdíl v přežití, měli v čase pozorovat přibližně stejně událostí v jedné i druhé skupině, jinými slovy hodnoty a by měly být přibližně stejné. Podobná úvaha za platnosti platí i pro zbývajících časů přežití. V celkovém součtu všech časů přežití pak logicky za platnosti očekáváme i stejný počet událostí v obou skupinách. Jakákoliv odchylka od tohoto předpokladu indikuje rozdílné přežití ve skupinách 1 a 2.

Tabulka 5.1 Pozorované počty událostí v čase .

Skupina

Počet subjektů v riziku v čase

Počet událostí

v čase

Počet subjektů bez události v čase

1

2

Celkem

Mantel a Haenszel navrhli hodnocení s pomocí pozorovaných četností , , a za podmínky pevně daných marginálních četností, což vede k hodnocení (ostatní pozorované četnosti jsou vzhledem k pevným marginálním četnostem dané). Za platnosti lze ukázat, že náhodná veličina má hypergeometrické rozdělení pravděpodobnosti a její podmíněná střední hodnota má tvar

E ( d 1 i ) = R 1 i d i R i

(5.9)

Podmíněný rozptyl má tvar

(5.10)

V čase lze tedy rozdíl mezi pozorovanou a očekávanou četností výskytu sledované události ve skupině 1 vyjádřit jako rozdíl . Logickým rozšířením přes všech pozorovaných časů přežití je pak statistika definovaná jako

U = n i = 1 ( d 1 i - E ( d 1 i ) )

(5.11)

Jednoduše řečeno, statistika vyjadřuje rozdíl mezi celkovým a očekávaným počtem sledovaných událostí ve skupině 1. Navíc, za platnosti bude mít statistika přibližně normální rozdělení pravděpodobnosti s nulovou střední hodnotou. Její rozptyl lze za předpokladu nezávislosti jednotlivých pozorovaných časů přežití vyjádřit jako součet rozptylů jednotlivých komponent , tedy jako

var ( U ) = n i = 1 var ( d 1 i )

(5.12)

Má-li statistika přibližně normální rozdělení pravděpodobnosti s nulovou střední hodnotou, pak statistika má přibližně normální rozdělení pravděpodobnosti s nulovou střední hodnotou a jednotkovým rozptylem (aproximace je tím lepší, čím více máme pozorovaných událostí). Z teorie pravděpodobnosti pak plyne, že statistika

Q M - H = U 2 var ( U ) = { i = 1 n ( d 1 i - E ( d 1 i ) ) } 2 i = 1 n var ( d 1 i )

(5.13)

má přibližně chí-kvadrát rozdělení pravděpodobnosti s jedním stupněm volnosti. O platnosti nulové hypotézy rozhodujeme po vypočtení testové statistiky srovnáním s příslušným kvantilem teoretického chí-kvadrát rozdělení. Pro nulovou hypotézu jsou příznivé nízké hodnoty , kdy pozorované četnosti souhlasí s očekávanými, a naopak, čím vyšší hodnota testové statistiky, tím menší pravděpodobnost, že nulová hypotéza skutečně platí.

Log-rank test stejně jako ostatní neparametrické metody předpokládá nezávislost cenzorování a výskytu jednotlivých událostí. Porušení tohoto předpokladu (např. je-li v jedné ze skupin větší pravděpodobnost cenzorování) může vést ke zkresleným závěrům testu a tak znehodnocení výsledků.

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict