Log-rank test, který se stejně jako Kaplanův-Meierův odhad funkce přežití stal standardem v hodnocení klinických studií, byl navržen v roce 1959 Mantelem a Haenszelem jako modifikace testu pro analýzu stratifikovaných kontingenčních tabulek. Důvodem pro označení log-rank test je fakt, že testovou statistiku lze odvodit z pořadí (ranks) hodnot pozorovaných časů přežití v jednotlivých skupinách subjektů. My zde však odvodíme testovou statistiku pomocí principu využívaného v analýze kontingenčních tabulek, jmenovitě v případě Pearsonova chí-kvadrát testu. Odvoďme nejprve log-rank test pro dvě skupiny subjektů. Předpokládejme v obou skupinách celkem různých časů přežití takových, že platí . V každém z těchto časů přežití můžeme sestavit kontingenční tabulku shrnující pozorované přežití v obou skupinách. Označme a počty subjektů v riziku v čase ve skupině 1 a 2 a obdobně a počty sledovaných událostí v čase ve skupině 1 a 2. Pak příkladem kontingenční tabulky shrnující pozorované přežití ve skupinách 1 a 2 v čase je tabulka 5.1. Předpokládejme, že obě skupiny jsou na začátku sledování stejně početné. Pak bychom za platnosti nulové hypotézy o tom, že mezi skupinami 1 a 2 není rozdíl v přežití, měli v čase pozorovat přibližně stejně událostí v jedné i druhé skupině, jinými slovy hodnoty a by měly být přibližně stejné. Podobná úvaha za platnosti platí i pro zbývajících časů přežití. V celkovém součtu všech časů přežití pak logicky za platnosti očekáváme i stejný počet událostí v obou skupinách. Jakákoliv odchylka od tohoto předpokladu indikuje rozdílné přežití ve skupinách 1 a 2.

Tabulka 5.1 Pozorované počty událostí v čase .

Skupina	Počet subjektů v riziku v čase	Počet událostí v čase	Počet subjektů bez události v čase
1
2
Celkem

Mantel a Haenszel navrhli hodnocení s pomocí pozorovaných četností , , a za podmínky pevně daných marginálních četností, což vede k hodnocení (ostatní pozorované četnosti jsou vzhledem k pevným marginálním četnostem dané). Za platnosti lze ukázat, že náhodná veličina má hypergeometrické rozdělení pravděpodobnosti a její podmíněná střední hodnota má tvar

$E (d_{1 i}) = R_{1 i} \frac{d_{i}}{R_{i}}$

(5.9)

Podmíněný rozptyl má tvar

(5.10)

V čase lze tedy rozdíl mezi pozorovanou a očekávanou četností výskytu sledované události ve skupině 1 vyjádřit jako rozdíl . Logickým rozšířením přes všech pozorovaných časů přežití je pak statistika definovaná jako

$U = \underset{i = 1}{\sum^{n}} (d_{1 i} - E (d_{1} i))$

(5.11)

Jednoduše řečeno, statistika vyjadřuje rozdíl mezi celkovým a očekávaným počtem sledovaných událostí ve skupině 1. Navíc, za platnosti bude mít statistika přibližně normální rozdělení pravděpodobnosti s nulovou střední hodnotou. Její rozptyl lze za předpokladu nezávislosti jednotlivých pozorovaných časů přežití vyjádřit jako součet rozptylů jednotlivých komponent , tedy jako

$var (U) = \underset{i = 1}{\sum^{n}} var (d_{1 i})$

(5.12)

Má-li statistika přibližně normální rozdělení pravděpodobnosti s nulovou střední hodnotou, pak statistika má přibližně normální rozdělení pravděpodobnosti s nulovou střední hodnotou a jednotkovým rozptylem (aproximace je tím lepší, čím více máme pozorovaných událostí). Z teorie pravděpodobnosti pak plyne, že statistika

$Q_{M - H} = \frac{U^{2}}{var (U)} = \frac{{\sum_{i = 1}^{n} (d_{1 i} - E (d_{1 i}))}^{2}}{\sum_{i = 1}^{n} var (d_{1 i})}$

(5.13)

má přibližně chí-kvadrát rozdělení pravděpodobnosti s jedním stupněm volnosti. O platnosti nulové hypotézy rozhodujeme po vypočtení testové statistiky srovnáním s příslušným kvantilem teoretického chí-kvadrát rozdělení. Pro nulovou hypotézu jsou příznivé nízké hodnoty , kdy pozorované četnosti souhlasí s očekávanými, a naopak, čím vyšší hodnota testové statistiky, tím menší pravděpodobnost, že nulová hypotéza skutečně platí.

Log-rank test stejně jako ostatní neparametrické metody předpokládá nezávislost cenzorování a výskytu jednotlivých událostí. Porušení tohoto předpokladu (např. je-li v jedné ze skupin větší pravděpodobnost cenzorování) může vést ke zkresleným závěrům testu a tak znehodnocení výsledků.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity