Úvod
Metodika analýzy přežití zahrnuje i vlastní modelovací postupy, které se umí vypořádat s cenzorovanými hodnotami, na něž standardní regresní modely nejsou použitelné. Nemáme-li však v hodnoceném souboru cenzorované hodnoty, můžeme pro hodnocení dat přežití teoreticky použít i standardní modely. Prakticky je však standardní metodika statistických modelů nevhodná i z dalších důvodů, kterými jsou zejména tyto tři:
- Čas přežití může nabývat pouze kladných hodnot a má kladně sešikmené rozdělení pravděpodobnosti. V analýze přežití se používají specifická rozdělení pravděpodobnosti, která vykazují vlastnosti nevhodné pro standardní statistické modely (např. zobecněné lineární modely).
- Vzhledem k časové složce, kterou data přežití obsahují, nás často místo odhadu střední hodnoty zajímá odhad pravděpodobnosti přežití v daném časovém bodě.
- V analýze přežití často nemodelujeme přímo pozorované hodnoty, ale odpovídající rizikovou funkci. Regresní modely v analýze přežití jsou tak založeny na rizikové funkci, která lépe popisuje chování přežití sledované skupiny subjektů než hustota pravděpodobnosti.
Předpokládejme tedy, že jsme v situaci, kdy chceme analyzovat a hlavně nějakým způsobem kvantifikovat vliv vysvětlující proměnné na přežití pacientů (obecně na dobu do sledované události). Jak to můžeme udělat? V zásadě bychom měli udělat tři kroky:
- V první řadě bychom měli sestrojit Kaplanovy-Meierovy odhady pro jednotlivé skupiny, které nám poskytnou náhled na rozdílný nebo stejný průběh přežití srovnávaných skupin subjektů. Tento postup však umožňuje pouze vizualizaci a optické zhodnocení rozdílu mezi skupinami danými jednou proměnnou. Nic nekvantifikuje a navíc nebere v úvahu vliv dalších proměnných.
- Dalším v pořadí je Mantelův-Haenszelův log-rank test, který umožňuje statistické zhodnocení rozdílu v přežití pomocí testové statistiky a s ní související p-hodnoty. Test ovšem také neposkytuje kvantifikaci pozorovaného rozdílu v přežití (např. efektu léčby) a nebere v úvahu více než jednu proměnnou.
- Až použití regresního modelu nám umožňuje současně uvažovat vliv více proměnných a vzájemně tak adjustovat jejich vlivy. Zároveň nám umožňuje kvantifikaci statistické významnosti i velikosti rozdílu v přežití jednotlivých skupin (kvantifikace pozorovaného efektu).
V analýze přežití existují dva hlavní modelovací přístupy umožňující vyjádřit vztah vysvětlujících proměnných a času do sledované události jako závisle proměnné a těmi jsou modely proporcionálních rizik (proportional hazards models), kde jsou vysvětlující proměnné vztaženy k rizikové funkci náhodné veličiny T, a tzv. modely zrychleného času (accelerated failure time models, AFT modely), kde jsou vysvětlující proměnné vztaženy k funkci (pravděpodobnosti) přežití.