
Analýza přežití
Genomické a proteomické experimenty v medicíně mají často dva základní cíle, s přesně definovanými otázkami:
- Predikce rizika molekulárních skupin. Mají skupiny definované pomocí genové exprese rozdílné přežití?
- Predikce času přežití na základě genové exprese. Má exprese genu vliv na přežití?
Není cílem tohoto učebního textu věnovat se podrobně teorii a základním pojmům analýze přežití. Doporučujeme Vám nastudovat si výukový text Aplikovaná analýza klinických a biologických datAplikovaná analýza přežití
Připomeňme si některé pojmy, které budeme používat v dalším textu. Předem je nutné si uvědomit, že přežití je čas do nějaké námi sledované události, nemusí tedy jít pouze o úmrtí, ale také o návrat onemocnění (například znovuobjevení nádoru nebo vytvoření metastázy) nebo relaps (návrat onemocnění nebo jeho zhoršení, případně úmrtí z jakéhokoliv důvodu) onemocnění. Doba přežití do úmrtí se nazývá celkové přežití (overall survival). Doba přežití do relapsu má anglický překlad relapse-free survival. Doba do obecného návratu onemocnění jako disease-free survival. Definice těchto pojmů nejsou standardizované a proto je nutné se před analýzou dat vždy informovat, co je považované za událost. Je to velice důležité jednak z pohledu interpretace, ale také v případě porovnání s jinými studiemi.
Data analýzy přežití jsou sbírána od nějakého zadaného času - začátek studie, diagnóza. Pro analytika jsou nejdůležitější dvě proměnné: čas přežití a informace o tom, zda událost nastala či nenastala (1 = událost nastala, 0 = událost nenastala). Pokud v datových souborech narazíme na časy přežití s výsledkem 0, jde o tzv. cenzorované hodnoty. K cenzorování dojde tehdy, pokud se například pacient z jakéhokoliv důvodu ztratí ze studie.
Pacient | Výsledek | Čas přežití (měsíce) |
1 | 1 | 4 |
2 | 1 | 11 |
3 | 0 | 56 |
4 | 1 | 8 |
5 | 0 | 44 |
6 | 0 | 48 |
7 | 0 | 57 |
8 | 1 |
3 |
V souvislosti s otázkou, na kterou chceme znát odpověď, se liší i metody, které použijeme. Například, chceme-li vědět jestli mají skupiny pacientů definované pomocí genové exprese rozdílné přežití, použijeme Kaplan-Meierův odhad funkce přežití pro každou z nich a následně porovnáme například Mantel-Haenszelovým log-rank testem.
Chceme-li odpovědět na otázku jestli má exprese genu vliv na riziko události o pacienta, nejčastější volbou je Coxův model proporcionálních rizik.