Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Základní schémata statistické analýzy dat Analýza přežití

Logo Matematická biologie

Analýza přežití

Genomické a proteomické experimenty v medicíně mají často dva základní cíle, s přesně definovanými otázkami:

  • Predikce rizika molekulárních skupin. Mají skupiny definované pomocí genové exprese rozdílné přežití?
  • Predikce času přežití na základě genové exprese. Má exprese genu vliv na přežití?

Není cílem tohoto učebního textu věnovat se podrobně teorii a základním pojmům analýze přežití. Doporučujeme Vám nastudovat si výukový text Aplikovaná analýza klinických a biologických datAplikovaná analýza přežití

Připomeňme si některé pojmy, které budeme používat v dalším textu. Předem je nutné si uvědomit, že přežití je čas do nějaké námi sledované události, nemusí tedy jít pouze o úmrtí, ale také o návrat onemocnění (například znovuobjevení nádoru nebo vytvoření metastázy) nebo relaps (návrat onemocnění nebo jeho zhoršení, případně úmrtí z jakéhokoliv důvodu) onemocnění. Doba přežití do úmrtí se nazývá celkové přežití (overall survival). Doba přežití do relapsu má anglický překlad relapse-free survival. Doba do obecného návratu onemocnění jako disease-free survival. Definice těchto pojmů nejsou standardizované a proto je nutné se před analýzou dat vždy informovat, co je považované za událost. Je to velice důležité jednak z pohledu interpretace, ale také v případě porovnání s jinými studiemi.

Data analýzy přežití jsou sbírána od nějakého zadaného času - začátek studie, diagnóza. Pro analytika jsou nejdůležitější dvě proměnné: čas přežití a informace o tom, zda událost nastala či nenastala (1 = událost nastala, 0 = událost nenastala). Pokud v datových souborech narazíme na časy přežití s výsledkem 0, jde o tzv. cenzorované hodnoty. K cenzorování dojde tehdy, pokud se například pacient z jakéhokoliv důvodu ztratí ze studie.

Pacient Výsledek Čas přežití (měsíce)
1 1 4
2 1 11
3 0 56
4 1 8
5 0 44
6 0 48
7 0 57
8 1

3

V souvislosti s otázkou, na kterou chceme znát odpověď, se liší i metody, které použijeme. Například, chceme-li vědět jestli mají skupiny pacientů definované pomocí genové exprese rozdílné přežití, použijeme Kaplan-Meierův odhad funkce přežití pro každou z nich a následně porovnáme například Mantel-Haenszelovým log-rank testem.

Chceme-li odpovědět na otázku jestli má exprese genu vliv na riziko události o pacienta, nejčastější volbou je Coxův model proporcionálních rizik

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity