E-learningová učebnice

Matematická biologie

Slovník | Vyhledávání | Mapa webu

Aplikovaná analýza klinických a biologických datAplikovaná analýza přežití Nástroje regresní diagnostiky Hodnocení vhodnosti modelu

Analýza a management dat pro zdravotnické obory, Analýza klinických dat | Aplikovaná analýza přežití |

Základní pojmy analýzy přežití |

Výstupy z výukové jednotky | Úvod | Cenzorování | Vliv cenzorování na hodnocení přežití | Literatura |

Hlavní charakteristiky v analýze přežití |

Výstupy z výukové jednotky | Funkce přežití | Výpočetní vztahy | Další charakteristiky přežití |

Medián přežití | Průměrná doba přežití | Průměrná doba dožití |

Úloha k procvičení | Literatura |

Neparametrické odhady |

Parametrické a neparametrické odhady | Kaplanův-Meierův odhad funkce přežití |

Greenwoodův vzorec | Interval spolehlivosti pro Kaplanův-Meierův odhad |

Odhad funkce přežití metodou úmrtnostních tabulek | Nelsonův-Aalenův odhad kumulativní rizikové funkce | Breslowův odhad funkce přežití | Úlohy k procvičení | Literatura |

Parametrické odhady |

Výstupy z výukové jednotky | Hlavní rozdělení pravděpodobnosti v analýze přežití |

Exponenciální rozdělení | Weibullovo rozdělení | Logaritmicko-normální rozdělení | Logaritmicko-logistické rozdělení |

Metoda maximální věrohodnosti | Ověření předpokladu exponenciálního a Weibullova rozdělení | Literatura |

Metody pro srovnání odhadů přežití |

Výstupy z výukové jednotky | Testování hypotéz v analýze přežití |

Srovnání pravděpodobností přežití v daném časovém bodě |

Mantelův-Haenszelův log-rank test | Neparametrické alternativy log-rank testu | Srovnání přežití tří a více skupin subjektů | Literatura |

Relativní přežití |

Výstupy z výukové jednotky | Přežití související s daným onemocněním |

Specifické přežití | Relativní přežití |

Výpočet relativního přežití | Věková standardizace | Literatura |

Regresní modely v analýze přežití |

Výstupy z výukové jednotky | Úvod | Modely proporcionálních rizik |

Parametrické modely proporcionálních rizik | Semiparametrické modely proporcionálních rizik |

Modely zrychleného času (Accelerated Failure Time, AFT) | Literatura |

Coxův model proporcionálních rizik I |

Výstupy z výukové jednotky | Úvod | Odhad regresních koeficientů Coxova modelu |

Skórový vektor a informační matice | Interval spolehlivosti pro poměr rizik |

Testy o regresních koeficientech | Breslowův odhad základní rizikové funkce | Literatura |

Coxův model proporcionálních rizik II |

Výstupy z výukové jednotky | Sestavení modelu | Výběr vysvětlujících proměnných do modelu | Stratifikovaný Coxův model | Coxův model s časově závislou vysvětlující proměnnou | Náhodné efekty v Coxově modelu | Literatura |

Nástroje regresní diagnostiky |

Výstupy z výukové jednotky | Úvod | Rezidua modelu | Ověření předpokladu proporcionality rizik | Hodnocení vhodnosti modelu | Literatura |

Modely s podílem vyléčených pacientů |

Výstupy z výukové jednotky | Úvod | Standardní modely s podílem vyléčených pacientů | Populační modely s podílem vyléčených pacientů | Poznámky k modelům s podílem vyléčených pacientů | Literatura |

Biostatistika pro matematickou biologii |

Hodnocení vhodnosti modelu

Ověřování platnosti modelu je v modelování důležitým krokem a je obvykle založeno na reziduích modelu, která představují rozdíl mezi pozorovaným výskytem sledovaných událostí a odpovídající predikcí událostí vypočtené s použitím regresního odhadu. Hodnocení vhodnosti modelu představuje velmi náročný úkol, protože objektivně není dáno, co je vhodný model a co už ne. Pro hodnocení celkového úspěšnosti modelu s ohledem na vysvětlenou variabilitu v datech přežití lze použít test dle Parzena Lipsitze [1] založený na podobném principu jako Pearsonův chí-kvadrát test pro kontingenční tabulky. Autoři navrhují rozdělit soubor hodnocených subjektů do K skupin dle rizika predikovaného modelem (vzhledem k tomu, že základní riziková funkce je stejná pro všechny subjekty, lze rozdělení provést pouze na základě hodnoty lineárního prediktoru) a v těchto skupinách následně vyhodnotit rozdíl mezi pozorovaným a očekávaným počtem sledovaných událostí. Pro toto vyhodnocení jsou použita martingale rezidua, respektive testová statistika dle Parzena Lipsitze je jejich transformací. Pro dostatečně velké soubory (kritérium pro dostatečnou velikost vzorku je podobné jako u Pearsonovy chí-kvadrát statistiky pro kontingenční tabulku) pak má testová statistika přibližně chí-kvadrát rozdělení s stupni volnosti.

Pro srovnání dvou modelů lze použít tzv. Akaikeho informační kritérium (Akaike information criterion, AIC), které slouží k posouzení schopnosti různých modelů vysvětlit variabilitu v pozorovaných datech. Statistika AIC je definována jako

.

(10.4)

kde je logaritmus věrohodnostní funkce modelu, je počet vysvětlujících proměnných v modelu a je počet parametrů uvažovaného rozdělení pravděpodobnosti. AIC je tak statistikou, která zohledňuje jak věrohodnost modelu, tak jeho složitost. Preferovány jsou modely s nižšími hodnotami AIC, které indikují lepší schopnost modelu „sedět“ na pozorovaná data. Nevýhodou AIC je však jeho nepoužitelnost v případě Coxova modelu, který se vyhýbá specifikaci konkrétního rozdělení pravděpodobnosti dat přežití. Hodnoty AIC spočítané pro Coxův model jsou totiž nesrovnatelné (srovnání by bylo vysoce zavádějící i z důvodu, že Coxův model využívá metody parciální věrohodnosti) s hodnotami AIC spočítanými pro model parametrický, využívající určité rozdělení pravděpodobnosti dat přežití.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity