Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Základní schémata statistické analýzy dat Predikce skupin

Logo Matematická biologie

Predikce skupin

V tomto typu analýzy se snažíme předpovědět příslušnost vzorku k jedné ze známých skupin, a to na základě jejich genomického nebo proteomického profilu. Například předpovídáme:

  • typ diagnózy
  • odpověď na terapii
  • přežití pacienta

Výsledkem této analýzy je klasifikační pravidlo (soubor pravidel), které využívá informaci o expresi genů nebo proteinů.

Vytvoření klasifikátoru může sloužit i jako nástroj pro selekci genů, které významně diskriminují mezi skupinami.

Tato analýza má tři základní kroky:

  1. Výběr proměnných pro klasifikaci (vybíráme geny nebo proteiny, které se v klasifikátoru použijí)
  2. Trénování - na trénovacích datech vytvoříme klasifikační pravidlo (klasifikátor, model)
  3. Testování - vytvořený klasifikátor se otestuje na testovacích datech. Tento krok slouží k odhadnutí výkonnosti (přesnosti) klasifikátoru a k výběru a optimalizaci jeho parametrů.
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity