Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Základní schémata statistické analýzy dat Porovnávání skupin

Logo Matematická biologie

Porovnávání skupin

Většina genomických/proteomických experimentů je ve své povaze komparativní. Jinými slovy, když provádíme takový experiment, je našim cílem porovnat geny/proteiny v různých situacích, abychom odhalili, které z nich jsou aktivní/přítomné za různých podímnek/skupin.

Tomu se říká porovnávání skupin. Nejjednodušší a nejběžnější případ je porovnat geny/proteiny mezi právě dvěma různými skupinami.

Například, můžeme chtít vědět, které geny jsou aktivní ve skupině pacientů, kteří trpí konkrétní nemocí, ve srovnání se skupinou zdravých lidí. Nebo můžeme mikročipový experiment vést ke studiu odlišností v proteinové expresi konkrétního bakteriálního druhu kultivovaného v různých podmínkách, například aerobní versus semi-aerobní podmínky. Jiný experiment může mít za cíl srovnat profily genové exprese nádorových vzorků v čase diagnózy a progrese.

     Příklady porovnání více skupin - můžeme například porovnat genovou expresi lymfatických buněk ze tří nebo více druhů lymfomu. Nebo si představme jinou situaci, pokud máme skupinu pacientů se stejnou diagnózou rozdělenou do dvou podskupin podle jejich léčby a skupinu kontrolních pacientů, pak můžeme porovnat jejich odezvu (odpověď) s ohledem na kontrolní skupinu.   

Ale jak lze všechna tato porovnání provést? Nejjednodušší způsob, jak nalézt odlišnosti mezi zkoumanými skupinami, je analyzovat expresi každého z genů napříč všemi skupinami.

Obecně existují tři přístupy, které mohou tyto odlišnosti mezi skupinami odhalit:

  • výpočet velikosti účinku
  • testování statistických hypotéz
  • regresní strategie

Výpočet velikosti účinku je nejjednodušší přístup a nevyžaduje žádné speciální statistické nástroje. Nicméně, v tomto případe schází informace o věrohodnosti expresních změn. Oproti tomu testování statistických hypotéz a regresní strategie věrohodnost výsledku počítají. Kterou z těchto dvou strategií si zvolíme záleží na tom, kolik proměnných do analýzy mezi skupinami vstupuje. Analýza s jednou proměnnou (exprese genu) může být úspěšně provedena testováním statistických hypotéz. Pro analýzu více proměnných (vliv exprese genu a zároveň věku...) bychom měli aplikovat regresní metody.

V dalších podkapitolách si představíme všechny tři přístupy podrobněji a zaměříme se na metody speciálně vyvinuté pro analýzu dat z vysokopokryvných genomických a proteomických experimentů.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity