Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Základní schémata statistické analýzy dat Porovnávání skupin Výpočet velikosti účinku

Logo Matematická biologie

Výpočet velikosti účinku

Výpočet velikostí účinku vysvětlíme na příkladu analýzy genové exprese, ale může být zobecněn na jakýkoli typ dat.

Nejjednodušší způsob, jak změřit rozdíly mezi dvěma skupinami je zodpovědět si otázku: “Kolikrát je exprese určitého genu větší ve skupině A ve srovnání se skupinou B?” . Odpovědí je jednoduchý podíl průměrné genové exprese obou skupin. Tomuto poměru se anglicky říká fold change (FCH) a je to míra velikosti účinku.

Velikost účinku je míra síly vztahu mezi dvěma proměnnými a tento poměr je samozřejmě míra mezi genovou expresí a skupinou. Například, pokud průměrná exprese genu (změřena na mikročipu) je 3 ve skupině A a 9 ve skupině B, pak je hodnota fold change rovna 3 a můžeme říct, že exprese genu ve skupině B je třikrát větší než ve skupině A:+

 

Nejčastěji se jako mezní hodnota pro biologicky relevantní rozdíl v expresi používá hodnota 2 a ta také slouží k selekci genů odlišně exprimovaných mezi skupinami. Samozřejmě, tato hranice platí v obou směrech (průměrná exprese genu v skupině A je 2x menší nebo 2x větší než ve skupině B).

Nicméně, hodnocení biologické relevance nebo ne-relevance není zcela postačující a to z následujících důvodů

  • Některé geny s relativně slabými účinky mohou mít v koordinaci s jinými geny podstatně velký vliv.
  • Poměr může být, podle kvality vzorku použitého pro extrakci mRNA, systematicky znížen směrem dolů, tedy skutečná hodnota exprese může být dvakrát větší v jedné ze skupin, ale my pouze naměříme v průměru 1.9x nebo 1.5x. Kvalita vzorku odráží heterogenitu buněk ve zkoumaném vzorku a také metodu přípravy/uchování vzorku. Nádorový vzorek je například téměř vždy směsí nádorových a normálních buněk. Existuje také heterogenita mezi samotnými nádorovými buňkami, protože různé části nádoru můžou mít odlišná stádia vývoje.  Čerstvě zmrazené vzorky mají jistě vyšší kvalitu než vzorky fixované formalínem a navíc zapuštěné v parafínovém bloku. RNA obecně degraduje rychleji, což může mít za následek menší specifickou hybridizaci, a proto horší intenzity signálu a nižší hodnoty poměru.
  • Snad nejdůležitejší je, že, prostým filtrováním podle změny v expresi se ztrácí informace o věrohodnosti výsledku. Jak víme, že velikost účinku je skutečná a není jen způsobena chybami v experimentu nebo náhodným výběrem vyšších hodnot genové exprese v jedné skupině? Právě na to slouží statistická významnost, která může být odhadnuta pouze tehdy, jestliže během experimentu byla provedena opakovaná měření stejného genu (ve smyslu vícenásobných vzorků). K určení významnosti změn genové exprese mezi jednou nebo více skupinami může být použito testování statistických hypotéz nebo regresní techniky.
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity