Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Analýza genových sad Nástroje pro analýzu genových sad Příklad metody dělící hranice

Logo Matematická biologie

Příklad metody dělící hranice

Podívejme se blíže na metody dělící hranice. Mějme datový soubor s 12 639 geny z mikročipového experimentu. V předchozích analýzách 1 272 genů získalo p-hodnotu menší než 0,05. V genové sadě máme 96 genů, z toho pouze 8 genů s nižší p-hodnotou než 5 %. Kolik odlišně exprimovaných genů očekáváme náhodně?

Typ statistického testu, který použijeme závisí na tom, použijeme-li uzavřenou nebo kompetitivní metodu:

  • Uzavřená metoda (pracujeme pouze s geny z genové sady): Náhodně očekáváme 96 x 5% = 4,8 významných genů. Pomocí binomického testu vypočítáme pravděpodobnost pozorování 8 a více významných genů: p = 0.1079, tedy nevýznamný výsledek.

> binom.test(x=8,n=96,p=0.05, alternative="greater")

  • Kompetitivní metoda (geny v sadě porovnáváme s geny mimo sady): 1272 z 12639 genů je odlišně exprimovaných v tomto datovém souboru, což je zhruba 10 %. Z množiny náhodně vybraných 96 genů očekáváme tedy 96 x 10 % = 9,6 významných genů. p-hodnotu vypočítáme z kontingenční tabulky pomocí Fisherova testu či Chí-kvadrát testu. p = 0.73 Fisherova testu (jednostranného), je to tedy nevýznamný výsledek.

 

je v GS

není v GS

významný

8

1264

nevýznamný

88

11279

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity