Příklad metody dělící hranice
Podívejme se blíže na metody dělící hranice. Mějme datový soubor s 12 639 geny z mikročipového experimentu. V předchozích analýzách 1 272 genů získalo p-hodnotu menší než 0,05. V genové sadě máme 96 genů, z toho pouze 8 genů s nižší p-hodnotou než 5 %. Kolik odlišně exprimovaných genů očekáváme náhodně?
Typ statistického testu, který použijeme závisí na tom, použijeme-li uzavřenou nebo kompetitivní metodu:
-
Uzavřená metoda (pracujeme pouze s geny z genové sady): Náhodně očekáváme 96 x 5% = 4,8 významných genů. Pomocí binomického testu vypočítáme pravděpodobnost pozorování 8 a více významných genů: p = 0.1079, tedy nevýznamný výsledek.
> binom.test(x=8,n=96,p=0.05, alternative="greater")
-
Kompetitivní metoda (geny v sadě porovnáváme s geny mimo sady): 1272 z 12639 genů je odlišně exprimovaných v tomto datovém souboru, což je zhruba 10 %. Z množiny náhodně vybraných 96 genů očekáváme tedy 96 x 10 % = 9,6 významných genů. p-hodnotu vypočítáme z kontingenční tabulky pomocí Fisherova testu či Chí-kvadrát testu. p = 0.73 Fisherova testu (jednostranného), je to tedy nevýznamný výsledek.
|
je v GS |
není v GS |
významný |
8 |
1264 |
nevýznamný |
88 |
11279 |