Analýza genových sad
Již víme, že genová exprese nebo proteinová abundance se může změnit se změnou podmínek organizmu. Víme, jak najít odlišně exprimované geny mezi skupinami, a víme také, jak na základě genové exprese najít nové skupiny nebo vytvořit klasifikátor. Nakonec umíme zjistit, jestli exprese některého genu souvisí s přežitím. Co ale tyto změny znamenají na biologické úrovni? Geny a proteiny jsou navzájem propojené ve velké spleti různých signálních, metabolických a různých dalších drah. Jak odhalíme, které dráhy jsou významně zasaženy v důsledku změny exprese genů mezi skupinami? Právě tyto dráhy mohou být příčinou vzniku onemocnění, nebo mohou poskytnout klíč k nalezení správné terapie. Máme dvě možnosti, jak na tuto otázku odpovědět.
- Geny, které najdeme odlišně exprimované mezi skupinami (porovnání skupin) můžeme vložit do databáze a podívat se kam patří (KEGG,MsigDB, ...). Nevýhodou však je to, že nemáme statistickou významnost toho, která z drah je zastoupena nejvíce.
- Můžeme však také porovnávat všechny geny se skupinami genů v jednotlivých drahách s pomocí statistických přístupů, které se obecně nazývají metody analýzy genových sad.
Předpoklad těchto analýz je, že operují již s definovanými skupinami genů jednotlivých drah.
Jaký je rozdíl mezi genovou sadou a genovou dráhou? Genová sada je jakákoliv množina genů, například všechny geny patřící do jedné dráhy či všechny geny, které mají podobnou funkci. Genová sada není genová dráha; je to mnohem všeobecnější a méně specifický pojem.
Této analýze se někdy říká také pathway analýza (angl. pathway analysis).