Úvod
Geny jsou přepisovány a proteiny vytvářeny podle individuálních potřeb buňky nebo celého organismu. To znamená, že všechny geny nejsou aktivní (neprodukují proteiny nebo funkční RNA) ve stejnou dobu. Aktivita genu se také liší v intenzitě. Některé geny jsou aktivní více, některé méně a jiné vůbec. Jsou to především procesy regulace aktivity genů a regulace struktury jejich produktů, které pomáhají buňce nebo organismu reagovat na různé podněty vnějšího prostředí, adaptovat se a přežít.
Různá aktivita genu je také například příčinou rozdílů mezi buňkami odlišných tkání organismu. Pokud by tomu tak nebylo, jak by bylo možné, že jsou například neuronové buňky ve srovnání s kožními buňkami zcela odlišné - jak ve tvaru, tak funkci, i když v jádrech obsahují úplně stejnou DNA?
Tisíce genů jsou přepisovány a překládány do proteinů v každém okamžiku existence buňky, přičemž jsou tyto procesy regulovány velkým množstvím složitých signálních drah. Deregulace některého z procesů může způsobit vážné problémy nejen v buňce, ale i v celém organismu. Aby k tomuto nedošlo, existuje v buňce množství kontrolních mechanismů. Jedná se například o mechanismy opravující špatně zařazené nukleotidové báze, k čemuž dochází během replikace DNA. Pokud z nějakého důvodu tento proces selže a vytvoří se nepřesná kopie DNA, dají jiné specifické proteiny buňce pokyn k uskutečnění naprogramované buněčné smrti, tzv. apoptóze. Deregulace procesu apoptózy je jedním z hlavních mechanismů způsobující vznik rakoviny.
Deregulace některého z komplexních procesů může být způsobena různými mechanismy:
- Změnami v expresi genů (nevhodné deaktivace nebo aktivace genu) reagující na příliš nízkou nebo příliš vysokou koncentraci proteinu v signální dráze. Neobvyklé množství proteinu může být zapříčiněno buď narušením regulačního mechanismu transkripce nebo genovými aberacemi.
- Jednobodovou nukleotidovou mutací v genu způsobijící nefunkční protein nebo protein se změněnou funkcí.
- Změnami v posttranslační modifikaci proteinů způsobenými dysfunkcí nebo nepředvídanou funkcí proteinu.
Každá z těchto deregulací může rozhodnout o vzniku nemoci a zároveň může být i jeho jedinou příčinou. To platí zejména v onkologii. Nádorové buňky jsou totiž dobře známé svou nestabilitou v genomu, čímž získávají oproti normálním buňkám výhodu přežití, nekontrolovatelné proliferace a proniknutí do dalších tkání.
S touto znalostí je jednoduché pochopit význam studia struktury genu, kontrolních mechanismů genové exprese a základních biologických procesů buňky a organismu.
Dekódování kompletní sekvence genomu jakéhokoliv organismu je prvním krokem v porozumění těchto procesů a přináší nové výzvy do biomedicínského výzkumu. Znalost genové sekvence pomáhá pochopit regulaci genové exprese, funkci genového produktu (funkční RNA, protein, ...) a jeho význam a zapojení v biologické signální dráze. Dekódování lidského genomu v rámci projektu Human Genome Project přineslo do medicíny novou naději s možností stanovení vztahu genů a jejich mutací s různými nemocemi. To by umožnilo nalezení optimální prevence a diagnostiky nemocí a nejlepší cílené terapie s maximální efektivitou a minimem vedlejších účinků. V biologii díky porovnání genomů různých druhů nalézáme evoluční spojitosti a jsme schopni tvořit fylogenetické stromy. Studium genové exprese bakterií nebo buněčných linií za různých podmínek může pomoci odhalit mechanismy přizpůsobení se a přežití.
Technologie dostupná pro identifikaci struktury genu, genové exprese nebo struktury proteinu závisí na typu vzorku, který je pro studium k dispozici (bakterie, bílé krvinky a jejich DNA, nádorové tkáně a jejich DNA/mRNA, krevní sérum nebo plazma a její proteomický a metabolický obsah, ...) a typu molekul, které chceme studovat. Můžeme sledovat změny:
- na úrovni genomu (mutace v genech, změny v počtu kopií genů nebo celých chromozomů) – studium RNA a DNA molekul
- na úrovni genové exprese - studium mRNA molekul
- ve změnách v množství nebo struktuře proteinů mezi odlišnými vzorky – studium peptidů a proteinů
Zatímco druh technologie se na základě typu studované molekuly značně liší, z analytického pohledu se nad těmito daty formulují stejné typy otázek:
- Porovnávací studie – jaký je rozdíl mezi dvěma, nebo více známými skupinami (např. které genové mutace jsou specifické pro nádor prsu a které pro nádor plic, exprese kterých genů dokáže rozlišit AML od ALL1?)
- Predikční studie – dá se na základě genomických a proteomických měření vytvořit pravidlo, které dokáže zařadit vzorek do známé skupiny (např. přítomnost určitého proteinu identifikuje bakteriální kmen, zvýšená exprese vybraných genů u nádoru predikuje odpověď na chemoterapii)
- Prognostické studie – mají změny v genomu/proteomu vliv na přežití pacienta?
- Objevovací studie – dají se na základě naměřených hodnot nalézt nové skupiny? (např. dokáže genová exprese rozdělit histologicky homogenní nádory kolorekta)
Následující kapitola popisuje vybrané technologie zaměřené na moderní vysokopokryvné metody genomické a proteomické analýzy, analýzu dat které se tento učební text věnuje detailně. Pak si představíme základní problémy týkající se dat, které tyto technologie produkují a proč je nutné data upravit a nakonec něco o metodách jejich analýzy.