Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Současné výzvy a technologie genomiky a proteomiky Úvod

Logo Matematická biologie

Úvod

Geny jsou přepisovány a proteiny vytvářeny podle individuálních potřeb buňky nebo celého organismu. To znamená, že všechny geny nejsou aktivní (neprodukují proteiny nebo funkční RNA) ve stejnou dobu. Aktivita genu se také liší v intenzitě. Některé geny jsou aktivní více, některé méně a jiné vůbec. Jsou to především procesy regulace aktivity genů a regulace struktury jejich produktů, které pomáhají buňce nebo organismu reagovat na různé podněty vnějšího prostředí, adaptovat se a přežít.

Různá aktivita genu je také například příčinou rozdílů mezi buňkami odlišných tkání organismu. Pokud by tomu tak nebylo, jak by bylo možné, že jsou například neuronové buňky ve srovnání s kožními buňkami zcela odlišné - jak ve tvaru, tak funkci, i když v jádrech obsahují úplně stejnou DNA?

Tisíce genů jsou přepisovány a překládány do proteinů v každém okamžiku existence buňky, přičemž jsou tyto procesy regulovány velkým množstvím složitých signálních drah. Deregulace některého z procesů může způsobit vážné problémy nejen v buňce, ale i v celém organismu. Aby k tomuto nedošlo, existuje v buňce množství kontrolních mechanismů. Jedná se například o mechanismy opravující špatně zařazené nukleotidové báze, k čemuž dochází během replikace DNA. Pokud z nějakého důvodu tento proces selže a vytvoří se nepřesná kopie DNA, dají jiné specifické proteiny buňce pokyn k uskutečnění naprogramované buněčné smrti, tzv. apoptóze. Deregulace procesu apoptózy je jedním z hlavních mechanismů způsobující vznik rakoviny.

Deregulace některého z komplexních procesů může být způsobena různými mechanismy:

  • Změnami v expresi genů (nevhodné deaktivace nebo aktivace genu) reagující na příliš nízkou nebo příliš vysokou koncentraci proteinu v signální dráze. Neobvyklé množství proteinu může být zapříčiněno buď narušením regulačního mechanismu transkripce nebo genovými aberacemi.
  • Jednobodovou nukleotidovou mutací v genu způsobijící nefunkční protein nebo protein se změněnou funkcí.
  • Změnami v posttranslační modifikaci proteinů způsobenými dysfunkcí nebo nepředvídanou funkcí proteinu.

Každá z těchto deregulací může rozhodnout o vzniku nemoci a zároveň může být i jeho jedinou příčinou. To platí zejména v onkologii. Nádorové buňky jsou totiž dobře známé svou nestabilitou v genomu, čímž získávají oproti normálním buňkám výhodu přežití, nekontrolovatelné proliferace a proniknutí do dalších tkání.

S touto znalostí je jednoduché pochopit význam studia struktury genu, kontrolních mechanismů genové exprese a základních biologických procesů buňky a organismu.

Dekódování kompletní sekvence genomu jakéhokoliv organismu je prvním krokem v porozumění těchto procesů a přináší nové výzvy do biomedicínského výzkumu. Znalost genové sekvence pomáhá pochopit regulaci genové exprese, funkci genového produktu (funkční RNA, protein, ...) a jeho význam a zapojení v biologické signální dráze. Dekódování lidského genomu v rámci projektu Human Genome Project přineslo do medicíny novou naději s možností stanovení vztahu genů a jejich mutací s různými nemocemi. To by umožnilo nalezení optimální prevence a diagnostiky nemocí a nejlepší cílené terapie s maximální efektivitou a minimem vedlejších účinků. V biologii díky porovnání genomů různých druhů nalézáme evoluční spojitosti a jsme schopni tvořit fylogenetické stromy. Studium genové exprese bakterií nebo buněčných linií za různých podmínek může pomoci odhalit mechanismy přizpůsobení se a přežití.

Technologie dostupná pro identifikaci struktury genu, genové exprese nebo struktury proteinu závisí na typu vzorku, který je pro studium k dispozici (bakterie, bílé krvinky a jejich DNA, nádorové tkáně a jejich DNA/mRNA, krevní sérum nebo plazma a její proteomický a metabolický obsah, ...) a typu molekul, které chceme studovat. Můžeme sledovat změny:

  • na úrovni genomu (mutace v genech, změny v počtu kopií genů nebo celých chromozomů) – studium RNA a DNA molekul
  • na úrovni genové exprese - studium mRNA molekul
  • ve změnách v množství nebo struktuře proteinů mezi odlišnými vzorky – studium peptidů a proteinů

Zatímco druh technologie se na základě typu studované molekuly značně liší, z analytického pohledu se nad těmito daty formulují stejné typy otázek:

  • Porovnávací studie – jaký je rozdíl mezi dvěma, nebo více známými skupinami (např. které genové mutace jsou specifické pro nádor prsu a které pro nádor plic, exprese kterých genů dokáže rozlišit AML od ALL1?)
  • Predikční studie – dá se na základě genomických a proteomických měření vytvořit pravidlo, které dokáže zařadit vzorek do známé skupiny (např. přítomnost určitého proteinu identifikuje bakteriální kmen, zvýšená exprese vybraných genů u nádoru predikuje odpověď na chemoterapii)
  • Prognostické studie – mají změny v genomu/proteomu vliv na přežití pacienta?
  • Objevovací studie – dají se na základě naměřených hodnot nalézt nové skupiny? (např. dokáže genová exprese rozdělit histologicky homogenní nádory kolorekta)

Následující kapitola popisuje vybrané technologie zaměřené na moderní vysokopokryvné metody genomické a proteomické analýzy, analýzu dat které se tento učební text věnuje detailně. Pak si představíme základní problémy týkající se dat, které tyto technologie produkují a proč je nutné data upravit a nakonec něco o metodách jejich analýzy.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity