Sekvenování genomu
První lidský genom byl osekvenován mezi lety 1990-2006, přičemž první verze byla zveřejněna v roce 2000, první kompletní verze v roce 2003 a poslední kompletní verze v roce 2006. Důvodem je, že v ranních fázích sekvenování lidského genomu se používalo Sangerovo sekvenování, které umožňuje přečíst <1000 bp v jedné reakci. V dnešní době je díky technologickému pokroku možné získat první, hrubou verzi genomické sekvence za dva týdny laboratorní práce a několik měsíců bioinformatické. Umožňuje to masivní paralelizace sekvenování.
Zpracování dat z celogenomového sekvenování (genome assembly) je nad rámec tohoto předmětu a tak si k němu probereme základní pravidla, ale ne konkrétní postup. Zpracujeme data ze Sangerova sekvenování, které je dodnes intenzivně využívané při studiu konkrétních genů.
Jednotlivé osekvenované úseky DNA se nazývají čtení (read). Kvalitně osekvenovaný úsek bude takový, který bude přečtený opakovaně. Opakovaným čtením stejného úseku DNA se říká pokrytí (coverage) a absolutní minimum je dvojnásobné pokrytí (2x) akceptovatelné u Sangerova sekvenování. U celogenomového sekvenování by se pokrytí mělo pohybovat od desítek po tisíce čtení v závislosti na použití.
- De-novo sekvenování genomu – organizmus ještě nemá osekvenovaný genom, celý se sestavuje od začátku, pokrytí alespoň 20-100x.
- Opakované sekvenování (resequencing) – sekvenování dalších jedinců druhu, který již má známou sekvenci genomu, pokrytí 10-50x.
- Sekvenování krátkých úseků (amplicon sequencing, mutation detection) – sekvenování PCR produktů genu, pro který nás zajímá frekvence mutací v populaci, pokrytí i nad 1000x, pokud je ve vzorku smíchána DNA z několika jedinců.