Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Substituční model Heterogenita rychlosti evoluce mezi pozicemi

Logo Matematická biologie

Heterogenita rychlosti evoluce mezi pozicemi

Jedním z předpokladů modelování evoluce DNA je nezávislost mutací na jednotlivých pozicích sekvence. Všechny pozice by tedy měly mutovat stejně rychle. V reálných datech ale často pozorujeme, že některé pozice akumulují mutace rychleji než jiné. Intuitivní příklad představují pozice v kodonech genů pro proteiny. Substituce se v protein-kódujících genech vyskytují nejčastěji na třetí pozici kodonu. Taková mutace totiž díky degenerovanému genetickému kódu často nevede k záměně aminokyselin – mutace je tichá, neboli synonymní. Selekční tlak, který působí na funkční geny, bude obzvlášť malý u synonymních substitucí. Obecně je četnost mutací na pozicích kodonu v sestupném pořadí 3 – 1 – 2, takže substituce na druhé pozici kodonu bývají nejméně časté. Ve starší literatuře může být třetí pozice kodonu vyjmuta do zvláštní partice, souboru pozic alignmentu, pro kterou bude substituční model určován samostatně ( Superstromy a supermatice). Tento přístup je na jedné straně přesný, ale zároveň vyžaduje určení všech parametrů substitučního modelu pro každou partici. V alignmentu se nemusí vyskytovat dostatek informací k určení všech parametrů pro každou partici, a tak výsledný model nebude správný.

V dnešní době se rozdíl četnosti akumulace mutací na jednotlivých pozicích přednostně modeluje dvěma způsoby: pomocí rozdělení anebo určením proporce nevariabilních pozic. Obě alternativy vyžadují určení jenom jednoho dalšího parametru substitučního modelu.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity