Parametry substitučního modelu
Jelikož modelujeme změnu na úrovni záměn nukleotidových bází sekvence DNA v čase, logicky míra této změny bude souviset s četností jednotlivých znaků a četností změn jejich stavů. Substituční model potřebuje vektor frekvence bází, frekvenční matici a mutační rychlost. Pro účely výpočtů potřebujeme předpokládat, že:
- Sekvence mají konečnou délku, takže na stejné pozici může dojít k vícenásobným mutacím,
- Substituce jsou v čase reverzibilní, takže pravděpodobnost jedné substituce se rovná pravděpodobnosti zpětné substituce,
- Substituce jsou na sobě nezávislé, takže mutace na jedné pozici neovlivňuje mutace na jiné pozici.
Otázka: Které předpoklady zjednodušují biologickou podstatu sekvencí DNA? Uveďte příklad z předchozích kapitol.
Pravděpodobnost, že cytozin v CpG ostrovech zmutuje na tymin je vysoká kvůli časté metylaci takových nukleotidů. Zpětná mutace z tyminu na cytozin nemá podobný chemický princip. Podobně, substituce, resp. přetrvávání mutací v populaci, bude u kódujících lokusů závislé na pozici nukleotidové báze v otevřeném čtecím rámci.