Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Substituční model Substituce

Logo Matematická biologie

Substituce

Sekvence DNA představuje vektor, kde každá jeho hodnota může nabývat čtyři diskrétní stavy – nukleotidové báze. Nukleotidové báze jsou navíc kvalitativní znak, a tak změny mezi jednotlivými stavy, substitucemi, potřebujeme modelovat. Demonstrujme si to na naivním příkladu na Obr. 1. Barvy jednotlivých květů (nukleotidových bází, ) nemůžeme přímo hodnotit statisticky, jelikož netvoří číselnou řadu. Např. nemůžeme tvrdit, že bílý květ je čtyři-krát barevnější než fialový. Můžeme ale vypočítat, jak často bude docházet k záměně bílé barvy na fialovou. Zde již ale květinový příklad nabývá na komplexitě, protože barva reálných květů je znak určovaný mnoha geny a jejich rozdílnou expresí.

Substituční model tedy modeluje evoluci sekvence DNA. Určuje, s jakou frekvencí a případně kde v sekvenci je možné očekávat konkrétní substituce nukleotidových bází. Navíc je substituční model schopen korigovat i případný výskyt vícenásobných substitucí.

Zde je namístě definovat pojmy substituce a mutace. Mutace je jakékoliv změna v sekvenci DNA.

  • Substituce - záměna jedné nukleotidové báze za jinou
  • Inserce – včlenění jedné nebo více bází na konkrétní pozici sekvence DNA
  • Delece – vyjmutí jedné nebo více bází z konkrétní pozici sekvence DNA; inserce a delece se souhrnně nazývají indely
  • Chromosomální přestavba – přesun delšího úseku DNA v rámci genomu

Substituce by měla být ve zkoumané vzorce fixována, tzn. měla by se vyskytovat u všech kopií daného lokusu. Při porovnávání dvou sekvencí, kde se nevyskytují indely,  je počet mutací rovný počtu substitucí. U substituce na mezidruhové úrovni se očekává, že bude pro daný druh fixována, tzn. bude se vyskytovat u všech jedinců druhu.

Mutace je pak jakákoliv chyba při kopírování DNA. Rozdíl mezi mutací (všechny změny sekvence DNA, krátkodobé měřítko) a substitucí (jenom záměna nukleotidových bází, dlouhodobé přetrvávání) je vhodné brát v úvahu hlavně při sledování rychlosti evoluce. Mutace se budou z populace rychle ztrácet náhodným genetickým driftem a působením selekčního tlaku. Rychlost evoluce měřena v recentní době (104-106 let) se tak bude jevit výrazně vyšší, než rychlost evoluce na mezidruhové úrovni (od cca. 1 mil. let). Jelikož délka větví fylogenetického stromu představuje kombinaci mutační rychlosti a času, pozorované zpomalování mutační rychlosti (říká se taky změna mutační v substituční rychlost) bude ovlivňovat určování délky větví. Jev je dobré mít na paměti při interpretaci výsledků.

Počet lístků 5 6 8 10
Barva 1? 2? 3? 4?

Obr. 1: Příklad nutnosti substitučního modelu k dalšímu statistickému zpracování sekvence DNA. Nukleotidové báze představují diskrétní kvalitativní znaky s netriviálními vztahy u konkrétních záměn.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity