Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Substituční model Heterogenita rychlosti evoluce mezi pozicemi Γ rozdělení

Logo Matematická biologie

Γ rozdělení

Modelování rychlosti substitucí na pozicích alignmentu pomocí rozdělení zjišťujeme, s jakou pravděpodobností pozice mutuje vysokými anebo nízkými rychlostmi (Obr. 4). V ASCII textu je tento model označován také jako , Gamma, nebo gamma. rozdělení má dva volné parametry a , ale při modelování rychlosti mutací se předpokládá , kdy je průměr mutačních rychlostí rovný 1. Hustota pravděpodobnosti rychlosti evoluce (, rate) se pak vyjadřuje podle vzorce:

Její tvar vystihuje, s jakou frekvencí se v alignmentu vyskytují pozice, které mutují korespondující rychlostí. Tedy, když  je , většina pozic mutuje pomalu a jen některé rychle a při většina pozic mutuje střední rychlostí a některé pomalu nebo rychle (Obr. 4). Přesné (a správné) určení mutační rychlosti pro všechny pozice alignmentu je ovšem nereálné a tvar křivky se odhaduje z několika kategorií. Každá pozice je pak zařazena do určité kategorie, která obsahuje daný rozsah mutačních rychlostí (Obr.5). Prakticky je výhodné používat čtyři kategorie pro alignmenty s nízkou genetickou variabilitou a osm u alignmentů rychle mutujících lokusů anebo obsahujících vzdáleně příbuzné organizmy. Nedoporučuje se navyšovat počet kategorií nad dvanáct z toho důvodu, že výsledný histogram odhadnutých mutačních rychlostí by mohl být multimodální.

Obr. 4: Modelování rozdílné rychlosti substitucí na pozicích alignmentu pomocí rozdělení. Při hodnotách α < 1 má většina pozic nízkou substituční rychlost.

 

Obr. 5: Počet kategorií použitých pro určení parametru α pro rozdělení modelující rozdílnou rychlost substitucí na jednotlivých pozicích alignmentu. Zobrazená data byla generována pro . U čtyř kategorií je na první pohled těžko odlišitelné, která hodnota je správná. Vyšší počet kategorií sice umožní přesnější určení parametru , ale s rizikem, že v některých kategoriích nebudou zařazeny pozice alignmentu v počtu, který by odpovídal rozdělení (zde v kategorii 3-3.5 u 8).

 

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity