Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Alignment Vícenásobný alignment Alignování velkých souborů sekvencí

Logo Matematická biologie

Alignování velkých souborů sekvencí

Jak bylo vidět na porovnání alignmentů na obr. 1 a obr. 3, optimalizace pozice mezer má velký potenciál pro zlepšení alignmentů. K tomuto účelu se používají iterace, kde se alignment opakovaně přehodnocuje na základě předchozího alignmentu. Umožňují je programy skupin Clustal, MAFFT, MUSCLE.

Pro geny se známou informací o struktuře je užitečné tuto informaci použít k sestavování alignmentu. Příkladem může být použití alignmentu aminokyselin k navedení alignmentu sekvencí nukleotidových bází tak, aby kodony odpovídaly aminokyselinám, které kódují. Navádět alignment sekvencí DNA pomocí alignmentu aminokyselinových sekvencí umí Transalign anebo Translation alignment v programu Geneious. Třírozměrná struktura molekuly se k alignování může použít i pro rRNA nebo tRNA geny v programech z balíku MAFFT.

Pracuje se také na využití skrytých Markovových modelů (hidden Markov models, HMM) k alignování sekvencí (v kapitole Anotace jsou HMM použity k vyhledávání genů v sekvenci DNA). HMM určí věrohodnost (likelihood) pro hodně možných alignmentů a uvede, který by měl být nejlepší. Jsou implementovány v programech POA nebo HHsearch.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity