Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Alignment Vícenásobný alignment Progresivní alignment

Logo Matematická biologie

Progresivní alignment

Sestavování alignmentu progresivními metodami znamená, že k existujícímu alignmentu se postupně přidávají další sekvence. Pro optimalizaci procesu je vhodné, aby se tyto přidávaly na základě podobnosti, jelikož alignování podobných sekvencí je jednoznačnější než u divergentních sekvencí.

Postupné přidávání sekvencí se provádí na základě vedoucího stromu (guide tree). Je to fylogenetický strom sestavený nejčastěji shlukovací metodou nejbližšího souseda ze sekvencí (Nejbližší soused), které se budou alignovat. Vstupní data pro metodu nejbližšího souseda představuje matice genetických vzdáleností. Místo přesných údajů se pro sestavení vedoucího stromu používají skóre alignmentů párových porovnání anebo jejich nekorigované vzdálenosti. Jelikož strom je sestaven z principiálně nesprávných údajů (genetické vzdálenosti jsou přibližné, nekorigují vícenásobné mutace nebo saturaci ( Substitucni model), jsou určovány z párového a ne globálního alignmentu), bude nevyhnutně nesprávný. Umožní ale efektivně přidávat sekvence k progresivnímu alignmentu.

Progresivní alignment využívají programy skupiny Clustal, T-Coffee a MAFFT. Nevýhodou progresívního alignmentu je, že je pomalý pro velké soubory sekvencí, ať už obsahují dlouhé anebo hodně sekvencí.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity