Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Alignment Globální alignment

Logo Matematická biologie

Globální alignment

Globální alignment seřazuje homologické pozice sekvencí v celé jejich délce. Používá Needleman-Wunschův algoritmus, kterého speciálním příkladem je dříve vysvětlený Smith-Watermanův algoritmus. Liší se od sebe v tom, že hodnoty skóre alignmentu při použití Needleman-Wunschova algoritmu můžou klesat pod nulu a traceback začíná v pravém dolním rohu matice.

Z praktického hlediska to znamená, že první sloupec a řádek, které představují úvodní indely, budou obsahovat hodnoty [0, nW], kde n je délka sekvence a W penalta za indel (obr. 5). Vyplnění tabulky je pak stejné. Odměna nebo penalta za shodu/rozdíl porovnávaných nukleotidových bází se připočte k hodnotě vlevo nahoře od vyplňované buňky. K hodnotám nad a vlevo od buňky se připočte penalta za mezeru. Buňka nadobude maximální z těchto tří hodnot (obr. 5).

Obr.5: Vyplňování tabulky dynamického programování při sestavování globálního alignmentu. Při porovnávání shody nebo rozdílu nukleotidových bází v sekvencích se odměna (+1) nebo penalta (–1) připočte k hodnotě vlevo nahoře od sledované buňky a hodnota penalty za indel (–2) se připočte k hodnotám nad a vlevo od buňky. Nová hodnota bude rovna nejvyšší hodnotě vypočítané z trojice buněk nad, vlevo a vlevo nahoře od doplňované buňky.

Při porovnání lokálního (obr. 3) a globálního alignmentu (obr. 5) vidíme, že ani jeden z algoritmů nenašel správný alignment (obr. 1). Důvodem u příkladu lokálního alignmentu je, že otevření mezery má stejnou penaltu jako rozdíl nukleotidových bází. Pokud by byla penalta za indel vyšší, lokální alignment by odpovídal tomu na obr. 1. U globálního alignmentu pozorujeme, že báze na začátku a konci sekvence byly přiřazené k sobě, i když se neshodují. Globální alignment zarovnává sekvence v celé jejich délce. Pokud tedy víme, že v našem souboru všechny počátky a konce sekvencí neobsahují homologické pozice, potřebujeme povolit mezery v těchto oblastech.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity