Detekce mutací v kontigu
Rozdíly v přečtených bázích na chromatogramech jednotlivých čteních můžou představovat chyby v sekvenování (obr. 2) anebo výskyt polymorfismu na dané pozici (obr. 4).
Upozornění: Kontig je sestavení čtení sekvence z jednoho jedince.
K rozlišení těchto dvou možností přispívá znalost očekávaného počtu kopií sekvenovaného lokusu v genomu. Např. mitochondriální DNA se dědí klonálně po mateřské linii a tedy každý mitochondriální gen by se měl vyskytovat v jedné kopii. Polymorfizmus je u takových genů vzácný. Naopak jaderný gen u diploidního jedince bude v genomu ve dvou kopiích – po jedné od každého z rodičů. Pokud je sekvenovaný jedinec heterozygot, projeví se jako dvě alternativy genu.
Reálný polymorfismus na jedné pozici je na chromatogramu patrný jako zdvojený vrchol (peak), který má zhruba poloviční výšku než sousedící vrcholy (obr. 4). Sekvence konkrétní alely genu ale nemusí být ze Sangerova sekvenování PCR produktů zjistitelná. Templátová DNA totiž obsahuje kopie všech úseků, na které při amplifikaci nasedaly primery, ale příslušnost k alele není zjistitelná. Laboratorně je možné alely odhalit klonováním (PCR produkt se včlení do plazmidu a ten se namnoží v bakteriální kultuře a následně osekvenuje). Anebo se haplotypy vypočítají ze sekvence, která obsahuje identifikovaná místa polymorfizmů. Takový výpočet je přesnější, pokud je k dispozici populační vzorek sekvencí více jedinců.
Výsledná konsenzuální sekvence se exportuje do textového formátu, kde je zachována jenom informace o pořadí nukleotidových bází.