Věrohodnost (L, likelihood)
Věrohodnost je podmíněná pravděpodobnost podle vzorce:
V kontextu fylogenetické analýzy sekvencí DNA data D představují alignment a hypotéza je fylogenetický strom a zároveň substituční model. Věrohodnost je tak pravděpodobnost, že s konkrétním substitučním modelem na konkrétním stromu uvidíme, že se vyvinuly pozorované sekvence.
Jedná se o velmi malé číslo a proto je vyjadřuje jako přirozený logaritmus a používá se k testování hypotéz.
kde je konkrétní uzel na stromě , je parametrizovaný substituční model s vektorem frekvence bází π pro abecedu prvků nukleotidových bází x = {A,C,T,G}, a je jedna pozice alignmentu .
Otázka: Má NJ strom věrohodnost?
Ano. Pro každý strom a substituční model je možné vypočítat věrohodnost. V případě NJ stromu by se věrohodnost měla počítat se substitučním modelem, který byl použitý pro výpočet matice genetických vzdáleností pro NJ analýzu.
Výpočet věrohodnosti je hierarchický a kombinuje informace o topologii stromu se substitučním modelem, aby zhodnotil pravděpodobnost ancestrálních stavů na pozicích sekvence v celém stromě.
- Součin (*) pravděpodobností evolučních změn na daném stromě pro daný model pro každý možný scénář
- Součet (+) pravděpodobností každého scénářa pro celý alignment
- Součin (*) všech pravděpodobností pro všechny pozice v alignmentu