Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Maximální věrohodnost Věrohodnost (L, likelihood)

Logo Matematická biologie

Věrohodnost (L, likelihood)

Věrohodnost je podmíněná pravděpodobnost podle vzorce:

V kontextu fylogenetické analýzy sekvencí DNA data D představují alignment a hypotéza  je fylogenetický strom a zároveň substituční model. Věrohodnost je tak pravděpodobnost, že s konkrétním substitučním modelem na konkrétním stromu  uvidíme, že se vyvinuly pozorované sekvence.

Jedná se o velmi malé číslo a proto je vyjadřuje jako přirozený logaritmus  a používá se k testování hypotéz.

kde je konkrétní uzel na stromě , je parametrizovaný substituční model s vektorem frekvence bází π pro abecedu prvků nukleotidových bází x = {A,C,T,G}, a je jedna pozice alignmentu .

Otázka: Má NJ strom věrohodnost?

Ano. Pro každý strom a substituční model je možné vypočítat věrohodnost. V případě NJ stromu by se věrohodnost měla počítat se substitučním modelem, který byl použitý pro výpočet matice genetických vzdáleností pro NJ analýzu.

Výpočet věrohodnosti je hierarchický a kombinuje informace o topologii stromu se substitučním modelem, aby zhodnotil pravděpodobnost ancestrálních stavů na pozicích sekvence v celém stromě.

  1. Součin (*) pravděpodobností evolučních změn na daném stromě pro daný model pro každý možný scénář
  2. Součet (+) pravděpodobností každého scénářa pro celý alignment
  3. Součin (*) všech pravděpodobností pro všechny pozice v alignmentu
 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity