Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Bayesiánská inference Markovovy řetězce Monte Carlo

Logo Matematická biologie

Markovovy řetězce Monte Carlo

Na počátku BI se stejně jako u analýzy maximální věrohodnosti určí topologie počátečního stromu s odpovídajícím substitučním modelem () a vypočte se jeho věrohodnost. Následují kroky, neboli generace, při kterých MCMC vzorkuje krajinu stromů. Jedna generace má tento postup:

  1. Strom a model se pozmění v rámci priorních předpokladů () a vypočte se věrohodnost nového stromu.
  2. Vypočte se poměr akceptace (acceptance ratio):
  • Pokud je , nový strom se akceptuje.
  • Pokud je , vygeneruje se náhodná hodnota mezi 0 a 1. Pokud je , nový strom se akceptuje.
  • Pokud je , nový strom se zamítne a do další generace vstupuje původní strom a model .

V jedné generaci MCMC buď najde lepší řešení a postoupí v krajině stromů nahoru, anebo někdy příjme i horší strom a dokáže tak překonat údolí v krajině stromů. Jak MCMC stoupá, postupně se ustálí v oblasti krajiny stromů, kde jsou řešení s vysokou věrohodností. Ty pak vzorkuje v mnoha generacích. Říkáme, že MCMC konvergoval.

Abychom ověřili, že MCMC skutečně konvergoval v globálním maximu, je vhodné spustit analýzu opakovaně z různých počátečních stavů a výsledky následně porovnat.

mcmcp nruns=2 ngen=1000000 diagnfreq=5000;

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity