Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Bayesiánská inference Efektivita prohledávání krajiny stromů

Logo Matematická biologie

Efektivita prohledávání krajiny stromů

MCMC v každém kroku drobně změní strom a model tak, že postupně stoupá věrohodnost. Tento proces může být velmi pomalý a analýza může zůstat na lokálním maximu (obr.1). Proto každá analýza běží s několika MCMC, které se odlišují teplotou. Jeden MCMC je studený, z něj se ukládají výsledky a dalších několik horkých prohledává krajinu stromů. Teplota řetězce vystihuje, jak často bude akceptovat horší strom s nižší věrohodností – ovlivňuje krok 4 z kapitoly Markovovy řetězce Monte Carlo. Horké řetězce akceptují i stromy s výrazně nižší věrohodností a můžou tak překonávat údolí v krajině stromů mezi lokálními maximy.

mcmcp nchains=4 temp=0.9;

Zároveň ale schopnost horkých řetězců překonávat údolí v krajině stromů znamená, sice dokážou naleznout globální maximum, ale nemusí v něm konvergovat a taky z něj odejdou podobně jak z lokálního maxima. Řetězce by si měly každých několik generací zkusit vyměnit místo. Pokud při takovém porovnání horký řetězec nalezl strom s vysokou věrohodností, tento strom přebírá studený řetězec. Tím se zabezpečí efektivní nalezení globálního maxima věrohodnosti a zároveň konvergence v něm.

mcmcp nswaps=1 swapfreq=2;

 

Obr. 1: Demonstrace prohledávání krajiny pomocí Markovova řetězce Monte Carlo. Horké řetězce výrazně zefektivňují vyhledávání. Video demonstruje použití programu iMCMC Johna Huelsenbecka (http://cteg.berkeley.edu/software.html#imcmc). Obdobný program pro Windows je MCMCrobot Paula Lewise (http://www.mcmcrobot.org).

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity