Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Ověření stability uzlů stromu – bootstrap Použití bootstrapu

Logo Matematická biologie

Použití bootstrapu

Bootstrapová analýza je časově a výpočetně náročná, jelikož každá pseudoreplikace se musí analyzovat samostatně zvolenou metodou. Pokud se bootstrapová analýza použije pro výpočet podpory uzlů na stromu z maximální věrohodnosti ( ML), která je sama o sobě výpočetně náročná, počet pseudoreplikací by měl být kompromisem mezi robustnosti analýzy a výpočetních a časových možnostech uživatele. Každopádně, počet pseudoreplikací, které uživatel bude zpracovávat, by měl být rádově v 103-104.

Nižší počet replikací je akceptovatelný u metod, které každou replikaci analyzují komplexně. Vyšší naopak u metod, které používají zjednodušení a vyhledávání optimálního stromu nevyčerpají.

Příkladem programu, který bootstrapové pseudoreplikace analyzuje povrchně, je RAxML. Díky tomu je program schopen analyzovat velmi velké alignmenty (rutinně i nad 1 mil. bp) na osobních počítačích, ale je vhodné uvědomit si limity této schopnosti. RAxML využívá tzv. algoritmus lezení na kopec (hill-climbing), který mění topologii stromu, hodnotí jeho věrohodnost a pokud věrohodnost mezi několika málo kroky dál nestoupá, algoritmus se přesouvá k další pseudoreplikaci. Riziko, že se analýza zastaví na lokálním maximu věrohodností je relativně vysoké a proto je nutno toto kompenzovat vysokým počtem opakování.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity