Analýza genomických a proteomických dat |
Analýza sekvencí DNA |
Sekvence |
Genom |
Sekvenování genomu |
Polymerázová řetězcová reakce |
Celogenomové sekvenování |
Genetické databáze |
Pyrosekvenování |
Sekvenování pomocí syntézy |
Iontové polovodičové sekvenování |
Sekvenování jedné molekuly DNA |
Sangerovo sekvenování |
Sestavení sekvence |
Vyhledávání v databázích |
Sekvence v GenBance |
Stahování sekvencí |
Informační zdroje pro proteiny |
BLAST-Vyhledávání podobných sekvencí |
Základní informace |
Výstupy z výukové jednotky |
Využití blastu |
Přístup k blastu |
Princip blastu |
E-hodnota |
Programy blastu |
Predikce genů a anotace sekvence DNA |
Nukleotidový blast |
Proteínový blast |
Blast využívající překlad DNA do sekvence aminokyselin a opačně |
Prohledávání specifických databází |
Vícenásobné vyhledávání |
Výsledek a interpretace |
Taxonomie nebo fylogeneze nalezených záznamů |
Základní informace |
Výstupy z výukové jednotky |
Komparativní anotace |
Anotace ab initio - od začátku |
Alignment |
Genomické ostrovy |
Otevřený čtecí rámec |
Predikce eukaryotických genů |
Skrytý markovův model |
Modelování začátku intronu |
Modelování frekvence kodonů |
Predikce jiných RNA molekul |
Příprava sekvence do genetických databází |
Základní informace |
Výstupy z výukové jednotky |
Lokální alignment |
Globální alignment |
Vícenásobný alignment |
Praktické problémy s alignmentem a jejich řešení |
Modelování příbuznosti sekvencí DNA |
Substituční model |
Substituce |
Genetické vzdálenosti |
Parametry substitučního modelu |
Příklady nejběžnějších substitučních modelů |
Heterogenita rychlosti evoluce mezi pozicemi |
Výběr substitučního modelu |
Metoda nejbližšího souseda |
Hierarchický test poměru věrohodností |
Akaikovo informační kriterium |
Bayesovo informační kritérium |
Inserce a delece |
Základní informace |
Výstupy z výukové jednotky |
Vstupní údaje pro metodu nejbližšího souseda |
Algoritmus NJ shlukování |
Výhody a nevýhody NJ metody |
Využití NJ metody |
Ověření stability uzlů stromu – bootstrap |
Fylogenetika |
Čtení fylogenetického stromu |
Fylogenetický strom formálně |
Fylogenetický strom intuitivně |
Počet možných stromů |
Vlastnosti fylogeneze |
Ancestrální sekvence |
Určení kořene stromu |
Využití fylogenetické informace |
Maximální věrohodnost |
Bayesiánská inference |
Markovovy řetězce Monte Carlo |
Efektivita prohledávání krajiny stromů |
Priory |
Autokorelace MCMC |
Burnin |
Posterior |
Diagnostika konvergence |
Divergence druhů |
Testování substitučního modelu
Substituční modely se porovnávají na základě jejich věrohodností. Věrohodnost (L, ML) je podmíněná pravděpodobnost, že budeme pozorovat konkrétní data (D) při platnosti dané fylogeneze (T) a substitučního modelu (M).
Z toho vyplývá, že pokud potřebujeme porovnávat substituční modely, je nutné zafixovat fylogenetický strom. Strom, který metody pro výběr optimálního substitučního modelu používají, je NJ strom sestrojený na základě nekorigovaných genetických vzdáleností anebo genetických vzdáleností podle JC substitučního modelu (Tab.2). Strom zůstává zafixovaný a věrohodnost se počítá na základě různých testovaných substitučních modelů.