Analýza genomických a proteomických dat |
Analýza sekvencí DNA |
Sekvence |
Genom |
Sekvenování genomu |
Polymerázová řetězcová reakce |
Celogenomové sekvenování |
Genetické databáze |
Pyrosekvenování |
Sekvenování pomocí syntézy |
Iontové polovodičové sekvenování |
Sekvenování jedné molekuly DNA |
Sangerovo sekvenování |
Sestavení sekvence |
Vyhledávání v databázích |
Sekvence v GenBance |
Stahování sekvencí |
Informační zdroje pro proteiny |
BLAST-Vyhledávání podobných sekvencí |
Základní informace |
Výstupy z výukové jednotky |
Využití blastu |
Přístup k blastu |
Princip blastu |
E-hodnota |
Programy blastu |
Predikce genů a anotace sekvence DNA |
Nukleotidový blast |
Proteínový blast |
Blast využívající překlad DNA do sekvence aminokyselin a opačně |
Prohledávání specifických databází |
Vícenásobné vyhledávání |
Výsledek a interpretace |
Taxonomie nebo fylogeneze nalezených záznamů |
Základní informace |
Výstupy z výukové jednotky |
Komparativní anotace |
Anotace ab initio - od začátku |
Alignment |
Genomické ostrovy |
Otevřený čtecí rámec |
Predikce eukaryotických genů |
Skrytý markovův model |
Modelování začátku intronu |
Modelování frekvence kodonů |
Predikce jiných RNA molekul |
Příprava sekvence do genetických databází |
Základní informace |
Výstupy z výukové jednotky |
Lokální alignment |
Globální alignment |
Vícenásobný alignment |
Praktické problémy s alignmentem a jejich řešení |
Modelování příbuznosti sekvencí DNA |
Substituční model |
Substituce |
Genetické vzdálenosti |
Parametry substitučního modelu |
Příklady nejběžnějších substitučních modelů |
Heterogenita rychlosti evoluce mezi pozicemi |
Výběr substitučního modelu |
Metoda nejbližšího souseda |
Hierarchický test poměru věrohodností |
Akaikovo informační kriterium |
Bayesovo informační kritérium |
Inserce a delece |
Základní informace |
Výstupy z výukové jednotky |
Vstupní údaje pro metodu nejbližšího souseda |
Algoritmus NJ shlukování |
Výhody a nevýhody NJ metody |
Využití NJ metody |
Ověření stability uzlů stromu – bootstrap |
Fylogenetika |
Čtení fylogenetického stromu |
Fylogenetický strom formálně |
Fylogenetický strom intuitivně |
Počet možných stromů |
Vlastnosti fylogeneze |
Ancestrální sekvence |
Určení kořene stromu |
Využití fylogenetické informace |
Maximální věrohodnost |
Bayesiánská inference |
Markovovy řetězce Monte Carlo |
Efektivita prohledávání krajiny stromů |
Priory |
Autokorelace MCMC |
Burnin |
Posterior |
Diagnostika konvergence |
Divergence druhů |

Bayesovo informační kritérium
Oproti AIC Bayesovo informační kritérium (BIC, Bayesian information criterion) intenzivněji penalizuje složité modely.
Nejvhodnější model je ten, který má nejnižší BIC. Všechny substituční modely, kde by měl uživatel zhodnotit jako potenciálně vhodné. Konečný výběr by měl zohledňovat i další informace, které o zkoumaných datech máme. Obecně, pro jednodušší modely bude snadněji možné získat správné hodnoty parametrů, ale složitější modely budou adekvátněji modelovat evoluci v souboru vzorek.
V ideálním případu se budou všechny zvoleny statistiky shodovat ve výběru optimálního substitučního modelu. Další kontrolou vhodnosti modelu jsou určené hodnoty parametrů:
- Členy vektoru frekvence bází
- Prvky frekvenční matice
- Poměr rychlostí tranzicí a transverzí
rozdělení modelující heterogenitu rychlostí substitucí na pozicích alignment bude mít parameter
.