Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA BLAST-Vyhledávání podobných sekvencí Programy blastu Prohledávání specifických databází

Logo Matematická biologie

Prohledávání specifických databází

Výchozí databáze, ve kterých programy blastu hledají, jsou neredundantní (nr) databáze Nucleotide a Protein z GenBanky. Uživatel si ale může podle potřeby zvolit i některou z dalších genetických databází, kterými buď urychlí vyhledávání nebo ho rozšíří o doplňující údaje. Například:
Lidský genom (Human genomic+transcript) – databáze specifická pro člověka, slabě využitelná pro jiné modelové organizmy.
Referenční sekvence (RefSeq) – sekvence, které byly vybrány jako reprezentativní pro daný gen a organizmus. Mělo by se jednat o nejspolehlivější údaje v GenBance. Referenční databáze jsou k dispozici pro genomické sekvence, tak i pro exprimované, kdy byla sekvenována RNA.
Celé genomy (chromosome) – prohledává sestavené genomy v GenBance.
Exprimované krátké sekvence (expressed sequence tags, EST) – prohledává se soubor údajů, které představují reálně exprimované geny. Nalezení shody v této databázi (a v refseq_rna) je možné považovat za in silico důkaz o funkčnosti sledovaného genu.
Nesestavené genomy (whole-genome shotgun contigs, WGS) – umožňuje prohledávat nekompletně sestavené genomy, ale uživatel musí omezit hledání na jistou skupinu organizmů.
Speciálním případem je použití uživatelské databáze, která na internetu není dostupná. Často se může jednat o nově sestavený genom anebo sadu sekvencí specifických pro určitý projekt. Uživatelskou databázi je nutné před použitím sestavit se samotných sekvencí programem, který je k dispozici ke stažení z GenBanky.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity