Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Genetické databáze Stahování sekvencí

Logo Matematická biologie

Stahování sekvencí

Hromadné stahování sekvencí je možné z celé řady programů, které dokážou komunikovat s GenBankou (Geneious, BioEdit, R, Genome Workbench). Liší se mírou uživatelské přívětivosti a možnostmi přímo GenBanku zevnitř programu i prohledávat.

Webové rozhraní s vyhledanými sekvencemi rovněž umožňuje stáhnout vybrané anebo všechny sekvence, které odpovídají zadanému dotazu (obr. 3). Pro další práci se sekvencemi je výhodné stáhnout je ve formátu fasta. Stažená sekvence tak bude obsahovat jenom popis sekvence s přístupovým číslem a samotnou sekvenci:

>GI|databáze|přístupové číslo|rod druh, gen

ACTGACTGACTG

Na prvním řádku fasta formátu je znaménko „“ a název sekvence. Stáhnutá sekvence obsahuje v názvu speciální znaky , které je vhodné pro další zpracování nahradit podtržítkem a celý název zkrátit. Na druhém řádku (a případně dalších, až do nejbližšího znaménka ) je samotná sekvence DNA.

Velké množství sekvencí je vhodné stahovat buď v noci nebo o víkendu. Případně využít možnost stáhnout si velkou část databáze přes ftp přístup.

Obr. 3. Stáhnutí vyhledaných nukleotidových sekvencí z GenBanky. Pozor – tento způsob stáhne celé sekvence, které byly vyhledány. Pokud jsou v seznamu genomy, pokusí se je stáhnout celé.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity