Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Genetické databáze Vyhledávání v databázích

Logo Matematická biologie

Vyhledávání v databázích

Vyhledávání dostupných genetických informací probíhá formou vyhledávání textu doplňujících informací k sekvenci (organizmus, gen, autor sekvence, publikace, přístupové číslo sekvence, a pod., obr. 1) anebo pomocí hledání podobnosti na úrovni samotné sekvence (kapitola Blast).
Organizmus uživatel zadává jednak ve formě druhového jména a jednak uvádí i kompletní linii (lineage) všech taxonomických úrovní, do kterých je druh kategorizován. I prohledávání je tak možné omezit na konkrétní taxonomickou skupinu.
Gen, neboli název lokusu, uvádí uživatelé často jako jedno z možných synonym, ale je nutné počítat i s překlepy a chybami. Synonyma názvů genů a jejich produktů přehledně uvádí databáze Gene Ontology (www.geneontology.org) a při vyhledávání sekvencí je užitečné zadat alternativní názvy genu nebo produktu. U protein-kódujících genů název genu představuje sekvenci DNA a v textu by měl být psaný kurzívou; produkt tohoto genu je protein, který kóduje.
Jelikož jsou všechny tři světové verze genetických databází propojeny, je volbou uživatele, ze které k nim bude přistupovat. Liší se uživatelským rozhraním a organizací výsledků vyhledávání. Např. GenBanka při vyhledávání zobrazí počet záznamů, které odpovídají zadanému dotazu v každé z dostupných databází (obr. 1) a ENA přednostně zobrazí nukleotidové sekvence, kam přiřadí i sekvence oligonukleotidů, které byly laboratorně syntetizovány (obr. 2).

Obr. 1: Vyhledávání sekvencí v genetických databázích GenBanky.
 

Obr. 2: Vyhledávání sekvencí v genetických databázích EMBL.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity