Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Genetické databáze Vyhledávání v databázích Přístupové číslo sekvence

Logo Matematická biologie

Přístupové číslo sekvence

Každá sekvence má dvě vlastní, jednoznačné čísla, která k ní odkazují. Jedná se o GI číslo (z anglického GenInfo Identifier) a přístupové číslo sekvence (Accession Number).

GI čísla jsou pořadová čísla sekvencí, která jsou přiřazována od zavedení genetických databází. Používaly se na sledování aktualizací sekvencí. Pokud byl záznam aktualizován, dostal nové GI číslo. Mezi třemi databázemi na jednotlivých kontinentech nebyly GI čísla ujednoceny a někdy každá databáze přiřadila sekvenci vlastní číslo.

Přístupová čísla naopak jsou sjednocená globálně. U sekvence DNA má přístupové číslo ve formátu dvě písmena, šest číslic, tečka, číslo (např. AB012345.1). Starší přístupová čísla jsou složena z jednoho písmena a pěti číslic. Číslo za tečkou představuje aktuální verzi dané sekvence.

Pokud je to databáze vložena sekvence DNA, dostane nové GI číslo a nové přístupové číslo s verzí 1. Pokud je tato sekvence aktualizována, dostane nové GI číslo a zvýší se jí číslo verze u stávajícího přístupového čísla.

Další formáty přístupových čísel charakterizují typ dat, na která odkazují. Např. formát dvou písmen, podtržítka a šesti čísel jsou referenční sekvence (databáze RefSeq). Referenční sekvence jsou vybrané sekvence genomů, proteinů a transkribovaných RNA, které představují aktuálně nejspolehlivější neredundantní záznamy. Jsou to vybrané kopie záznamů.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity