Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Genetické databáze Informační zdroje pro proteiny

Logo Matematická biologie

Informační zdroje pro proteiny

Databáze Protein v GenBance obsahuje sekvence aminokyselin, které jsou propojeny s odpovídajícími sekvencemi DNA. Struktura záznamu je podobná informacím v databáze Nucleotide.
Detailnější informace o proteinech je možné nalézt v databázi UniProtKB (http://www.uniprot.org). Tato databáze byla původně ručně revidována a představovala nejspolehlivější záznamy o proteinech. Kvalita informací je doteď na velmi vysoké úrovni, ale UniProtKB již musí používat i automatizované záznamy kvůli inflaci genetických informací v posledních letech. Záznam v databázi UniProtKB souhrnně uvádí informace o funkci proteinu včetně odkazů na původní data, organizmus, z kterého pochází, odkazy na 3D strukturu a domény, které se v daném proteinu vyskytují.
Zápis o funkci proteinu uvádí strukturu, jakou má tato informace v databáze Gene Ontology. Funkce produktu genu uvedena na třech úrovních informací:

  1. Biologický proces – jaký biologický proces vykonává daný protein, např. transport elektronů přes membránu.
  2. Součást buňky – kde v buňce se protein vyskytuje, např. integrální součást buněčné membrány.
  3. Molekulární funkce – co konkrétní vykonává na molekulární úrovni, např. aktivita při přenosu elektronů. 

Gene Ontology (GO) databáze se snaží zavést řád a standardizovat terminologii názvů genů a jejich produktů. Každý známý gen zařadí do konkrétní kategorie podle funkce, přičemž funkce jsou hierarchicky organizované od obecných zařazení po specifické. Hierarchická organizace umožňuje najít geny, které se podílejí na dané aktivitě v buňce. Na rozdíl od databází pro metabolické dráhy (KEGG, MetaCyc) GO neříká, jak spolu molekuly interagujú, ale co dělají.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity