Nejistota v anotaci
Často ale není možné ověřit laboratorně všechny anotované geny. V takových případech je vhodné sekvenci anotovat s přiznáním nejistoty v anotaci.
Typy přiznané nejistoty anotací genů, jak se vyskytují v záznamech genetických databází:
- Hypothetical - neznámá funkce, bez podobného záznamu v GenBance
- Conserved hypothetical - neznámá funkce, podobný záznam již existuje
- -like - protein vypadá podobně jako známý protein, ale bez jistoty, zda jde o ortology
- Ortology – homologické sekvence u různých druhů
- Paralogy – homologické sekvence v jednom genomu po duplikaci lokusu
- Putative - pravdepodobně se jedná o protein
- Predicted - predikovaný protein bez biochemického ověření
Samotný název proteinu by měl být používaný jen v případech, kdy daný gen byl u daného organismu jednoznačně identifikovaný (např. EST). Zároveň je hypotetické proteiny potřeba brát v úvahu jako možný cíl budoucího výzkumu. Např. cvičení ke kapitole Genetické databáze – gen pro protein microcin S měl v databázích ortology se 100% shodou sekvence aminokyselin, které byly značené jako „hypothetical protein“