Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza sekvencí DNA Substituční model Parametry substitučního modelu Vektor frekvence bází

Logo Matematická biologie

Vektor frekvence bází

Frekvence výskytu nukleotidových bází (base frequency vector - π) byla součástí cvičení Složení sekvence. V nejjednodušším příkladu se budou v sekvenci vyskytovat všechny nukleotidové báze se stejnou frekvencí = 1/4. Takový přístup má výhodu v tom, že je neparametrický, ale zase slabě odpovídá reálným datům. Proto je vhodné minimálně rozlišovat frekvenci purinů a pyrimidinů, kdy potřebujeme určit jenom jeden volný parametr:

Ideální postup ale uvádí specifickou frekvenci pro každou nukleotidovou bází, která je většinou určena empiricky.

Dostatečně velké datasety budou obsahovat dostatek informací k správnému a přesnému určení všech tří volných hodnot parametrů vektoru frekvence bází. Praktická pomůcka je, že pro datasety, které obsahují alespoň kolem tisíce znaků, je možné již dostatečně dobře určit všechny parametry pro .

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity