Slovník | Vyhledávání | Mapa webu
 
Analýza a modelování dynamických biologických datLineární a adaptivní zpracování dat Náhodné procesy a modely časových řad - dekompozice Vybrané statistické momenty náhodných procesů Korelační a kovarianční funkce

Logo Matematická biologie

Korelační a kovarianční funkce

Pokud časová řada x(n) nabude pro konkrétní n hodnoty X, je pravděpodobné, že ještě alespoň krátkou dobu po n zůstanou i další hodnoty časové řady x(n) v okolí X. Vzorky časové řady s krátkým vzorkovacím intervalem obecně nejsou na sobě nezávislé. Je proto třeba znát časové průměry charakterizující tyto závislosti (nebo korelace) mezi vzorky v různých časech. Jedním z takových časových průměrů je autokorelační funkce.

(6.12)

Díky stacionaritě časových průměrů nezávisí autokorelační funkce Rxx(k) na absolutním času daným indexem vzorku n, ale jen na zpoždění mezi vzorky k. Z uvedeného vztahu lze intuitivně usoudit, že autokorelační funkce měří podobnost mezi po sobě jdoucími vzorky časové řady. Pokud jsou změny v časové řadě pomalé, budou mít vzorky v n a n-1 často stejné znaménko, a tak bude průměrná hodnota jejich součinů Rxx velká. Naopak, pokud se časová řada s nulovou střední hodnotou mění velmi rychle a pro vzorky oddělené krátkými intervaly je stejně pravděpodobné, že mají shodná i různá znaménka, bude se průměrná hodnota jejich součinů Rxx nejspíš blížit nule [1].

Dalším časovým průměrem, který charakterizuje závislosti mezi vzorky v různých časech, se nazývá autokovarianční funkce.

(6.13)

Jedná se o autokorelační funkci časové řady s odečtenou střední hodnotou. Protože jde o autokorelační funkci, budou mít Cxx a Rxx stejné matematické vlastnosti.

Autokorelační funkce jsou sudé funkce zpoždění:

(6.14)

Autokorelační funkce časové řady x(n) vyčíslená v počátku odpovídá střednímu výkonu x(n) a autokovarianční funkce časové řady x(n) v počátku odpovídá rozptylu x(n):

(6.15)
(6.16)

Autokorelační funkce nabývá maxima vždy v počátku:

(6.17)

Pro veliká zpoždění k se autokovarianční funkce časové řady x(n), je-li x(n) bez periodických komponent, blíží nule:

(6.18)

Předchozímu tvrzení odpovídá intuitivní představa o tom, že vzorky, které jsou v náhodné časové řadě oddělené velkým zpožďovacím intervalem k, jsou nekorelované. Toto odpovídá případům, kdy je časový průběh sledovaného náhodného procesu velmi nepravidelný a nepředvídatelný.

Pro veliká zpoždění k se autokorelační funkce časové řady x(n) blíží kvadrátu střední hodnoty x(n):

(6.19)

Autokorelační koeficient rxx(k) lze vyjádřit jako hodnotu autokovarianční funkce vztaženou k rozptylu:

(6.20)

O náhodné časové řadě v(n) se říká, že je bílá, když je její autokovarianční funkce Cvv váženým jednotkovým impulsem v počátku:

(6.21)

Pro autokorelační funkci bílé časové řady potom platí:

(6.22)

Pojem „bílá“ pochází z fyziky světelného záření, o němž se říká, že je bílým světlem, pokud jeho zdroj vyzařuje energii rovnoměrně na všech vlnových délkách vnímaných lidským okem. Tato fyzikální představa má i svůj matematický základ, neboť se dá ukázat, že spektrum jednotkového impulsu je rovnoměrné, což znamená, že jeho harmonické složky jsou na všech frekvencích zastoupeny stejně. Při modelování časových řad hraje zásadní roli bílý šum, jak bude ukázáno později v této kapitole.

V mnoha úlohách se nevystačí pouze s analýzou jediné náhodné časové řady, ale je třeba se zabývat kombinací více časových řad.  Například pro biosignál snímaný z lidské hrudi můžeme pozorovanou časovou řadu x(n) chápat jako aditivní směs užitečné složky, tj. elektrokardiogramu s(n) a rušivé složky v(n), způsobené aktivitou jiných svalů a šumem snímací elektroniky:

(6.23)

Autokorelační funkce časové řady x(n) je dána:

(6.24A)

a s využitím (6.12) lze (6.24) přepsat na:

(6.24B)

S využitím křížové korelační funkce[1] dvou náhodných časových řad x(n) a y(n), která je definována jako [1]:

(6.25)

lze (6.23) a (6.24) přepsat na:

(6.26)

Podobně jako autokorelační funkce určuje míru závislosti mezi následujícími vzorky jediné časové řady, vyjadřuje křížová korelační funkce Rxy(k) podobnost mezi časovou řadou x(n) a zpožděnou časovou řadou y(n). Křížová korelační funkce centrovaných časových řad x(n)-mx a y(n)-my se označuje jako křížová kovarianční funkce [1]:

(6.27)

Na rozdíl od autokorelačních funkcí nejsou křížové korelační funkce sudé:

(6.28)

Korelační koeficient rxy(k) lze vyjádřit jako křížovou kovarianční funkci normovanou součinem směrodatných odchylek:

(6.29)

O časových řadách x(n) a y(n) se říká, že jsou nekorelované, je-li jejich křížová kovarianční funkce Cxy(k) nulová pro všechna zpoždění k. Taková situace často ukazuje na to, že časové řady x(n) a y(n) jsou realizace dvou na sobě nezávislých náhodných procesů. Z (6.27) vyplývá, že pokud je alespoň jeden z náhodných procesů charakterizován nulovou střední hodnotou, potom i křížová korelační funkce Rxy(k) je nulová pro všechna zpoždění k.

Křížové korelační a autokorelační funkce jsou užitečné pro detekci periodických komponent v časových řadách postižených aditivním rušením. Obr. 6.1 ukazuje tuto detekci ve směsi užitečné harmonické složky s(n)=A cos (wn+j) a aditivního rušení v(n) s nulovou střední hodnotou. Předpokládá se, že užitečná složka a rušivá složka jsou nekorelované. Křížová korelační funkce mezi aditivní směsí a jednotkovou kosinovou vlnou y(n)= cos (wn)  se stejnou úhlovou frekvencí jako s(n) je:

(6.30)

Druhý člen v rovnici (6.30) je nulový, neboť y(n) a v(n) jsou nekorelované (viz výše uvedený předpoklad), a tak se křížová korelační funkce zjednoduší tak, že je až na amplitudu stejná jako užitečná složka:

(6.31)

V případech, kdy není perioda užitečné složky předem známá, lze pro určení periody využít autokorelační funkci směsi x(n):

(6.32)

kde poslední dva členy budou nulové za předpokladu, že rušení v(n) a užitečná složka s(n) jsou nekorelované. Autokorelační funkce náhodné rušivé složky Rnn(k) bude pro velká zpoždění mezi vzorky zanedbatelná, a tak bude jistě snazší určovat periodu užitečné periodické složky z Rxx(k) než z průběhu x(n), viz obr. 6.1D.

 


 

[1] Křížová korelační funkce je v české odborné literatuře uváděná také jako vzájemná korelační funkce.

 

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity