Slovník | Vyhledávání | Mapa webu
 
Analýza a modelování dynamických biologických datLineární a adaptivní zpracování dat Náhodné procesy a modely časových řad - dekompozice Úloha k procvičení

Logo Matematická biologie

Úloha k procvičení

ÚLOHA 1: Proveďte dekompozici časové řady pozorované při měřeních koncentrace CO2 v ovzduší. Soubor dat, který je dostupný na: http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc4411.htm obsahuje měsíční průměrné koncentrace CO2 na observatoři Mauna Loa v letech 1974 – 1987. Koncentrace jsou udávány v bezrozměrných jednotkách, jako molární zlomek (mole fraction).

Tab. 6.1:  Ukázka datového souboru pro modelovanou časovou řadu v úloze 1. Soubor obsahuje celkem 161 řádků, kde každý řádek reprezentuje jedno měření průměrné měsíční koncentrace CO2.

CO2 Rok a měsíc Rok Měsíc
333.13 1974.38 1974 5
332.09 1974.46 1974 6
331.10 1974.54 1974 7
329.14 1974.63 1974 8
327.36 1974.71 1974 9
327.29 1974.79 1974 10
328.23 1974.88 1974 11
329.55 1974.96 1974 12
330.62 1975.04 1975 1
331.40 1975.13 1975 2
331.87 1975.21 1975 3
333.18 1975.29 1975 4
333.92 1975.38 1975 5

 

Řešení

Data, která jsou na uvedené adrese k dispozici v textovém formátu, je třeba nejdříve převést běžnými softwarovými prostředky do souboru ve formátu CSV (comma separated values), kde jsou na každém řádku k dispozici všechny numerické hodnoty k jednomu měření oddělené čárkou, tabulátorem nebo středníkem. Každé měření je reprezentováno čtyřmi parametry, z toho tři reprezentují údaje na časové ose, jak ukazuje tab. 6.1.

Kód skriptu, který v Matlabu realizuje načtení dat, jejich vykreslení, analýzu trendu a periodických komponent je na obr. 6.4. Na obr. 6.5 je časová řada vykreslena spolu s vypočítanou lineární trendovou funkcí. Obr. 6.6 ukazuje grafickou analýzu čar v diskrétním spektru vypočteném z časové řady očištěné od lineárního trendu. Výsledkem analýzy jsou dvě významné harmonické komponenty s periodou 12 a 6 měsíců. Sezónní diferencování s periodou 12 vzorků utlumí obě tyto komponenty (i další vyšší harmonické), jak je vysvětleno v textu výukové jednotky Náhodné procesy a modely časových řad - Boxovy a Jenkinsovy modely a na obr. 6.3.

Obr. 6.4:  Úloha 1 – modelování časové řady s měsíčními koncentracemi CO2.
První část: dekompozice.

 

Obr. 6.5: Nahoře: časová řada x(t) s měsíčními koncentracemi CO2 v ovzduší a lineární trendová funkce T(t) vypočítaná z x(t) pomocí metody nejmenších čtverců. Dole: časová řada x(t) očištěná od lineárního trendu a s indexem vzorku n jako nezávisle proměnnou.

 

Obr. 6.6: Zjišťování periody významných cyklických/sezónních jevů. Amplitudová část diskrétního spektra: vlevo - časové řady očištěné od lineárního trendu dx(n)=x(n)-T(n), vpravo - časové řady očištěné od lineárního trendu a po sezónním diferencování s periodou 12 vzorků. Při zjišťování periody ve frekvenční doméně je nutno mít na paměti, že spektrum je diskrétní a frekvenční osa je vzorkována podle počtu vzorků časové řady, viz rov. 2.8 pro definici DFT. V časové řadě xd(n) je 161 vzorků a v časové řadě xd12(n) je po sezónním diferencování 149 vzorků.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity