Slovník | Vyhledávání | Mapa webu
 
Analýza a modelování dynamických biologických datLineární a adaptivní zpracování dat Náhodné procesy a modely časových řad - dekompozice Náhodné procesy a modely časových řad

Logo Matematická biologie

Náhodné procesy a modely časových řad

Experimentální data v podobě časových řad získaných pozorováním reálných dynamických systémů mohou být využita pro konstrukci matematických modelů těchto systémů. Modely jsou z naměřených dat zpravidla vytvářeny za účelem hlubšího porozumění operacím a vazbám, které ovlivňují vznik hodnot časových řad, viz obr. 1.1. Dílčími změnami těchto operací nebo vazeb, prováděnými nad modelem, lze simulovat jejich vliv na změny hodnot časové řady. Matematický aparát modelování umožňuje nalézt v časových řadách ty komponenty, které nesou užitečnou informaci a které mají přímou interpretaci, popsat je ve formě deterministických funkcí času a separovat je od náhodné složky rušení. Analýzou časových řad ve formě modelování procesů jejich vzniku a s využitím simulací nad zkonstruovanými modely lze od prostého pozorování dospět až k možnostem ovlivnění či řízení systémů, které časové řady generují.

Při modelování vzniku časových řad se naměřené posloupnosti obvykle považují za realizace náhodných procesů. Pojem „náhodný“ je používán vzhledem k časté nepravidelnosti či komplikovanosti dějů reprezentovaných naměřenými průběhy, což však nutně neznamená, že by takové časové řady byly nepredikovatelné. Příkladem uváděným v [1] je elektrokardiogram, jehož hodnotu je sice možno vypočítat z elektrických potenciálů všech srdečních svalových buněk, avšak získávat takto složitá data pro rozhodování, zda pacient potřebuje kardiostimulátor, by bylo příliš náročné. Není tedy chybou považovat časovou řadu pro určitý účel za realizaci náhodného procesu a pro tutéž časovou řadu konstruovat kompletní deterministický model, vyžaduje-li to jiný účel. Postup modelování časových řad vyžaduje obvykle následující kroky.

  • Změření dat. Konstrukce dobrého modelu závisí na tom, zda naměřená data reflektují chování modelovaného systému či náhodného procesu. Správné nastavení experimentu zahrnuje nejen sledování těch správných proměnných s dostatečnou přesností, ale jde také o to, aby záznam byl dostatečně dlouhý[1] a pořizovaný s vhodnou vzorkovací frekvencí tak, aby byly zachyceny veškeré důležité dynamické jevy.
  • Volba struktury modelu. Strukturou se myslí matematický vztah mezi vstupními a výstupními proměnnými, přičemž tento vztah obsahuje neznámé parametry. Příkladem struktury lineárního modelu může být přenosová funkce H(z) s nastavitelnými póly a nulovými body. Za strukturu lineárního modelu lze považovat např. i tuto jednoduchou diferenční rovnici: y(n) + ay(n - 1) = bx(n), kde a a b jsou volitelné parametry modelu. Struktura modelu často souvisí s matematicko-fyzikálními principy, kterými se řídí pozorované jevy. Je-li struktura modelu dána známými zákony a závislostmi, pak je cílem modelování pouze odhad numerických hodnot parametrů modelu z dostupných dat a takové úlohy se označují jako modelování šedé skřínky (gray-box modelling). Pokud struktura modelu není předem známá, potom se hovoří o modelování černé skřínky (black-box modelling).
  • Odhad parametrů modelu podle zvolené struktury. Výpočet numerických hodnot parametrů modelu vede na minimalizaci rozdílu mezi naměřenými daty x(n) a výstupem modelu . Tento rozdíl:

(6.1)

se označuje jako chyba predikce a z vážené l2-normy posloupnosti n(n) se odvozuje minimalizační kritérium označované také jako střední kvadratická chyba (MSEmean squared error).

  • Hodnocení kvality modelu. V závěrečném kroku je nutné posoudit kvalitu modelu a prověřit tak, zda je chování modelu adekvátní k zadané aplikaci. Hodnocení může být provedeno např. prostým srovnáním časových řad x(n) a  (např. graficky), nebo pomocí analýzy n(n), která se často označuje jako analýza residuí. Residua reprezentují tu část dat, která není vysvětlena modelem.

 


[1] Pojem "dostatečně dlouhý" je nutno vnímat s ohledem na to, jak rychlé jsou změny v naměřených průbězích nebo s ohledem na periody opakujících se jevů.

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity