Slovník | Vyhledávání | Mapa webu
 
Analýza a modelování dynamických biologických datSignály a lineární systémy Časové řady I 1 Vzorkování 1.1 Seznamme se

Logo Matematická biologie

1.1 Seznamme se

Vzhledem k zaměření těch, jimž je tento text určen především, musíme začít trochu obecněji.

Definice 1.1. Vzorkování je postup výběru jednotlivých pozorování, na jehož základě získáváme informaci o vlastnostech sledované skutečnosti či jevu.

Každé pozorování může obecně zahrnovat více vlastností (věk, diagnóza onemocnění, velikost napětí, …), které mohou být použity k identifikaci daného jevu či jeho části.

Teď zkusme stručnou úvodní definici ještě dále upřesnit.

Definice 1.2. Vzorkováním rozumíme postup výběru určité podmnožiny (vzorku) dané množiny (veličiny, signálu, populace, dat, materiálu) tak, aby vlastnosti vybraného vzorku (dostatečně) přesně reprezentovaly vlastnosti celé množiny (veličiny, signálu, populace, dat, materiálu).

V této definici může být problém s vymezením pojmu dostatečně přesné reprezentace vzorkovaného děje. Protože vzorkování je postup, který je součástí technické praxe, zejména spojené s oblastí zpracování informace, veličin i signálů jedno- či vícerozměrných (obrazů, video sekvencí, apod.), stejně tak jako praxe statistické, např. při kontrole jakosti výroby či léčebného procesu nebo třeba i při průzkumu veřejného mínění, budou požadavky na přesnost vyjádření vzorkovaného děje vyplývat z aplikací.

Takové aplikace mohou být na příklad:

  • volba frekvence a místa odběru pro hodnocení úrovně znečištění vodních toků;
  • volba parametrů digitalizace obrazu pro jeho přenos či archivaci;
  • volba tématu a množiny respondentů při průzkumu veřejného mínění;
  • výběr výrobků při výstupní kontrole kvality výroby;
  • výběr pacientů pro odhad vývoje daného onemocnění;
  • diagnostika centrální nervové soustavy založená na zpracování signálu EEG.

Každá z obou aplikačních oblastí má svá specifika v terminologii i přístupech. Např. statistická analýza pojímá vzorkování poněkud šířeji, i jako součást plánování experimentu a vychází z existence variability dat, jejíž příčiny nemusí být vždy jasné a navíc je variabilita považována za víceméně nežádoucí složku, kterou není nutné v navzorkovaných datech zachovat. Lze proto v statistických publikacích nalézt i následující definici:

Definice 1.3. Vzorkování je postup selekce jednotlivých pozorování s cílem získat určitou znalost o dané populaci, zejména pro účely statistické inference1.

Zatímco oblast zpracování signálů předpokládá, že veškerá informace v datech zůstane zachována (tzn., že za určitých podmínek lze původní průběh signálu z navzorkovaných dat beze zbytku zrekonstruovat), vzorkování v oblastech připouštějících určitou neurčitost v datech netrvají na možnosti zrekonstruovat původní data, nýbrž pouze požadují, aby závěry vyvozené z pořízených dat byly správné.

Podle všech výše uvedených definic je vzorkování pojem označující proces pořizování vzorků, prvků množiny určené definičním oborem daných pozorování a určování funkční hodnoty, která vzorek charakterizuje.

Definiční obor může být tvořen např. množinou všech onkologických pacientů v České republice (statistika často používá pro označení této definiční množiny pojem populace), všechny automobily vyrobené ve Středočeském kraji, všechny vodní toky a plochy v Evropě, barevná fotografie. Z uvedených příkladů plyne, že definiční obor může být jak množina spojitá, tak i diskrétní.

Vzorky musí být vybrány tak, aby bylo možné z funkčních hodnot jejich vlastností určit hodnoty funkce vlastností v celém definičním oboru, podle aplikační oblasti, buď zcela přesně, nebo alespoň odhadnout s dostatečnou požadovanou přesností, příp. alespoň odhadnout jejich globální charakteristiky.

Pro kvalitu rekonstrukce funkce vlastností je rozhodující způsob výběru vzorků. Strategie jejich výběru může být určena nějakým pevně stanoveným deterministickým pravidlem, nebo může být i náhodná.

 

 


1Inference (lat.inferre vnášet, přinášet, dedukovat; in- do, ferre nést, nosit) ~ usuzování, odvozování výroků z jiných souvislostí. Pojem používaný ve filosofii, matematice, statistice a logice, psychologii, atp. V psychologii můžeme použít tohoto pojmu pro rozpoznání právě prožívaného emočního či afektivního stavu pozorované osoby z výrazu jejího obličeje, v informatice se používá pro konstrukci substitučních pravidel gramatik ze znalosti slov formálního jazyka, … .

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity