Motivace
Distribuční funkce popisuje rozložení pravděpodobnosti náhodné veličiny (budeme předpokládat spojitost náhodné veličiny). Stejně jako při rekonstrukci hustoty zmnožiny pozorovaných dat lze distribuční funkci odhadnout parametrickými nebo neparametrickými metodami. Zaměříme se výhradně na neparametrické metody, kdy předpokládáme pouze jistou hladkost odhadované distribuční funkce.
Distribuční funkce má použití v analýze přežití, v teorii spolehlivosti, klasifikaci diagnostických testů (ROC křivky) aj. Funkce se nazývá funkce přežití a vyjadřuje pravděpodobnost, že daná událost (úmrtí, selhání, porucha) nenastane dříve než po nějakém čase S touto funkcí se můžeme setkat i v hydrologii, kde se nazývá křivkou zabezpečenosti.
Křivka zabezpečenosti je jedním z nejdůležitějších indikátorů toku řeky během daného časového období. Tato křivka vyjadřuje míru, s jakou je zajištěn vybraný průtok. Máme k dispozici průměrné měsíční průtoky řeky Dyje v profilu Vranov1 (pod přehradou Vranov, plocha povodí asi 2,220 km2) v období 1931-1990. Zajímá nás stabilita měsíčních průměrných průtoků.
Obr. 1. Průměrné měsíční průtoky řeky Dyje
|
Máme-li tedy náhodnou veličinu která je popsána svou distribuční funkcí a k ní příslušnou hustotou pak platí
|
|
|
|
Nejužívanějším neparametrickým odhadem distribuční funkce je empirická distribuční funkce Ovšem je schodovitá funkce i v případě, že je spojitá. Nadaraya (1964) navrhl „hladkou“ alternativu k a to jádrový odhad který se získá integrací známého jádrového odhadu hustoty Jádrové odhady hustoty (1).
1 Data byla poskytnuta ČHMÚ, pobočka Brno.