
Bodový odhad intenzity
Pozorujeme trajektorii Poissonova procesu s konstantní intenzitou
v intervalu
zvolené délky
. Neznámou intenzitu
chceme odhadnout metodou maximální věrohodnosti na základě pozorování časů událostí. Předpokládejme, že během intervalu nastalo právě
událostí v časech
,
.
Z kapitoly o Poissonově procesu již víme, že doba od počátku pozorování do příchodu první události, , a doby mezi po sobě následujícími událostmi,
, jsou nsr s exponenciálním rozdělením s parametrem
. Tyto časové intervaly jsou rovny
,
. Hustota pravděpodobnosti náhodného vektoru
je tedy součinem hustot exponenciálních rozdělení (Zákon malých čísel 9).
|
1 |
Je však nutné si uvědomit, že tato hustota odpovídá situaci, že za dobu
přišlo alespoň
událostí, nikoliv právě
událostí!
Abychom vzali do úvahy i informaci, že , uvažujme ještě okamžik
-ní události,
. Označme
dobu mezi
-tou a
-ní událostí ve stejném Poissonově procesu. Protože až do času
bylo zaznamenáno právě
událostí, musela tato další událost přijít až po skončení intervalu pozorování,
, což ekvivalentně vyjádříme relací
.
S pomocí distribuční funkce , viz (Zákon malých čísel 10), pak spočítáme pravděpodobnost
|
2 |
Náhodné veličiny jsou nsr s exponenciálním rozdělením s parametrem
, a proto je hustota pravděpodobnosti náhodného vektoru
rovna
|
3 |
Současně však , to znamená, že hustota
je rovna
|
4 |
a nezávisí tedy na konkrétních okamžicích událostí, které nastaly během intervalu , ale pouze na jejich počtu,
.
Spočítáme logaritmickou věrohodnostní funkci ,
|
Derivací (hledáme stacionární bod) dostáváme rovnici
|
odkud vyjádříme maximálně věrohodný odhad,
|
5 |
jako poměr počtu událostí ku délce intervalu pozorování. Je zřejmé, že intenzita má rozměr rovný převrácené hodnotě jednotky času. Lehce ověříme pomocí druhé derivace, , že jde opravdu o maximum.
Prozkoumáme číselné charakteristiky maximálně věrohodného odhadu intenzity. Využijeme toho, že má Poissonovo rozdělení pravděpodobnosti s parametrem
a dostáváme střední hodnotu
|
6 |
Tento odhad intenzity je tedy nestranný. Pokračujeme výpočtem rozptylu,
|
7 |
Vidíme, že rozptyl odhadu lineárně klesá s rostoucí délkou intervalu pozorování. Výpočtem Fisherovy míry informace lze ukázat, že je dokonce tzv. vydatným (efficient) odhadem, tzn. že dosahuje nejmenšího možného rozptylu.
Všimneme si ještě jedné zajímavosti. Z Poissonova rozdělení náhodné veličiny , viz (Zákon malých čísel 4), lze pravděpodobnost (2) spočítat také takto:
|
8 |
Podmíněná hustota náhodného vektoru je dána podílem simultánní hustoty (4) a pravděpodobnosti (8),
|
Po jednoduché úpravě dostaneme
|
9 |
a nezávisí na intenzitě . To znamená, že statistika
je tzv. postačující statistikou (sufficient statistics ) pro parametr
. Veškerá statistická informace o intenzitě
je obsažena v počtu pozorovaných událostí
, nepotřebujeme znát okamžiky výskytu jednotlivých pozorovaných událostí. Tuto skutečnost dobře ilustruje následující fakt. Předpokládejme, že víme, že v intervalu
nastalo
událostí, avšak okamžiky jejich výskytu neznáme. Pravděpodobnost tohoto jevu je rovna (8) a střední hodnota je rovna
. Odtud snadno vyjádříme momentový odhad intenzity ve stejném tvaru, jako maximálně věrohodný odhad,
. Přitom podmíněná hustota (9) je konstantní, rovna
, což odpovídá hustotě uspořádaného výběru (seřazené časy příchodů událostí) rozsahu
z rovnoměrného rozdělení na intervalu
. Hustota každého náhodného výběru z rovnoměrného rozdělení je rovna
, ale vždy
výběrů (permutace časů příchodů událostí) odpovídá stejnému uspořádanému výběru.