Slovník | Vyhledávání | Mapa webu
 
Analýza a modelování dynamických biologických datVybrané kapitoly z matematického modelování Statistické metody pro Poissonův proces Bodový odhad intenzity

Logo Matematická biologie

Bodový odhad intenzity

Pozorujeme trajektorii Poissonova procesu s konstantní intenzitou v intervalu zvolené délky . Neznámou intenzitu chceme odhadnout metodou maximální věrohodnosti na základě pozorování časů událostí. Předpokládejme, že během intervalu nastalo právě událostí v časech , .
Z kapitoly o Poissonově procesu již víme, že doba od počátku pozorování do příchodu první události, , a doby mezi po sobě následujícími událostmi, , jsou nsr s exponenciálním rozdělením s parametrem . Tyto časové intervaly jsou rovny , . Hustota pravděpodobnosti náhodného vektoru je tedy součinem hustot exponenciálních rozdělení (Zákon malých čísel 9).

1

Je však nutné si uvědomit, že tato hustota odpovídá situaci, že za dobu přišlo alespoň událostí, nikoliv právě událostí!

Abychom vzali do úvahy i informaci, že , uvažujme ještě okamžik -ní události, . Označme dobu mezi -tou a -ní událostí ve stejném Poissonově procesu. Protože až do času bylo zaznamenáno právě událostí, musela tato další událost přijít až po skončení intervalu pozorování, , což ekvivalentně vyjádříme relací .

S pomocí distribuční funkce , viz (Zákon malých čísel 10), pak spočítáme pravděpodobnost

2

Náhodné veličiny jsou nsr s exponenciálním rozdělením s parametrem , a proto je hustota pravděpodobnosti náhodného vektoru rovna

3

Současně však , to znamená, že hustota je rovna

 4

a nezávisí tedy na konkrétních okamžicích událostí, které nastaly během intervalu , ale pouze na jejich počtu, .

Spočítáme logaritmickou věrohodnostní funkci ,

Derivací (hledáme stacionární bod) dostáváme rovnici

odkud vyjádříme maximálně věrohodný odhad,

5

jako poměr počtu událostí ku délce intervalu pozorování. Je zřejmé, že intenzita má rozměr rovný převrácené hodnotě jednotky času. Lehce ověříme pomocí druhé derivace, , že jde opravdu o maximum.
Prozkoumáme číselné charakteristiky maximálně věrohodného odhadu intenzity. Využijeme toho, že má Poissonovo rozdělení pravděpodobnosti s parametrem a dostáváme střední hodnotu

6

Tento odhad intenzity je tedy nestranný. Pokračujeme výpočtem rozptylu,

7

Vidíme, že rozptyl odhadu lineárně klesá s rostoucí délkou intervalu pozorování. Výpočtem Fisherovy míry informace lze ukázat, že je dokonce tzv. vydatným (efficient) odhadem, tzn. že dosahuje nejmenšího možného rozptylu.
Všimneme si ještě jedné zajímavosti. Z Poissonova rozdělení náhodné veličiny , viz (Zákon malých čísel 4), lze pravděpodobnost (2) spočítat také takto:

8

Podmíněná hustota náhodného vektoru je dána podílem simultánní hustoty (4) a pravděpodobnosti (8),

Po jednoduché úpravě dostaneme

9

a nezávisí na intenzitě . To znamená, že statistika je tzv. postačující statistikou (sufficient statistics ) pro parametr . Veškerá statistická informace o intenzitě je obsažena v počtu pozorovaných událostí , nepotřebujeme znát okamžiky výskytu jednotlivých pozorovaných událostí. Tuto skutečnost dobře ilustruje následující fakt. Předpokládejme, že víme, že v intervalu nastalo událostí, avšak okamžiky jejich výskytu neznáme. Pravděpodobnost tohoto jevu je rovna (8) a střední hodnota je rovna . Odtud snadno vyjádříme momentový odhad intenzity ve stejném tvaru, jako maximálně věrohodný odhad, . Přitom podmíněná hustota (9) je konstantní, rovna , což odpovídá hustotě uspořádaného výběru (seřazené časy příchodů událostí) rozsahu z rovnoměrného rozdělení na intervalu . Hustota každého náhodného výběru z rovnoměrného rozdělení je rovna , ale vždy výběrů (permutace časů příchodů událostí) odpovídá stejnému uspořádanému výběru.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity