Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datAnalýza a management dat pro zdravotnické obory, Analýza klinických dat Náhodná veličina, rozdělení pravděpodobnosti a reálná data Náhodná veličina a distribuční funkce

Logo Matematická biologie

Náhodná veličina a distribuční funkce

Označme množinu všech možných výsledků náhodného pokusu ( reprezentuje základní soubor), a jednotlivé elementární jevy ( reprezentuje -tý prvek základního souboru). Náhodná veličina představuje číselné vyjádření výsledku náhodného pokusu a každému elementárnímu jevu z přiřadí hodnotu z množiny možných hodnot.

Celý základní soubor často není znám (množina může být i nekonečná) a nejsme tak schopni ho popsat. Výhodou náhodné veličiny je, že základní prostor na čísla a teprve na jejich základě usuzujeme na vlastnosti . Náhodné veličiny je zvykem označovat velkými písmeny z konce abecedy, např. , jejich převádí číselné realizace pak odpovídajícími malými písmeny, např. .

Pravděpodobnostní chování náhodné veličiny, tedy přiřazení pravděpodobnosti každému možnému výsledku náhodné veličiny, jednoznačně popisuje tzv. rozdělení pravděpodobnosti (probability distribution), což je předpis daný buď jako funkce zadaná analyticky, nebo jako výčet možností a jim příslušných pravděpodobností. Druhou možnost lze ilustrovat jednoduchým příkladem v podobě sledování skutečnosti, zda při hodu kostkou padne číslo 6. Náhodná veličina X pak nabývá hodnot 1 (číslo 6 padlo, pravděpodobnost je rovna 1/6) nebo 0 (číslo 6 nepadlo, pravděpodobnost je rovna 5/6). Je tedy zřejmé, že náhodná veličina se netýká pouze kvantitativních znaků, neboť číselné vyjádření výsledku náhodného pokusu může popisovat i pohlaví.

Rozdělení pravděpodobnosti představuje model chování náhodné veličiny v cílové populaci. Pomocí vzorku (naměřených pozorování) se ptáme, jestli je model správný a jaké jsou jeho charakteristiky. Rozdělení pravděpodobnosti náhodné veličiny lze jednoznačně popsat pomocí tzv. distribuční funkce (cumulative distribution function), kterou standardně značíme .

Příklad 1. Uvažujme 5 hodů mincí. Náhodná veličina představuje počet líců a může nabývat pouze hodnot z množiny {0, 1, 2, 3, 4, 5}. Pro úplnost dodejme, že množina je v tomto případě množina všech uspořádaných pětic složených z nul a jedniček reprezentujících ruby, respektive líce. Pravděpodobnosti jednotlivých realizací náhodné veličiny lze spočítat jednoduše pomocí kombinatoriky: = 1/32, = 5/32, = 10/32, = 10/32, = 5/32, = 1/32. Distribuční funkce náhodné veličiny je pak schodovitá funkce daná tabulkou 3.1.

Tabulka 3.1: Hodnoty distribuční funkce náhodné veličiny X udávají počet líců v pěti hodech mincí.

Distribuční funkce je teoretický předpis, který sice definuje pravděpodobnostní model pro náhodnou veličinu , ale v řadě případů neznáme jeho přesné vyjádření. Jejím výběrovým ekvivalentem, který kumulativním způsobem popisuje pravděpodobnostní chování pozorovaných hodnot je tzv. výběrová (empirická) distribuční funkce (empirical cumulative distribution function), .

Výběrová distribuční funkce je při splnění předpokladu reprezentativnosti experimentálního vzorku odhadem teoretické distribuční funkce, což znamená, že z jejích hodnot a grafického znázornění můžeme usuzovat na vlastnosti teoretické distribuční funkce. Distribuční funkce jednoznačně přiřazuje každému číslu na reálné ose pravděpodobnost, když odpovídá na otázku, s jakou pravděpodobností náhodná veličina právě toto nepřekročí (obrázek 3.1). Často nás zajímá ale i opačná úvaha, tedy odpověď na otázku, jaké číslo na reálné ose nepřekročí náhodná veličina s určitou pravděpodobností (označme ji ), což může být např. číslo = 0,8, 0,9 nebo 0,95. Odpověď na tuto otázku dává tzv. kvantilová funkce, což je funkce inverzní k distribuční funkci, jejímž výsledkem není pravděpodobnost, ale právě číslo na reálné ose, které této pravděpodobnosti odpovídá.

Kvantilová funkce úzce souvisí s pojmem kvantil, který byl vysvětlen v předchozí kapitole, ale zatímco tam byl kvantil zaveden jako jedna z pozorovaných hodnot s určitou vlastností (-procentní kvantil rozděluje data na procent hodnot a () procent hodnot), zde se jedná o teoretickou funkci, která je charakteristikou rozdělení náhodné veličiny .

Obr. 3.1: Rozdělení pravděpodobnosti a distribuční funkce

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity