Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datTeorie a praxe jádrového vyhlazování Jádrové odhady hustoty Motivace

Logo Matematická biologie

Motivace

Velká část pozorování a měření prováděných v biologii i jiných vědách má výsledek vyjádřený reálným číslem. Tato čísla jsou hodnotami nějaké reálné náhodné veličiny. Jako příklad můžeme vzít měření obsahu cholesterolu v krevní plazmě pacientů. Jde o soubor 371 měření - hodnoty jsou na následujícím obrázku - která byla provedena u pacientů, kteří si stěžovali na bolest na hrudi. Data pocházejí z rozsáhlé studie, v níž autoři zkoumali vliv lipidů a jiných látek na nemoci srdce [10, 11].

Obr. 3.1. Měření cholesterolu v krevní plazmě 371 pacientů

Chceme zjistit, jak často se v populaci vyskytuje dané množství cholesterolu v krvi? Případně, jaká je pravděpodobnost, že pacient bude mít zvýšený obsah cholesterolu? Rozdělení pravděpodobnosti je popsáno reálnou funkcí, která se nazývá hustota pravděpodobnosti a značí se  Hustota pravděpodobnosti je základním pojmem ve statistice [1, 2]. Funkce hustotou spojité náhodné veličiny, jestliže platí

  • je nezápornou funkcí pro všechna
  •  

Odhadem hustoty rozumíme rekonstrukci hustoty z množiny naměřených dat. Tato rekonstrukce může poskytnout důležité informace o dané množině dat. Předpokládejme, že máme k dispozici nezávislé náhodné proměnné které mají tutéž spojitou hustotu Můžeme předpokládat, že neznámá hustota patří do třídy hustot, které závisejí na nějakých parametrech. Pro odhad hledané hustoty je tedy třeba odhadnout tyto parametry. Tento přístup se nazývá parametrický.

My se zaměříme na neparametrický přístup, ve kterém se předpokládá pouze jistá hladkost odhadované hustoty (tj. dostatečný počet spojitých derivací). 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity