Slovník | Vyhledávání | Mapa webu
 
Aplikovaná analýza klinických a biologických datAnalýza a management dat pro zdravotnické obory, Analýza klinických dat Data, jejich popis a vizualizace Význam popisu a vizualizace dat Popis a vizualizace kvalitativních dat

Logo Matematická biologie

Popis a vizualizace kvalitativních dat

Označme zaznamenané hodnoty sledovaného znaku u výběrového souboru subjektů. U kvalitativních dat předpokládáme opakování pozorování jednotlivých hodnot daného znaku, proto je logické sumarizovat tato data pomocí tabulky s četnostmi možných hodnot (tabulka četností, frequency table). Označíme-li možné hodnoty sledovaného znaku, pozorovanou (absolutní) četnost odpovídající variantě znaku budeme označovat jako . Pro lepší orientaci a možnost srovnání je vhodné doplnit pozorovanou četnost i relativní četností, která má pro variantu znaku tvar .

Příklad 1. Sledujeme přítomnost diabetu u pacientů zdravotnického zařízení za období jednoho roku s tím, že rozlišujeme pacienta bez diabetu a pacienty s diabetem 1. nebo 2. typu ( = 3). Celkem bylo pozorováno = 687 pacientů, sumarizaci výsledků uvádí tabulka 2.1.

Tabulka 2.1: Počty pacientů ve zdravotnickém zařízení dle přítomnosti diabetu

Vzhledem k tomu, že kvalitativní data často nelze seřadit dle velikosti, používá se jako frekvenční charakteristika těchto dat tzv. mód (mode), což je varianta znaku s největší četností. V příkladu 1 je modální hodnotou pacient bez diabetu. Vypovídací hodnota módu jako reprezentanta pozorovaných dat závisí především na počtu kategorií sledovaného znaku a vyrovnanosti jejich četností. Někdy může být mód opravdu typickou hodnotou, jindy mohou být četnosti jednotlivých variant znaku tak vyrovnané, že to spíše indikuje neexistenci typické hodnoty pro daný znak.

V případě nízkých pozorovaných četností některých kategorií je často vhodné tyto kategorie sloučit a dále pracovat již pouze se sloučenými kategoriemi. Slučovat by se však měly pouze příbuzné (nebo po sobě následující v případě seřaditelných kategorií) kategorie a ještě pouze v případě, kdy jejich sloučení zachovává data interpretovatelnými (příkladem mohou být hierarchické kategorizace jako je mezinárodní klasifikace nemocí, kdy namísto detailních podkategorií diagnózy je možné použít danou diagnózu souhrnně nebo stádia onemocnění, kdy namísto detailních stádií I, II, III, IV dává v řadě případů smysl sloučení I+II, III+IV  apod.).

Pro vizualizaci kvalitativních dat se nejčastěji používají sloupcový graf (bar plot) a výsečový neboli koláčový graf (pie chart), kde výška sloupců (šířka je pro všechny sloupce stejná), respektive plocha výsečí, pro jednotlivé varianty je úměrná jejich četnosti. U koláčového grafu jeho plocha představuje 100 %, proto je vhodný pro vizualizaci relativních četností, ve sloupcovém grafu můžeme zobrazit obojí, jak absolutní, tak relativní četnosti. Příklad sloupcového a koláčového grafu s absolutními a relativními četnostmi z tabulky 2.1 je uveden na obrázku 2.1.

Obr. 2.1: Příklad sloupcového a výsečového grafu na datech z tabulky 2.1.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity