Vícerozměrná data
Vícerozměrná data se vyskytují v situacích, kdy pozorovaný soubor popisujeme více než jednou proměnnou (vlastností, charakteristikou, znakem). Výsledný datový soubor objektů, u nichž jsme zjistili hodnoty proměnných, zapisujeme ve formě matice s rozměrem :
Je patrné, že jednotlivé objekty jsou zaznamenány v řádcích matice , zatímco sloupce této matice odpovídají záznamům jednotlivých proměnných. Jeden prvek matice je tedy hodnota -té proměnné u ‑tého objektu. Ukázkový datový soubor v maticovém zápisu je na Obr. 1.
Proměnné popisující jednotlivé objekty mohou být dvou základních typů, a to kvalitativní (kategoriální) a kvantitativní (numerické). Kvalitativní proměnné není možné kvantifikovat, lze je pouze řadit do kategorií. Patří sem proměnné binární (např. pohlaví), nominální (např. krevní skupiny) a ordinální (např. stupeň bolesti). Kvantitativní proměnné lze na rozdíl od kvalitativních charakterizovat číselnou hodnotou. Rozlišujeme kvantitativní proměnné spojité (např. výška a váha osob) a diskrétní (např. počet hospitalizací pacienta s leukémií). Jiné dělení kvantitativních proměnných je na proměnné intervalové (např. teplota ve stupních Celsia) a poměrové (např. výška a váha osob). Více detailů k jednotlivým typům proměnných lze najít [Typy dat]. V následující podkapitole si ukážeme, jak můžeme vícerozměrná data obsahující kvalitativní i kvantitativní proměnné znázornit graficky.