Význam popisu a vizualizace dat
Metody popisné statistiky mají za cíl sumarizovat pozorované hodnoty tak, abychom mohli lépe a jednodušeji pracovat s informací v nich uloženou. Na základě pozorovaných hodnot chceme vypočítat hodnoty označované jako statistiky (statistics), které budou pozorovaná data dále zastupovat při prezentaci, testování apod. Jinak řečeno, tyto zástupné hodnoty slouží k „uložení“ informace obsažené v datech, neboť použití všech pozorovaných hodnot je nepraktické a často vlastně i nemožné.
Cílem vizualizace dat je především pozorovaná data graficky zpřehlednit a poskytnout uživateli na minimální ploše maximum informací. Vizualizace dat je nezbytná bez ohledu na to, jak pokročilé metody chceme následně při zpracování dat použít, vizualizace nám totiž dává informaci nejen o charakteru dat, případně procesu, při kterém vznikla, ale i o problematických záznamech a chybných hodnotách. Bez adekvátní vizualizace můžeme v datech nechat pozorování, která negativně ovlivní další hodnocení a znemožní správnou interpretaci výsledků. Identifikaci problematických hodnot se věnuje část Identifikace odlehlých hodnot.
Výstupy popisného zpracování dat jsou obecně neformální, jde pouze o shrnutí pozorovaného a ne o formální testování hypotéz s použitím statistických testů. Vztahují se pouze na vybraný soubor dat, respektive na experimentální vzorek, a zobecnění získaných informací na celou cílovou populaci je tak opět podmíněno jeho reprezentativností vůči cílové populaci. Výstupy popisné statistiky často slouží jako podklad pro stanovení hypotéz, které jsou následně ověřeny dalšími experimenty.