Hierarchické shlukování
Hierarchické shlukovací metody seřazují skupiny do hierarchické struktury. Existují dva přístupy hierarchického shlukování: aglomerativní a divizivní. Při aglomerativních metodách spojujeme objekty navzájem nejpodobnější a poté s každou skupinou pracujeme jako se samostatným objektem až do okamžiku, kdy zůstane pouze jedna skupina. Tento postup není vhodný pro velmi objemná data. U divizivních metod se celý soubor dělí nejčastěji na dvě části – každou z nich lze potom považovat za samostatný soubor, který se znovu dělí.
Výsledky hierarchických shlukovacích metod lze graficky znázornit v podobě stromu – dendrogramu) (Obr. 1). Představíme si jej na příkladu aglomerativního shlukování. Na vodorovné ose je stupnice pro hladinu spojování (Obr. 1a). Vlevo začíná strom n větvemi – objekty, v příkladu na Obr. 1 je jich pět. V každém kroku se spojí dvě větve v bodě, který odpovídá příslušné hladině spojení. V příkladu na obrázku jsou si nejpodobnější objekty 1 a 2, jsou tedy spojeny na nejnižší hladině. Dále jsou si velice podobné i objekty 4 a 5, k nimž se pak připojí objekt 3. Na konec jsou oba shluky spojeny do jednoho shluku obsahujícího všechny objekty. Dendrogram lze zobrazit nejen horizontálně (Obr. 1a), ale i vertikálně (Obr. 1b).
Obr. 1: Ukázka dendrogramu pěti objektů. Strom lze zobrazit horizontálně (a) i vertikálně (b).