Daviesův-Bouldinův validační index (Davies-Bouldin validity index)
Daviesův-Bouldinův validační index je podíl sumy vnitro-shlukového rozložení a mezi-shlukového rozložení. Hodnoty tohoto indexu získáme ze vzorce:
|
(2)
|
Příklad 3
Výpočet Daviesova-Bouldinova validačního indexu si představíme na případu zubních vzorců savců. Jako vstupní data použijeme data z příkladu 1 z kapitoly Nehierarchická shluková analýza [l1] .
V tabulce 5 vidíme zařazení savců do shluků nehierarchickou shlukovou metodou k-průměrů pro různé nastavení počtu shluků. Připomeňme, že při nehierarchické metodě k-průměrů musíme definovat počet skupin k předem. Proto analýzu provádíme pro několik různých skupin k a následně použijeme validační index k určení optimálního počtu shluků.
Výsledkem metody k-průměrů jsou kromě zařazení objektů do shluků i hodnoty vzdálenosti objektů od centroidů ( Tabulka 5) a vzdálenosti mezi centroidy shluků ( Tabulka 6). Tyto použijeme při výpočtu validačního indexu. Výpočet ukážeme pro počet shluků k = 4 ( Tabulka 6).
Stejným postupem je možné spočítat hodnoty Daviesova-Bouldinova validačního indexu pro různá nastavení počtu shluků. Nízká hodnota tohoto indexu indikuje optimální počet shluků.
Podle Daviesova-Boudinova validačního indexu je zjevné, že rozdělení savců do čtyř shluků je optimální. Shluky jsou v tomto případě kompaktní a dobře odděleny, na což poukazuje nízká hodnota validačního indexu ( Obr. 2). Počet shluků k = 4 se i z biologického hlediska zdá nejvhodnější; jednu skupinu tvoří hmyzožravce (netopýry a krtek), druhou hlodavci a zajícovci, třetí dravce a poslední kopytníky.