Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Shluková analýza Validace shlukové analýzy Goodmanův-Kruskalův index (Goodman-Kruskal index)

Logo Matematická biologie

Goodmanův-Kruskalův index (Goodman-Kruskal index)

Pro daný datový soubor Goodmanův-Kruskalův (GK) index hodnotí všechny možné čtveřice objektů . Nechť d je vzdálenost mezi dvěma objekty ( a nebo a ).

Pak se čtveřice nazývá shoda (concordant), když platí:

  • , přičemž a jsou ve stejném shluku a a nejsou ve stejném shluku
  • nebo , přičemž a jsou ve shlucích odlišných a a jsou ve stejném shluku.

Naopak se čtveřice nazývá neshoda (disconcordant), když platí:

  •  a a nejsou ve stejném shluku, zatímco a ve stejném shluku jsou
  • nebo také , přičemž a jsou ve stejném shluku a a nejsou ve stejném shluku.

Dobré rozdělení datového souboru by mělo obsahovat hodně shod a málo neshod těchto čtveřic. Označme počet shod a neshod . Goodmanův-Kruskalův index dále získáme podle vzorce

 
.
(6)

Vysoké hodnoty GK indexu znamenají dobře vytvořené shluky a počet shluků, který maximalizuje hodnoty indexu, dává optimální počet shluků.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity