Výběr popisných proměnných
Jak bylo uvedeno dříve, nedokážeme určit nejvhodnější veličiny z hlediska analýzy či klasifikace přímo, nýbrž pouze vybrat z předem dané množiny veličin. To znamená, že se objekt, reprezentovaný původně -rozměrným vektorem hodnot jednotlivých proměnných, snažíme vyjádřit vektorem m-rozměrným tak, aby množství tzv. diskriminační informace obsažené v původním vektoru bylo v co největší míře zachováno. Výběr proměnných se tedy převádí na hledání zobrazení , kterým se původní p-rozměrný prostor transformuje do nového m-rozměrného prostoru .
Zmenšení rozměru obrazového prostoru lze dosáhnout dvěma principiálně různými způsoby (Obr.2):
- selekce – nalezení těch proměnných, které přispívají k separabilitě klasifikačních tříd nejméně, a pro klasifikaci se z původní množiny ponechá jen nejvíce informativních proměnných. Zobrazení tedy pouze vynechává proměnných.
- extrakce – transformace původních proměnných na menší počet jiných proměnných.
K tomu, abychom dokázali realizovat libovolný z obou způsobů výběru proměnných, je třeba definovat a splnit určité podmínky optimality.
Nechť je kriteriální funkce, jejíž pomocí vybíráme proměnné. Pak v případě selekce vybíráme vektor ze všech možných -tic proměnných , . Optimalizaci výběru proměnných tudíž můžeme formálně zapsat jako
Problémy, které je nutné vyřešit, jsou stanovení kriteriální funkce, rozměru nového prostoru a optimalizačního postupu.
Při extrakční alternativě transformujeme prostor na základě výběru zobrazení z množiny všech možných zobrazení z prostoru do , tj.
I v tomto případě je potřeba určit vhodnou kriteriální funkci, rozměr nového obrazového prostoru a rovněž zvolit požadavky na vlastnosti zobrazení i vhodný optimalizační postup (pokud nevyplývá z vlastností zobrazení).