Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Klasifikace Hodnocení úspěšnosti klasifikace Resubstituce

Logo Matematická biologie

Resubstituce

Při resubstituci (resubstitution) jsou použita stejná data pro trénování i testování. Výhodou je jednoduchost a rychlost tohoto přístupu, má však jednu velkou nevýhodu - resubstituce vede zpravidla k příliš nadhodnoceným výsledkům klasifikace. Když bychom potom klasifikátor naučený na celém našem souboru a otestovaný na celém našem souboru použili na nový datový soubor, mohlo by se stát, že úspěšnost klasifikace bude velmi nízká, přestože při resubstituci nám vyšla vysoká úspěšnost klasifikace a my bychom si mysleli, že náš klasifikátor je dobrý. Pokud totiž použijeme stejná data pro trénování i testování, může dojít k tzv. přeučení klasifikátoru, kdy klasifikátor perfektně klasifikuje natrénovaná data, ale naprosto selhává při klasifikaci nových dat.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity