Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Klasifikace Hodnocení úspěšnosti klasifikace Rozdělení souboru na trénovací a testovací data

Logo Matematická biologie

Rozdělení souboru na trénovací a testovací data

V předchozí podkapitole jsme se zmínili o tom, že bohužel ne vždy máme k dispozici nezávislou datovou sadu k otestování natrénovaného klasifikátoru. V takovém případě musíme náš datový soubor vhodně využít pro natrénování i pro testování klasifikátoru, přičemž se je možné využít jeden ze čtyř základních přístupů, které jsou podobněji popsány v následujících odstavcích:

  • resubstituce (resubstitution)
  • náhodný výběr s opakováním (bootstrap)
  • predikční testování externí validací (hold-out)
  • křížová validace (cross-validation)
 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict