Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datVícerozměrné metody pro analýzu a klasifikaci dat Klasifikace Hodnocení úspěšnosti klasifikace Náhodný výběr s opakováním

Logo Matematická biologie

Náhodný výběr s opakováním

Náhodný výběr s opakováním (bootstrap) je založen na N-krát provedeném náhodném výběru subjektů s opakováním z původního datového souboru (s N subjekty), které se použijí jako testovací sada. Zbylé subjekty (ani jednou nevybrané) jsou použity pro testování. Při rozumně velkých datech se při náhodném výběru s opakováním vybere zhruba 63,2% subjektů pro učení a 36,8% subjektů pro testování. Výhodou tohoto přístupu je, že trénovací sada je stejně velká jako původní datový soubor, a další výhodou je i rychlost tohoto přístupu ve srovnání například s křížovou validací. Nevýhodou však je, že se subjekty v trénovací sadě opakují.

 
vytvořil Institut biostatistiky a analýz Masarykovy univerzity | | zpětné odkazy | validní XHTML 1.0 Strict