Slovník | Vyhledávání | Mapa webu
 
Analýza a hodnocení biologických datStatistické hodnocení biodiverzity Data pro analýzu biodiverzity Příprava a čištění dat pomocí nástrojů MS Excel

Logo Matematická biologie

Příprava a čištění dat pomocí nástrojů MS Excel

Současná statistická analýza se neobejde bez zpracování dat pomocí statistických software. Předpokladem úspěchu je správné uložení dat ve formě „databázové“ tabulky umožňující jejich zpracování v libovolné aplikaci.

Neméně důležité je věnovat pozornost čištění dat předcházející vlastní analýze. Každá chyba, která vznikne nebo není nalezeno ve fázi přípravy dat se promítne do všech dalších kroků a může zapříčinit neplatnost výsledků a nutnost opakování analýzy.

  • Správné a přehledné uložení dat je základem jejich pozdější analýzy
  • Je vhodné rozmyslet si předem jak budou data ukládána
  • Pro počítačové zpracování dat je nezbytné ukládat data  v tabulární formě
  • Nejvhodnějším způsobem je uložení dat ve formě databázové tabulky
  • Každý sloupec obsahuje pouze jediný typ dat, identifikovaný hlavičkou sloupce
  • Každý řádek obsahuje minimální jednotku dat (např. organismus, lokalita, odběr apod.)
  • Je nepřípustné kombinovat v jednom sloupci číselné a textové hodnoty
  • Komentáře jsou uloženy v samostatných sloupcích
  • U textových dat nezbytné kontrolovat překlepy v názvech kategorií
  • Specifickým typem dat jsou datumy u nichž je nezbytné kontrolovat, zda jsou datumy uloženy v korektním formátu

Takto uspořádaná data je v tabulkových nebo databázových programech možné převést na libovolnou výstupní tabulku (obr. 2.5). Pro základní uložení a čištění dat menšího rozsahu je možné využít aplikací MS Office, zejména MS Excel - základní postupy jeho využití jsou popsány v následujícím textu.

Obr. 2.5: Uspořádání dat v MS Excel

Ukotvení příček (obr. 2.6) - Umožňuje ukotvení libovolných řádků a sloupců pro pohodlné vkládání a prohlížení dat v tabulce. Umožňuje číst řádky/sloupce ze začátku tabulky i po přesunutí se dále.

Obr. 2.6: Ukotvení příček

Automatický zadávací formulář - Slouží k usnadnění zadávání dat do databázových tabulek, načítá automaticky hlavičky sloupců jako zadávané položky, Aplikaci automaticky zadávaného formuláře je nutné aktivovat (obr. 2.7), data jsou následně zadávána prostřednictvím formuláře (obr. 2.8).

Obr. 2.7: Aktivace automatického zadávacího formuláře

 

Obr. 2.8: Automatický zadávací formulář

Automatické seznamy (obr. 2.9) - Vytváří se z hodnot buněk v daném sloupci a umožňují vložit hodnotu výběrem ze seznamu již zadaných hodnot – usnadnění zadávání.

Obr. 2.9: Automatické seznamy

Automatická kontrola dat (obr. 2.10) - Umožňuje ověřit typ, rozsah nebo povolit pouze určitý seznam hodnot zadávaných do sloupce databázové tabulky

Obr. 2.10: Automatická kontrola dat

Seznamy (obr. 2.11) - Skupiny hodnot zachovávající logické pořadí, některé jsou zabudované (např. dny v týdnu, měsíce v roce), další je možné uživatelsky vytvořit, slouží pro účely řazení a automatického vyplňování.

Obr. 2.11: Seznamy

Řazení dat (obr. 2.12) - řazení dat je nejjednodušším způsobem jejich zpřehlednění, užitečným hlavně u menších/výsledkových tabulek. Vždy zkontrolujte, zda seřazení nezničí vazby mezi buňkami = kontrola oblasti, kterou řadíte.

Obr. 2.12: Řazení dat

Automatický filtr (obr. 2.13) - Pomocí automatického filtru je snadné vybírat úseky dat pro další zpracování na základě hodnot ve sloupcích databázové tabulky, výběr je možný i podle více sloupců (např. určitá skupina pacientů). Funkce automaticky rozezná hlavičky sloupců v souvislé oblasti buněk, u sloupců použitých pro filtraci jsou rozbalovací seznamy zbarveny modře. Výhodný nástroj pro čištění dat (vyhledávání překlepů, kombinace textu a čísel).

Obr. 2.13: Automatický filtr

Automatické dokončování hodnot buněk (obr. 2.14) - Vhodné pro textová pole; následně není nutné vypisovat celé slovo či slovní spojení, ale jen zvolit nabízené, již dříve použité slovo či slovní spojení. Automatické dokončování hodnot buněk je nutné nastavit.

Obr. 2.14: Automatické dokončování hodnot buněk

 

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity