
Rozšířené ovládání R
K základnímu ovládání R doporučujeme prostudování výukové jednotky Základy informatiky pro biologyVýpočetní matematické systémy Výuka jazyka R První setkání s jazykem R
V této kapitole se navíc dozvíte několik důležitých a pro analýzu praktických informací.
Pracovní adresář
Z praktického pohledu je dobré vědět, ve kterém adresáři R defaultně pracuje - odtud R načítá všechny soubory a sem se ukládají všechny výstupy (pokud neurčím jinak).
V systému Linux nebo Mac je pracovním adresářem ten, ve kterém jsme R spustili.
U Windows je to obvykle adresář Dokumenty ("C :/ ... /Dokumenty/").
Adresář ve kterém pracujeme zjistíme zadáním následujícího příkazu přímo do konzoly:
> getwd ()
Chceme-li adresář změnit, použijeme funkci setwd(), kde jako argument nastavíme cestu k novému pracovnímu adresáři, např.:
> setwd("C:/Users/Desktop")
Alokace paměti a práce s velkými datovými soubory
R pracuje s objekty, které skladuje ve své paměti, kterou předem vyčlení z RAM. Navíc funguje systémem pass-by-value (ne pass-by-reference) - pokud zadáváme proměnnou do funkce, neodkazuje se na ni, ale její hodnotu zkopíruje, čímž se potřeba RAM značně zvyšuje. Práce s velkými datovými soubory proto vyžaduje počítač s dostatečně velkou RAM, a nejlépe vícejádrovým procesorem.
Pro příklad - normalizace mikročipových dat (viz výuková jednotka Analýza genomických a proteomických datAnalýza genomických a proteomických dat Úprava a normalizace dat oligonukleotidových mikročipů Úlohy k procvičení ) vyžaduje v případě stovek vzorků 16GB RAM a 4 jádrový procesor.