Slovník | Vyhledávání | Mapa webu
 
Základy informatiky pro biologyAnalýza dat v R Rozšířené základy R Rozšířené ovládání R

Logo Matematická biologie

Rozšířené ovládání R

K základnímu ovládání R doporučujeme prostudování výukové jednotky Základy informatiky pro biologyVýpočetní matematické systémy Výuka jazyka R První setkání s jazykem R

V této kapitole se navíc dozvíte několik důležitých a pro analýzu praktických informací.

Pracovní adresář

Z praktického pohledu je dobré vědět, ve kterém adresáři R defaultně pracuje - odtud R načítá všechny soubory a sem se ukládají všechny výstupy (pokud neurčím jinak).

V systému Linux nebo Mac je pracovním adresářem ten, ve kterém jsme R spustili.

U Windows je to obvykle adresář Dokumenty ("C :/ ... /Dokumenty/").

Adresář ve kterém pracujeme zjistíme zadáním následujícího příkazu přímo do konzoly:
> getwd ()

Chceme-li adresář změnit, použijeme funkci setwd(), kde jako argument nastavíme cestu k novému pracovnímu adresáři, např.:

> setwd("C:/Users/Desktop")

Alokace paměti a práce s velkými datovými soubory

R pracuje s objekty, které skladuje ve své paměti, kterou předem vyčlení z RAM. Navíc funguje systémem pass-by-value (ne pass-by-reference) - pokud zadáváme proměnnou do funkce, neodkazuje se na ni, ale její hodnotu zkopíruje, čímž se potřeba RAM značně zvyšuje. Práce s velkými datovými soubory proto vyžaduje počítač s dostatečně velkou RAM, a nejlépe vícejádrovým procesorem.

Pro příklad - normalizace mikročipových dat (viz výuková jednotka Analýza genomických a proteomických datAnalýza genomických a proteomických dat Úprava a normalizace dat oligonukleotidových mikročipů Úlohy k procvičení ) vyžaduje v případě stovek vzorků 16GB RAM a 4 jádrový procesor.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity