Slovník | Vyhledávání | Mapa webu
 
Základy informatiky pro biologyAnalýza dat v R Grafické výstupy R Tradiční grafika

Logo Matematická biologie

Tradiční grafika

S tradičním grafickým systémem jste se určite již setkali - je to základní grafika R. Grafický výstup se utváří postupně, ve vrstvách - každý příkaz se dokresluje na předchozí vstup.

Funkce, které v tomto systému nalezneme se dělí na:

  • Funkce vyššího stupně, které produkují celé grafy, definují celý prostor grafu, jsou samostatné.
    •  Patří sem např. plot()
  • Funkce nižšího stupně, které dále upravují vzhled grafu, a které nelze vykreslit samostatně, pouze do grafu již nakresleného funkcí vyššího stupně.
    • Např: lines() - přidává čáry
  • Funkce nastavení grafu - mění nastavení ještě před vykreslením grafu.
    • buď v konzole pomocí par()
    • nebo jako parametr grafické funkce plot (x, y, parametr = ...)

Speciálním případem pak jsou tzv. trellis funkce - funkce vyššího stupně, které kreslí komplexní grafy jediným příkazem (mají funkce nižšího stupně jako argumenty)

Nasledující text předpokládá prostudování základů práce s tradiční grafikou, kterou lze nastudovat zde: Základy informatiky pro biologyVýpočetní matematické systémy Výuka jazyka R Grafika v R.

Základní grafická funkce v tradiční grafice je plot(). Již víte, že se jedná o tzv. generickou funkci a že proměnné se dají zadat jako plot(x), nebo plot(x,y).

Dalším způsobem nejen u této funkce je zápis typu "model": plot (x ~ y)

Pozor na záměnu matice a datové tabulky. Zatímco řádky matice se chovají jako vektory, řádky datové tabulky jsou listy a proto je výsledný graf jiný:

> ma <- matrix(1:8,2,4)
> plot(ma[1,],ma[2,])


> ma2 <- as.data.frame(ma)
> plot(ma2[1,],ma2[2,])

Základní grafy již znáte. Další zajímavý graf, na který chceme upozornit, je dotchart(), který zobrazuje spojité hodnoty v kategoriích:

> dotchart(VADeaths, main = "Death Rates in Virginia - 1940")

Další funkce, na kterou chceme upozornit, je funkce locator(), která nám umožňuje získat koordináty bodu kliknutím na graf. Číslo ve funkci značí, kolik míst chceme identifikovat.

Ukážeme si na příkladu histogramu normálního rozložení:

> hist(rnorm(1000))

> locator(1)

Teď funkce čeká, až kliknete na bod v grafu, koordináty kterého chcete zjistit. Po kliknutí je vypíše:

> locator(1)
$x
[1] -3.501606

$y
[1] 183.5963

 

Tuto funkci můžeme využít, chceme-li umístit text na určité místo v grafu - můžeme funkci locator(1) použít přímo jako zadání koordinát x a y ve funkci  text()

> text(locator(1), "N=1000")

Proložení křivky - vyhlazení dat

Šikovnou funkcí je lowess() - neparametrická regresní funkce, která vyhlazuje data. Máme-li dostatek dat, může sloužit k orientačnímu zobrazení závislosti - pozor, její použití není vždy vhodné (zejména je-li málo pozorování). Vykresleme si závislost očekávané délky přežití od průměrného platu v US státech:

> plot(states$Life.Exp, states$Income)
> lines(lowess(states$Life.Exp, states$Income))

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity