
Příklady k procvičení
1. Jakým typem analýzy dat by jste přistupovali k řešení těchto tyto biomedicínských problémů:
a. Nalezení genů jejichž exprese bude sloužit ke stanovení diagnózy roztroušené sklerózy.
b. Kolik existuje skupin proteinů s podobnou expresí v konkrétním podtypu nádoru tlustého střeva?
c. Které biologické procesy jsou odlišné mezi estrogen-receptor pozitivním a estrogen-receptor negativním karcinomem prsu?
a. Predikce skupin - vyhledáváme geny a budujeme klasifikační pravidlo.
b. Objevování skupin - hledáme shluky proteinů se stejnou expresí.
c. Porovnání skupin a analýza genových sad (pathway analýza) - nejdříve identifikujeme odlišně exprimované geny mezi skupinami ER+ a ER- a pak na nich provedeme analýzy genových sad abychom určili biologické dráhy, které se mezi skupinami liší.
b. Objevování skupin - hledáme shluky proteinů se stejnou expresí.
c. Porovnání skupin a analýza genových sad (pathway analýza) - nejdříve identifikujeme odlišně exprimované geny mezi skupinami ER+ a ER- a pak na nich provedeme analýzy genových sad abychom určili biologické dráhy, které se mezi skupinami liší.
2. Co je nevýhoda statického řezu dendrogramu a kde se tato metoda využívá?
Statický řez je metoda prořezání dendrogramu v hierarchickém shlukování, která umožňuje definovat skupiny vzorků nebo genů. Nevýhoda této metody je její neschopnost odlišit shluky na různých hladinách řezu a tedy různou vnitřní mírou podobnosti, což vede k vysokému výskytu nezařazených vzorků nebo k příliš komplexním shlukům.