Slovník | Vyhledávání | Mapa webu
 
Analýza genomických a proteomických datAnalýza genomických a proteomických dat Úprava a normalizace dat cDNA mikročipů Úvod

Logo Matematická biologie

Úvod

Existují tedy dvě úrovně kontroly kvality a tedy i úprav dat v analýze DNA mikročipových experimentů (obrázek 4.1):

  1. Úroveň mikročipu - zde se kontroluje jednak kvalita jednotlivých sond a jednak kvalita samotného mikročipu. Pracujeme se základní datovou maticí.
  2. Úroveň experimentu – zde se kontroluje kvalita jednotlivých transkriptů v rámci celého experimentu a standardizují se hodnoty mezi sklíčky tak aby byly porovnatelné.  Pracuje se všemi základními datovými maticemi, ze kterých nakonec vytvoříme finální datovou matici.

Obr. 4.1: Úrovně kontroly kvality DNA mikročipů

Základní principy těchto úprav jsou společné pro cDNA i oligonukleotidové platformy. Protože úpravy dat cDNA mikročipů jsou lépe strukturovány, nejdříve si je vysvětlíme u této skupiny čipů, přičemž zavedeme i obecné principy. Pak tyto poznatky využijeme při vysvětlování úprav dat oligonukleotidových (Affymetrix) mikročipů.

Zatímco předcházející výukové jednotky byly spíše teoretické, v této části již budeme pracovat s reálnými příklady v programu R. Více o instalaci a základech analýzy dat v R najdete v učebních textech Analýza dat v R. Pro všechny analýzy bude potřebné nainstalovat Bioconductor, nástavbu R pro analýzy genomických a proteomických dat. Pracovat budeme hlavně s balíkem marray.

V této výukové jednotce budeme pracovat s datovým souborem N=20 dvoukanálových cDNA mikročipů platformy Agilent. Cílem experimentu bylo porovnat genovou expresi mikrocév normálního mozku a mozku s Alzheimerovou nemocí. Experiment byl proveden v tzv. dye swap designu - tedy každý vzorek mozku s Alzheimerovou nemocí byl hybridizován spolu s kontrolním vzorkem normálního mozku na dva mikročipy. Na prvním byl do červeného (Cy5) kanálu hybridizován vzorek s Alzheimerovou nemocí a do zeleného (Cy3) kanálu vzorek normální, na druhém mikročipu se kanály prohodili.

Data jsou veřejně přístupna v databázi mikročipových experimentů ArrayExpress pod číslem E-GEOD-45596:

http://www.ebi.ac.uk/arrayexpress/experiments/E-GEOD-45596/

Základní datové matice se dají stáhnout ZDE.

 
vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity