AffyBatch - R datová struktura pro oligonukleotidové mikročipy
AffyBatch je datová struktura, která obsahuje jednak základní matice intensity všech mikročipů v experimentu (na úrovni sond – probe level), a jednak další volitelné informace o jednotlivých vzorcích v experimentu (například typ nádoru, ze kterého byl vzorek odebrán, věk pacienta, pohlaví...).
Načteme knihovnu affy pro základní práci s Affymetrix GeneChip daty:
> library(affy)
Vytvoření datové struktury AffyBatch budeme demonstrovat na příkladu mikročipů z experimentu porovnávajícího ER (estrogen receptor) pozitivní a ER negativní karcinomy prsu. Pomocí funkce ReadAffy načteme základní datové matice (CEL soubory) našeho příkladu do datové struktury AffyBatch.
> breast = ReadAffy(celfile.path="Raw/")
> sampleInfo=read.csv("sampleInfo.csv",header=T, row.names=1)
Názvy čipů upravíme, odstraníme koncovku ".CEL" a odstraníme předponu:
> ns = length(sampleNames(breast))
> nm = unlist(strsplit(sampleNames(breast), split=".", fixed=TRUE))[seq(1,2*ns,2)]
> sampleNames(breast) = substring(nm, 11, nchar(nm))
> sampleInfo = sampleInfo[sampleNames(Xraw),]