Úprava a normalizace dat cDNA mikročipů
V předcházející kapitole jsme si vysvětlili jakým způsobem vznikají základní datové matice u DNA mikročipových experimentů. Tyto data však ani zdaleka nejsou připraveny pro vstup do dalších analýz. Je nutno si uvědomit, že data v základní datové matici nereprezentují koncentraci zkoumané molekuly ve vzorku (tedy u expresních čipů koncentraci mRNA). Hodnoty získané touto technologií jsou pouze pozitivně korelovány s množstvím molekuly, a jsou zkresleny různými biologickými a technickými faktory.
Z biologických faktorů jsou to například kontaminace vzorku (vzorek nádoru obsahuje i zdravé tkanivo), RNA degradace, efektivita amplifikace DNA v procesu PCR, efektivita referzní transkripce, efektivita samotné hybridizace nebo design a tedy specificita sond. Z technických pak kvalita samotného mikročipu (efektivita spotování), nastavení skeneru, segmentace obrazu, způsob kvantifikace signálu a odečítání signálu pozadí.
Je tedy potřebné provést další sumarizace intenzit signálů, kontrolu kvality jednotlivých mikročipů, ale také data standardizovat tak, aby byly porovnatelné mezi jednotlivými mikročipy. V této kapitole se proto budeme věnovat právě metodám standardizace a normalizace dat.