Analýza genomických a proteomických datAnalýza genomických a proteomických dat Analýza genových sad Nástroje pro analýzu genových sad Příklad metody dělící hranice

Analýza genomických a proteomických dat |

Současné výzvy a technologie genomiky a proteomiky |

Výstupy z výukové jednotky | Úvod | Moderní technologie analýzy genomu a proteomu a jejich datové výstupy |

Mikročipy | Hmotnostní spektrometrie | 2D gelová elektroforéza | Shrnutí |

Bioinformatika a statistika v analýze genomických a proteomických dat |

Typy dat a potřeba jejich úpravy | Základní kroky analýzy genomických a proteomických dat | Standardy analýzy genomických a proteomických dat | Software pro analýzu |

Příklady k procvičení |

Princip a rozdělení DNA mikročipů |

Analýza obrazu (kvantifikace signálu) DNA mikročipů |

Výstupy z výukové jednotky | Úvod | cDNA mikročipy |

Kvantifikace signálu | Parametry kontroly kvality | Základní datová matice |

Oligonukleotidové mikročipy |

Kvantifikace signálu | Parametry kontroly kvality | Základní datová matice |

Příklady k procvičení | Literatura |

Úprava a normalizace dat cDNA mikročipů |

Výstupy z výukové jednotky | Úvod | Kontrola kvality |

Kontrola kvality v rámci spotů | Kontrola kvality a normalizace v rámci mikročipu |

Procento nekvalitních měření | Systematické odchylky |

Normalizace cDNA mikročipů a vytvoření finální datové matice |

Normalizace v rámci mikročipu |

Normalizace mezi mikročipy |

Sumarizace a vytvoření finálního datového souboru |

Příklady k procvičení | Literatura |

Úprava a normalizace dat oligonukleotidových mikročipů |

Výstupy z výukové jednotky | Úvod | AffyBatch - R datová struktura pro oligonukleotidové mikročipy | Kontrola kvality |

Kontrola na úrovni sond | Kontrola na úrovni mikročipů |

Kontrola kvality na základě parametrů Affymetrix | Kontrola kvality s pomocí základních diagnostických grafů | Kontrola kvality na základě modelu úrovně sondy (PLM - probe level model) |

Normalizace a sumarizace |

Normalizace v rámci mikročipu |

MAS 5.0 metoda korekce na pozadí | RMA konvoluce |

Normalizace mezi mikročipy | Sumarizace |

Metody sumarizace v rámci jednoho mikročipu | Metody sumarizace vícečipové |

Příklady k procvičení | Literatura |

Základní schémata statistické analýzy dat |

Výstupy z výukové jednotky | Porovnávání skupin |

Výpočet velikosti účinku | Testování hypotéz u genomických a proteomických dat |

SAM - Significance Analysis of Microarrays | Limma - Linear Models for Analysis of Microarrays |

Praktický příklad analýzy |

Kontrola kvality | Analýza dat |

Objevování skupin |

Konsenzusové shlukování | Dynamické řezání stromu | Praktický příklad analýzy |

Predikce skupin |

Výběr proměnných | Typy klasifikátorů | Odhad výkonnosti klasifikátoru |

Analýza přežití |

Praktický příklad analýzy |

Příklady k procvičení |

Analýza arrayCGH |

Metody analýzy arrayCGH | Princip segmentačních metod | Porovnání metod |

Analýza genových sad |

Databáze genových sad/pathways | Nástroje pro analýzu genových sad |

Příklad metody celého seznamu | Příklad metody dělící hranice | Porovnání metod | Metody smíšené |

Studijní materiály a software |

Analýza dat hmotnostní spektrometrie |

Time-of-flight spektrometrie |

Úprava základních dat |

Liquid Chromatography MS/MS |

Zpracování dat | Databázové vyhledávání | Rekonstrukce sady proteinů |

2D gelová elektroforéza |

DIGE | Úprava dat |

Veřejně dostupné databáze dat |

Analýza sekvencí DNA |

Příklad metody dělící hranice

Podívejme se blíže na metody dělící hranice. Mějme datový soubor s 12 639 geny z mikročipového experimentu. V předchozích analýzách 1 272 genů získalo p-hodnotu menší než 0,05. V genové sadě máme 96 genů, z toho pouze 8 genů s nižší p-hodnotou než 5 %. Kolik odlišně exprimovaných genů očekáváme náhodně?

Typ statistického testu, který použijeme závisí na tom, použijeme-li uzavřenou nebo kompetitivní metodu:

Uzavřená metoda (pracujeme pouze s geny z genové sady): Náhodně očekáváme 96 x 5% = 4,8 významných genů. Pomocí binomického testu vypočítáme pravděpodobnost pozorování 8 a více významných genů: p = 0.1079, tedy nevýznamný výsledek.

> binom.test(x=8,n=96,p=0.05, alternative="greater")

Kompetitivní metoda (geny v sadě porovnáváme s geny mimo sady): 1272 z 12639 genů je odlišně exprimovaných v tomto datovém souboru, což je zhruba 10 %. Z množiny náhodně vybraných 96 genů očekáváme tedy 96 x 10 % = 9,6 významných genů. p-hodnotu vypočítáme z kontingenční tabulky pomocí Fisherova testu či Chí-kvadrát testu. p = 0.73 Fisherova testu (jednostranného), je to tedy nevýznamný výsledek.

	je v GS	není v GS
významný	8	1264
nevýznamný	88	11279

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity