Projets 2014 - L3-Info transrciptome
From silico.biotoul.fr
Nous avons vu en TD comment identifier les gènes différentiellement exprimés entre deux séries d'hybridations correspondant à des conditions expérimentales/biologiques différentes.
Pour ce projet, vous aurez à effectuer le même type d'analyse à partir de la publication que vous aurez sélectionnée :
- description du contexte et du but de l'étude (maladie, processus biologique, nombre de conditions, nombre d'hybridations, ...)
- récupération des données brutes fournies par le logiciel d'analyse d'images,
- chargement des données dans R/Bioconductor,
- contrôles qualité des hybridations et graphiques de description des données d'hybridation,
- application des méthodes pour la prise en compte du bruit de fond puis justification et sélection d'une méthode,
- application des méthodes de normalisation puis justification et sélection d'une méthode,
- extraction et transformation en log2 des valeurs d'expression,
- identification des spots différentiellement exprimés,
- conversion des probeset ids au format GENENAME et au format UNIPROT
Vous remettrez un rapport (fichier PDF) sous la forme de compte rendu d'analyse incluant les étapes ci-dessus. Pour chaque étape, vous indiquerez les commandes R effectuées et les résultats obtenus (copier/coller de la sortie R ou des graphiques) et vous commenterez les résultats obtenus.
Articles proposés :
- Overexpression of Apoptotic Cell Removal Receptor MERTK in Alveolar Macrophages of Cigarette Smokers PMID:18587056
- Pour cette analyse, vous identifierez les gènes différentiellement exprimés ayant une p-valeur ≤ 0.05 et un logFoldChange ≥ 2
- Effects of cigarette smoke on the human oral mucosal transcriptome PMID20179299
- Pour cette analyse, vous identifierez les gènes différentiellement exprimés ayant une p-valeur ≤ 0.05 et un logFoldChange ≥ 1.5 ainsi que comme les auteurs une p-valeur ≤ 0.001 (sans ajustement du seuil pour les tests multiples) et un logFoldChange ≥ 2