silico.biotoul.fr
 

L2-L3 Bioinfo - TP Banques de données et analyse de séquences

From silico.biotoul.fr

Revision as of 09:01, 17 February 2017 by Gaulin (Talk | contribs)
Jump to: navigation, search

Introduction

Les TPs précédents ont permis de mettre en évidence l'implication de la séquence ATG5G46330 d'Arabidopsis thaliana dans les phénomènes analysés. L'idée est maintenant d'obtenir le maximum d'informations sur cette séquence (fonction, localisation, existence d'homologue..) afin d'établir une hypothèse quant au rôle ATG5G46330 d'Arabidopsis thaliana.

Exercice 1: Recherche dans les bases de données

Les séquences biologiques (ADN, ARN, Protéines..) sont déposées et stockées dans différentes bases de données qu'il est possible d'interroger soit en utilisant des mots clés, soit des numéros d'accession ou encore en utilsant la séquence. Il existe différents types de banques dont :

  • des banques 'généralistes ou de connaissances' : regroupant différents types d'informations (ADN, ARN, protéines, SNP..)
  • des banques 'spécialisées' : par exemple des banques dédiées à un type de séquence (ARN ou protéines) ou un type d'organisme (Arabidopsis, Drosophile..)

1/ Sur le site du NCBI

  • Qu'est ce que le NCBI ?
  • Identifiez si la séquence portant le numéro d'accession AT5G46330 est référencée

1/ Sur le site du NCBI

  • Qu'est ce que le NCBI ?
  • Identifiez si la séquence portant le numéro d'accession AT5G46330 est référencée
  • Regarder la séquence génomique RefSeq NG_007114 (format Genbank) : combien d'exons composent ce gène ? combien constituent la séquence codante ?