silico.biotoul.fr
 

L2-L3 Bioinfo - TP Banques de données et analyse de séquences

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
(Exercice 1: Recherche d'informations dans les bases de données)
(Exercice 1: Recherche d'informations dans les bases de données)
Line 25: Line 25:
* Combien de transcrit ?  
* Combien de transcrit ?  
* Quel type de SNPs sont référencés pour ce locus ?
* Quel type de SNPs sont référencés pour ce locus ?
-
* Quel est le numéro d'accession dans la banque UniprotKb/SwissProt ?
+
* Cette séquence est-elle référencée dans une banque 'specialisée' ?
 +
 
 +
 
 +
3/ sur le portail dédié a Ara
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
* Quel est le numéro d'accession dans la banque UniprotKb/SwissProt de la protéine correspondante ?
* Dans UniprotKb/swissprot, récupérez et enregistrez la séquence en acides aminés de la protéine correspondante (onglet Format--> Fasta (canonical))
* Dans UniprotKb/swissprot, récupérez et enregistrez la séquence en acides aminés de la protéine correspondante (onglet Format--> Fasta (canonical))

Revision as of 10:38, 17 February 2017

Introduction

Les TPs précédents ont permis de mettre en évidence l'implication de la séquence ATG5G46330 d'Arabidopsis thaliana dans les phénomènes analysés. L'idée est maintenant d'obtenir le maximum d'informations sur cette séquence (fonction, localisation, existence d'homologue..) afin d'établir une hypothèse quant au rôle ATG5G46330 d'Arabidopsis thaliana.

Exercice 1: Recherche d'informations dans les bases de données

Les séquences biologiques (ADN, ARN, Protéines..) sont déposées et stockées dans différentes bases de données qu'il est possible d'interroger soit en utilisant des mots clés, soit des numéros d'accession ou encore en utilsant la séquence afin de recueillir des informations. Il existe différents types de banques dont :

  • des banques 'généralistes ou de connaissances' : regroupant différents types d'informations (ADN, ARN, protéines, SNP..)
  • des banques 'spécialisées' : par exemple des banques dédiées à un type de séquence (ARN ou protéines) ou un type d'organisme (Arabidopsis, Drosophile..)

1/ Sur le site du NCBI

  • Qu'est ce que le NCBI ?
  • Identifiez si la séquence portant le numéro d'accession AT5G46330 est référencée dans les banques hébergées au NCBI
  • Existe-t-il des publications scientifiques relatives à cette séquence ? Dans quelle base de données sont-elles stockées ?


2/ Intéressez-vous dans la banque 'Gene' du NCBI à votre séquence AT5G46330

  • Quel type de séquences héberge la banque 'Gene' ?
  • Quel est le nom de AT5G46330 ?
  • Sur quel chromosome d'arabette ce locus est-il présent ?
  • Cette séquence est-elle codante ?
  • Combien d'exons sont présents dans ce gène ?
  • Combien de transcrit ?
  • Quel type de SNPs sont référencés pour ce locus ?
  • Cette séquence est-elle référencée dans une banque 'specialisée' ?


3/ sur le portail dédié a Ara




  • Quel est le numéro d'accession dans la banque UniprotKb/SwissProt de la protéine correspondante ?
  • Dans UniprotKb/swissprot, récupérez et enregistrez la séquence en acides aminés de la protéine correspondante (onglet Format--> Fasta (canonical))

Exercice 2: Analyse d'une séquence protéique

L'idée ici est de définir la fonction, la localisation subcellulaire et les processus physiologiques dans lesquels pourraient intervenir la protéine au sein d'Arabidopsis thaliana et de confronter notre analyse aux annotations présentes dans les banques de données.


la protéine si la protéine codée par ce gène possède des domaines protéqiues qui pourraient nous renseigner sur sa Recherchez si votre séquence protéique contiendrait des domaines protéiques pouvant révéler sa fonction