Projet Cyanobactéries et ARN 16S

Bienvenue sur le projet "Cyanobactéries et ARN 16S"





















  découverte de la photosynthese
:
la protéine RubisCo est une enzyme essentielle dans la photosynthèse chez l'arabette des dames (Arabidopsis thaliana)
son nom complet est : RibUlose BIsphosphate CarbOxylase
Aujourd'hui, nous allons essayer de retrouver la partie du génome codante pour cette protéine de façon ludique!
le but du jeu : tu dois retrouver cette enzyme, impliquée dans la photosynthèse, chez Arabidopsis Thaliana :)

NB : bref rappel sur le procédé (de production d’oxygène et) de fixation du CO2 par la photosynthèse pour toutes les plantes vertes :
le dioxyde de carbone de l’atmosphère est fixé dans un sucre (ribose<==>ribulose) lors de la photosynthèse. Ce Ribose (sucre) devient une source d'énergie pour le futur développement de la plante.

L'ENIGME :
voici la séquence "énigme" de nucléotides, issue du séquencage de l'arabette ( source : http://biochimej.univ-angers.fr/Page2/COURS/9ModulGenFoncVeg/6Proteomique/4ApplicationProteomiq.htm ):
    ACTGTCAAGAGTGATTTTATTAATATTTTAATATTAAATATTTGGATTTATAAAAAGTCAAAGATTCAAA
    ACTTGAAAAAGAAGTATTAGGTTGCGCTATACATATGAAAGAATATACAATAATGATGTATTTGGCGAAT
    CAAATATCATGGTCTAATAAAGAATAATTCTGATTAGTTGATAATTTTGTGAAAGATTCCTGTGAAAAAG
    GTTAATTAAATCTATTCCTAATTTATGTCGAGTAGACCTTGTTGTTTTGTTTTATTGCAAGAATTCTAAA
    TTCATGACTTGTAGGGAGGGACTTATGTCACCACAAACAGAGACTAAAGCAAGTGTTGGGTTCAAAGCTG
    GTGTTAAAGAGTATAAATTGACTTACTATACTCCTGAATATGAAACCAAGGATACTGATATCTTGGCAGC
    ATTCCGAGTAACTCCTCAACCTGGAGTTCCACCTGAAGAAGCAGGGGCTGCGGTAGCTGCTGAATCTTCT
    ACTGGTACATGGACAACTGTGTGGACCGATGGGCTTACCAGCCTTGATCGTTACAAAGGACGATGCTACC
    ACATCGAGCCCGTTCCAGGAGAAGAAACTCAATTTATTGCGTATGTAGCTTATCCCTTAGACCTTTTTGA
    AGAAGGTTCGGTTACTAACATGTTTACCTCGATTGTGGGTAATGTATTTGGGTTCAAAGCCCTGGCTGCT
    CTACGTCTAGAGGATCTGCGAATCCCTCCTGCTTATACTAAAACTTTCCAAGGACCACCTCATGGTATCC
    AAGTTGAAAGAGATAAATTGAACAAGTATGGACGTCCCCTATTAGGATGTACTATTAAACCAAAATTGGG
    GTTATCCGCTAAAAACTATGGTAGAGCAGTTTATGAATGTCTACGTGGTGGACTTGATTTTACCAAAGAT
    GATGAGAATGTGAACTCCCAACCATTTATGCGTTGGAGAGACCGTTTCTTATTTTGTGCCGAAGCTATTT
    ATAAATCACAGGCTGAAACAGGTGAAATCAAAGGACATTATTTGAATGCTACTGCGGGTACATGCGAAGA
    AATGATCAAAAGAGCTGTATTTGCCAGAGAATTGGGAGTTCCTATCGTAATGCATGACTACTTAACAGGG
    GGATTCACTGCAAATACTAGTTTGTCTCATTATTGCCGAGATAATGGCCTACTTCTTCACATCCACCGTG
    CAATGCACGCTGTTATTGATAGACAGAAGAATCATGGTATGCACTTCCGTGTACTAGCTAAAGCTTTACG
    TCTATCTGGTGGAGATCATATTCACGCGGGTACAGTAGTAGGTAAACTTGAAGGAGACAGGGAGTCAACT
    TTGGGCTTTGTTGATTTACTGCGCGATGATTATGTTGAAAAAGATCGAAGCCGCGGTATCTTTTTCACTC
    AAGATTGGGTCTCACTACCAGGTGTTCTGCCTGTGGCTTCAGGGGGTATTCACGTTTGGCATATGCCTGC
    TTTGACCGAGATCTTTGGAGATGATTCTGTACTACAATTCGGTGGAGGAACTTTAGGCCACCCTTGGGGA
    AATGCACCGGGTGCCGTAGCCAACCGAGTAGCTCTGGAAGCATGTGTACAAGCTCGTAATGAGGGACGTG
    ATCTTGCAGTCGAGGGTAATGAAATTATCCGTGAAGCTTGCAAATGGAGTCCTGAACTAGCTGCTGCTTG
    TGAAGTATGGAAAGAGATCACATTTAACTTCCCAACCATCGATAAATTAGATGGCCAAGAGTAGATGAAT
    TAGATTTAGTAATTCACGTTTGTTTTATTAGTTTAATTGCACTCGGCTCAATCTTTTTTTTACTAAAAAA
    GATTGAGCCGAGGTTATCTGTTGTATATACTATTTTTTTTGATAGATACATACTTAAATCTAGATAGAAA
    AAAAACTCTTCAATAAAAAAAAGAAGATTAAACACAACTACAATTTTGTTATTGTAGTGTTGTGTCCACA
    AGAAATCCTATACGAAACATGGATTCTTAATTCTTAGGAGTGTTATATTCTTTCGTGTCAGGGCTTGAAC
    CAAGTATCCCCGCTTCTTCTACCCCATCCTGCATGTTGTCCGTTTCTTTTCATTCCGTATTGGAATAAAA
    AAAGTTTTTTTTTATATTAGTATACGAGATTTTACTAAAAAAGTTCTTAATATTCTTATATTCATAAGCG
    AAGAACAAATATTTCTT

  1. Dans un premier temps,  on cherche une traduction de la séquence précédente qui soit vraisemblable sur une des trois phases, afin de coder une "vraie" une protéine. On utilise pour cela le programme "translate" suivant : http://web.expasy.org/translate/

  2. actgtcaagagtgattttattaatattttaatattaaatatttggatttataaaaagtcaa
    L S R V I L L I F - Y - I F G F I K S Q
    agattcaaaacttgaaaaagaagtattaggttgcgctatacatatgaaagaatatacaat
    R F K T - K R S I R L R Y T Y E R I Y N
    aatgatgtatttggcgaatcaaatatcatggtctaataaagaataattctgattagttga
    N D V F G E S N I M V - - R I I L I S -
    taattttgtgaaagattcctgtgaaaaaggttaattaaatctattcctaatttatgtcga
    - F C E R F L - K R L I K S I P N L C R
    gtagaccttgttgttttgttttattgcaagaattctaaattcatgacttgtagggaggga
    V D L V V L F Y C K N S K F M T C R E G
    cttatgtcaccacaaacagagactaaagcaagtgttgggttcaaagctggtgttaaagag
    L M S P Q T E T K A S V G F K A G V K E
    tataaattgacttactatactcctgaatatgaaaccaaggatactgatatcttggcagca
    Y K L T Y Y T P E Y E T K D T D I L A A
    ttccgagtaactcctcaacctggagttccacctgaagaagcaggggctgcggtagctgct
    F R V T P Q P G V P P E E A G A A V A A
    gaatcttctactggtacatggacaactgtgtggaccgatgggcttaccagccttgatcgt
    E S S T G T W T T V W T D G L T S L D R
    tacaaaggacgatgctaccacatcgagcccgttccaggagaagaaactcaatttattgcg
    Y K G R C Y H I E P V P G E E T Q F I A
    tatgtagcttatcccttagacctttttgaagaaggttcggttactaacatgtttacctcg
    Y V A Y P L D L F E E G S V T N M F T S
    attgtgggtaatgtatttgggttcaaagccctggctgctctacgtctagaggatctgcga
    I V G N V F G F K A L A A L R L E D L R
    atccctcctgcttatactaaaactttccaaggaccacctcatggtatccaagttgaaaga
    I P P A Y T K T F Q G P P H G I Q V E R
    gataaattgaacaagtatggacgtcccctattaggatgtactattaaaccaaaattgggg
    D K L N K Y G R P L L G C T I K P K L G
    ttatccgctaaaaactatggtagagcagtttatgaatgtctacgtggtggacttgatttt
    L S A K N Y G R A V Y E C L R G G L D F
    accaaagatgatgagaatgtgaactcccaaccatttatgcgttggagagaccgtttctta
    T K D D E N V N S Q P F M R W R D R F L
    ttttgtgccgaagctatttataaatcacaggctgaaacaggtgaaatcaaaggacattat
    F C A E A I Y K S Q A E T G E I K G H Y
    ttgaatgctactgcgggtacatgcgaagaaatgatcaaaagagctgtatttgccagagaa
    L N A T A G T C E E M I K R A V F A R E
    ttgggagttcctatcgtaatgcatgactacttaacagggggattcactgcaaatactagt
    L G V P I V M H D Y L T G G F T A N T S
    ttgtctcattattgccgagataatggcctacttcttcacatccaccgtgcaatgcacgct
    L S H Y C R D N G L L L H I H R A M H A
    gttattgatagacagaagaatcatggtatgcacttccgtgtactagctaaagctttacgt
    V I D R Q K N H G M H F R V L A K A L R
    ctatctggtggagatcatattcacgcgggtacagtagtaggtaaacttgaaggagacagg
    L S G G D H I H A G T V V G K L E G D R
    gagtcaactttgggctttgttgatttactgcgcgatgattatgttgaaaaagatcgaagc
    E S T L G F V D L L R D D Y V E K D R S
    cgcggtatctttttcactcaagattgggtctcactaccaggtgttctgcctgtggcttca
    R G I F F T Q D W V S L P G V L P V A S
    gggggtattcacgtttggcatatgcctgctttgaccgagatctttggagatgattctgta
    G G I H V W H M P A L T E I F G D D S V
    ctacaattcggtggaggaactttaggccacccttggggaaatgcaccgggtgccgtagcc
    L Q F G G G T L G H P W G N A P G A V A
    aaccgagtagctctggaagcatgtgtacaagctcgtaatgagggacgtgatcttgcagtc
    N R V A L E A C V Q A R N E G R D L A V
    gagggtaatgaaattatccgtgaagcttgcaaatggagtcctgaactagctgctgcttgt
    E G N E I I R E A C K W S P E L A A A C
    gaagtatggaaagagatcacatttaacttcccaaccatcgataaattagatggccaagag
    E V W K E I T F N F P T I D K L D G Q E
    tagatgaattagatttagtaattcacgtttgttttattagtttaattgcactcggctcaa
    - M N - I - - F T F V L L V - L H S A Q
    tcttttttttactaaaaaagattgagccgaggttatctgttgtatatactattttttttg
    S F F Y - K R L S R G Y L L Y I L F F L
    atagatacatacttaaatctagatagaaaaaaaactcttcaataaaaaaaagaagattaa
    I D T Y L N L D R K K T L Q - K K E D -
    acacaactacaattttgttattgtagtgttgtgtccacaagaaatcctatacgaaacatg
    T Q L Q F C Y C S V V S T R N P I R N M
    gattcttaattcttaggagtgttatattctttcgtgtcagggcttgaaccaagtatcccc
    D S - F L G V L Y S F V S G L E P S I P
    gcttcttctaccccatcctgcatgttgtccgtttcttttcattccgtattggaataaaaa
    A S S T P S C M L S V S F H S V L E - K
    aagtttttttttatattagtatacgagattttactaaaaaagttcttaatattcttatat
    K F F F I L V Y E I L L K K F L I F L Y
    tcataagcgaagaacaaatatttctt
    S - A K N K Y F
  3. On sélectionne une phase codante vraisemblable, c'est à dire suffisamment longue pour contenir un gène : il s'agit ici dans le sens 5'->3' de la phase 2. En suivant les instructions : en cliquant sur la Méthionine de départ de l'ORF (Open-Reading-Frame), on obtient la séquence protéique virtuelle résultante :

  4. SEQUENCE 486 AA; 845AB8F1E586141D CRC64.
    MTCREGLMSP QTETKASVGF KAGVKEYKLT YYTPEYETKD TDILAAFRVT PQPGVPPEEA
    GAAVAAESST GTWTTVWTDG LTSLDRYKGR CYHIEPVPGE ETQFIAYVAY PLDLFEEGSV
    TNMFTSIVGN VFGFKALAAL RLEDLRIPPA YTKTFQGPPH GIQVERDKLN KYGRPLLGCT
    IKPKLGLSAK NYGRAVYECL RGGLDFTKDD ENVNSQPFMR WRDRFLFCAE AIYKSQAETG
    EIKGHYLNAT AGTCEEMIKR AVFARELGVP IVMHDYLTGG FTANTSLSHY CRDNGLLLHI
    HRAMHAVIDR QKNHGMHFRV LAKALRLSGG DHIHAGTVVG KLEGDRESTL GFVDLLRDDY
    VEKDRSRGIF FTQDWVSLPG VLPVASGGIH VWHMPALTEI FGDDSVLQFG GGTLGHPWGN
    APGAVANRVA LEACVQARNE GRDLAVEGNE IIREACKWSP ELAAACEVWK EITFNFPTID
    KLDGQE

    (-> // Sequence in FASTA format BLAST logo BLAST submission on ExPASy/SIB)

  5. On va essayer de retrouver cette protéine dans la base de données des génomes entiers. Pour spécifier l'espèce, il faut faire attention de choisir la base "Arabidopssi Thaliana":




































  6. vérification de l'alignement de la séquence "énigme"

  7. 1. O03042 (RBL_ARATH)
    Score = 963 bits (2489), Expect = 0.0, Method: Compositional matrix adjust.
    Identities = 479/479 (100%), Positives = 479/479 (100%), Gaps = 0/479 (0%)
    Query 8 MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQpgvppeeagaavaae 67
    MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAAE
    Sbjct 1 MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAAE 60
    Query 68 SSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTSI 127
    SSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTSI
    Sbjct 61 SSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTSI 120
100% d'alignement : youpi !

le génome complet d'Arabidopsia Thaliana a été un des premiers à être séquencé en entier (2000). Il existe une base de donnée créée et maintenue par "Phoenix Bioinformatics" situé en Californie (TAIR : http://www.arabidopsis.org/Blast/).


Article n°2 : Outils logiciels bioinformatiques
un serveur de calcul est disponible à l'adresse IP suivante : 217.182.83.15 (identifiant : debian, mdp (name of a rock-star)) , un certain nombre d'outils y sont installés : http://arn16s.chez.com/bioinfo_tools.html

Article n°3 : Le repiquage des Cyanobactéries (à suivre)
Repiquage des Cyanobactéries (Synechosystis)
un TP à réaliser sous microscope : http://www.sonodis.fr/p5325/kit-transformation-d-escherichia-coli-avec-la-gfp