Projet Cyanobactéries et ARN 16S
Bienvenue sur le projet "Cyanobactéries et ARN 16S"

découverte de la photosynthese :
la protéine RubisCo est une enzyme essentielle
dans la photosynthèse chez l'arabette des dames (Arabidopsis
thaliana)
son nom complet est : RibUlose BIsphosphate CarbOxylase
Aujourd'hui, nous allons essayer de retrouver la partie du génome
codante pour cette protéine de façon ludique!
le but du jeu : tu dois retrouver cette enzyme, impliquée
dans la photosynthèse, chez Arabidopsis Thaliana :)
NB : bref rappel sur le procédé (de production d’oxygène
et) de fixation du CO2 par la photosynthèse pour toutes les
plantes vertes :
le dioxyde de carbone de l’atmosphère est fixé dans un sucre
(ribose<==>ribulose) lors de la photosynthèse. Ce Ribose
(sucre) devient une source d'énergie pour le futur développement
de la plante.
L'ENIGME :
voici la séquence "énigme" de nucléotides, issue du séquencage de
l'arabette ( source :
http://biochimej.univ-angers.fr/Page2/COURS/9ModulGenFoncVeg/6Proteomique/4ApplicationProteomiq.htm
):
ACTGTCAAGAGTGATTTTATTAATATTTTAATATTAAATATTTGGATTTATAAAAAGTCAAAGATTCAAA
ACTTGAAAAAGAAGTATTAGGTTGCGCTATACATATGAAAGAATATACAATAATGATGTATTTGGCGAAT
CAAATATCATGGTCTAATAAAGAATAATTCTGATTAGTTGATAATTTTGTGAAAGATTCCTGTGAAAAAG
GTTAATTAAATCTATTCCTAATTTATGTCGAGTAGACCTTGTTGTTTTGTTTTATTGCAAGAATTCTAAA
TTCATGACTTGTAGGGAGGGACTTATGTCACCACAAACAGAGACTAAAGCAAGTGTTGGGTTCAAAGCTG
GTGTTAAAGAGTATAAATTGACTTACTATACTCCTGAATATGAAACCAAGGATACTGATATCTTGGCAGC
ATTCCGAGTAACTCCTCAACCTGGAGTTCCACCTGAAGAAGCAGGGGCTGCGGTAGCTGCTGAATCTTCT
ACTGGTACATGGACAACTGTGTGGACCGATGGGCTTACCAGCCTTGATCGTTACAAAGGACGATGCTACC
ACATCGAGCCCGTTCCAGGAGAAGAAACTCAATTTATTGCGTATGTAGCTTATCCCTTAGACCTTTTTGA
AGAAGGTTCGGTTACTAACATGTTTACCTCGATTGTGGGTAATGTATTTGGGTTCAAAGCCCTGGCTGCT
CTACGTCTAGAGGATCTGCGAATCCCTCCTGCTTATACTAAAACTTTCCAAGGACCACCTCATGGTATCC
AAGTTGAAAGAGATAAATTGAACAAGTATGGACGTCCCCTATTAGGATGTACTATTAAACCAAAATTGGG
GTTATCCGCTAAAAACTATGGTAGAGCAGTTTATGAATGTCTACGTGGTGGACTTGATTTTACCAAAGAT
GATGAGAATGTGAACTCCCAACCATTTATGCGTTGGAGAGACCGTTTCTTATTTTGTGCCGAAGCTATTT
ATAAATCACAGGCTGAAACAGGTGAAATCAAAGGACATTATTTGAATGCTACTGCGGGTACATGCGAAGA
AATGATCAAAAGAGCTGTATTTGCCAGAGAATTGGGAGTTCCTATCGTAATGCATGACTACTTAACAGGG
GGATTCACTGCAAATACTAGTTTGTCTCATTATTGCCGAGATAATGGCCTACTTCTTCACATCCACCGTG
CAATGCACGCTGTTATTGATAGACAGAAGAATCATGGTATGCACTTCCGTGTACTAGCTAAAGCTTTACG
TCTATCTGGTGGAGATCATATTCACGCGGGTACAGTAGTAGGTAAACTTGAAGGAGACAGGGAGTCAACT
TTGGGCTTTGTTGATTTACTGCGCGATGATTATGTTGAAAAAGATCGAAGCCGCGGTATCTTTTTCACTC
AAGATTGGGTCTCACTACCAGGTGTTCTGCCTGTGGCTTCAGGGGGTATTCACGTTTGGCATATGCCTGC
TTTGACCGAGATCTTTGGAGATGATTCTGTACTACAATTCGGTGGAGGAACTTTAGGCCACCCTTGGGGA
AATGCACCGGGTGCCGTAGCCAACCGAGTAGCTCTGGAAGCATGTGTACAAGCTCGTAATGAGGGACGTG
ATCTTGCAGTCGAGGGTAATGAAATTATCCGTGAAGCTTGCAAATGGAGTCCTGAACTAGCTGCTGCTTG
TGAAGTATGGAAAGAGATCACATTTAACTTCCCAACCATCGATAAATTAGATGGCCAAGAGTAGATGAAT
TAGATTTAGTAATTCACGTTTGTTTTATTAGTTTAATTGCACTCGGCTCAATCTTTTTTTTACTAAAAAA
GATTGAGCCGAGGTTATCTGTTGTATATACTATTTTTTTTGATAGATACATACTTAAATCTAGATAGAAA
AAAAACTCTTCAATAAAAAAAAGAAGATTAAACACAACTACAATTTTGTTATTGTAGTGTTGTGTCCACA
AGAAATCCTATACGAAACATGGATTCTTAATTCTTAGGAGTGTTATATTCTTTCGTGTCAGGGCTTGAAC
CAAGTATCCCCGCTTCTTCTACCCCATCCTGCATGTTGTCCGTTTCTTTTCATTCCGTATTGGAATAAAA
AAAGTTTTTTTTTATATTAGTATACGAGATTTTACTAAAAAAGTTCTTAATATTCTTATATTCATAAGCG
AAGAACAAATATTTCTT
- Dans un premier temps, on cherche une traduction de la
séquence précédente qui soit vraisemblable sur une des
trois phases, afin de coder une "vraie" une protéine. On utilise
pour cela le programme "translate" suivant : http://web.expasy.org/translate/
actgtcaagagtgattttattaatattttaatattaaatatttggatttataaaaagtcaa
L S R V I L L I F - Y - I F G F I K S Q
agattcaaaacttgaaaaagaagtattaggttgcgctatacatatgaaagaatatacaat
R F K T - K R S I R L R Y T Y E R I Y N
aatgatgtatttggcgaatcaaatatcatggtctaataaagaataattctgattagttga
N D V F G E S N I M V - - R I I L I S -
taattttgtgaaagattcctgtgaaaaaggttaattaaatctattcctaatttatgtcga
- F C E R F L - K R L I K S I P N L C R
gtagaccttgttgttttgttttattgcaagaattctaaattcatgacttgtagggaggga
V D L V V L F Y C K N S K F M T C R E G
cttatgtcaccacaaacagagactaaagcaagtgttgggttcaaagctggtgttaaagag
L M S P Q T E T K A S V G F K A G V K E
tataaattgacttactatactcctgaatatgaaaccaaggatactgatatcttggcagca
Y K L T Y Y T P E Y E T K D T D I L A A
ttccgagtaactcctcaacctggagttccacctgaagaagcaggggctgcggtagctgct
F R V T P Q P G V P P E E A G A A V A A
gaatcttctactggtacatggacaactgtgtggaccgatgggcttaccagccttgatcgt
E S S T G T W T T V W T D G L T S L D R
tacaaaggacgatgctaccacatcgagcccgttccaggagaagaaactcaatttattgcg
Y K G R C Y H I E P V P G E E T Q F I A
tatgtagcttatcccttagacctttttgaagaaggttcggttactaacatgtttacctcg
Y V A Y P L D L F E E G S V T N M F T S
attgtgggtaatgtatttgggttcaaagccctggctgctctacgtctagaggatctgcga
I V G N V F G F K A L A A L R L E D L R
atccctcctgcttatactaaaactttccaaggaccacctcatggtatccaagttgaaaga
I P P A Y T K T F Q G P P H G I Q V E R
gataaattgaacaagtatggacgtcccctattaggatgtactattaaaccaaaattgggg
D K L N K Y G R P L L G C T I K P K L G
ttatccgctaaaaactatggtagagcagtttatgaatgtctacgtggtggacttgatttt
L S A K N Y G R A V Y E C L R G G L D F
accaaagatgatgagaatgtgaactcccaaccatttatgcgttggagagaccgtttctta
T K D D E N V N S Q P F M R W R D R F L
ttttgtgccgaagctatttataaatcacaggctgaaacaggtgaaatcaaaggacattat
F C A E A I Y K S Q A E T G E I K G H Y
ttgaatgctactgcgggtacatgcgaagaaatgatcaaaagagctgtatttgccagagaa
L N A T A G T C E E M I K R A V F A R E
ttgggagttcctatcgtaatgcatgactacttaacagggggattcactgcaaatactagt
L G V P I V M H D Y L T G G F T A N T S
ttgtctcattattgccgagataatggcctacttcttcacatccaccgtgcaatgcacgct
L S H Y C R D N G L L L H I H R A M H A
gttattgatagacagaagaatcatggtatgcacttccgtgtactagctaaagctttacgt
V I D R Q K N H G M H F R V L A K A L R
ctatctggtggagatcatattcacgcgggtacagtagtaggtaaacttgaaggagacagg
L S G G D H I H A G T V V G K L E G D R
gagtcaactttgggctttgttgatttactgcgcgatgattatgttgaaaaagatcgaagc
E S T L G F V D L L R D D Y V E K D R S
cgcggtatctttttcactcaagattgggtctcactaccaggtgttctgcctgtggcttca
R G I F F T Q D W V S L P G V L P V A S
gggggtattcacgtttggcatatgcctgctttgaccgagatctttggagatgattctgta
G G I H V W H M P A L T E I F G D D S V
ctacaattcggtggaggaactttaggccacccttggggaaatgcaccgggtgccgtagcc
L Q F G G G T L G H P W G N A P G A V A
aaccgagtagctctggaagcatgtgtacaagctcgtaatgagggacgtgatcttgcagtc
N R V A L E A C V Q A R N E G R D L A V
gagggtaatgaaattatccgtgaagcttgcaaatggagtcctgaactagctgctgcttgt
E G N E I I R E A C K W S P E L A A A C
gaagtatggaaagagatcacatttaacttcccaaccatcgataaattagatggccaagag
E V W K E I T F N F P T I D K L D G Q E
tagatgaattagatttagtaattcacgtttgttttattagtttaattgcactcggctcaa
- M N - I - - F T F V L L V - L H S A Q
tcttttttttactaaaaaagattgagccgaggttatctgttgtatatactattttttttg
S F F Y - K R L S R G Y L L Y I L F F L
atagatacatacttaaatctagatagaaaaaaaactcttcaataaaaaaaagaagattaa
I D T Y L N L D R K K T L Q - K K E D -
acacaactacaattttgttattgtagtgttgtgtccacaagaaatcctatacgaaacatg
T Q L Q F C Y C S V V S T R N P I R N M
gattcttaattcttaggagtgttatattctttcgtgtcagggcttgaaccaagtatcccc
D S - F L G V L Y S F V S G L E P S I P
gcttcttctaccccatcctgcatgttgtccgtttcttttcattccgtattggaataaaaa
A S S T P S C M L S V S F H S V L E - K
aagtttttttttatattagtatacgagattttactaaaaaagttcttaatattcttatat
K F F F I L V Y E I L L K K F L I F L Y
tcataagcgaagaacaaatatttctt
S - A K N K Y F
- On sélectionne une phase codante vraisemblable, c'est à dire
suffisamment longue pour contenir un gène : il s'agit ici dans
le sens 5'->3' de la phase 2. En suivant les instructions :
en cliquant sur la Méthionine de départ de l'ORF
(Open-Reading-Frame), on obtient la séquence protéique virtuelle
résultante :
SEQUENCE 486 AA; 845AB8F1E586141D CRC64.
MTCREGLMSP QTETKASVGF KAGVKEYKLT YYTPEYETKD TDILAAFRVT PQPGVPPEEA
GAAVAAESST GTWTTVWTDG LTSLDRYKGR CYHIEPVPGE ETQFIAYVAY PLDLFEEGSV
TNMFTSIVGN VFGFKALAAL RLEDLRIPPA YTKTFQGPPH GIQVERDKLN KYGRPLLGCT
IKPKLGLSAK NYGRAVYECL RGGLDFTKDD ENVNSQPFMR WRDRFLFCAE AIYKSQAETG
EIKGHYLNAT AGTCEEMIKR AVFARELGVP IVMHDYLTGG FTANTSLSHY CRDNGLLLHI
HRAMHAVIDR QKNHGMHFRV LAKALRLSGG DHIHAGTVVG KLEGDRESTL GFVDLLRDDY
VEKDRSRGIF FTQDWVSLPG VLPVASGGIH VWHMPALTEI FGDDSVLQFG GGTLGHPWGN
APGAVANRVA LEACVQARNE GRDLAVEGNE IIREACKWSP ELAAACEVWK EITFNFPTID
KLDGQE
(-> // Sequence in FASTA format BLAST logo BLAST submission on
ExPASy/SIB)
- On va essayer de retrouver cette protéine dans la base de
données des génomes entiers. Pour spécifier l'espèce, il faut
faire attention de choisir la base "Arabidopssi Thaliana":
-
vérification de l'alignement de la séquence "énigme"
1. O03042 (RBL_ARATH)
Score = 963 bits (2489), Expect = 0.0, Method: Compositional
matrix adjust.
Identities = 479/479 (100%), Positives = 479/479 (100%), Gaps =
0/479 (0%)
Query 8
MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQpgvppeeagaavaae 67
MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAAE
Sbjct 1
MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAAE 60
Query 68
SSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTSI 127
SSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTSI
Sbjct 61
SSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTSI 120
100% d'alignement : youpi !
le génome complet d'Arabidopsia Thaliana a été un des premiers à
être séquencé en entier (2000). Il existe une base de donnée créée
et maintenue par "Phoenix Bioinformatics" situé en Californie
(TAIR : http://www.arabidopsis.org/Blast/).
Article n°2 : Outils logiciels
bioinformatiques
un serveur de calcul est disponible à l'adresse IP suivante : 217.182.83.15 (identifiant : debian,
mdp (name of a rock-star)) , un certain nombre d'outils y sont
installés : http://arn16s.chez.com/bioinfo_tools.html
Article n°3 : Le repiquage des
Cyanobactéries (à suivre)
Repiquage des
Cyanobactéries (Synechosystis)
un TP à réaliser sous microscope : http://www.sonodis.fr/p5325/kit-transformation-d-escherichia-coli-avec-la-gfp