terug
Katalase-gen ontrafeld
Van veel genen is inmiddels de nucleotidenvolgorde vastgesteld. De gegevens
worden volgens een bepaald protocol in grote databases opgeslagen. In de
afbeelding hieronder is een gedeelte van zo’n protocol met informatie van het
katalase-gen van de sojaboon Glycine max weergegeven. Katalase is een
enzym dat in de cellen van alle dieren wordt aangetroffen. Het katalyseert de
omzetting van het giftige waterstofperoxide in water en zuurstof.
Naast het gedeelte van het gen dat codeert voor de aminozuurvolgorde van de
katalase (de exons, onderbroken door introns), bevat het gen nucleotidenvolgordes
die betrokken zijn bij de regulatie van de transcriptie van dit gen en
delen die fungeren als promotor en terminator. Volgens afspraak wordt in het
genprotocol de nucleotidenvolgorde van de coderende streng (het complement
van de template of matrijsstreng) weergegeven, in de richting van 5‘ naar 3‘.
Katalase-gen van de sojaboon Glycine max |
LOCUS |
1-4687 bp (basenparen) |
5‘UTR |
1725-1856 (gebied in het mRNA aan de 5 zijde van het startcodon dat niet ‘vertaald’ wordt)
|
CDS |
(coderende gebieden, inclusief de nucleotiden die coderen voor start- en stopcodon)
1857-1871,1963-2059,2138-3192,3292-3381,3785-3852,3951-4044,4560-4619 |
translatie |
|
|
□MDPYKNRPSSAFNSPFWTTNSGAPIWNNNSSLTVGSRGPILLED
YHLVEKLANFDRERIPERVVHARGASAKGFFEVTHDISHLTCADFLRAPGVQTPLIVR
FSTVIHERGSPETLRDPRGFAVKFYTREGNFDLVGNNFPVFFVRDGLKFPDMVHALKP
NPKSHIQENWRILDFFSHHPESLHMFSFLFDDVGIPQDYRHMDGFGVNTYTLINKAGK
ALYVKFHWKTTSGEKSLLDDEAIRVGGSNHSHATQDLYDSIAAGNYPEWKLYIQTLDP
ENEDRLDFDPLDVTKTWPEDVLPLQPVGRMVLNKNIDNFFAENEQLAFCPAIIVPGVY
YSDDKLLQTRVFSYADTQRHRLGPNYLQLPANAPKCAHHNNHHDGFMNFMHRDEEVNY
FPSRYDPVRHAEKVPVPPRILGGKREKCMIEKENNFKQPGERYRSWPSDRQERFVRRW
VDALSDPRVTHEIRSIWISYWSQADRSLGQKIASHLNLKPSI□
|
exons |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
nucleotiden |
1857-
1871 |
1963-
2059 |
2138-
3192 |
3292-
3381 |
3785-
3852 |
3951-
4044 |
4560-
4619 |
basenvolgorde van coderende streng
1 | aagcttgtaa | tcgattacaa | cattgtgtaa | tcgattacca | gacatgagaa | attcaaattt |
61 | caagtctgaa | gagtcacaac | tcttcagaaa | ctaactatgt | aattgattac | aacatttatg |
121 | taatcgatta | ccagtaagga | attttcgaaa | ataactccca | agagtcacaa | ctgttcaaga |
181 | agtttttgaa | tggccatcga | aggcctataa | ataggtgact | tgggatagga | aattccttag |
241 | agtttttttg | aacaacattg | tcttagcctc | tccaaaccaa | attgtcttat | tactctcaaa |
* ……………………………………………………………………………… |
1741 | tgactgtata | gtataaaata | aaattgtgcc | catagaaata | gaatagtgac | agacacactc |
1801 | gtgaatcgtg | atttagcatt | taccacacca | aaatcaatct | gcggagtcag | aaagccatgg |
1861 | atccctacaa | ggtttgctct | tcttttcttt | tcttttcgga | ttagattcga | ttaaatttct |
1921 | caacttgctt | gttattttga | ctgtgttttg | ttttccattt | agaatcggcc | atcaagcgcc |
1981 | ttcaattctc | ccttctggac | tacaaattcc | ggtgctccca | tctggaacaa | taactcatcg |
* ……………………………………………………………………………… |
2041 | ctgactgttg | gatctagagg | tatggtattt | aatatttttc | attgaattga | attaggttaa |
2101 | ttaatatcag | tattgggaat | tgaattgggg | catgcaggtc | caattctgct | ggaggattac |
2161 | catctggtgg | agaagcttgc | aaactttgac | agggaacgga | tccccgaacg | tgttgtccac |
2221 | gctcgtggag | ctagcgcaaa | gggtttcttt | gaagtcacgc | atgacatttc | tcacctcaca |
2281 | tgtgccgatt | tccttcgagc | ccctggagtt | cagacccccc | tcatcgtccg | tttctccact |
* ……………………………………………………………………………… |
4441 | tggtaggtcc | cttgaactaa | aaaaatagtt | atagactgtc | tataggctca | aaccataaaa |
4501 | agtgaatctg | catttgggtg | ctaattaatg | tgattttcat | ggatggtatt | gctacgcagg |
4561 | ctgatcgttc | tcttggacaa | aagatagcat | ctcacctgaa | cttgaagcca | agtatctaag |
4621 | attggtggtg | gaaaccctag | cttctaagag | atgcagatgt | agggaacaag | gtgagaggtt |
4681 | tgtggcc |
|
* Niet alle basen zijn hier afgedrukt