Sequence of DPV East African cassava mosaic Kenya virus

East African cassava mosaic Kenya virus isolate Comoros:Grande-Comore:GC35BC1:2009 segment DNA-A, complete sequence.
ACC No: JF909114
Dated: 2012-12-05 | Length: 2800 | CRC: 404653327
                
ID   JF909114; SV 1; circular; genomic DNA; STD; VRL; 2800 BP.
XX
AC   JF909114;
XX
DT   21-JUN-2012 (Rel. 113, Created)
DT   05-DEC-2012 (Rel. 115, Last updated, Version 3)
XX
DE   East African cassava mosaic Kenya virus isolate
DE   Comoros:Grande-Comore:GC35BC1:2009 segment DNA-A, complete sequence.
XX
KW   .
XX
OS   East African cassava mosaic Kenya virus
OC   Viruses; ssDNA viruses; Geminiviridae; Begomovirus.
XX
RN   [1]
RC   Publication Status: Online-Only
RP   1-2800
RX   PUBMED; 23186303.
RA   De Bruyn A., Villemot J., Lefeuvre P., Villar E., Hoareau M.,
RA   Harimalala M., Abdoul-Karime A.L., Abdou-Chakour C., Reynaud B.,
RA   Harkins G.W., Varsani A., Martin D.P., Lett J.M.;
RT   "East African cassava mosaic-like viruses from Africa to Indian ocean
RT   islands: molecular diversity, evolutionary history and geographical
RT   dissemination of a bipartite begomovirus";
RL   BMC Evol. Biol. 12(1):228-228(2012).
XX
RN   [2]
RP   1-2800
RA   Villemot J., Lefeuvre P., Villar E., Hoareau M., Harimalala M.,
RA   Abdoul-Karime A.L., Abdou-Chakour C., Reynaud B., Varsani A., Martin D.P.,
RA   Lett J.-M.;
RT   ;
RL   Submitted (24-MAR-2011) to the INSDC.
RL   UMR PVBMT, CIRAD, 7, chemin de l'IRAT, Saint-Pierre, Reunion 97410, France
XX
FH   Key             Location/Qualifiers
FH
FT   source          1. .2800
FT                   /organism="East African cassava mosaic Kenya virus"
FT                   /segment="DNA-A"
FT                   /host="Manihot esculenta (cassava)"
FT                   /isolate="Comoros:Grande-Comore:GC35BC1:2009"
FT                   /mol_type="genomic DNA"
FT                   /country="Comoros:Grande-Comore"
FT                   /lat_lon="11.84 S 43.31 E"
FT                   /collection_date="2009"
FT                   /db_xref="taxon:393599"
FT   gene            174. .539
FT                   /gene="AV2"
FT   CDS             174. .539
FT                   /codon_start=1
FT                   /gene="AV2"
FT                   /product="movement protein"
FT                   /protein_id="AEG90018.1"
FT                   /translation="MWDPLLNDFPETVHGFRSMLAVKYLLHLEQEYDRGTVGAEYIRDL
FT                   IGVLRCKSYVEATRRYNNLNTRIQGAEEAELRQPIHEPCCCPHCPRHQKQNMGQQAHVS
FT                   EAQDVQNVSKPRCSEGL"
FT   gene            334. .1107
FT                   /gene="AV1"
FT   CDS             334. .1107
FT                   /codon_start=1
FT                   /gene="AV1"
FT                   /product="coat protein"
FT                   /protein_id="AEG90017.1"
FT                   /translation="MSKRPGDIIISTPVSKVRRRLNFDSPYTNRVVAPTVRVTRSKIWA
FT                   NRPMYRKPKTYRMYRSPDVPKGCEGPCKVQSYEQRDDVKHTGMVRCVSDVTRGSGITHR
FT                   VGKRFCVKSIYILGKIWMDENIKKQNHTNHVMFFLVRDRRPYGQSPQDFGQVFNMFDNE
FT                   PTTATVKNDLRDRYQVLRKFYTTVVGGPSGMKEQSLVKRFFRINNHVVYNHQEQAKYEN
FT                   HTENALLLYMACTHASNPVYATLKIRIYFYDAVTN"
FT   gene            complement(1104. .1508)
FT                   /gene="AC3"
FT   CDS             complement(1104. .1508)
FT                   /codon_start=1
FT                   /gene="AC3"
FT                   /product="replication enhancer"
FT                   /protein_id="AEG90021.1"
FT                   /translation="MDSRTGELITAPQAKNGVFTWELTNPLYFDITNHDKRPGNMNHDI
FT                   ITFQIRFNHNIRKALGIHKCFLNFKVWTTLRPPTGLFLKVFRYQVLKYLDMIGVISINT
FT                   VIQAVDHVLYNVLLNTLQVTEQHAIKFNLY"
FT   gene            complement(1249. .1656)
FT                   /gene="AC2"
FT   CDS             complement(1249. .1656)
FT                   /codon_start=1
FT                   /gene="AC2"
FT                   /product="transcription activator protein"
FT                   /protein_id="AEG90020.1"
FT                   /translation="MPPSSPSTSHCSQVPIKVQHRTAKTRAVRRRRVDLECGCSFYLHI
FT                   DCINHGFSHRGTHHCASSKEWRFYLGTNKSPLFRHHQPRQETREHEPRHHHIPDTVQPQ
FT                   HPEGIGDSQMFSQLQGLDDLTASDWSFLKSI"
FT   gene            complement(1580. .2644)
FT                   /gene="AC1"
FT   CDS             complement(1580. .2644)
FT                   /codon_start=1
FT                   /gene="AC1"
FT                   /product="replication associated protein"
FT                   /protein_id="AEG90019.1"
FT                   /translation="MPRAGRFSIKAKNYFLTYPKCSLSKEAALDQLRQLQTPTNKLFIK
FT                   ICRELHDNGEPHLHALIQFEGKYNCTNQRFFDLISPSRSAHFHPNIQGAKSSSDVKSYL
FT                   DKDGDTIQWGEFQIDGRSARGGQQSANDAYAKALNSANKSEALNVIRELAPKDFVLQFH
FT                   NLNSNLERIFQEPLTPYISPFLSSSFTDVPEELEAWVSDNVMGSAARPWRPSSIVIEGD
FT                   SRTGKTMWARSLGPHNYLCGHLDLSPKVYSNDAWYNVIDDVDPHYLKHFKEFMGAQRDW
FT                   QSNTKYGKPIQIKGGIPTIFLCNPGPTSSYKEFLDEEKNQSLKAWAIKNATFITLHEPL
FT                   FSSAHQSPTPHSED"
FT   gene            complement(2197. .2493)
FT                   /gene="AC4"
FT   CDS             complement(2197. .2493)
FT                   /codon_start=1
FT                   /gene="AC4"
FT                   /product="C4 protein"
FT                   /protein_id="AEG90022.1"
FT                   /translation="MTMGNLICMRSFSSKASTIVPTNDSSTSYHLPGPPISTQIFRELN
FT                   QAPTSSPIWIRTETPSNGASFRSTDDLLEADNNPPMTLTPRLLTQQISQRLLM"
XX
SQ   Sequence 2800 BP; 725 A; 562 C; 723 G; 790 T; 0 other;

jf909114 Length: 2800  05-DEC-2012  Type: N  Check: 5291  ..

       1  accggatggc cgcgcccgaa aaaagcaggt ggccccacaa gatggccgcg
      51  cccgttaaag aaagtggtcc ccgcgcactt gtgttggtcg gccagtcata
     101  ttcacgcgtg aaagtctaga tatttgttgt ttgtctttat agacttcgtc
     151  gcgaagtagt ggagcgcgtc aacatgtggg atccattgtt gaacgatttt
     201  cccgaaaccg ttcacggttt ccgttctatg cttgctgtta aatacctgtt
     251  acatctggaa caggaatacg atcgcggtac tgtcggggcg gagtatatac
     301  gtgatttaat aggggttcta cggtgtaaga gttatgtcga agcgaccagg
     351  agatataata atctcaacac ccgtatccaa ggtgcggagg aggctgaact
     401  tcgacagccc atacacgaac cgtgttgttg cccccactgt ccgcgtcacc
     451  agaagcaaaa tatgggccaa caggcccatg tatcggaagc ccaagacgta
     501  cagaatgtat cgaagcccag atgttccgaa gggctgtgaa ggcccatgta
     551  aggttcagtc ctatgaacag agggatgatg tgaagcacac tggtatggtc
     601  cgatgtgtta gtgatgttac tcgtggatca ggcattaccc atagagtcgg
     651  gaagaggttt tgtgtgaagt ccatatatat attgggcaag atttggatgg
     701  atgagaatat caagaagcaa aatcatacga accatgttat gttcttcctt
     751  gttcgagata gaaggcctta cggtcagagt cctcaagatt ttggacaagt
     801  gttcaacatg tttgataatg aacctactac ggcaactgtg aagaatgatc
     851  ttagggaccg atatcaggtg ttacgtaaat tttatacgac tgttgttggt
     901  ggaccctctg ggatgaagga acaatctctg gttaagaggt tttttaggat
     951  caataatcat gtagtgtata atcatcagga acaggccaag tatgagaacc
    1001  atactgagaa tgccttgtta ttgtatatgg catgtacaca tgcctcgaat
    1051  cctgtgtacg ctacgctgaa aatacgcatc tatttctatg atgcagtgac
    1101  aaattaataa aggttgaatt ttattgcatg ttgctccgta acttggagtg
    1151  tgtttagtaa tacattgtac agaacatgat caacagcttg aattacagtg
    1201  ttaatggaaa taacgcctat catatctaaa tacttgagca cctgatatct
    1251  aaatactttt aagaaaagac cagtcggagg ccgtaaggtc gtccagacct
    1301  tgaagttgag aaaacatttg tgaatcccca atgccttccg gatgttgtgg
    1351  ttgaaccgta tctggaatgt gatgatgtcg tggttcatgt tccctggtct
    1401  cttgtcgtgg ttggtgatgt cgaaatagag gggatttgtt agttcccagg
    1451  taaaaacgcc attctttgct tgaggcgcag tgatgagttc ccctgtgcga
    1501  gaatccatga ttgatgcagt cgatatgaag atagaacgag cagccgcatt
    1551  cgaggtctac ccgcctacgt ctgacggccc tagtcttcgc tgtgcggtgt
    1601  tggactttga tgggcacttg agaacaatgg ctcgtggagg gtgatgaagg
    1651  tggcattctt tatagcccag gctttaaggg actggttctt ttcctcgtcc
    1701  agaaactctt tatatgatga tgttggtcct ggattgcata ggaagatagt
    1751  gggaatgccg cctttaattt gaattggctt cccgtacttt gtattgcttt
    1801  gccagtccct ttgggccccc atgaattctt tgaaatgctt gaggtagtgg
    1851  gggtcgacgt catcaatgac gttgtaccat gcgtcgttac tgtatacctt
    1901  tggactgaga tccaggtgtc cacacaagta gttatgtggt cccaaagagc
    1951  gagcccacat tgtcttccct gtcctactat ctccctcgat gacgatacta
    2001  ctcggtctcc atggccgcgc agcggaaccc atcacgttgt cggaaaccca
    2051  agcttcaagt tcctcaggaa cgtcagtgaa agaagaagaa agaaagggag
    2101  aaatataagg agtgagaggc tcttgaaaaa tcctctctaa attgctattt
    2151  aaattatgaa actgtaaaac aaaatctttt ggggctagtt cccgtattac
    2201  attaagagcc tctgacttat ttgctgagtt aagagccttg gcgtaagcgt
    2251  cattggcgga ttgttgtccg cctcgagcag atcgtccgtc gatctgaaac
    2301  tcgccccatt ggatggtgtc tccgtcctta tccagatagg acttgacgtc
    2351  ggagcttgat ttagctccct gaatatttgg gtggaaatgg gcggaccggg
    2401  aaggtgatat gaggtcgaag aatcgttggt tggtacaatt gtacttgcct
    2451  tcgaactgaa tgagcgcatg cagatgaggt tccccattgt catggagctc
    2501  tctgcagatc ttgatgaaca atttatttgt tggggtttgg agctgtcgga
    2551  gctgatccaa ggccgcttct ttcgatagag aacatttggg atatgtgagg
    2601  aaatagtttt tggctttgat gctaaaacga ccagcccttg gcatttgcgc
    2651  tgtcgtatag caatcggggg gggcactcaa aatctgtagc aatcggggga
    2701  atgggggggc aatttatatg atgcccccca aatggcattt atgtaatatc
    2751  ctcatgtaat ttgaatttca aacgtggaaa gcggccatcc gtataatatt