Está en la página 1de 17

1.

SECUENCIA ESPECIFICA NUCLEOTIDIC DEPURADA Y VERIFICADA


( FORMATO FASTA)
ATGTCAGTAGCTTCACCGATTCAATGTATCAGGATTCTAAATCCATCATCTTCATCTTCT
TCTTCGACAGCTTCGTCGTCTTTTAGATTCTCAACAACGACTAAGCCATGTGTCTTCATC
ATCAGATGCTCTCAGACAGAAGGTCCTTTAAGAAGACCATCGGCTCCTCCTACTCTCCGG
GAGCCTCAAAAACCTGTTCCTCCATCACAGCCATCTTCCTCTCCTCCTCCTTCTCCGCCG
CCGCAGAAAGCTGTAGCTGTTGATGGGAAGAGTGTAACTACAGTGGAGTTTCAGAGACAA
AAGGCTAAAGAGCTTCAAGAGTACTTTAAACAGAAAAAGCTTGAAGCTGCTGGTCAAGGT
CCCTTTTTTGGTTTCCAACCCAAAAATGAGATCTCCAATGGAAGGTGGGCTATGTTTGGT
TTCGCAGTTGGTATGCTCACAGAGTATGCAACAGGATCAGACCTTGTTGATCAAGTTAAG
ATCCTTCTCTCAAATTTCGGCATTCTAGACTTGGAATAA
2. SECUENCIA ESPECIFICA AMINOACIDICA DEPURADA Y VERIFICADA
(FORMATO FASTA)
MSVASPIQCIRILNPSSSSSSSTASSSFRFSTTTKPCVFIIRCSQTEGPLRRPSAPPTLREPQKPVPPS
QPSSSPPPSPPPQKAVAVDGKSVTTVEFQRQKAKELQEYFKQKKLEAAGQGPFFGFQPKNEISNGRWAM
FGFAVGMLTEYATGSDLVDQVKILLSNFGILDLE

3. HOMOLOGOS DE SECUENCIA DE AMINOACIDOS (RESULTADO DE BLAST-NCBI)


NUMERO DE ACCESO ESPECIE
ID DE SECUENCIA: NM_103122.4 Proteína 2 de una hélice de Arabidopsis thaliana
LONGITUD: 824 (OHP2), ARNm
SIMILITUD DEL 100%
ID DE SECUENCIA: AY091438.1 fotosistema putativo ii de arabidopsis thaliana
LONGITUD: 550 ARNm de proteína de 22 kDa (at1g34000), cd completo
SIMILITUD DEL 100%

ID DE SECUENCIS: XM_006305641.2 Proteína similar al complejo captador de luz de


LONGITUD:788 Capsella rubéola OHP2, cloroplástico (LOC17898835),
SIMILITUD DEL 89% ARNm
ID DE SECUENCIA: XM_010480511.2 PREDICTIVA DE Camelina sativa no caracterizada
LONGITUD: 793 LOC104757743 (LOC104757743), ARNm
SIMILITUD DEL 90%
ID DE SECUENCIA: BX818633.1 Arabidopsis thaliana ADNc de longitud completa
LONGITUD: 692 SIMILITUD 95.74% Secuencia completa del clon GSLTSIL89ZF08 de
Silique de la cepa col-0 de Arabidopsis thaliana
(thale cress)

ID DE SECUENCIA: XM_002893752.2 PREDICCIÓN: Arabidopsis lyrata subsp. proteína


LONGITUD: 765 similar al complejo captador de luz de lyrata OHP2,
SIMILITUD DE 94.29% cloroplástico (LOC9327133), ARNm
ID DE SECUENCIA: OX291666.1 Ensamblaje del genoma de Arabidopsis thaliana,
LONGITUD: 36287601 cromosoma: 1
SIMILITUD DEL 98.52%
ID DE SECUENCIA: AY084529.1 Arabidopsis thaliana clon 11084 ARNm, secuencia
LONGITUD: 813 completa
SIMILITUD DEL 95.57%
ID DE SECUENCIA: XM_010462915.1 PREDICCIÓN: Camelina sativa no caracterizada
LONGITUD: 796 LOC104741967 (LOC104741967), ARNm
SIMILITUD DEL 89.64%
ID de secuencia: AF325046.1 ARNm de Arabidopsis thaliana F12G12.18, cd completo
Longitud: 570
SIMILITUD:100%
4. HOMOLOGOS DE SECUENCIA DE AMINOACIDOS (RESULTADO DE BLAST-NCBI)
NUMERO DE ACCESO ESPECIE
ID DE SECUENCIA: NP_564432.3 proteína de una hélice 2 [Arabidopsis
LONGITUD: 172 thaliana]
100%
ID DE SECUENCIA: KAG7599167.1 LONGITUD: 175 proteína hipotética ISN44_As06g033630
96.57% [Arabidopsis suecica]
ID DE SECUENCIA: XP_006305703.1 proteína similar al complejo captador
LONGITUD: 176 de luz OHP2, cloroplástica [Capsella
94%
rubella]
ID DE SECUENCIA: XP_010478813.1 PREDICCIÓN: proteína no caracterizada
LONGITUD: 176 LOC104757743 [Camelina sativa]
93%
ID DE SECUENCIA: KAF8047693.1 proteína hipotética N665_2867s0003
LONGITUD: 171 [Sinapis alba]
87%

ID DE SECUENCIA: XP_018436447.1 proteína similar al complejo captador


LONGITUD: 172 de luz OHP2, cloroplástica [Raphanus
87.58%
sativus]
ID DE SECUENCIA: KAG2304370.1 proteína hipotética Bca52824_033021
LONGITUD: 175 [Brassica carinata]
86%
ID DE SECUENCIA: KAF3522864.1 proteína hipotética F2Q69_00047741
LONGITUD: 167 [Brassica cretica]
82%
ID DE SECUENCIA: XP_010530123.1 PREDICCIÓN: proteína rica en prolina
LONGITUD: 181 11 [Tarenaya hassleriana]
70%
ID DE SECUENCIA: KAH9757702.1 Proteína similar al complejo captador
LONGITUD: 183 de luz OHP2 [Citrus sinensis]
62%

5. TABLA DE HOMOLOGOS DE SECUENCIA NUCLEOTICA( DE BLAST- BASE


ESPECIALIZADA)
NUMERO DE ACCESO cromosoma
TAIR chr5:2344775-2345485
AT5G07400.8 | [4134-4844]
Longitud=711
Similitud:78%
TAIR chr5:2344477-2345485
AT5G07400.7 | [3836-4034] [4138-4844]
Longitud=906
Similitud:78%
TAIR cro5:2344317-2345458
AT5G07400.6 | [3676-4034] [4138-4817]
Longitud=1039
Similitud:78%
TAIR chr5:2344477-2345485
AT5G07400.4 | [3836-4844]
Longitud=1009
Similitud:78%
TAIR chr5:2344317-2345545
AT5G07400.3 | [3684-4912]
Longitud=1229
6. TABLA DE HOMOLOGOS DE SECUENCIA DE AMINOACIDOS ( DE BLAST- BASE
ESPECIALIZADA)
ubicación longitud similitud
1:12358486-12358641 52 92%
1:12358154-12358267 38 100%
1:12358720-12358800 27 100%
1:16872943-16873071 43 39%
1:12358858-12358902  15 100%

7. REPRESENTACION GRAFICA O LINEAL DE LA SECUENCIA NUCLEOTIDICA


DEPURADA(FICHA DE NCBI)

8. REPRESENTACION GRAFICA O LINEAL DE LA SECUENCIA AMINOACIDICA


DEPURADA(PROSCAN, SIGNAP P)
MODIFICACION POSTRADUCCIONAL: 5 PATORNES DIFERENTES ENCONTRADOS EN
PROSCAN
1. SITIO DE FOSFORILACIÓN DE PROTEÍNA QUINASA DEPENDIENTE DE CAMP Y
CGMP.
2. SITIO DE FOSFORILACIÓN DE LA PROTEÍNA QUINASA C
3. SITIO DE FOSFORILACIÓN DE LA CASEÍNA QUINASA II.
4. SITIO DE FOSFORILACIÓN DE TIROSINA QUINASA.
5. MOTIVO A DEL SITIO DE UNIÓN A ATP/GTP (BUCLE P).
RESULTADO DE SIGNA P A CONTINUACION:
9. TABLA DE CARACTERIZTICAS GENERALESSEC NUCLEOTICA Y
AMINOACIDA(LONGITUD,PI,PM, COMPOSICION
LONGITUD 172 AMINOACIDOS
824 NUCLEOTIDOS
PI 9,44
PM 18665.31
COMPOSICION CARBÓN C 832
HIDRÓGENO H 1316
NITRÓGENO N 224
OXÍGENO O 251
AZUFRE S 6
FORMULA C 832 H 1316 N 224 O 251 S 6
NÚMERO TOTAL DE ÁTOMOS: 2629
VIDA MEDIA ESTIMADA: EL N-TERMINAL DE LA SECUENCIA CONSIDERADA ES M
(MET).
LA VIDA MEDIA ESTIMADA ES: 30 HORAS (RETICULOCITOS
DE MAMÍFEROS, IN VITRO)
>20 HORAS (LEVADURA, IN VIVO).
>10 HORAS (ESCHERICHIA COLI, IN VIVO).

ÍNDICE DE INESTABILIDAD: EL ÍNDICE DE INESTABILIDAD (II) SE CALCULA EN 67,96


ESTO CLASIFICA A LA PROTEÍNA COMO INESTABLE.
ÍNDICE ALIFÁTICO: 66,34
GRAN PROMEDIO DE HIDROPATICIDAD (GRAVY): -0.363
COMPOSICION DE AMINOACIDOS Ala (A) 11 6,4 % Ser (S) 24 14,0 %
Ala (A) 11 6,4 % Thr (T) 10 5,8 %
Arg (R) 8 4,7 % Trp (W) 1 0,6 %
Asn (N) 4 2,3 % Tyr (Y) 2 1,2 %
Asp (D) 4 2,3 % Val (V) 10 5,8 %
Cys (C) 3 1,7 % Pyl (O) 0 0,0%
Gln (Q) 12 7,0 % Número total de residuos
Glu ( E) 9 5,2 % cargados positivamente
Gly (G) 10 5,8 % (Arg + Lys): 19
His (H) 0 0,0 % Épsilon molecular teórico
Ile (I) 8 4,7 % a 280 nm (1 cm): 8672
Leu (L) 11 6,4 % Número total de residuos
Lys (K) 11 6,4 % cargados negativamente
Met (M) 3 1,7 % (Asp + Glu): 13
Phe (F ) 11 6,4 %
Pro (P) 20 11,6 %
10. PREDICCION DE ESTRUCTURA SECUNDARIA DE LA PROTEINA
10 20 30 40 50 60 70
| | | | | | |
UNK_47460 MSVASPIQCIRILNPSSSSSSSTASSSFRFSTTTKPCVFIIRCSQTEGPLRRPSAPPTLREPQKPVPPSQ
DSC
cccccccceeeeecccccccccccceeeeeecccccceeeeeeccccccccccccccccccccccccccc
MLRC
cccccceeeeeeeccccccccccccceeeeeccccceeeeeeeccccccccccccccccccccccccccc
PHD
ccccccceeeeeecccccccccccccccceceeccceeeeeeeecccccccccccccccccccccccccc
Sec.Cons.
ccccccceeeeeeccccccccccccceeeeeccccceeeeeeeccccccccccccccccccccccccccc
80 90 100 110 120 130 140
| | | | | | |
UNK_47460 PSSSPPPSPPPQKAVAVDGKSVTTVEFQRQKAKELQEYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFG
DSC
cccccccccccceeeeeccccceeehhhhhhhhhhhhhhhhhhhhhccccccccccccccccccceeeee
MLRC
ccccccccccccceeeeccceeeeeeehhhhhhhhhhhhhhhhhhhccccccccccccccccccheeeee
PHD
cccccccccccceeeeeccccceeehhhhhhhhhhhhhhhhhhhhhhcccceecccccccccccchhhhh
Sec.Cons.
cccccccccccceeeeeccccceeehhhhhhhhhhhhhhhhhhhhhccccccccccccccccccceeeee
150 160 170
| | |
UNK_47460 FAVGMLTEYATGSDLVDQVKILLSNFGILDLE
DSC eeeeeeeeecccccccceeeeeeccccccccc
MLRC eehheehcccccchhhhhhhhhhhhccccccc
PHD hhhhhhhhhhcccchhhhhhhhhhhhcceecc
Sec.Cons. eehheeh??ccccchhhhhhhhhhhccccccc
DSC: MLRC:
Hélice alfa ( Hh ): 21 es 12.21% Hélice alfa ( Hh ): 35 es 20.35%
3 10 hélice ( Gg ): 0 es 0.00% 3 10 hélice ( Gg ): 0 es 0.00%
Pi hélice ( Ii ): 0 es 0.00% Pi hélice ( Ii ): 0 es 0.00%
Puente beta ( Bb ): 0 es 0.00% Puente beta ( Bb ): 0 es 0.00%
Cadena extendida ( Ee ): 45 es 26.16% Cadena extendida ( Ee ): 39 es 22.67%
Turno beta ( Tt ): 0 es 0.00% Turno beta ( Tt ): 0 es 0.00%
Región de plegado ( Ss ): 0 es 0,00 % Región de plegado ( Ss ): 0 es 0,00 %
Bobina aleatoria ( Cc ): 106 es 61,63% Bobina aleatoria ( Cc ): 98 es 56,98%
Estados ambiguos (?): 0 es 0.00% Estados ambiguos (?): 0 es 0.00%
Otros estados: 0 es 0.00% Otros estados: 0 es 0.00%

Sec.Cons. : DOCTOR :
Hélice alfa ( Hh ): 35 es 20.35% Hélice alfa ( Hh ): 49 es 28,49%
3 10 hélice ( Gg ): 0 es 0.00% 3 10 hélice ( Gg ): 0 es 0.00%
Pi hélice ( Ii ): 0 es 0.00% Pi hélice ( Ii ): 0 es 0.00%
Puente beta ( Bb ): 0 es 0.00% Puente beta ( Bb ): 0 es 0.00%
Hilo extendido ( Ee ): 35 es 20,35% Cadena extendida ( Ee ): 29 es 16.86%
Turno beta ( Tt ): 0 es 0.00% Turno beta ( Tt ): 0 es 0.00%
Región de plegado ( Ss ): 0 es 0,00 % Región de plegado ( Ss ): 0 es 0,00 %
Bobina aleatoria ( Cc ): 100 es 58,14% Bobina aleatoria ( Cc ): 94 es 54,65%
Estados ambiguos (?): 2 es 1.16% Estados ambiguos (?): 0 es 0.00%
Otros estados: 0 es 0.00% Otros estados: 0 es 0.00%

11. HOMOLOGOS ESTRUCTURALES( MAX PLANCK INSTITUTE)


CODIGO Nombre Probabilidad Longitud
6LY5_B FCPI-1; diatomea, PSI-FCPI, photosyem, fotosíntesis; HET: A86, LMT, PQN, 98.34 223
DD6, KC1, CLA, LHG, LMG, SF4, DGD, SQD, BCR;
7Y5E_8N Gorra roja; complejo, FOTOSÍNTESIS; HET: HOMBRES, OEX, PUB, PQN, 98.05 180
PL9, BGC, PEB, BCT, 3XQ, CYC, ZEX, GOL, LMG, PHO, CLA, LHG, SF
7Y7B_8 ACPI-8; Cryptophyte, Fotosistema I, evolución, FOTOSÍNTESIS; HET: LMU, 97.95 227
IHT, 8CT, PQN, KC2, II3, CLA, LHG, LMG, SF4, DG
7Y5E_12 proteína de unión ab de clorofila, cloroplástica; complejo, 97.82 174
FOTOSÍNTESIS; HET: HOMBRES, OEX, PUB, PQN, PL9, BGC, PEB, BCT, 3X
6FOS_4 Similar a la proteína de recolección de luz; proteína de membrana, 97.79 214
complejo fotosintético, centro de reacción, fotosistema, PHOTOSYNTHE
6JO5_9 proteína de unión ab de clorofila, cloroplástica; proteína de membrana del 97.76 189
fotosistema, FOTOSÍNTESIS; HET: PQN, CHL, CL0, CLA, L
7ZQC_9 proteína de unión ab de clorofila, cloroplástica; Fotosíntesis, algas verdes, 97.76 213
PSI dimérico; CALIDAD: LMU, PQN, CHL, CL0, CLA,
6ZZX_2 proteína de unión ab de clorofila, cloroplástica; fotosistema I, estrés ligero, 97.74 215
FOTOSÍNTESIS; CALIENTE: PLM, RRX, PQN, SPH, 4R
7EWK_6 proteína de unión ab de clorofila Lhca6; Fotosistema I, Complejo captador 97.72 211
de luz, Lhca6, transporte cíclico de electrones, Fotos
7Y7B_e ACPI-11; Cryptophyte, Fotosistema I, evolución, FOTOSÍNTESIS; HET: 97.7 208
LMU, IHT, 8CT, PQN, KC2, II3, CLA, LHG, LMG, SF4, D
7KUX_4 proteína de unión ab de clorofila, cloroplástica; PSI, transporte de 97.66 203
electrones, fotosíntesis, clorofila, Antena, luz har
6ZZY_1 proteína de unión ab de clorofila, cloroplástica; fotosistema I, estrés ligero, 97.65 192
FOTOSÍNTESIS; CALIENTE: PLM, RRX, PQN, SPH, 4R
6ZZY_4 proteína de unión ab de clorofila, cloroplástica; fotosistema I, estrés ligero, 97.64 207
FOTOSÍNTESIS; CALIENTE: PLM, RRX, PQN, SPH, 4R

12. PERFIL FISICOQUIMICO DE LA SECUENCIA


1. HIDROFILIA (HOOP & WOODS,
1981)

2. HIDROPATÍA (KYTE &


DOOLITTLE,1982)

3. FLEXIBILIDAD (KARPLUS &


SCHULZ, 1985)

4. ANTIGENICIDAD (PARKER ET
AL., 1986)

5. ACCESIBILIDAD (JANIN, 1979)

6. MEMBRANAENTERRADA-HÉLICE
(ARGOS, 1986)

7. ANTIGENICIDAD (WELLING, 1985


13. MULTIALINEAMIENTO DE NUCLEOTIDOS
CLUSTAL O(1.2.4) multiple sequence alignment
OX291666.1 TCCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCC 60
XM_002893752.2 --------------------------------------------------------CCAC 4
AY084529.1 ----------------------------------------------------------AC 2
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 ------------------------------------------------------------ 0
NM_103122.4 ----------------------------------------------------------AC 2
AY091438.1 ------------------------------------------------------------ 0
XM_006305641.2 ------------------------------------------------------------ 0
XM_010480511.2 ----------------------------------------------------CACATCCA 8
XM_010462915.1 -------------------------------------------CCATATC--ACATCCAC 15

OX291666.1 TAAACCCTAAACCCTAAACCCTAAACCCAAAACCCTAAACCCTAAACCCTAAACCCTAAA 120


XM_002893752.2 AAAGACATTAC-C-AAAAGACAGAACC---------------------AAAGCTTCGAAA 41
AY084529.1 AAAGACATTAG-C-AAAAGACAGAACC---------------------AAAGCTTCGAAA 39
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 ------------------------------------------------------------ 0
NM_103122.4 AAAGACATTAC-C-AAAAGACAGAACC---------------------AAAGCTTCGAAA 39
AY091438.1 ------------------------------------------------------------ 0
XM_006305641.2 AAAGACATTAC-C-AAAAGACAGAACAGAACTAAAAGCTTCGA-AGAAAAAAAATCAGAC 57
XM_010480511.2 AAAGACATTAC-C-AAA--------AAGACGGAACCAAAGCTT-CGGAAAAAAATT-CAG 56
XM_010462915.1 AAAGACATTAC-C-AAA--------AAGACAGAACCAAAGCTT-CGGAAAAAAAATTCAG 64

OX291666.1 CCCTAAACCCTAACCTAAACCACTAAACCCTAAACCCTAAACCCTAAACCCTAACCCCTA 180


XM_002893752.2 -ATCAGACAATTCAACTAAACGAAAAGATGTC------------AGTAGCTTCACC--GA 86
AY084529.1 -ATCAGACAATTCAACTAA-CAAAAAAATGTC------------AGTAGCTTCACC--GA 83
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 ----------------------AAAAAATGTC------------AGTAGCTTCACC--GA 24
NM_103122.4 -ATCAGACAATTCAACTAA-CAAAAAAATGTC------------AGTAGCTTCACC--GA 83
AY091438.1 ---------------------------ATGTC------------AGTAGCTTCACC--GA 19
XM_006305641.2 -AATTCAATTTCAACTAAACGAAGAAGATGTC------------AGTAGCCTCACC--GA 102
XM_010480511.2 -ACAAATCAAGTAAACGAAGAAGAAAGATGTC------------AGTAGCTTCACC--GA 101
XM_010462915.1 -ACAA----TTCAACGAAACGAAGAAGATGTC------------AGTAGCTTCACC--GA 105

OX291666.1 AACCCTAAACCCTAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCC 240


XM_002893752.2 TTCAATGTATCAGGATTCTAAATCCATCATCTTCCTC-------------TTCTTCAT-- 131
AY084529.1 TTCAATGTATCAGGATTCTAAATCCATCATCTTCATC-------------------TT-- 122
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 TTAAATGTATCAGGATTCTAAATCCATCATCTTCATC-------------------TT-- 63
NM_103122.4 TTCAATGTATCAGGATTCTAAATCCATCATCTTCATC-------------------TT-- 122
AY091438.1 TTCAATGTATCAGGATTCTAAATCCATCATCTTCATC-------------------TT-- 58
XM_006305641.2 TTCAATGTATCAGGATTCTAAATCCATCATCATCTTC-------------TTCATCATTA 149
XM_010480511.2 TTCAATGTATCAGGATTCTAAATCCATCATCATCATC-------------TTCTTCATCT 148
XM_010462915.1 TTCAATGTATCAGGATTCTAAATCCATCATCATCAAC-------------TTCTTCATCA 152

OX291666.1 TAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAA 300


XM_002893752.2 -CTTCTTCAACAGCTTCGT-----CGTCTTTTAGATTCTCATCGACGACTAAGCCATGTG 185
AY084529.1 -CTTCTTCGACAGCTTCGT-----CGTCTTTTAGATTCTCAACAACGACTAAGCCATGTG 176
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 -CTTCTTCGACAGCGTCGT-----CGTCTTTGAGATTTTCAACAACGACTCAGCCTTGTG 117
NM_103122.4 -CTTCTTCGACAGCTTCGT-----CGTCTTTTAGATTCTCAACAACGACTAAGCCATGTG 176
AY091438.1 -CTTCTTCGACAGCTTCGT-----CGTCTTTTAGATTCTCAACAACGACTAAGCCATGTG 112
XM_006305641.2 TCTACCACAACAGCTTCAT-----CGTCTTTTAGATTCTCAAAGAGTACTAAGCCATGTG 204
XM_010480511.2 TCTTCT------ACCTCAA-----CATCTTTTAGATTCTCAACGACTACTAAGCCATGTG 197
XM_010462915.1 TCTTCT------ACCTCAA-----CATCTTTTAGATTCTCAACGAATACTAAGCCATGTG 201

OX291666.1 CCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCT 360


XM_002893752.2 TATTCATCATCAGATGT------------------------------------------- 202
AY084529.1 TCTTCATCATCAGATGC------------------------------------------- 193
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 TCTTCATCATCAGAGGC------------------------------------------- 134
NM_103122.4 TCTTCATCATCAGATGC------------------------------------------- 193
AY091438.1 TCTTCATCATCAGATGC------------------------------------------- 129
XM_006305641.2 TATTCATCATCAGATGT------------------------------------------- 221
XM_010480511.2 TATTCATCATCAGATGT------------------------------------------- 214
XM_010462915.1 TATTCATCATCAGATGT------------------------------------------- 218

OX291666.1 AAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAAC 420


XM_002893752.2 ------------------------------------------------------------ 202
AY084529.1 ------------------------------------------------------------ 193
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 ------------------------------------------------------------ 134
NM_103122.4 ------------------------------------------------------------ 193
AY091438.1 ------------------------------------------------------------ 129
XM_006305641.2 ------------------------------------------------------------ 221
XM_010480511.2 ------------------------------------------------------------ 214
XM_010462915.1 ------------------------------------------------------------ 218

OX291666.1 CCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTA 480


XM_002893752.2 ------------------------------------------------------------ 202
AY084529.1 ------------------------------------------------------------ 193
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 ------------------------------------------------------------ 134
NM_103122.4 ------------------------------------------------------------ 193
AY091438.1 ------------------------------------------------------------ 129
XM_006305641.2 ------------------------------------------------------------ 221
XM_010480511.2 ------------------------------------------------------------ 214
XM_010462915.1 ------------------------------------------------------------ 218

OX291666.1 AACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACC 540


XM_002893752.2 -----------------------------------------------------------T 203
AY084529.1 -----------------------------------------------------------T 194
AF325046.1 ------------------------------------------------------------ 0
BX818633.1 -----------------------------------------------------------G 135
NM_103122.4 -----------------------------------------------------------T 194
AY091438.1 -----------------------------------------------------------T 130
XM_006305641.2 -----------------------------------------------------------T 222
XM_010480511.2 -----------------------------------------------------------T 215
XM_010462915.1 -----------------------------------------------------------T 219

OX291666.1 CTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAA 600


XM_002893752.2 C-------TCAGACAGAAGGT------CCT-TTAAGA-------AGGCCCTCGGCT---- 238
AY084529.1 C-------TCAAACAGAAGGA------CCC-TTAAGA-------AGGCCATCGGCT---- 229
AF325046.1 ---------GAGACAGAAGGT------CCT-TTAAGA-------AGACCATCGGCT---- 33
BX818633.1 C-------TGAGACAGAAGGT------CCT-TTAAGA-------AGACCATCGGCT---- 170
NM_103122.4 C-------TCAGACAGAAGGT------CCT-TTAAGA-------AGACCATCGGCT---- 229
AY091438.1 C-------TCAGACAGAAGGT------CCT-TTAAGA-------AGACCATCGGCT---- 165
XM_006305641.2 C-------TCAGACAGAAGGT------CCT-TTAAGA-------AGGCCATCGGCT---- 257
XM_010480511.2 C-------TCAGACAGAAGGT------CCT-TTACGA-------AGGCCCTCGGCT---- 250
XM_010462915.1 C-------TCAGACAGAAGGT------CCT-TTGAGA-------AGGCCCTCGGCT---- 254
* * ** ** * ** * *

OX291666.1 ACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCC 660


XM_002893752.2 ---CCTCCAACTC-------TCCGGGAGCCG-------CAAAAACCTGTT-------CCT 274
AY084529.1 ---CCTCCTGCTC-------TCCGGGAGCCG-------CAAAAACCTGTT-------CCT 265
AF325046.1 ---CCTCCTACTC-------TCCGGGAGCCT-------CAAAAACCTGTT-------CCT 69
BX818633.1 ---CCTCCTACTC-------TCCGGGAGCCT-------CAAAAACCTGTT-------CCT 206
NM_103122.4 ---CCTCCTACTC-------TCCGGGAGCCT-------CAAAAACCTGTT-------CCT 265
AY091438.1 ---CCTCCTACTC-------TCCGGGAGCCT-------CAAAAACCTGTT-------CCT 201
XM_006305641.2 ---CCTCCTACTC-------TCCGGGAGCCG-------CAAAAACCTGTT-------CCT 293
XM_010480511.2 ---CCTCCTACTC-------TCCGGGAGCCG-------CAA-AACCTGTT-------CCT 285
XM_010462915.1 ---CCTCCTACTC-------TCCGGGAGCCG-------CAAAAACCTGTT-------CCT 290
* ** * * * * * * *** **

OX291666.1 TAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAA 720


XM_002893752.2 CCATC-GC-------AGCCC-TC------TTCCGCTCCTCC----TCCTC---------- 305
AY084529.1 GCATC-AC-------AACCG-TC------TTCCTCTCCTCC----ACCA----------- 295
AF325046.1 CCATC-AC-------AGCCA-TC------TTCCTCTCCTCC----TCCTT---------- 100
BX818633.1 CCATC-AC-------AGCCT-TC------TTCCTCTCCTCC----TCCTT---------- 237
NM_103122.4 CCATC-AC-------AGCCA-TC------TTCCTCTCCTCC----TCCTT---------- 296
AY091438.1 CCATC-AC-------AGCCA-TC------TTCCTCTCCTCC----TCCTT---------- 232
XM_006305641.2 CCATC-TC-------AGTCT-TC------TTCCTCTCCACC----ACCATC-------AC 327
XM_010480511.2 CCATC-GC-------AGCCT-TC------TTCCGCTCCATC----ACCATC-------AC 319
XM_010462915.1 CCATC-GC-------AGCCT-TC------ATCCGCTCCATC----ACCATC-------AC 324
* * * * * * ** * **

OX291666.1 CCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCT 780


XM_002893752.2 ----------CT--CC-----CCCG--CCGCA-----GAAAGCTGTGGCTGTTGA----- 336
AY084529.1 --------------CC-----ACCG--CCGCA-----GAAATCAGTGGCTATTGA----- 324
AF325046.1 ----------CT--CC-----GCCG--CCGCA-----GAAAGCTGTAGCTGTTGA----- 131
BX818633.1 ----------CT--CC-----GCCG--CCGCA-----GAAAGCTGTCGCTGTTGA----- 268
NM_103122.4 ----------CT--CC-----GCCG--CCGCA-----GAAAGCTGTAGCTGTTGA----- 327
AY091438.1 ----------CT--CC-----GCCG--CCGCA-----GAAAGCTGTAGCTGTTGA----- 263
XM_006305641.2 C----------A--CC-----GCCG--CCGCA-----GAAAGCTGTGGCTGTTGA----- 358
XM_010480511.2 CACT----GCCG--CC-----GACG--CCGCA-----GAAAGCTGTGGCTGTTGA----- 356
XM_010462915.1 CACC----GCCG--CC-----GACG--CCGCA-----GAAAGCTGTGGCTGTTGA----- 361
** * * * ** * * * *

OX291666.1 AAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAAC 840


XM_002893752.2 --TGGGAAGAGTGT-------AACTACG---G--TGGA------GTTTCAGAGACA---- 372
AY084529.1 --TGGTAAGAGTGT-------AACTACA---G--TGGA------GTTTCAGAGACA---- 360
AF325046.1 --TGGGAAGAGTGT-------AACTACA---G--TGGA------GTTTCAGAGACA---- 167
BX818633.1 --TGGGAAGAGTGT-------CACTACA---G--TGGA------GTGTCAGAAAAA---- 304
NM_103122.4 --TGGGAAGAGTGT-------AACTACA---G--TGGA------GTTTCAGAGACA---- 363
AY091438.1 --TGGGAAGAGTGT-------AACTACA---G--TGGA------GTTTCAGAGACA---- 299
XM_006305641.2 --TGGTAAGAGTGT-------AACTACG---G--TTGA------GTTTCAGAGAGT---- 394
XM_010480511.2 --TGGGAAGAGTGT-------AACTACG---G--TTGA------GTTTCAGAGACA---- 392
XM_010462915.1 --TGGGAAGAGTGT-------AACTACG---G--TTGA------GTTTCAGAGACA---- 397
* * * * * * * * *

OX291666.1 CCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTA 900


XM_002893752.2 ---GAAGGCTAAAGA-----GCTTCAAGA--GTA-------CTTTAAACAGAA------- 408
AY084529.1 ---AAAGGCTAAAGA-----GCTTCAAGA--ATA-------CTTTAAACAGAA------- 396
AF325046.1 ---AAAGGCTAAAGA-----GCTTCAAGA--GTA-------CTTTAAACAGAA------- 203
BX818633.1 ---AAAGGCTAAAGA-----GCTTCAAAA--GTA-------CTTTAAACAGAA------- 340
NM_103122.4 ---AAAGGCTAAAGA-----GCTTCAAGA--GTA-------CTTTAAACAGAA------- 399
AY091438.1 ---AAAGGCTAAAGA-----GCTTCAAGA--GTA-------CTTTAAACAGAA------- 335
XM_006305641.2 ---CAAGGCTAAAGA-----GCTTCAGGA--GTA-------CTTTAAAAAGAA------- 430
XM_010480511.2 ---GAAGGCTAAAGA-----GCTTCAAGA--GTA-------CTTTAAAAAGAA------- 428
XM_010462915.1 ---GAAGGCTAAAGA-----GCTTCAAGA--GTA-------CTTTAAAAAGAA------- 433
** ***** * * * * * **** *

OX291666.1 AACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACC 960


XM_002893752.2 GAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------TT---TTTTTGGTT 446
AY084529.1 AAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT---TTTTTGGTT 434
AF325046.1 AAAGCTTGAAGC-------TTGCTGGTCA------AGGTC------CC-T-TTTTTGGTT 242
BX818633.1 AAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT-TT--TTTGGTT 378
NM_103122.4 AAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT-TT--TTTGGTT 437
AY091438.1 AAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT-TTTTTTTGGTT 375
XM_006305641.2 GAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT---TCTTTGGTT 468
XM_010480511.2 GAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT---TCTTTGGTT 466
XM_010462915.1 GAAGCTTGAAGC-------TGCTGGTCAA------GGTCC------CT---TCTTTGGTT 471
* ** * * * * * *

OX291666.1 CTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAA 1020


XM_002893752.2 T-------CCAACCCAAAAA-------TGAGATCTCCA-------ATGGA----AGGTGG 481
AY084529.1 T-------CCAACCCAAAAA-------TGAGATCTCCA-------ATGGA----AGGTGG 469
AF325046.1 T-------CCAACCCAAAAA-------TGAGATCTCCA-------ATGGA----AGGTGG 277
BX818633.1 T-------CCAACCCAAAAA-------TGAGAACTCCA-------ATGGA----AGGTGG 413
NM_103122.4 T-------CCAACCCAAAAA-------TGAGATCTCCA-------ATGGA----AGGTGG 472
AY091438.1 T-------CCAACCCAAAAA-------TGAGATCTCCA-------ATGGA----AGGTGG 410
XM_006305641.2 T-------TCAACCCAAAAA-------CGAGATCTCTA-------ATGGA----AGGTGG 503
XM_010480511.2 T-------CCAACCCAAAAA-------TGAGATCTCTA-------ATGGA----AGGTGG 501
XM_010462915.1 T-------TCAACCCAAAAA-------TGAGATCTCTA-------ATGGA----AGGTGG 506
***** *** * * * * * *

OX291666.1 ACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCC 1080


XM_002893752.2 GCGATGTT---TGG----T---TTCGCAGT-------TGGAATGCTCA-------CAGAG 517
AY084529.1 GCTATGTT---TGG----T---TTCGCAGT-------TGGTATGCTCA-------CAGAG 505
AF325046.1 GCTATGTT---TGG----T---TTCGCAGT-------TGGTATGCTCA-------CAGAG 313
BX818633.1 GCTATGTT---TGG----T---TTCGCAGT-------TGGTATGCTCA-------CAGAT 449
NM_103122.4 GCTATGTT---TGG----T---TTCGCAGT-------TGGTATGCTCA-------CAGAG 508
AY091438.1 GCTATGTT---TGG----T---TTCGCAGT-------TGGTATGCTCA-------CAGAG 446
XM_006305641.2 GCTATGTT---TGG----T---TTCGCAGT-------CGGGATGCTTA-------CCGAG 539
XM_010480511.2 GCTATGTT---TGG----T---TTCGCAGT-------TGGGATGCTGA-------CAGAG 537
XM_010462915.1 GCAATGTT---TGG----T---TTCGCAGT-------TGGGATGCTCA-------CAGAG 542
* * * * * * * * *

OX291666.1 TAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAA 1140


XM_002893752.2 T--ATGCAAC-------AGGATCAGACC-------TTGTTGATCAAGT-------TAAGA 554
AY084529.1 T--ATGCAAC-------AGGATCAGACC-------TTGTTGATCAAGT-------TAAGA 542
AF325046.1 T--ATGCAAC-------AGGATCAGACC-------TTGTTGATCAAGT-------TAAGA 350
BX818633.1 T--ATGCCAC-------AGGATCAGACC-------TTGTTGATCAAGT-------GAAGA 486
NM_103122.4 T--ATGCAAC-------AGGATCAGACC-------TTGTTGATCAAGT-------TAAGA 545
AY091438.1 T--ATGCAAC-------AGGATCAGACC-------TTGTTGATCAAGT-------TAAGA 483
XM_006305641.2 T--ATGCAAC-------TGGATCAGATC-------TTGTCGACCAAGT-------TAAGA 576
XM_010480511.2 T--TAGCAAC-------AGGATCTGATC-------TTGTCGACCAAGT-------TAAGA 574
XM_010462915.1 T--ATGCAAC-------AGGATCTGACC-------TGGTCGACCAAGT-------TAAGA 579
* * * * * * ** * *

OX291666.1 CCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCT 1200


XM_002893752.2 TCCTTCT-------CTCGAATTTCGG-------CATTGTAGACTT-------GGAATAAT 593
AY084529.1 TCCTTCT-------ATCGAATTTCGG-------CATTCTAGACTT-------GGAATAAT 581
AF325046.1 TCCTT-T-------CTCAAATTTCGG-------CATTCTAGACTT-------GGAATAAT 388
BX818633.1 TCCTTCT-------CTCGAATGTCGG-------CATTCTAGACTT-------GGAATCAT 525
NM_103122.4 TCCTTCT-------CTCAAATTTCGG-------CATTCTAGACTT-------GGAATAAT 584
AY091438.1 TCCTTCT-------CTCAAATTTCGG-------CATTCTAGACTT-------GGAATAAT 522
XM_006305641.2 TCCTTCT-------CTCGAATTTCGG-------CATTCTAGACTT-------GGAATAAT 615
XM_010480511.2 TCCTTCT-------CTCGAATTTCGG-------CATTCTAGACTT-------GGAATAAT 613
XM_010462915.1 TCCTTCT-------TTCGAATTTCGG-------CATTCTAGACTT-------GGAATAAT 618
*** * ** * * ** ** ** *

OX291666.1 AAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAAC 1260


XM_002893752.2 AAGA-------GTGTTGT---T-------A-T-ATATAGAC-AG-------ACCCTTTTC 626
AY084529.1 AAGA-------GTGTTGTTGTT-------A-T-ATATAGAC-AG-------ATCCTTTTC 617
AF325046.1 AAGA-------GTGTTGTTGTT-------A-T-ATATAGAC-AG-------ATCCTTTTC 424
BX818633.1 CACA-------GTGTTGTTGTT-------A-T-ATATAGAC-AG-------AACCTTTTC 561
NM_103122.4 AAGA-------GTGTTGTTGTT-------A-T-ATATAGAC-AG-------ATCCTTTTC 620
AY091438.1 AAGA-------GTGTTGTTGTT-------A-T-ATATAGAC-AG-------ATC------ 552
XM_006305641.2 ATGA-------GTGTGTTATTA-------T-ATATAGAC----A-------GACCTCTTC 649
XM_010480511.2 AAGA-------GTGTTATTATA-------T-ATAGAACAGA-CA-------GACCCCTTC 650
XM_010462915.1 AAGA-------GTGTTATTATA-------T-ATATAGACAG--A-------CCTCTTCTC 654
*
OX291666.1 CCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTA 1320
XM_002893752.2 TCTC-----TTGTCTCCTA-------TTCCTCT------TCTTGTTTATTGTTCTT---- 664
AY084529.1 TCTC-----TTGTCTCTGA-------TTCCTCT------TCTTGTTGTTTATTCAT---- 655
AF325046.1 TCTC-----TTCTCTTCGA-------TTCCTCT------TCTTGTTGTTTCT---T---- 459
BX818633.1 TCTG-----TTCTCTTCGA-------TTCCTCT------TCTTGTAGTGTCT---T---- 596
NM_103122.4 TCTC-----TTCTCTTCGA-------TTCCTCT------TCTTGTTGTTTCT---T---- 655
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 TCTC-----TTGTCTCCAA-------TTCCTCT------ACTTGTTGATTCT---T---- 684
XM_010480511.2 TCTC-----TTGTCTCCAA-------TTCCTCT------ACTTGTTGTTGATTCTT---- 688
XM_010462915.1 TCTC-----TTGTCTCCAA-------TTCCTCT------ACTTGTTGTTGATTCTT---- 692

OX291666.1 AACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACC 1380


XM_002893752.2 ---CCTGTATATG-TA-------TCTCTA-------------------AGATTTTTAA-- 692
AY084529.1 ---CTTCTTCTTCCTG-------TATGTG-------------------TATCTGTAAC-- 684
AF325046.1 ---CTTCTTCTTCCTG-------TATATG-------------------TATCTATATA-- 488
BX818633.1 ---CTTCTTCTCCCTG-------TATATG-------------------TATCTATATA-- 625
NM_103122.4 ---CTTCTTCTTCCTG-------TATATG-------------------TATCTATATA-- 684
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ---CTTCCTGTATAT-----------GTATCTCTAA-------GATCTTACCTACA-A-- 720
XM_010480511.2 ---CTTCCTGTATAT-----------GTATCTCCAA-------GATCTTACCTAAAAA-- 725
XM_010462915.1 ---CTTCCTGTATATG-------TAAGTATCTCCAA-------GATCTTACCTAAAAA-- 733

OX291666.1 CTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAA 1440


XM_002893752.2 -----ATACAGGGCCAT-------TTGTGTATCCAATC-------AC-TT--TATCTTCA 730
AY084529.1 -----ATACAGGGCCAT-------TTGTGTATTCAATC-------ACTTT--TATCTTCA 723
AF325046.1 -----ATACAGGGCCAT-------TTGTGTATTCAATC-------ACTTT--TATCTTCA 527
BX818633.1 -----ATACAGGGCCAT-------TTGTGTATTCAATC-------ACTTT--TATCTTCA 664
NM_103122.4 -----ATACAGGGCCAT-------TTGTGTATTCAATC-------ACTTT--TATCTTCA 723
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 -----ATACAGGGCCAT-------TTGTGTATTCAATC-------ACTTTTTTATCTTCA 761
XM_010480511.2 -----ATACAGGGCCAT-------TTGTGTATTCAATC-------ACTTT-TTATCTTCA 765
XM_010462915.1 -----ATACAGGACCAT-------TTGTGTATTCAATC-------ACTTT-T-ATCTTCA 772

OX291666.1 ACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCC 1500


XM_002893752.2 A------ATGGTAT-------AAATACGATCTTG-------TATCGATTCTGA------- 763
AY084529.1 A------ATGGTAT-------AAATACGATCTTG-------CATCATTGATTC------- 756
AF325046.1 A------ATGGTAT-------AAATACGATCTTG-------TACCAAAAAAAA------- 560
BX818633.1 A------ATGGTAT-------AAATACGATCTTG-------TATTATT------------ 692
NM_103122.4 A------ATGGTAT-------AAATACGATCTTG-------TATCATTGATTC------- 756
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 A------ATGGTAT-------AAATACGATCTTG-------TATCGA------------- 788
XM_010480511.2 A------ATGGTAT-------AAATCCGATCTTT-------GTATC-------------- 791
XM_010462915.1 A------ATGGTAT-------AAATACGACCTTT-------GTATC-------------- 798

OX291666.1 TAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAA 1560


XM_002893752.2 A----------------------------------------------------------- 764
AY084529.1 TAGAATTGCA----TAC-------AAACGAT-GTTT-------TGAGGATTA-------A 790
AF325046.1 AAAAAAAAAA-------------------------------------------------- 570
BX818633.1 ------------------------------------------------------------ 692
NM_103122.4 TAGAATTGCA----TAC-------AAAAGAT-GTTT-------TGAGGATTA-------A 790
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ------------------------------------------------------------ 788
XM_010480511.2 ------------------------------------------------------------ 791
XM_010462915.1 ------------------------------------------------------------ 798

OX291666.1 CCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCT 1620


XM_002893752.2 ------------------------------------------------------------ 764
AY084529.1 ATGCAAAG-------TGTAATCT-------CGTTTT--------C--------------- 813
AF325046.1 ------------------------------------------------------------ 570
BX818633.1 ------------------------------------------------------------ 692
NM_103122.4 ATGGAAAG-------TGTATTCT-------CGTTTT--------CAAA-------AGTA- 820
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ------------------------------------------------------------ 788
XM_010480511.2 ------------------------------------------------------------ 791
XM_010462915.1 ------------------------------------------------------------ 798

OX291666.1 AAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAAC 1680


XM_002893752.2 ------------------------------------------------------------ 764
AY084529.1 ------------------------------------------------------------ 813
AF325046.1 ------------------------------------------------------------ 570
BX818633.1 ------------------------------------------------------------ 692
NM_103122.4 ------TAA-------T------------------------------------------- 824
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ------------------------------------------------------------ 788
XM_010480511.2 ------------------------------------------------------------ 791
XM_010462915.1 ------------------------------------------------------------ 798

OX291666.1 CCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTA 1740


XM_002893752.2 ------------------------------------------------------------ 764
AY084529.1 ------------------------------------------------------------ 813
AF325046.1 ------------------------------------------------------------ 570
BX818633.1 ------------------------------------------------------------ 692
NM_103122.4 ------------------------------------------------------------ 824
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ------------------------------------------------------------ 788
XM_010480511.2 ------------------------------------------------------------ 791
XM_010462915.1 ------------------------------------------------------------ 798

OX291666.1 AACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACC 1800


XM_002893752.2 ------------------------------------------------------------ 764
AY084529.1 ------------------------------------------------------------ 813
AF325046.1 ------------------------------------------------------------ 570
BX818633.1 ------------------------------------------------------------ 692
NM_103122.4 ------------------------------------------------------------ 824
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ------------------------------------------------------------ 788
XM_010480511.2 ------------------------------------------------------------ 791
XM_010462915.1 ------------------------------------------------------------ 798

OX291666.1 CTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAAACCCTAA 1860


XM_002893752.2 ------------------------------------------------------------ 764
AY084529.1 ------------------------------------------------------------ 813
AF325046.1 ------------------------------------------------------------ 570
BX818633.1 ------------------------------------------------------------ 692
NM_103122.4 ------------------------------------------------------------ 824
AY091438.1 ------------------------------------------------------------ 552
XM_006305641.2 ------------------------------------------------------------ 788
XM_010480511.2 ------------------------------------------------------------ 791
XM_010462915.1 ------------------------------------------------------------ 798

OX291666.1 ACCCTAAACCCTAAACCCTAAACCCTAAAC 1890


XM_002893752.2 ------------------------------ 764
AY084529.1 ------------------------------ 813
AF325046.1 ------------------------------ 570
BX818633.1 ------------------------------ 692
NM_103122.4 ------------------------------ 824
AY091438.1 ------------------------------ 552
XM_006305641.2 ------------------------------ 788
XM_010480511.2 ------------------------------ 791
XM_010462915.1 ------------------------------ 798

14. MULTIALINEAMIENTO DE AMINOACIDOS


CLUSTAL O(1.2.4) multiple sequence alignment
XP_010530123.1 MSSASPIPCIRILNSASPSS-----SSSSSSSLASSCFRFSPSKPCVFTVRCSQTDGPLR 55
XP_006305703.1 MSVASPIQCIR------ILNPSSSSSSLSTTTASSSFRFSKSTKPCVFIIRCSQTEGPLR 54
KAG7599167.1 MSVASPIQCIR------ILNPSSSSSSSCSSTASSSFRFSTTTKPCVFIIRCSQTEGPLR 54
KAH9757702.1 MSVASSVPCLRVPTSSSCCSSSSSSNPSNFRISRTKLSPFTVTCSQGDGPIRRPVAPPLR 60
KAG2304370.1 MSLASPIQCIRIINPSS--------SSSSSYLTTRSSLRFSTSKPCVFIIRCSQAEGPLR 52
NP_564432.3 MSVASPIQCIRIL-NPS--------SSSSSSTASSSFRFSTTTKPCVFIIRCSQTEGPLR 51
KAF8047693.1 MSVASPIQCI--KILNP--------YSSSSSLTTSSSLRFSTSKPCVFIIRCSQAEGPLR 50
XP_010478813.1 MSVASPIQCIRILNPSS--------SSSSSSSTSTSFRFSTTTKPCVFIIRCSQTEGPLR 52
XP_018436447.1 MSLASPIQCI--RIINP--------SSSSSSLTTSSSLRFSTSKPCVFIIRCSQADGPLR 50
KAF3522864.1 ----MSLASP--IQCIR--------IINPSSLTTSSSLRFSTSKPCVFIIRCSQAEGPLR 46
***

XP_010530123.1 RPVAPPPLREPSPPSTPIPPPPSPSSSAVSPTPTPTPVGFEEGKGVITLEFQRQKAKELQ 115


XP_006305703.1 RPSAPPTLREPQKPVPPSQ----SSSSPPPSPPPPQKAVAVDGKSVTTVEFQRVKAKELQ 110
KAG7599167.1 RPSAPPTLREPQKPVPPSQP--S---SAPPPPPPPQKAVAVDGKSVTTVEFQRQKAKELQ 109
KAH9757702.1 EPSPPSTVKPVPPSPPQPSP--PSP-LSSSVAQPPKPAAVVEDKNVVTLEFQRQKAKELQ 117
KAG2304370.1 RPSAPPTLREPSPPQK-PVP--PTPSSSPPPPPPLQKAVAVDGKSVTTVEFQRQKAKELQ 109
NP_564432.3 RPSAPPTLREPQKPVPP-----SQPSSSPPPSPPPQKAVAVDGKSVTTVEFQRQKAKELQ 106
KAF8047693.1 RPSAPPTLREPSPPQKP-----VPPTPSSSPPPPPQKSVAVDGKSVTTVEFQRQKAKELQ 105
XP_010478813.1 RPSAPPTLREPQKPVPPSQP--SSAPSPSPLPPTPQKAVAVDGKSVTTVEFQRQKAKELQ 110
XP_018436447.1 RPSAPPTLREPTPPQKP--A--PPTPSTSPPPPPPQKAVAVDGKSVTTVEFQRQKAKELQ 106
KAF3522864.1 RPSAPPTLREPSPPQKP--V--LPMPSSSPPPP-QKAVAVDGKSVVTTVEFQRQKAKELQ 101
* * * * **** ******

XP_010530123.1 DYFKKKKLEAATQGPFFGFLPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 175


XP_006305703.1 EYFKKKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 170
KAG7599167.1 EYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 169
KAH9757702.1 EYFKQKKLEEANVGPFFGFIGKNEIANGRWAMFGFAVGMLTEYATGSDFVDQVKILLSNF 177
KAG2304370.1 DYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 169
NP_564432.3 EYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 166
KAF8047693.1 DYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 165
XP_010478813.1 EYFKKKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 170
XP_018436447.1 DYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 166
KAF3522864.1 DYFKQKKLEAAGQGPFFGFQPKNEISNGRWAMFGFAVGMLTEYATGSDLVDQVKILLSNF 161
*** **** * ****** **** ********************** ***********

XP_010530123.1 GIIDLE 181


XP_006305703.1 GILDLE 176
KAG7599167.1 GIVDLE 175
KAH9757702.1 GILDLE 183
KAG2304370.1 GILDLE 175
NP_564432.3 GILDLE 172
KAF8047693.1 GILDLE 171
XP_010478813.1 GILDLE 176
XP_018436447.1 GILDLE 172
KAF3522864.1 GILDLE 167
** ***

15. FILOGENIA DE SECUENCIA NULEOTICA

16. FILOGENIA DE SECUENCIA NULEOTICA


17. Descripción de la función

las proteínas de una hélice (OHP), se caracterizan por tener de una a


cuatro hélices que atraviesan la membrana. Estas proteínas funcionan
en la absorción de luz y la disipación de energía, detectando la
intensidad de la luz y desencadenando la fotomorfogénesis o la unión
de la clorofila y los intermediarios de la biosíntesis de la
clorofila. Arabidopsis thaliana contiene dos OHP. Se han asignado
varias funciones a Hlips, que van desde la fotoprotección y el
ensamblaje del fotosistema (PS)I y PSII hasta la regulación de los
primeros pasos de la biosíntesis de clorofila, pero se sabe poco sobre
la función de las dos plantas OHP. OHP2 es esencial para la
acumulación de las subunidades centrales de PSII, mientras que los
otros complejos fotosintéticos y los principales LHCP no se vieron
afectados.

18. Mapeo de restricción de secuencia nucleotídica.


Site: Positions:
AfaI gt|ac 323
AluI ag|ct 11, 71, 251, 257, 313, 340, 347
BclI t|gatca 469
BfaI c|tag 506
BglII a|gatct 390
DpnII |gatc 390, 455, 469, 480
DraI ttt|aaa 328
HindIII a|agctt 338
HpaII c|cgg 178
MboI |gatc 390, 455, 469, 480
MspI c|cgg 178
NdeII |gatc 390, 455, 469, 480
NlaIII catg| 111
RsaI gt|ac 323
ScaI agt|act 323
TaqI t|cga 65
XbaI t|ctaga 505

También podría gustarte