Está en la página 1de 12

BIOLMOL-TA— PROF

Bases de datos biológicas, alineamiento y


análisis de secuencias
Nombres: Cristian Gutierrez y Monica Pinto

Objetivos
* Afianzar el uso de algunas bases de datos biológicas así como las generalidades y usos básicos
de la herramienta BLAST.

* Poner en práctica algunos usos del alineamiento de secuencias tanto de DNA como de proteínas.

Ejercicio 2
La secuencia con el número de acceso FJ236988.1 corresponde a un gen eucariota.
• A qué gen corresponde ese número de acceso, de qué organismo es ese gen?

Lupinus albus scarecrow 2 (SCR2) gene, complete cds, proveniente del organismo Lupinus albus Eukaryota;
Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;Spermatophyta; Magnoliopsida; eudicotyledons;
Gunneridae;Pentapetalae; rosids; fabids; Fabales; Fabaceae; Papilionoideae; 50 kb inversión clade; genistoides
sensu lato; core genistoids;Genisteae; Lupinus.

• A qué base de datos corresponde ese número de acceso?

GenBank
• ¿Qué significa el .1 que aparece en el número de acceso al final del mismo?

la identificación de una parte de la clave primaria o llave primaria o también llamada clave principal que
básicamente hacen referencia a un campo o una combinación de campos que se distribuyen en filas en una tabla
para identificar a una secuencia en particular, no se encuentran dos filas de números en la misma tabla, con el fin
de la adaptación de una secuencia ya existente, el último número es una forma de lenguaje de marcado de datos
con una estructura diseñada específicamente para acceder a bases de datos relacionales. Describe las secuencias
con cada elemento de información en un registro de secuencia separado por etiquetas, para que cada subporción
del registro de secuencia se pueda agregar fácilmente a las tablas relacionales y luego extraerse (integración de
datos entre bases de datos).
• Hay intrones en ese gen? si es el caso, cuántos, en qué posiciones están?

Hay 1 intron desde la posición aproximada 3034 nt a 5423 nt

• Usando algún recurso para análisis genómicos indique la localización cromosomal del gen, los genes vecinos y
otra infromación que encuentre relevante a este respecto.
Al realizar realizar un blast n de la secuencia problema con todo el genoma del organismo Lupinus albus utilizando
la herramienta genoma blast, se puede identificar su localización a nivel cromosomal. La proraíces proteiformes o
raíces en racimo—1 son densos conglomerados de raíces laterales cortas y densamente espaciadas, que dan lugar
a la expresion de dicho gen ubicado en el locus CA411474, Localización: 1,164..6,146, Posición del ARNm: 1,704,
con dos exones y un intrón, la secuencia con un 11 % de cobertura y una expectancia de 0 y un porcentaje de
BIOLMOL-TA— PROF
identidad de 91.69 % da a entender que la secuencia candidato tienen una alta similitud con el genoma del
organismo

Ahora, usando primer3 o primer3plus diseñe una pareja de primers para amplificar solo la región codificante de ese
gen (es decir, sólo los exones). También diseñe otra pareja para amplificar solo la región 5’ UTR del gen.

Exón 1

GGATGCTTGTGCTATGCTCAGCGGTGGCAGCAATAATAACATTGAAGATGGCAGCAACAACAACAACATT
AATGGGGGTAGTCCTTTGACTAGTGCTTCTAATAACTCTAGTAATATCAGCAGTGAAGAGCACACTCACA
CTCAGCAGCTCCAGCATTCCCATTCTGGAAAAAGGAAAATGGTGAGAAAGAGGATGGCTTCTGAGATGGA
ACCAACTCATACTATGTTGCCACATGGTGCTATCGATAGTAGGTTTCCTCGTCGAAGCAGCAGCAACAAC
AACAACATGTCATCAGTACTAATTTGCTCTTCTTTACCTCCAGCTGTAGAAAAAACAACTAGTTTTAATA
ACTACTACCATTATAAAACTAGTTCTTCTTCAAGAGTAGATAATAACGCCCATGTTGTTCCAAACCCCAC
TACTCCCAACTACTCCACTTTGCTACTACCTTCTTCTTCTACAACTATTAATCCCAACTATAACATTATT
CAGACGCAGCAGCAAGATCAGAACCAACTTACATCACCTGCAGTGTGTGGATTCTCGGGTTTGCCCCTTT
TTCCTGCATCTCAGCAACGAAATCATCATCACAATAGTACTAGTACCGGTGCTACTGTTGAGGTTGCTGC
TTCTCCTTCCATGGAAGACAATAACAACAACAACAACTCAGCAGCCACTGATTGGATTGATGGTATATTG
AAGGATCTTATCCATAGCTCCAACAGTGTTTCCATTCCTCAACTCATCAGCAACGTTAGAGAGATTATAT
ACCCTTGCAACCCCAACCTCGCTGTTGTTCTTGAATACAGGCTGCGTCTTCTCACCTCTCATGACAACAC
CTCTACTGCTCCAAACAACAACAACAACAACAACAACTCATCTAACCCTGCATCAGTTAGAAAAAACAAT
ACAATCGAAGTGGGAGAGGGTTTGAACCAAAATCAGAGGCCCTTACCCTCAGGAGCTAATAATGTTATGC
ATGATAATTTCCCACCAGATTCTTCATCAGGTGCTGCTCCTGTAGTTATGAATCAGATGTTGTCCAATTG
GGGTGTGCTTCCAATTACCCATGGCGGAAATTCTTCGATGTCTGCTACTGATTTACCAACTCATCATGAA
GAGGAATGTTGTGATATTGCTGCTAATGAAGCAGACACAACAAGAAAGAAGAAAGAAGAGATGCAGGGAC
AGAAGAAAGACGAAGAGGGGTTGCACCTCCTCAGTTTGCTGCTTCAATGTGCAGAAGCAGTATCAGCTGA
GAATGTTGAAGATGCCAACAAGATGCTCCTTGAGATTTCCCAGCTATCAACACCATTCGGCACATCAGCG
CAGCGAGTGGCAGCTTATTTCTCAGAAGCAATATCAGCAAGGCTAGTGAGTTCGTGTTTGGGAATATATG
CGACCTTTCCTTCAACGGTAGTGTCTCACAAGGTAGCATCAGCATACCAAGTGTTCAACGGGATCAGTCC
ATTCGTGAAATTCTCACACTTCACAGCCAACCAGGCAATACAGGAAGCATTTGAGAGAGAGGAGAGGGTA
CACATAATAGATCTAGACATAATGCAAGGGTTGCAATGGCCAGGACTGTTTCACATACTGGCTTCAAGAC
CTGGTGGGCCCCCTTATGTTAGACTCACTGGTCTTGGCACTTCAATGGAGGCACTTGAGGCAACAGGTAA
CCGTTTGTCTGATTTTGCTAATAAACTTGGTCTTCCTTTTGAGTTCTCTCCTGTGCCTCATAAGGTTGGG
AACCTTGATCTTGAGATACTCAATGTTAGTAAGACTGAAGCTGTTGCTGTCCATTGGTTGCAACATTCCC
TCTACGATGTCACTGGCTCCGACACTAATACCTTGTGGCTTTTGCAGAG

Primer izquierda y derecha


BIOLMOL-TA— PROF

Exon 2

ACTGGCACCTAAAGTGGTGACGGTGGTAGAGCAGGACCTGAGCAACGCAGGATCCTTCTTGGGAAGGTTT
GTGGAAGCAATACATTACTACTCAGCGTTGTTTGATTCACTTGGGTGTAGCTATGGTGAAGAAAGTGAAG
AGAGACATGTGGTGGAACAACAACTATTATCAAGAGAGATTCGTAATGTACTCGCAATTGGGGGCCCATC
AAGGACCGGAGAGTTCAAGTTTCATAACTGGAGAGAAAAGCTTCAACAATGTGGGTTTAGAGGTATCTCA
CTATCTGGTAATGCTGCCACTCAAGCCAGCTTACTTCTTGGTATGTTTCCATCTGAGGGATATACCCTTG
TGGAGGATAATGGAATTCTCAAACTTGGTTGGAAAGACCTTTGCTTGCTCACTGCTTCTGCTTGGAGACC
TCCCTTCCACACCACTACCGCCATTCCTCATAGTTAATTTCTCTCATGCATGCTCCCCTTATTACCATAT
CTAATTCAAATTCCTCTCTACAATACTCTGAACTAAAAAGGACATCACTACACCCTAGATTTGTTTGTTT
TTTAGTTGACAGTATTATTTTATTGACTATCTTACTATGATGTTCTTATTTACGGCTGTTAAGGAGGTAG
TGAGTTGTTTATTTATTGTCGGTTTTCTTATTAAATGTGTATGTCAAATGTTTCATTATCATAGGGATAA
GTAATAAAAC
BIOLMOL-TA— PROF
Primer izquierda y derecha

Región 5’UTR

TCTGTCCCGAACCTATAGTACTTAATATAAAAATTAATACATTTATCCGATGTTAGTTCATTCATAGAGG
TATTCAGTTTTTTTAGACATCGATGTCATAACTGTATATAGAGTAGTATGATAAAAAAGCATGTGATTTT
TTAGCTGTTGTTCTTAATCAATGTCTGGAATCTGGACAGATAATAGTAAATGTTTGATTAAAATAATTTG
TTTAGTAGTGTACTCTGTAGAAGTTAAAACTGGTATAATTTTTCATTACTTTTATGTTATTGTTGATCTT
AATTATTATAGGTAAATAATTCAAAATTCGTTGGCTTGGAAACAACTAAACCATATCCAAAAAAAAATGA
ATGGGGATCACTTGTCTCGAATGATGTCTCATTCCCTATCTCGGACCAATGATATATTATCATATAAATA
AAAGAAATTTTTAAAAAACAAAAAGTGAGATTCTTATTAGTTCGGGACATGGATTAGGACCAGTATCTAC
CTCATTCGTGTTGGTTGTCCAATGTATAATTTCCGACCGCAAACAGTAGCTAGTAGCTAGTGCCTCATAT
CATATGGTAATAAGTAGTCTCTCGATTTCATTTAAAAAATAGCAATAAGAAAATGCTAAGCATGAGCAAC
BIOLMOL-TA— PROF
AACATACATAAAATCAAAATACACAAAGACAAACAACAAATTGACAATAAGTATACCCTTGGCATTGGAT
TAGAGATAGATCCAAAAGGCAAATGGCATAGAGAACCGTGTTCAAGCCAGAAAAAAAGGGAATCCTCTTG
CCATTGTCCAAATCTTCACACCGTTATCTCTTTGGTTATACGCTACTAATTCAAATTACACATAACATTC
CTTCGCTTCAATGGGATGGGTTTTAGCTAGCTAAGTTAATTATTTGATATAGAGAGGAGGAAAAAGTACA
TAAACATATTAAAAAAAATTCTACTGTATGAGCTGAACCTATTATCTATTGGACATAAATCACATGTATT
AAATGACATTATATTTTCCGTCCCAGATTAATGATAATTACTTTTTGTTTTAATTTTTTTTATTTTCTCT
ATGTAACAATATCATAATAAATTGAACAACATACATGTGATTTATGTCCTTATGTATTACCCATCACTAT
CACCTATTAATCTATCTCACTCACCTTGGCTTCTCTCTAAAATGGATGCTTGTGCTA

• Haga el análisis de especificidad referido en el punto anterior.

Teniendo en cuenta que E define los alineamientos, el valor cercano obtenido para el exón 1, 2 y 5’ UTR, nos indica
un valor positivo y significativo para la alineación. Se evidencia que el cubrimiento de la secuencia corresponde al
100% lo cual corresponde a Lupinus albus scarecrow 2 (SCR2). Como se evidencia en la información de las tablas,
podemos ver que se presentan secuencias que no corresponden a Lupinus, lo cual nos indica que los primer son
poco específicos ya que concuerdan con otras especies mostradas en las imágenes.

• Qué utilidad puede tener el amplificar estas regiones (la codificante y la 5’ UTR)?
BIOLMOL-TA— PROF
podría regular y modular la expresión génica precisa de dicho gen, ya que la regiones 5 ́ pueden contener
elementos reguladores de interacción con microARN conservados o riboswitch, manejando las condiciones de
expresión de proteínas mediante elementos de pos-transcripción mediante la interacción del ARN.

Ejercicio 3

Actualmente la compañía Monsanto posee la patente del glifosato, el cual es comercializado como
Roundup® . Este sigue siendo uno de los herbicidas más utilizados por su amplio espectro de acción.
La cuestión es que Monsanto también posee la patente del gen que confiere resistencia al glifosato y que la
misma compañía ha utilizado para transformar plantas como el maíz o la soya y así hacerlas ''Round-up
Ready” o resistentes a glifosato.
Muchos investigadores están tratando de encontrar nuevos genes que confieran resistencia al glifosato
tanto por razones evolutivas como económicas. Hace ya algunos años (2005), un grupo Chino encontró una
bacteria Pseudomonas putida cepa 4G-1, que es naturalmente resistente al glifosato. Ellos clonaron el
nuevo gen aroA, el cual posee diferencias en secuencia con respecto al anterior gen AroA.El gen AroA
codifica para la enzima 3-phosphoshikimate 1-carboxyvinyltransferase, la cual juega un papel clave en la
biosíntesis de aminoácidos aromáticos. La resistencia surge por una mutación que hace que el glifosato no
se pueda unir a la proteína.
Ustedes han sido contratados para seleccionar cepas de Pseudomonas putida que contengan el nuevo gen
aroA (GenBank AJ812018.1) con la intención de generar un nuevo cultivar resistente al glifosato. Para lo
anterior, ustedes deben:

1. Establecer dónde comienza la región codificante del gen aro A (GenBank AJ812018.1) y cuál es la
región 5’ UTR para este gen. Pueden mostrar sus resultados sobre la secuencia del gen o pueden hacer
un esquema donde muestran las posiciones de cada región.

Región superior sin marcar correspondiente a la región 5’ UTR.


Región marcada con café que indica la región codificante.
BIOLMOL-TA— PROF

2. Acerca de la región 5’ UTR del gen: Qué función cumple esta región? (enfóquese solo en el tipo de
organismo que estamos trabajando aquí para la respuesta). Ubique los elementos reguladores que
usted espera encontrar en esta región.

La región 5´UTR es muy importante ya que cumple la función de regular y podemos encontrar el
promotor que señala el punto de inicio de la transcripción. En la secuencia anteriormente descrita
encontramos la principal secuencia del promotor (TATA) ubicada corriente arriba del sitio de inicio de
la transcripción y es el sitio de inicio del ensamble del complejo de preiniciación para la transcripción.

3. Diseñen una pareja de primers que amplifiquen la región del gen que uds consideren importante para
1) verificar la presencia del gen en la bacteria y posteriormente en las plantas que se transfectan
usando esta bacteria 2) Amplificar alguna región del gen que corresponda a una región de la proteína
codificada que sea diferente de la proteína codificada por el gen AroA (el original).
Para cada primer diseñado:

No se encuentra una relación significativa en el alineamiento de palabras cortas con respecto al gen
AroA y el aroA contra la secuencia de ADN correspondiente a la proteína de la cepa de Janibacter sp.
BIOLMOL-TA— PROF

dies primer correspondientes para la amplificación del gen Aro para la 3-fosfosfoshikimato 1-
carboxiviniltransferasa en la pseudomona correspondiente a la Beta-lactamasa de espectro extendido
de clase A de la familia CepA, también en la clase A de betalactamasa de espectro extendido CepA-29 y
betalactamasa de espectro extendido clase A CepA-49. utilizando los primer se podría identificar la
presencia del gen de transfección en la planta.
BIOLMOL-TA— PROF

1. Determine si cumple con los parámetros básicos. Tenga en cuenta el Tm, longitud, y posibilidad de
estructuras secundarias o dímeros de primer y use esta información para decidir si usar o no estos
primers en un PCR.

Teniendo en cuenta que para el diseño de primers se tiene en cuenta valores de Tm: 52-60°C,
longitud: 18-24 Pb y G/C de 45 a 55%, y la información suministrada para estos valores según las
anteriores tablas, todos los primers cumplen con los parámetros requeridos. También podemos
observar que en los primers generados no existe complementariedad, por lo tanto no puede haber
formación de dímeros, siendo así que los primers si se pueden usar para aplicar PCR.

2. Determine la especificidad de su pareja de primers para el gen aroA. Analice los resultados los 5
primeros hits de cada primer. Examine si en los resultados se encuentra la secuencia de la cual
usted partió.

En este caso tomamos el producto de mayor tamaño: par 2.

Primer_1_F: CCGCATCTCGGTGTAAAAGT
Primer_1_R: AAACCAAACCGCTTCATCAC

Podemos observar en la tabla que el valor de E, score y Query cover, para el gen Pseudomonas
BIOLMOL-TA— PROF
putida aroA para 3-phosphoshikimate 1-carboxyvinyltransferase, presenta un valor cercano a cero,
un score alto y un cubrimiento del 100% lo que nos indica su alta especificidad. También podemos
observar para las tres últimas especies que presentan un E muy alto, indicando la baja especificidad
de las secuencias.

La secuencia de la cual partimos, si se encuentra.

5. Más recientemente (2016) Yi y colaboradores aislaron un nuevo gen aroA naturalmente presente en una
cepa de Janibacter sp. aislada de un sedimento marino que le confiere resistencia a glifosato a la bacteria.
Aunque la secuencia en concreto no fue publicada, si se reporta que la proteína codificada tiene 67% de
identidad de aminoácidos con una enzima aroA de Janibacter sp HTCC2649 (GenBank: EAP99947.1). Con esta
información ustedes deben:
1. Analizar la secuencia de la proteína codificada por este gen (calcular (o indicar el reportado si ya lo
hay) el peso molecular y punto isoeléctrico, ubicar los dominios y relacionarlos con la función de la
proteína) y compararla con la de la proteína de Pseudomonas.

3-phosphoshikimate 1-carboxyvinyltransferase [Janibacter sp. HTCC2649]


BIOLMOL-TA— PROF

Función: Cataliza la transferencia del resto enolpiruvil del fosfoenolpiruvato (PEP) al 5-hidroxilo del
shikimato-3-fosfato (S3P) para producir enolpiruvil shikimato-3-fosfato y fosfato inorgánico.

3-phosphoshikimate 1-carboxyvinyltransferase [Pseudomonas putida], Pseudomonas putida cepa


4G-1
CAH19218.1

Función: Cataliza la transferencia del resto enolpiruvil del fosfoenolpiruvato (PEP) al 5-hidroxilo del
shikimato-3-fosfato (S3P) para producir enolpiruvil shikimato-3-fosfato y fosfato inorgánico.

De acuerdo a los datos mostrados anteriormente se puede evidenciar que las secuencias en
comparación, son similares en cuanto a su punto isoelectrico, peso molecular y ubicación similar
para la región de sus dominios indicando también la similaridad de sus funciones.
BIOLMOL-TA— PROF

2. Ya que ambas proteínas son codificadas por genes aroA, haga un alineamiento (pairwise) con las
dos secuencias y analice los resultados (que tanto se parecen? tienen los mismos dominios?
pertenecen a la misma familia? ….). Para este análisis es recomendable hacer una revisión en la
literatura sobre estas proteínas en general.

el alineamiento BLAST de dos secuencias de aminoácidos indica que el porcentaje de identidad entre ellas es muy bajo
debido a su diferencia en sus aminoácidos, pero no se podriamos descartar similitudes estrechas entre su actividad
catalítica debido a que la similitud entre este tipo de componentes permite que las proteínas puedan tener funciones
similares, aun así su secuencia difiera significativamente, por otro lado se podría decir que cabe la posibilidad de que se
tenga una similitud machor a la hora de alinear todo a la secuencia de manera múltiple siendo así más clara su similitud
por ejemplo en el ácido glutámico altamente conservado en lugares específicos. Por otro lado, es imperativo tener en
cuenta información de sus triadas catalíticas y la coincidencia que estas podrían albergar.

PAGE 3 OF 3

También podría gustarte