Seminario 1

Ignacio Castejón Mataix
SEMINARIO 1
A. GEN COX1 (cytochrome oxidase unit 1) de cerdo, caballo y vaca.
Indicar mediante NCBI GenBank:
Especie Locus Accesión Región Versión Tamaño Tipo código
nucleótid molécula Gi
o
Bos NC_006 NC 5687…7 NC 1545 pb DNA 6010182
taurus 853 006853 231 006853. lineal 4
mitochon 1
diron
Equus NC_001 NC 5362…6 NC_001 1545 pb DNA 5835107
caballus 640 001640 906 640.1 lineal
mitochon
dion
Sus NC_000 NC 6511..80 NC_000 1545 bp DNA 5835862
Scrofa 845 000845 55 845.1 lineal
mitochon
drion
El alineamiento se hizo en “Blast” introduciendo los código “gi” de las secuencias del gen
“COX1” de cerdo, caballo y vaca. Se utilizó como “Query”, el gen “COX1” de Bos taurus. En
la opción de alineamiento de 2 o más secuencias se introdujeron los códigos “gi”
correspondientes. Respecto al algoritmo utilizado, se marcó la opción “Blastn” para la
búsqueda de secuencias de nucleótidos similares pero de una forma menos específica que
“MegaBlast”.
Atendiendo al resultado de los alineamientos se encontró:
“E-value” fue 0, por lo que la probabilidad de que esta “Score” se pueda dar con secuencias
similares por puntuaciones al azar es nula. El “Score máximo” (inversamente proporcional a
el E-value) estaba en torno a 14000 puntos en cada caso, esto indicó la consistencia de los
datos y la gran similitud de las secuencias (puntuaciones en función del número de
nucleótidos alineados entre la secuencia “Query” y la que se compara).
Presentó un 100% de cobertura, por lo que el alineamiento cubrió el 100% del “ Query”.
Este resultado lo podemos contrastar en el apartado de “visualización gráfica” de las
secuencias alineadas. El porcentaje de identidad también fue elevado (número de
coincidencias cada cien posiciones). En todos los casos fue ~80%.
-1-
En esta imagen vemos respecto al “Query” como el porcentaje de cobertura es del 100% y
la puntuación obtenida de las “Scores” es superior a 200, por lo que son muy similares. En
el apartado de alineamiento, se seleccionó la opción “Flat query anclado con puntos
identificadores”, hemos tomado 2 regiones diferentes para ver cómo se alinean las
secuencias y los huecos o “Gaps” presentes.
Los puntos respecto al “Query” se corresponden con zonas idénticas, los nucleótidos
dispersos frente al “Query” nos permiten ver pequeñas diferencias entre las secuencias
comparadas. Realmente no se encontraron muchas zonas donde la similitud entre las 3
secuencias fuera lo suficientemente elevada para el diseño de “primers universales”, quizás
si en el fragmento ubicado en la región 1501...1545 pb. Tampoco se encontraron huecos o
“Gaps” entre los fragmentos alineados. Con los valores obtenidos del alineamiento se
consideró oportuno emplear dichas secuencias para el diseño de “primers específicos” de
especie.
B. Gen GAPDH (Glyceraldehyde-3-phosphate dehydrogenase).
Búsqueda de las entradas NM_204305 y NM_001303179.
Entrada Fuente Tamaño nucleótido Tipo de molécula
NM_204305 Gallus Gallus 3918 pb. mRNA lineal
NM_001303179. Meleagris gallopavo 3924 pb mRNA lineal
Gallus gallus: RNAm Gi: 2099396162
Meleagris gallopavo: RNAm Gi:100303685
Gene ID Status Accesión región Versión tamaño Intrón/exon

Ref-seq
374193 PROVISI NC_05253 76902321. NC_05253 3918 bp 12 exon, 11

ONAL 2 .76906238 2.1 intrón
10030368 PROVISI NC_01501 75800689. NC_01501 3924 bp 12 exon, 11

5 ONAL 1 .75804612 1.2 intron
Comparación en Blastn de las entradas gen “GAPDH” ( NM_204305 y NM_001303179) con

el de la región del gen “GAPDH” de los genomas completos de cada especie
Resultado Megablast
-2-
Resultado Blastn
Los resultados difieren sustancialmente, aunque el porcentaje de identidad es muy alto. Lo

que sucede es que se está comparando la secuencia de RNA mensajero (solo contiene la
región codificante con exones) con la secuencia de DNA cromosómico lineal del genoma
completo (contiene exones e intrones).
Gallus gallus
Meleagris gallopavo
Si observamos la representación gráfica vemos que la entrada NM_204305 sólo contiene

los exones al ser RNAm. Si atendemos a los alineamientos vemos como en las zonas
alineadas el porcentaje de identidad es muy elevado.
Para el diseño de primers puede ser mejor opción el uso de DNA frente a RNAm, ya que
contiene mayor información y los métodos están, en parte, más desarrollados para la
amplificación de DNA. Aunque por otro lado, las regiones de intrones pueden presentar
zonas muy conservadas en las que predominan secuencias repetitivas que en función de su
naturaleza pueden generar enlaces muy fuertes (GGGG o CCCC) o muy débiles (AAA o
TTT). Otro problema en el uso de RNAm es la necesidad de emplear una “RT-PCR” con
-3-
una transcriptasa inversa para obtener DNAc, lo que incide en el precio. Además el hecho
de que trabajes sólo con la región codificante implica que los primers o cebadores están
dentro del Target, por lo que puedes perder información. Te puede interesar si quieres que
sean cebadores específicos para diferenciar entre especies. Esto último se puede explicar
con “Primer-Blast”, donde obtenemos que en la secuencia de DNA no se han obtenido
primers específicos, pero sí en el caso de la entrada de RNAm.
C. Gen: NADH deshidrogenasa 2

Para la identificación del amplicón obtenido se acudió a BLASTn intentando buscar
secuencias homólogas. Se introdujo el código FASTA de dicho fragmento y se seleccionó el
algoritmo Megablast para la búsqueda de alta similitud respecto al amplicón. Se obtuvo:
La mayor similitud u homología se encontró respecto a la secuencia de DNA mitocondrial de

Thunnus albacares. El apartado “accession” redirigió a la secuencia concreta en “GenBank”
del genoma de la especie homóloga aportando mayor información. Se trata de DNA circular
(ya que es mitocondrial), comúnmente, se designa como atún de aleta amarilla. Desde
Blastn, en el apartado “taxonomía”, se observaron aspectos como el linaje completo del
organismo en base a la mayor similitud de acuerdo a las score y el valor E. Se representó la
posición del amplicón en un mapa filogenético (en este caso, mediante el método de unión
de vecinos) y analizando las distancias frente a las especies comparadas..
-4-
*Uknown: posición que ocupa la secuencia estudiada (“Query”) en una representación de

árbol circular (A) y en un árbol de distancias (B). Vemos su proximidad frente a Thunnus
albacares.
D. Búsqueda de genes target para la diferenciación de apio (Apium graveolens), mostaza
blanca (Sinapis alba) y sésamo (Sesamum indicum).
A través del motor Entrez (NCBI) se buscó la entrada del “Query”, en este caso Apium
graveolens. Para ello, se accedió a la base de datos “Gene”, donde se identificaron los
diferentes genes, se seleccionaron “psbI”, “rps13” e “Ycf1” como posibles targets. Desde
“GenBank” se accedió al apartado “run Blast”. Comparando cada gen con las otras 2
especies (mostaza y sésamo) en el apartado “Choose Search set”. En el algoritmo de
búsqueda se seleccionó “discontiguous megablast o blastn” para que la búsqueda utilice un
criterio menos estricto en cuanto a la similitud de los fragmentos:
Alineamiento respecto a gen psbI photosystem II protein I
-5-
En este caso E-value es mayor que 0 por lo que esto hizo ver la falta de homología entre las
secuencias. La tasa de cobertura fue del 100% y el porcentaje de identidad fue elevado.
Como vemos en el apartado de alineamientos sí sería válido para el diseño de primers
específicos de especie.
Alineamiento respecto al gen rps13
También se encontró otro gen que podría ser interesante para diferenciar Apium graveloens
del resto de especies. Se trata del gen “rps13” que codifica para la proteína ribosomal S13.
Este gen directamente no está presente en las otras especies. Por lo que su detección en
estas indicaría la contaminación con Apium graveolens.
Alineamiento respecto a gen ycf1

Se utilizó el algoritmo megablast para buscar con un criterio más estricto respecto a la
similitud de las secuencias:
-6-
El “E-vaule” fue 0, indicando la probabilidad nula de un alineamiento al azar, por lo que

mostró la similitud y homología entre las secuencias comparadas. En el apartado de
“alineamientos” se dieron ligeras diferencias en determinadas regiones de las secuencias
respecto a los nucleótidos. Es un gen válido para el diseño de “primers universales”.
E. Gen: ALMT (alumniun-active malato transporter)
Se buscó la entrada correspondiente del gen “ALMT1” y desde “GenBank” se accedió a
“Blast” a través de la opción “Run Blast”. En la sección “Choose Search Set” se indicaron los
genomas de los organismos con los que comparar la secuencia “Zea mays” y “Oryza
sativa”. Se realizó el alineamiento mediante el algoritmo “Blastn” y se obtuvo:
Se encontraron las máximas scores para los genes “ALMT1” de maíz y una secuencia del
cromosoma 4 en el arroz. En todos los casos el porcentaje de cobertura fue muy bajo con
respecto al gen de trigo. El valor E indicó su similitud con la secuencia de maíz pero no en
el caso del arroz. En ambos casos el porcentaje de identidad en las regiones alineadas fue
bueno con respecto al gen “ALMT1” de trigo.
En la representación gráfica vemos arriba el “Query” (gen ALMT1 de trigo), la secuencia de

·”ALMT1” de maíz y abajo del todo la secuencia de arroz.
Aquí vemos algunas regiones representativas del alineamiento del arroz respecto al gen del
trigo. Pese al alto porcentaje de identidad de los nucleótidos valdría para el diseño de
primers específicos de especie.
-7-
Respecto al alineamiento de las secuencias,en el maíz la secuencia es idéntica a la del gen

de trigo, por lo que este no valdría para el diseño de primers específicos.
En esta imagen se observa el alineamiento de todo el gen ALTM1 de maíz respecto al de

trigo.
Por lo tanto, el Gen ALTM1 sería bueno para detectar contaminación de trigo en arroz, pero
no para el maíz, ya que son homólogos y obtendremos un falso positivo.
F. Gen: prs de Listeria monocytogenes M7 para el diseño de cebadores específicos para
detección de contaminación en cárnicos: cerdo o lácteos.
Introducimos en el motor de búsqueda “Entrez” la entrada del genoma “CP002816.1”.
Seleccionamos la base de datos “nucleotide” y accedemos a “GenBank”. En el apartado
“Features” podemos encontrar los diferentes genes ya sea la región codificante CDS
(exones) e intrones, indicando su nombre, su “id” de identificación y la región que ocupan en
el genoma en pares de bases. Buscamos el gen “prs”. Nos indica que hay 2 genes:
Nombre Locus Región Tamaño
Psr CP0002816 221849..222805 957 pb
Psr CP002816 540467..541402 936 pb
Elegimos el gen de mayor tamaño para estudiar la viabilidad en el diseño de cebadores

específicos que permitan detectar la presencia de L.monocytogenes en cárnicos (vacuno y
-8-
cerdo). Utilizamos Blastn desde el apartado GenBank del gen en cuestión, seleccionando
“Run Blast”. Introducimos en el apartado “Choose Search Set” los organismos con los que
comparar el “Query”: Sus scrofa y Bos taurus:
Como era de esperar, no es un gen presente en la vaca o el cerdo, por lo tanto, es idóneo
para el diseño de “primers específicos”.
-9-

Seminario 1

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Seminario 1

Cargado por

Copyright:

Formatos disponibles

Ignacio Castejón Mataix

Entrada Fuente Tamaño nucleótido Tipo de molécula

NM_204305 Gallus Gallus 3918 pb. mRNA lineal

NM_001303179. Meleagris gallopavo 3924 pb mRNA lineal

Gallus gallus: RNAm Gi: 2099396162

Meleagris gallopavo: RNAm Gi:100303685

Gene ID Status Accesión región Versión tamaño Intrón/exon

374193 PROVISI NC_05253 76902321. NC_05253 3918 bp 12 exon, 11

10030368 PROVISI NC_01501 75800689. NC_01501 3924 bp 12 exon, 11

Comparación en Blastn de las entradas gen “GAPDH” ( NM_204305 y NM_001303179) con

Los resultados difieren sustancialmente, aunque el porcentaje de identidad es muy alto. Lo

Si observamos la representación gráfica vemos que la entrada NM_204305 sólo contiene

C. Gen: NADH deshidrogenasa 2

La mayor similitud u homología se encontró respecto a la secuencia de DNA mitocondrial de

*Uknown: posición que ocupa la secuencia estudiada (“Query”) en una representación de

Alineamiento respecto a gen ycf1

El “E-vaule” fue 0, indicando la probabilidad nula de un alineamiento al azar, por lo que

En la representación gráfica vemos arriba el “Query” (gen ALMT1 de trigo), la secuencia de

Respecto al alineamiento de las secuencias,en el maíz la secuencia es idéntica a la del gen

En esta imagen se observa el alineamiento de todo el gen ALTM1 de maíz respecto al de

Elegimos el gen de mayor tamaño para estudiar la viabilidad en el diseño de cebadores

También podría gustarte