Está en la página 1de 106

Tutorial para la

resolucin de la prctica:
Introduccin
a la Bioinformtica I
Instituto Politcnico Nacional
Escuela Nacional de Ciencias Biolgicas
Materia: Biologa Molecular
Carrera: Qumico Bacterilogo Parasitlogo
2011
Autores:
Dra. Jane Castillo Vera
Dra. Karla Montserrat Gil Becerril
Dra. Alicia Jimnez Alberto
Dra. Rosa Mara Ribas Jaimes
En este tutorial se
presentan ejercicios
que pueden ser tomados
como ejemplo para
resolver los problemas
planteados en el manual
de prcticas.
Se hacen sealamientos
importantes mediante el uso
de flechas, crculos y letras
de colores.
Identificar pginas Web que
ofrezcan explicaciones
tutoriales y/o demostraciones
en lnea por medio de
animaciones o video de
enzimas de restriccin.
EJERCICIO 1
Ingresar a algn buscador en Internet; seleccionar la bsqueda de imgenes
o videos y escribir las palabras clave del tema de inters. A continuacin se
presentan 3 ejemplos.
Ejemplo de resultados obtenidos con el servidor yahoo.com
Consultar la pgina web de
Restriction Enzyme data BASE
(REBASE)
http://rebase.neb.com/rebase/rebase.html

EJERCICIO 2
a) Explica que tipo de protenas forman esta base de datos.
En la pgina principal se encuentran datos generales sobre el tipo de
informacin que proporciona el sitio y los conos que permiten ingresar a las
herramientas con que cuenta.
Seleccionar
Aparecer la seccin en la que se muestran los tipos de protenas que
contiene esta base de datos.
b) Cuntas enzimas de restriccin nuevas se han registrado en esta
semana?
Es posible localizar las enzimas informadas en el ltimo da, semana, mes,
ao, etc.
Seleccionar
Seleccionar
nuevas
enzimas
Seleccionar
Aparecer un listado de las enzimas nuevas reportadas en la semana de la
bsqueda.
c) De cuntas de estas enzimas nuevas se conoce la secuencia de
reconocimiento? Contarlas a partir de la lista, aqu se sealan dos
ejemplos.
d) Diga cul es la secuencia de reconocimiento de la enzima EcoRI.
Para encontrar datos ms especficos de una enzima; desde la pgina
principal se puede solicitar la informacin, escribiendo el nombre de la
enzima.
Algunos de los datos que se pueden obtener son: secuencia especfica de
corte, organismo del que se aisl, nmero de cortes en algunos vectores,
etc.
Utilizando las herramientas de
REBASE investigar para el plsmido
pUC19 y contestar:
EJERCICIO 3
a) Cul es su contenido GC?
Elegir
esta
opcin
Seleccionar
2. Oprimir
1. Seleccionar
Se mostrarn una serie de datos como el contenido de GC, enzimas
comerciales que cortan el plsmido, los sitios de reconocimiento, etc.
Oprimir
b) Cuntos sitios de corte existen en este plsmido para la enzima
AluI?
Lista de las enzimas de restriccin que cortan este vector.
c) Cuntas enzimas comercialmente disponibles tienen corte nico en el
vector?
Seleccionar All commercial dentro del men Availability.
Despus seleccionar 1 cutters dentro del men List, para ver el listado
de las enzimas que slo cortan una vez en este vector.
Lista de las enzimas que tienen corte nico en este vector.
d) Obtener los esquemas que indiquen los sitios de restriccin nicos y
exportarlos a una presentacin de PowerPoint

.
Seleccionar de la lista las enzimas con sitio nico de corte, despus oprimir
Digest.
Aparecer un esquema, con los sitios nicos de restriccin.
Copiar el resultado con la tecla Impr Pant (imprimir pantalla), que se
encuentra en el teclado de la computadora, y pegarla en un archivo de
PowerPoint

.
Utilizar PubMed y obtener la lista
de publicaciones de los ltimos 5
aos, relacionadas con la
aerolisina de Aeromonas
hydrophila.
EJERCICIO 4
a) Cuntos artculos se encontraron?
Seleccionar PubMed del men Search.
Escribir la bsqueda: aerolysin AND Aeromonas hydrophila y oprimir
Search.
Es posible limitar la bsqueda de informacin de acuerdo con criterios
especficos como pueden ser: ttulo de la publicacin, palabras clave,
autor o perodo, entre otros. Esto puede hacerse desde el men Limits.
Seleccionar datos publicados en los ltimos 5 aos.
Se mostrar la lista de artculos publicados en los ltimos 5 aos.
En este caso aparecen 21 artculos.
b) Cuntos fueron publicados por las revistas Nature Structure Molecular
Biology y por Infection and Immunity?
La flechas en esta diapositiva sealan dos de los resultados.
c)Cuntos artculos estn relacionados con las toxinas de otros
microorganismos?
Aqu se seala 1 artculo relacionado con toxinas de Clostridium sp.
Si se quita el lmite del periodo de 5 aos a) cuntos artculos se
encuentran?
As se localizan 124 artculos.
b) Elegir los tres primeros artculos y leer los resmenes (Abstract).
Una vez ledos, guardarlos como archivo de texto (*.txt).
Entrar en uno de ellos.
Guardar el resumen como archivo de texto, desde el men Archivo.
Guardar el archivo con el nombre de Abstract 1 Aerolisina.
d) De qu Instituciones son esos artculos?
e) Cmo se puede contactar a estos grupos de investigacin?
Algunos autores escriben su direccin electrnica, enseguida del ttulo.
Otros autores no escriben a simple vista su direccin electrnica,
por lo que hay que seleccionar su nombre.
Aparecern otros artculos de ese autor, entonces hay que ingresar
a alguno de ellos.
Y entonces aparecer su direccin de correo electrnico y as se podr
contactar al investigador.
Utilizando la herramienta Entrez del
NCBI, buscar la secuencia de
nucletidos completa del gen aerA de
Aeromonas hydrophila


EJERCICIO 5
Con el men All Databases se puede desplegar la lista de bases de datos
con que cuenta el NCBI, seleccionar la base de datos de nucleotide para la
bsqueda y delimitarla con palabras clave.
De todas las opciones, seleccionar la de inters
Para descargar una secuencia, lo ms conveniente es hacerlo en formato
FASTA, ya que ste es compatible con muchos programas de alineamiento o
edicin.
Al guardar el archivo debe hacerse como archivo de texto (*.txt) o FASTA
(*.fasta) seleccionando del men Send la opcin File.
Seleccionar el destino
1
y el formato del archivo
2
.
1
2
a) Realizar una bsqueda por homologa de secuencias, empleando la
herramienta BLAST.
Desde la pgina principal del NCBI, seleccionar BLAST.
BLAST es una herramienta para localizar secuencias homlogas a la
secuencia en estudio mediante alineamientos locales.
En este caso se har un alineamiento nucletido-nucletido, por lo que se
debe seleccionar esta opcin (nucleotide blast).
La bsqueda puede ser ms especfica si se seleccionan una base de datos
1
.
1
Aparecen los resultados.
a) En la primera seccin se encuentran los datos generales de la
bsqueda.
Bajar en la pgina para seguir
viendo los resultados
a) Posteriormente, se encuentra un grfico donde se muestran las
secuencias con similitud a la secuencia que se ingres (Query).
Bajar en la pgina
para seguir viendo
los resultados.
b) Obtener las secuencias nucleotdicas de los 5 genes que tuvieron la mejor
puntuacin. Ms abajo est la lista de las secuencias con las que se
encontr homologa, as como algunos parmetros del alineamiento para
cada una.
Estas secuencias se descargarn
c) y usarn en el inciso d)
PARA GUARDARLAS SIGUE LAS
INSTRUCCIONES QUE SE
ENCUENTRAN MS ADELANTE ()
Bajar en la pgina
para seguir viendo
los resultados
a) Despus, se encuentra cada uno de los alineamientos mostrando las
regiones que son comunes entre la secuencia de inters y la encontrada por
BLAST.
Para descargar las secuencias resultantes del alineamiento,
se selecciona cada una de ellas como se indica a continuacin.
Una vez seleccionadas las secuencias de inters al principio de
los alineamientos se localiza el botn Get selected sequences
Seleccionar las seis secuencias
En el men Display Settings se selecciona el formato en el que
se desean guardar, que para este ejercicio ser el formato
FASTA
Despus en el men Show se selecciona Text
Archivo con
todas las
secuencias en
formato FASTA
d) Realizar un alineamiento mltiple empleando el programa CLUSTALX o
CLUSTALW, con los parmetros predeterminados. Esta es la interfase del
programa CLUSTALX, desde el men File se lee el archivo que contiene
todas las secuencias por alinear.
Se selecciona el tipo de alineamiento desde el men Alignment y sin
modificar ningn parmetro predeterminado, se selecciona Do Complete
Alignment.
Secuencias por
alinear
Posicin de los nucletidos
e) Localizar las regiones ms conservadas y ms diferentes en el
alineamiento obtenido. Hacerlo de forma manual desplazndose a
travs de los resultados
1
, se seala una regin muy conservada
2
.
Secuencias alineadas
1
2
Regin conservada, notar
que las secuencias se
parecen y slo hay un
cambio en la regin
marcada
Archivos generados por
CLUSTALX
Se generan dos archivos:
El archivo *.aln contiene el alineamiento de todas las secuencias, y se
abre con el block de notas.
El archivo *.dnd contiene un grfico, en el que puede visualizarse con facilidad
cuales son las secuencias que se encuentran ms relacionadas entre s.
Puede leerse con los programas BioEdit

o TreeView

.
1
2
f) Realizar la misma operacin modificando los parmetros para la apertura y
extensin de huecos (Gap penalties).
Cul es la diferencia entre los diferentes alineamientos que se realizaron?
El alineamiento puede hacerse ms o menos estricto, modificando los
parmetros predeterminados
1,2
.
Cambiar los valores predeterminados por cero
Si se disminuyen los valores de penalizacin por apertura y extensin de
huecos se obtendr un alineamiento menos estricto.
La barra inferior corresponde a la numeracin de los nucletidos, si se
compara con el alineamiento anterior a este mismo nivel, se nota la
diferencia debida a la modificacin de los parmetros predeterminados.
Resultado del alineamiento
menos estricto para los valores
de Gap penalties
Observar que se trata de la misma regin
mostrada en el alineamiento inicial del inciso e).
EJERCICIO 6

Diseo de oligonucletidos
Es de especial importancia el dato de energa libre de Gibbs (o
entalpa libre) que se obtiene para distintos parmetros de los
oligonucletidos, como la formacin de estructuras secundarias
llamadas horquillas (hairpin en ingls) y la formacin de dmeros.

Las horquillas son estructuras indeseables en un oligonucletido para
PCR, pues podran dificultar el alineamiento de ste con la secuencia
blanco, afectando la eficiencia y especificidad de la reaccin.

Los dmeros son resultado de la alineacin entre oligonucletidos, ya
sea directo con directo o reverso con reverso (homlogos), o directo
con reverso (heterlogos); lo cual afecta negativamente el desarrollo
de la PCR.

La energa libre de Gibbs es un potencial termodinmico que da la
condicin de equilibrio y de espontaneidad para una reaccin qumica
(a presin y temperatura constantes). Los cambios en la energa libre
se simbolizan como G, la cual representa la energa que queda
disponible para trabajo qumico til.

En el diseo de iniciadores este trmino se aplica para indicar la
energa requerida para deshacer las estructuras secundarias y los
dmeros.
PARMETROS IMPORTANTES A CONSIDERAR EN EL
DISEO DE OLIGONUCLETIDOS
PARMETROS IMPORTANTES A CONSIDERAR EN EL DISEO DE LOS
OLIGONUCLETIDOS
1) A una Tm mayor de 80C la Polimerasa presenta actividad baja, de modo que la
Tm ptima se encuentra entre los 55 y los 60C.





3)El contenido GC deber estar entre 40 y 60%.

4) La diferencia de Tm entre los iniciadores no deber ser mayor a 5C.

5) La formacin de horquillas (Hairpin): cuando se presentan valores de G -2
kcal/mol en el extremo 3 y G -3 kcal/mol en la regin interna son aceptables,
es decir, con estos valores de energa no es tan probable la formacin de
horquillas.

6) Los dmeros homlogos (Self dimer): cuando se presentan valores de G -5
kcal/mol en el extremo 3 y G -6 en la regin interna son admisibles, es decir,
con estos valores de energa no es tan probable la formacin de dichos dmeros.

7) Los dmeros heterlogos (Cross dimer): cuando se presentan valores de G -5
kcal/mol en el extremo 3 y G -6 en la regin interna son aceptables, es decir,
con estos valores de energa no es tan probable la formacin de dichos dmeros.
2) Generalmente, la longitud de los oligonucletidos deber ser de 20 a 30 bases,
aunque depender de diferentes factores, por ejemplo el tipo de PCR y el contenido
de GC.
Disear un par de oligonucletidos para detectar por la PCR: a) el gen de la
aerolisina de Aeromonas hydrophila. Indicar el programa que se emple y
los criterios fundamentales que cumplen estos oligonucletidos para ser
utilizados en la PCR. Bsqueda de la secuencia nucleotdica del gen aerA
Secuencia del gen aerA
buscada en el ncbi en la base
de datos nucleotide como se
realiz en los ejercicios
anteriores.
Se puede restringir la
bsqueda a la regin
codificante del gen se se
requiere, mdiante el link CDS.
Elegir el formato FASTA de la secuencia.
Diseo de oligonucletidos
con el software
PrimerQuest
http://www.idtdna.com/Scitools/Applications/PrimerQuest/Default.aspx/
Iniciar en modo bsico.
URL
Modo bsico
Pegar la secuencia en la ventana correspondiente.
Ir a modo avanzado y anotar en la ventana Targets el nucletido donde
comienza el gen de la metiltransferasa y su longitud, separando con una
coma ambos datos (inciso b anterior, diapositiva 87).
Ms abajo en esa misma pgina anotar en la ventana Product Size
Ranges un intervalo dentro del que se encuentre la longitud del gen, en
este caso el gen de la metiltransferasa es de 1763 pb
Enviar los datos oprimiendo CALCULATE.
A continuacin se mostrarn los resultados, en los cuales se sugieren
varios pares de oligonucletidos, de ellos se escoger el ms adecuado de
acuerdo con los siguientes criterios:

- Regin blanco que amplificarn (verificar que se delimite lo mejor posible
el gen de inters).
- Longitud y contenido GC de los oligonucletidos.
- Tm.
- Formacin de horquillas.

Resultados: primer par de oligonucletidos propuesto; en este caso se
delimita bien la regin de inters (nucletidos 1948 a 3711), por lo que este
par de iniciadores es elegible. Adicionalmente tienen Tm similares no se
forman horquillas estables (ver siguiente pgina).
1
Para ver la formacin de horquillas en el iniciador directo, oprimir
HAIRPIN (pgina anterior)
1
, luego oprimir mFold Input
2
y finalmente,
SUBMIT
3
.
2
3
De acuerdo con la G, la estructura ms estable que podra formar el
iniciador directo es la 1 y no es muy probable.
Para ver la formacin de horquillas en el iniciador reverso, oprimir
HAIRPIN
1 (Diapositiva 97)
, luego oprimir mFold Input
2
y finalmente,
SUBMIT
3
.
3
2
De acuerdo con la G la estructura ms estable que podra formar el
iniciador reverso tampoco es estable.
Diseo de oligonucletidos
con el software
GeneFisher
Ingresar a la pgina web:
http://bibiserv.techfak.uni-bielefeld.de/genefisher/old.html
y oprimir Start.
Ingresar direccin de correo electrnico
1
y pegar la secuencia en el
formato FASTA
2
.
1
2
Seleccionar OK, para iniciar el clculo de oligonucletidos.
La secuencia ya fue aceptada, presionar OK.
Aparecern una serie de parmetros, como la longitud del oligonucletido,
contenido de GC, Tm, degeneracin del primer, etc., los cuales no se
modificarn.
Los iniciadores se estn calculando, oprimir Result.
A continuacin aparecer un listado de los 8 mejores pares de oligonucletidos,
de ellos se escoger el ms apropiado de acuerdo con los siguientes criterios:
Regin blanco que amplificarn (verificar que se delimite lo mejor posible el gen
de inters), as como la longitud y Tm de los oligonucletidos.


Se muestran otras condiciones de ambos oligonucletidos, el contenido de
GC, tamao y degeneracin de la bases; al elegir la liga sealada con la flecha
roja se mostrar una lista de los oligonucletidos directos.
Se muestra una lista de los oligonucletidos directos; luego (regresar
una pgina).
Seleccionar list reverse primers.
Se muestra una lista de los oligonucletidos reversos.

También podría gustarte