Está en la página 1de 97

Guía de Trabajos Prácticos

Cátedra BIOLOGIA MOLECULAR

Facultad de Ciencias Naturales e IML


U.N.T.

-2015-

JTPs: Dra. Virginia Albarracín


Dr.Sergio Cuozzo
Dra. Marta Polti
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Programa de Trabajos Prácticos

Trabajo Práctico N 1. Reacción en Cadena de la Polimerasa. Definición e importancia. Usos y


aplicaciones. Optimización. Tipos de PCR. Electroforesis. Fundamentos.

Trabajo Práctico N 2. Vectores de clonado: Plásmidos. Características: Estructura, clasificación


(criterios), funciones codificadas (fenotipos), número de copias. Grupos de incompatibilidad.
Electroforesis de plásmidos.

Trabajo Práctico N 3. Bioinformática. Concepto e Importancia. Bases de datos en Internet:


NCBI, EMBL. Software (DNAman, MEGA 4, Treeview) y Programas on line para análisis de
secuencias: Workbench Biology, Eztaxon Server, Ribosome DataBase Project, NCBI. Algoritmos
de comparación: BLAST. Construcción de Árboles Filogenéticos.

Trabajo Práctico N° 4. Taxonomía molecular. Marcadores moleculares y técnicas más


comúnmente usadas. Identificación de microorganismos mediante ARDRA. Digestión in silico con
enzimas de restricción. Tipos de enzimas. Mapas de Restricción.

Trabajo Práctico N° 5. Secuenciación y Genómica. Análisis de genomas con plataforma RAST.


Cantidad y tipo de genes. División en subsistemas. Anotación de genes con programa ARTEMIS.

-1-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Trabajo Práctico N1


REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

1- Objetivos

• Que el alumno comprenda el fundamento teórico que permitió el desarrollo de la


técnica de PCR.
• Que el alumno comprenda la importancia de la técnica en el desarrollo de la
tecnología del ADN recombinante.
• Que el alumno conozca las aplicaciones y usos de la técnica.
• Que el alumno sea capaz de diseñar y efectuar reacciones de PCR en el laboratorio.
• Que el alumno pueda interpretar los resultados obtenidos en relación al objetivo del
experimento planteado.

2- Introducción

Definición e importancia.

La reacción en cadena de la polimerasa (PCR) fue desarrollada por el grupo de Kary Mullis
de Cetus-Perkin- Elmer en 1985.
El primer experimento de Mullis y colaboradores, publicado en
Science en 1985 fue planeado para desarrollar un método de diagnóstico que no insumiera
más de 24 hs para la detección de la hemoglobinopatia de eritrocitos falciformes ("sickle
cellanemia"). En esta anemia la cadena  de la globina está mutada a nivel de la segunda
base del séptimo codón de lo que resulta un cambio de glutámico (cadena PA normal) por
valina (cadena s patológica). A nivel del gen esto hace desaparecer un sitio Dde pero no
afecta a otro sitio Hinf contiguo.

En el experimento amplificaron un fragmento de 110 pb portador o no de la mutación.


Luego de la amplificación el producto desnaturalizado monocatenario se hibridizó con un
oligonucleótido homólogo de 40 bp en cuyo extremo 5' están dos hemisitios de Hinf y Dde.
El fragmento fue marcado con 32P en dicho extremo.
El híbrido es entonces tratado primero con Dde a 56"C que de cortar, genera un producto de
8 nucleótidos. El segundo tratamiento es con Hinf que no actúa sobre e! producto de Dde
pero si corta generando un fragmento de 3 nucleótidos si el sitio Dde no existe.
En los últimos años, la PCR se ha convertido en una revolucionaria tecnología que facilita
los estudios moleculares en el laboratorio y que abre nuevas perspectivas a la investigación
y al diagnóstico médico. Esta nueva tecnología se basa en la ampliación de secuencias
específicas del ADN y se conoce como reacción en cadena de la polimerasa o PCR
(polymerase chain reaction).

-2-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

La revolución que la PCR ha originado en el campo de la investigación genética y


molecular es comparable a la producida por el descubrimiento de las enzimas de restricción
o de los polimorfismos del ADN.

Ventajas y usos.

- Se dispone, en forma rápida y eficaz, de cantidades suficientes de una determinada


secuencia de DNA para su posterior estudio molecular.
- Diagnóstico de patologías genéticas o adquiridas,
- Investigación sobre los defectos moleculares todavía no definidos.
- Aplicación a la medicina forense y legal.
- Detección de patógenos responsables de enfermedades infecciosas.

Fundamentos

La PCR permite, mediante la utilización de una ADN polimerasa, la amplificación de


regiones específicas de ADN de simple cadena, la que actúa como molde para la síntesis de
una nueva cadena complementaria. Estos moldes de ADN se obtienen cuando se calienta el
mismo a una temperatura cercana a un punto de ebullición (desnaturalización),
produciéndose la separación de las cadenas de ADN. Para la iniciación de la síntesis de la
cadena complementaria al molde se requiere además de la presencia de cebadores o
primers, que son secuencias cortas de nucleótidos sintéticos (oligonucléotidos) o primers,
hibridan de forma específica con las dos hebras complementarias de ADN. Los cebadores
se diseñan de tal manera que hibriden en los extremos opuestos de cada hebra de la región
de interés, así las nuevas cadenas de ADN sintetizadas que comienzan en cada primer se
extiende hacia la posición del primer que se encuentra en la hebra opuesta. De esta forma
se generan en cada cadena de ADN nuevamente sintetizada nuevos sitios de unión a los
primers. La mezcla de racción se calienta nuevamente para separar la cadena original de la
nueva, las cuales quedan disponibles para nuevos ciclos de hibridación del primer, síntesis
de ADN, separación de las cadenas, y así sucesivamente.
Es decir que básicamente, la amplificación de la secuencia de interés se consigue al realizar
una serie de ciclos repetitivos que consisten en:
- Desnaturalización del ADN molde.
- Hibridación de los primers con el molde.
- Síntesis del ADN complementario mediante la acción de la enzima denominada
ADN polimerasa, termoestable.
El resultado de una reacción de PCR es que al final de n ciclos, la reacción contiene un
máximo teórico de 2n moléculas de DNA de doble cadena que son copias de la secuencia
de DNA comprendida entre los primers específicos.
Si se realizan 20-30 ciclos del proceso de PCR señalado anteriormente, se pueden obtener
varios millones de copias de la secuencia de interés, flanqueada por los primers utilizados
en la amplificación.

Tema 4. Componentes de la reacción de PCR.

-3-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

La reacción típica de PCR consta de:


- Muestra de ADN que contiene la secuencia a amplificar.
- Enzima ADN polimerasa.
- Secuencias cebadoras o primers.
- Desoxinucleótidos trifosfatos (dNTPs)
- Mg Cl2
- Buffer de reacción.
- Enhancers.
- Aceite mineral.

Muestra de ADN o templado. La muestra de ADN puede consistir en 100 ng de ADN


genómico (aproximadamente 100.000 copias del ADN molde a amplificar); o ADN
obtenido de una única célula, es decir solo una a dos copias del ADN (aproximadamente 5
pg de ADN).

ADN polimerasa. Existen varios tipos de enzimas ADN polimerasa. En un principio se


utilizó ADN polimerasa procedente de E. coli. Sin embargo, la actividad de esta enzima
desciende considerablemente por encima de los 37º C, y la exposición a las altas
temperaturas de desnaturalización, necesarias para separar las dos cadenas de ADN inactiva
la enzima tras cada ciclo de amplificación. Por tal razón, en la reacción de PCR se utilizan
ADN polimerasas termoestables; éstas se han aislado a partir de microorganismos que
viven a temperaturas elevadas. La ADN polimerasa del microorganismo Thermus aquaticus
( Taq ADN polimerasa) permite la síntesis del ADN por encima de los 70º C, resistiendo
temperaturas de hasta 94º C. Otras enzimas termoestables son las Tfl ADN polimerasa
obtenida del Thermus flavus, la Pfu ADN polimerasa de Pyrococcus furiosus, VENT
(nombre comercial de enzima de Thermococcus litoralis), DeepVENT (nombre comercial
de enzima de Pyrococcus sp. GB-D), estas tres últimas presentan mayor termoestabilidad
que la Taq polimerasa, presentando además una actividad exonucleasa 3 a 5 que le
permite corregir los nucleótidos incorporados en forma errónea; es decir que los fragmentos
de PCR generados con esta enzima tendrán menos errores de incorporación que los
generados con la Taq polimerasa. La Tth polimerasa de Thermus termophilus, posee
además actividad de RT en presencia de Mn2+.

Cebadores. Los primers o cebadores son secuencias cortas de ADN de 20 a 30 bases que
se obtienen por síntesis; la secuencia de los mismos se diseña de acuerdo al fragmento de
ADN que se desea amplificar. Se debe tener una concentración de 0.2-1.0 M c/u, en
muchísimo exceso molar respecto del templado (relación primer/target: inicial: 108 y final:
10 aproximadamente. En el diseño de los primers es necesario tener en cuenta algunas
consideraciones:
- Deben ser específicos, especialmente en el extremo 3´.
- Las bases que lo componen deben tener una distribución homogénea a lo largo de la
secuencia, evitando regiones ricas en polipurinas, polipirimidinas u otras secuencias poco

-4-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

comunes. Se debe tratar en lo posible que el contenido de CG sea similar al del fragmento a
amplificar.
- Diseñar "primers" con el Tm más alto posible, 55 a 80 C y similares entre los
primers.
- Los primers no deben estar distanciados por mas de 3 kbp.
- Se debería evitar la presencia de secuencias que permitan la formación de
estructuras secundarias, particularmente en el extremo 3 del primer .
- Es muy conveniente controlar que no existan regiones de complementariedad entre
los primers (uno con otro) evitando que el par de cebadores posean extremos 3 solapados,
ya que podrían dar lugar a un artefacto de amplificación llamado dímero de primers. Estos
dímeros aparecerán como producto de la reacción de PCR especialmente cuando se hacen
muchos ciclos de amplificación sobre una muestra que tiene pocas copias iniciales del
material a amplificar. Un dímero de este tipo es un fragmento de ADN cuya longitud es
muy próxima a la suma de los dos primer y su formación ocurriría cuando un primer es
“extendido” por la polimerasa sobre el otro primer. La concatenación resultante es un
molde extremadamente eficiente que puede , si es que ocurre en un ciclo temprano,
fácilmente volverse el producto predominante de la reacción. Existen programas de
computación que facilitan el diseño de los primers.

dNTPs. Son necesarios para la formación del nuevo ADN amplificado. 0.2 mM c/u (0,8
mM en total), corresponden a aproximadamente a 1016 moléculas de dNTPs. Cuando se
amplifican productos largos se aumenta también la concentración de dNTPs. También se
puede reemplazar un dNTP por algún nucleótido modificado. Ej: ddNTP, bases
modificadas, adición de biotina, fluorocromos, etc.

Mg2+. Afecta la unión del primer, el Tm del templado, la especificidad del producto
(que los primers se unan únicamente a la secuencia de interés), la actividad de la enzima y
su fidelidad. Junto con la temperatura es uno de los parámetros a manipular. Usualmente se
ensayan concentraciones, entre 0.5 y 5.0 mM.

Buffer de reacción. 50 mM KCl y 10 mM Tris-HCl (pH 8.3).

Enhancers. En ciertas circunstancias el agregado de sustancias como DMSO (1-10%),


PEG-6000 o glicerol (5-15%), detergente no iónicos, formamida {1-10%), BSA (10-100
g/ml) pueden mejorar mucho la especificidad y e! rendimiento.

Aceite mineral: para evitar la evaporación de la mezcla de reacción, 2 gotas

-5-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Diseño de una reacción de PCR.

En una reacción de PCR se busca optimizar tres elementos fundamentales: Especificidad,


Rendimiento y Fidelidad. La especificidad se refiere a la capacidad de obtener un producto
de PCR único y deseado. La fidelidad busca por su parte que el producto de amplificación
sea tan fiel a la secuencia original como sea posible, es decir, que se minimicen los errores
en la adición de bases durante la replicación. Y el rendimiento implica la obtención de una
gran cantidad de producto final después de toda la reacción.
Debido a la amplia variedad de aplicaciones en las que se está utilizando la PCR, no existen
condiciones estándares que garanticen el éxito en todas la situaciones. Sin embargo,
algunos parámetros pueden ser tenidos en cuenta como referencia para el diseño de una
reacción de PCR.
Una reacción de PCR se realiza habitualmente en un volumen de 25 a 50l, en un aparato
automático programado (ciclador térmico) para conseguir las temperaturas y los ciclos
deseados. Un ciclo típico consiste en realizar la desnaturalización a 94º C durante 20 seg.,
la hibridación de los primers con el ADN molde a 55º C durante 20 seg., y la síntesis a
72º C durante 30 seg. Los aparatos existentes en el mercado permiten llegar a las
temperaturas deseadas a una velocidad de entre 0,3 y 1º C por segundo, por lo que un ciclo
dura menos de 5 min., y el total del proceso de amplificación puede ser de menos de 3
horas de duración.
En la mezcla de reacción, la concentración del ión Mg2+ puede tener un profundo efecto
sobre la especificidad y el rendimiento en una amplificación. Generalmente una
concentración de 1,5 mM de MgCl2 es óptima cuando se trabaja con concentraciones de
200 M de cada desoxinucleótido trifosfato (dNTP) pero en algunas circunstancias pueden
ser requeridas diferentes cantidades de Mg2+. En general, el exceso de Mg2+ producirá una
acumulación de productos de amplificación no específicos, y una cantidad insuficiente del
mismo reducirá el rendimiento en la amplificación del fragmento deseado.
Los desoxinucleótidos trifosfato (dATP, dCTP, dTTP y dGTP) se utilizan normalmente en
concentraciones equimolares y comprendidas entre 50 a 200 mM cada uno de ellos.
Concentraciones más elevadas pueden dar lugar a incorporaciones erróneas por la ADN
polimerasa (es decir, disminuye la fidelidad de la copia); a las concentraciones
mencionadas hay suficiente cantidad de precursor para sintetizar aproximadamente 6,5 y 25
mg de ADN respectivamente. A concentraciones menores disminuye el rendimiento de la
reacción, es decir, la cantidad de producto amplificado que obtengo.
La Taq polimerasa se utiliza en una concentración de 2,5 unidades por 100 l; al
incrimentar la cantidad de enzima pueden aumentar la producción de productos no
específicos de PCR, reduciendo así el rendimiento del fragmento de ADN deseado.
La cantidad de cebador utilizada en una amplificación dependerá de varios factores, pero en
general las concentraciones de los mismos están comprendidas entre 0,05 a 0,5 l; de cada
uno de los oligonucleótidos.
El tiempo de incubación a 72º C (extensión) varía de acuerdo a la longitud de la secuencia
a ser amplificada. La temperatura de hibridación o annealing depende de la longitud de los
cebadores y de su contenido de CG.

-6-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Si los primers tienen una complementariedad perfecta con el templado se usa 55 C para
(C+G) < 50% o 60 C para (C+G) > 50%. Si no la tienen por ignorarse detalles de las
secuencia del primer, hay que hacer pruebas variando la temperatura entre 35 y 65 C,
hasta la obtención de un único producto con la longitud deseada.
Este último caso es el de la mezcla de oligonucleótidos “degenerados” donde la referencia
que se tiene del templado es sobre la secuencia de aminoácidos de la proteína y no de la
secuencia de bases del gen o mRNA.
En otros casos se introducen a propósito en los primers zonas sin homología; por ejemplo
cuando se trata de introducir una mutación o bien un sitio de restricción. Cuando esto
ocurre, la zona no homóloga debe estar en el lado 5´ del primer; caso contrario puede no
haber extensión.
Como vemos, son varios los parámetros a tener en cuenta en una reacción de PCR y
muchas veces puede ocurrir que una región particular del ADN presente dificultad en ser
amplificada por esta técnica. Este es el caso de aquellas regiones de ADN ricas en CG o
aquellas que forman estructuras secundarias; en estos casos se puede incluir en la mezcla
de reacción un aditivo que incremente el rendimiento y la especificidad. Los aditivos más
usados son dimetilsulfóxido (DMSO), la N,N,N-trimetilglicina (betaína) y la formamida,
también se utilizan el glicerol, detergentes no iónicos, polietilenglicol, albúmina sérica
bovina.

Condiciones que favorecen una mayor especificidad

Tipos de PCR.

1. Reacción de PCR a partir de ARN (RT-PCR).

Esta técnica es una variante de la PCR que permite determinar la presencia de un


transcripto, estimar los niveles de expresión del mismo y clonar productos de ADNc.

-7-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

El material de partida es ARN, pero como la PCR utiliza una ADN polimerasa, es necesario
hacer previamente una copia del ARN a ADNc; esto se consigue haciendo en una primera
etapa una transcripción reversa del ARN total o el ARNm a ADNc con una transcriptasa
reversa; el ADNc obtenido es el sustrato en la reacción de PCR usando cebadores
específicos.

2. PCR anidada o Nested PCR.

Es un método para incrementar la sensibilidad y la especificidad de la amplificación. Luego


de 20 ciclos de amplificación, se toma un 10% de la mezcla que se somete a una nueva
amplificación por 20 ciclos pero ahora en presencia de otro par de primers que se ubican
por dentro de la secuencia a amplificar respecto de los primers iniciales.

3. PCR anclada o Anchored PCR.

Se la utiliza cuando solamente se tiene información para el diseño de un solo primer.

4. PCR con “random primers”.

Está basado en la utilización de “primers” con secuencias seleccionadas al azar. Se usa para
la detección de polimorfismos genéticos en ausencia de información sobre secuencias de
bases. El esquema de fragmentos amplificados con esta técnica es trnsmitido
mendelianamente de padres a hijos y sirve para caracterizar especies de indviduos y
eventualmente para construir mapas genéticos. El método se denomina “Random Amplified
Polymorphic DNA” y se realiza con primers de 10 nucleótidos y la renaturalización se debe
efectuar a 36C.

5. RNA display.

El método fue descripto por el grupo de Pardee (1991). Se basa en la utilización de primers
con secuencias seleccionadas al azar para detectar mRNAs específicos de un estadío celular
mediante RT- PCR. La renaturalización se debe efectuar a 40C. Un ejemplo de los primers
que se utilizan es:

-8-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

6. Real Time PCR.

Es una metodologia que permite medir en tiempo real la formacion de un producto de PCR.
Utiliza un fluorometro adosado a un equipo convencional de PCR y tubos de calidad optica.
Se basa en el uso de un oligonucleotido que contiene un fluorocromo y un quencher. La
proximidad de estos dos elementos bloquea la fluorscencia. Cuando estos dos elementos se
separan en el transcurso de la amplificacion, aumenta la emision de fluorescencia.
Las desventajas que presenta incluyen la necesidad de una optimizacion perfecta, no se
puede asegurar la especificidad de la reaccion, complica el uso de controles internos, y
elevado costo.

Cuando el fluorocromo se aleje o separe


del quencher, se observara fluorescencia.

Comparacion con electroforesis

Comparacion entre distintas concentraciones

7. RACE: rapid amplification of cDNA ends; Amplificación rápida de extremos de


cDNA.
La RACE –PCR es un método muy utilizado para obtener las secuencias completas de
cDNA (Frohman et al., 1988). RACE-PCR es una modificación anclada de la RT-PCR.
Está basada en la amplificación de la secuencia comprendida entre una sola región

-9-
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

previamente caracterizada en el mRNA (cDNA) y una secuencia de anclaje apareada en el


extremo 5‟ o 3‟. Se diseña un cebador a partir de una secuencia interna conocida y el
segundo cebador tiene la secuencia de anclaje. Un paso previo a la RACE-PCR implica la
introducción de una secuencia específica en o el extremo 3‟ o 5‟, por lo que efectivamente
es una forma de mutagenesis

A- 3‟ RACE-PCR utiliza un primer antisense que empieza con una secuencia específica 5‟,
generalmente de más de 15 nucleótidos, que se incorpora en el transcripto de cDNA en el
paso donde interviene la transcriptasa reversa. Un primer sense interno se utiliza para
generar un segunda cadena corta que termina en una secuencia complementaria a la
secuencia original de anclaje. Después, la PCR se inicia utilizando el primer sense interno y
el primer de anclaje.
B- 5‟ RACE-PCR. Aquí un primer antisense interno se utiliza para preparar la síntesis del
templado de una cadena parcial de cDNA. Una cola de poly(dA) se añade al extremo 3‟del
cDNA usando una transferasa terminal. La síntesis de la segunda cadena se prepara
utilizando un primer sense con una secuencia de extensión específica (el ancla). Esta
cadena se utiliza como templado para un paso adicional de la síntesis que utiliza el primer
interno para producir una copia complementaria de la sucesión de anclaje. La PCR,
entonces, se puede realizar utilizando los primers interno y de anclaje

- 10 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

8. PCR mutagénica

La PCR también puede ser utilizada para introducir mutaciones en sitios específicos.
Mutagénesis 5‟: (A) Los primers son modificados en el extremo 5‟, por lo que se pueden
introducir, por ejemplo, secuencias marcadas, secuencias que contengan un sitio de
restricción o un promotor que dirija la expresión.
Mutagénesis específica de sitio: (B) En este caso, la mutación ocurre en una zona
localizada en el centro del amplicón. Se llevan a cabo dos reacciones de PCR, A y B, que
amplifican segmentos superpuestos que contienen la mutación introducida a propósito, al
modificar los primers internos de la secuencia original. Luego los dos productos son
combinados mediante otra PCR.
Mutagénesis por unión incorrecta: En este caso el primer es solo parcialmente
complementario a la secuencia original.

Aplicaciones de la PCR.

- 11 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

La PCR ha simplificado y magnificado las posibilidades diagnósticas del ADN en


medicina. La nueva tecnología permite el diagnóstico preciso de la patología hereditaria,
que incluye tanto los procesos en los que el defecto molecular es conocido en detalle, como
aquellos para los que sólo ha sido posible la localización cromosómica del defecto en
cuestión. En enfermedades genéticas adquiridas, como el cáncer y los procesos
autoinmunes, la PCR permite detectar con precisión los defectos moleculares que han sido
definidos, y facilita la exploración de su patología básica. El estudio de la hipervariabilidad
en el genoma supone la posibilidad de su empleo en los estudios de susceptibilidad a ciertas
enfermedades y la aplicación a la medicina forense y legal. En este campo, el poder
discriminativo de la nueva tecnología es altamente superior al obtenido con la metodología
clásica. La detección de patógenos infecciosos y la identificación de variabilidad genética
asociada a enfermedad se ha visto también revolucionada con la utilización de la tecnología
del ADN recombinante.
La PCR en el campo de las enfermedades monogénicas tiene dos aplicaciones principales:
- El análisis indirecto de los procesos hereditarios mediante el estudio de
polimorfismos asociados a los genes responsables de los distintos procesos.
- La detección directa de mutaciones, mediante hibridación, digestión con enzimas de
restricción, secuenciación directa del ADN o simple visualización de fragmentos. Además
de la posibilidad de análisis de procesos genéticos, cáncer y susceptibilidad a
enfermedades, la nueva tecnología permite el análisis rápido de patógenos infecciosos. El
análisis de la presencia de estos patógenos y de mutaciones en oncogenes en material
médico de archivo, como bloques de tejidos de parafina, fijados en formol, permite
importantes trabajos retrospectiv os.

Detección de la presencia de HIV en plasma

La técnica del PCR permite no solo determinar la presencia del virus en sangre sino
también la carga viral.
Puesto que la PCR solo puede amplificar ADN, el ARN del HIV-1 debe ser transcripto a
ADNc mediante una transcriptasa reversa (RT-PCR). El ARN del HIV-1 se extrae del
plasma usando agentes caotrópicos como el tiocianato de guanidina, que inactiva a las
RNAsas , luego se precipita con isopropanol y se solubiliza el pellet en agua y se coloca en
un tubo de micro centrífuga junto a los otros componentes de la reacción, para amplificar
una secuencia de 142-bases del gen gag.
Los primeros utilizados poseen 25 a 30 bases de longitud, hibridan por fuera de las regiones
de la secuencia del gen gag a amplificar. En la mezcla de reacción se coloca además
cantidades conocidas de un estándar interno que es una molécula de ARN sintético idéntico
al ARN viral a amplificar con la diferencia que posee una delección (ARN competidor); la
presencia de este estándar permite la cuantificación del virus en la muestra problema.
Luego que los ciclos de PCR han terminado, los productos de amplificación se separan por
electroforesis en un gel teñido con bromuro de etidio. Se determina la intensidad de la
banda de 142 pares de bases del ARN del HIV-1 y la intensidad de la banda del producto de
amplificación del estándar interno (que tiene una talla menor). La relación de intensidades

- 12 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

de ambos fragmento permite realizar un cálculo del número de copias del ARN del HIV-1
en la muestra original.

Detección de genes de microorganismos en alimentos

Las aplicaciones de la técnica de PCR en el control de alimentos son numerosas. Se pueden


utilizar para identificar especies cárnicas y especies de pescado de interés alimenticio,
detectar la presencia de agentes patógenos en los alimentos (Salmonella spp., Listeria
monocytogenes, Escherichia coli O157:H7) o detectar la presencia o ausencia de
organismos genéticamente modificados (OGM) en los alimentos. Para ello se amplifican
por PCR marcadores moleculares específicos y se detecta su presencia en un gel de
agarosa.

Aplicación de la biología molecular en la identificación de individuos

Desde 1990, se empezó a utilizar la técnica de PCR para la identificación molecular


forense. Este sistema posibilitó la obtención de información genética útil a partir de
muestras provenientes de cadáveres antiguos, de tejidos descompuestos, de restos
epiteliales de colillas de cigarrillos o bulbo piloso, etc. básicamente, se identifican
secuencias de DNA hipervariables.
Los patrones generados por este sistema presentan dos bandas (alelos) en un determinado
individuo, cada una de ellas aportada por cada uno de sus progenitores:
Condición de inclusión: el individuo comparte una banda con su padre y otra con su madre.
Condición de exclusión: el individuo no comparte ninguna banda con su padre o su madre.
Si nos encontramos ante una condición de exclusión, podemos afirmar que los supuestos
progenitores y el individuo testeado no tienen ninguna relación.
Si nos encontramos ante una condición de exclusión, no podemos confirmar con el análisis
de un solo sistema que por ejemplo el padre alegado es el padre biológico; por eso debemos
utilizar más de un sistema para alcanzar niveles de certeza compatibles con la paternidad.
Existe cierto numero de regiones no codificantes de el gen de la mioglobina humana las
cuales exhiben un alto grado de variabilidad entre individuos. Estas secuencias presentan
un comportamiento de herencia “de padres a hijos” (herencia mendeliana) y se localizan en
diferentes regiones del genoma. Estas secuencia se pueden utilizar como sondas o
marcadores sobre DNA, llamando a esta técnica DNA fingerprinting (huellas digitales
genéticas HDG) o sondas capaces de generar tales patrones se denominan sondas
multilocus (MLP).
Este tipo de secuencias fueron reemplazadas por otro tipo de secuencias variables pero
localizadas en posición determinada del genoma de tal manera que el patrón producido por
estas, al ser usadas como sondas, sólo presentaba dos bandas (en la condición heterocigota)
o una banda (en la condición homocigota). Estas sondas fueron denominadas unilocus y
reciben actualmente la mayor atención por su posibilidad de estandarización y de
generación de bancos de datos poblacionales intercomparables.
El análisis molecular de los fragmentos variables con sondas de locus múltiple (MLP) o
con sondas de locus específico (SLP) permitieron demostrar que tal variación depende del

- 13 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

número de veces que se encuentran presentes ciertos segmentos de ADN, los que
constituyen unidades de repetición. Tal propiedad valió para que se las denominará
Repeticiones en Tándem de Número Variable (VNTR).

Visualización de ADN

ELECTROFORESIS

FUNDAMENTOS

El método electroforético aprovecha la propiedad de las partículas cargadas de migrar en un


campo eléctrico, en donde la velocidad de migración depende de la carga de dichas
partículas. Este método se puede usar tanto para proteínas como para ácidos nucleicos. Las
proteínas poseen carga como resultado de la presencia de aminoácidos básicos (arginina y
lisina) y ácidos (glutámico y aspártico) pero también poseen cargas adicionales debido a las
modificaciones postraduccionales mediante glicosilación, sulfatación y fosforilación.
En el caso del ADN, éste se carga negativamente cuando se encuentra en un buffer alcalino,
debido a sus extremos fosfatos y de esta manera puede migrar al ánodo en un campo
eléctrico. Otros factores influyen en la migración y la separación del ADN, además de la
carga: tamaño del ADN, concentración de agarosa, concentración de ADN e intensidad del
campo eléctrico. Los fragmentos del ADN lineal, por ejemplo, migran a través de la matriz
del gel a una velocidad inversamente proporcional al log10 de sus pesos moleculares. Esta
relación puede ser usada para estimar el tamaño de los fragmentos de ADN.

FORMA DE LLEVAR A CABO UNA ELECTROFORESIS

Entre los soportes más comunes están: papel, acetato de celulosa, agarosa y poliacrilamida.
Estos soportes afectan la movilidad de las moléculas cargadas de manera diferente, ya que
pueden absorber moléculas al medio de soporte (tales como los grupos hidroxilos del papel
de celulosa) o reducir el movimiento mediante un tamiz de poros moleculares como en el
caso del PAGE. La migración de partículas cargadas en un gel, presenta un alto coeficiente
de rozamiento. Este tipo de medio no sólo previene la convección y minimiza la difusión
sino que participa activamente en la separación de las moléculas haciendo intervenir en
forma importante el criterio de dimensión ya que ejercen un efecto de filtración molecular.
Este efecto de tamiz es función de la dimensión de los poros del gel, lo que depende de la
concentración del gel.
Cualquier matriz que el operador elija es importante que sea eléctricamente neutra ya que la
presencia de grupos cargados en dicho soporte produce un fenómeno de electroósmosis que
disminuye el poder resolutivo de esta técnica. Los soportes más comunes para la
electroforesis en gel son los de agarosa y poliacrilamida. Los primeros dan un tamaño de
poros más grande y su utilización permite la separación de grandes moléculas mientras que
con geles de poliacrilamida se logran poros de pequeño tamaño, haciendo posible la
separación de pequeñas macromoléculas.

- 14 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

ELECTROFORESIS EN GELES DE AGAROSA

Es un método estándar usado para analizar moléculas de ADN de más de 200 pares de base
(pb). La electroforesis en gel de agarosa fue desarrollada primariamente en plataformas
horizontales. Los geles horizontales se preparan colocando la agarosa fundida en un molde,
cerca del extremo se coloca un peine para formar los pocillos. Una vez que la agarosa ha
solidificado, el peine es removido. El método más común para la electroforesis del ADN es
el método submarino en el cual el buffer cubre el gel. Se utilizan buffers neutros o
alcalinos. Ej: TAE. Éste contiene EDTA que es un agente quelante de cationes divalentes,
que son requeridos por las DNasas y así se previene la degradación de la muestra de gel.
La agarosa actúa como tamiz molecular, por lo tanto la conformación del ADN afecta su
migración y separación durante la electroforesis. El ADN posee tres conformaciones
normales: superenrrollado, relajado (circular abierto) y lineal. Generalmente el ADN
superenrrollado corre más rápido que el ADN lineal, y éste corre más rápido que el ADN
relajado.
Cuando el análisis del ADN es cuantitativo, es muy importante que las bandas puedan
resolverse y verse claramente. La resolución depende de muchos factores: tamaño y forma
del pocillo, tamaño de los fragmentos de ADN, concentración de agarosa y voltaje usado.
La intensidad del campo también determina la velocidad de migración del ADN. Un
gradiente de altos voltajes conduce a una pobre resolución debido a que los fragmentos
tienden a atravesar el gel como una masa compacta. El uso de voltajes bajos puede producir
la difusión del ADN de la banda, reduciendo así la resolución.
PROTOCOLO CORRIDA ELECTROFORÉTICA EN GEL DE AGAROSA.

Visualizar el ADN extraído corriendo 5 l de muestra en posillos dentro de en un gel de


agarosa 0.8% en una cuba de electroforesis usando como buffer de electroforesis TAE 1X y
como marcador de peso molecular, 1 Kb. Debe tenerse en cuenta siempre que el volumen
de las muestras no debe sobrepasar el volumen de los pocillos del gel. Antes de sembrar la
muestra se le agrega un volumen determinado de colorante (1 µl) de frente (azul de
bromofenol) para visualizar la corrida. La electroforesis se lleva a cabo a 10 V cm -1 durante
1 h a temperatura ambiente; los geles luego se tiñen con solución de bromuro de etidio y
se observan bajo luz UV.
Reactivos necesarios.
1. 1X TAE buffer ( 0.04 M Tris-acetate, 0.001 M EDTA, pH 8.0)
2. 0,8 % agarosa en 1X TAE buffer.
3. Solución de bromuro de etidio: 1 µg ml-1 in 1X TAE buffer.
4. Marcador de peso molecular: 1Kb.
5. Buffer de corrida.

Preparación del gel de agarosa.

1- Preparar la cuba de electroforesis con el peine correspondiente.

- 15 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

2- Realizar el calculo necesario para preparar un gel de agarosa 0,8 %(25 ml).
3- Pesar la agarosa. Diluir con TAE 1x hasta 25 ml y calentar hasta disolución.
4- Dejar enfriar 10 minutos y verter solución de agarosa.
5- Dejar solidificar y cubrir el gel con TAE 1x.

Esquema ilustrando el resultado de una corrida electroforética.

ELECTROFORESIS EN GELES DE POLIACRILAMIDA

COMPOSICIÓN QUÍMICA.

La matriz está compuesta de acrilamida copolimerizada con N, N· - metilenbis acrilamida.


La polimerización ocurre cuando el persulfato de amonio se disuelve en agua, formándose
radicales libres. Cuando estos radicales libres se ponen en contacto con la acrilamida, ésta
se polimeriza en largas cadenas de poliacrilamida, que gelificarán debido a la presencia de
la bisacrilamida que forma enlaces cruzados entre las cadenas. El TEMED, una amina
cuaternaria N N N tetrametilen diamina actúa como catalizador, debido a su capacidad de
existir en la forma de radical libre. Debido a que el oxigeno inhibe la polimerización, la
mezcla se somete a vacío o se purga con gas inerte. El tamaño del poro de la acrilamida
polimerizada depende de la cantidad de acrilamida usada por unidad de volumen en el
medio de reacción, y el grado de entrecruzamiento. La relación acrilamida/bis acrilamida es
también crítica para el tamaño de poro. Al aumentar la concentración de acrilamida
disminuye el tamaño del poro. Para ajustar aún más el tamaño de poro puede variarse la
concentración de bisacrilamida. Pudo establecerse que con un 5% de bisacrilamida con
respecto a la cantidad total de acrilamida-bisacrilamida se logra el poro más fino. Por abajo
o por arriba de ese porcentaje el tamaño del poro aumenta.
Los geles pueden ser hechos en placas planas o en tubos cilíndricos. En ambos casos en el
borde superior, el gel forma un menisco que posteriormente distorsiona el esquema de las
bandas, para evitarlo se coloca una fina capa de agua antes de que polimerice.

- 16 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

SISTEMAS DE ELECTROFORESIS EN GELES DE POLIACRILAMIDA


- Sistema continuo: La concentración del gel , el pH y la fuerza iónica quedan fijos .
Se utiliza el mismo buffer en el gel y en las cubas. Utiliza un tipo de gel llamado gel
de separación (o de resolución) y además un gel concentrador (o espaciador).
- Sistema discontinuo: En este sistema los parámetros anteriores varían pero la
resolución es superior.
SISTEMAS DESNATURALIZANTES Y NO DESNATURALIZANTES
Tanto en los sistemas continuos y discontinuos pueden seleccionarse a su vez un sistema
que permita mantener las muestras en su estado nativo, o sea no desnaturalizante mediante
el uso de tampones adecuados que no contengan detergentes, con pH y concentración
predeterminada y reduciendo el calor al máximo. Por lo contrario cuando la resolución de
las muestras proteicas es difícil de llevar a cabo, se incluye en el gel un agente
desnaturalizante, siendo el más comúnmente utilizado el detergente dodecil sulfato de sodio
(SDS) en concentraciones entre 1 y 2%. En este sistema disociador se logra la disociación
de los agregados de macromoléculas en las subunidades polipeptídicas. Existen otros
agentes disociantes como urea, ácido acético, ac. Acético más fenol, detergentes no iónicos,
o cambios de pH. Con el SDS, la mezcla proteica se desnaturaliza calentando al 100º C
durante 1 a 2 min en presencia de un exceso de SDS y beta mercaptoetanol (un agente
reductor). La presencia de SDS en todo el sistema incluyendo la muestra negativiza las
proteínas, las que migrarán hacia el ánodo de acuerdo solamente a su peso molecular.

PROTOCOLO DE UNA CORRIDA ELECTROFORÉTICA DE GELES DE POLIACRILAMIDA

Reactivos y soluciones
1. 10X TBE buffer ( 0.04 M Tris-borato, 0.001 M EDTA, pH 8.0)
2. 40% acrilamida: bis {19:1) y TEMED o:Acryl-a-Mix Solution (6%)
3. 0.5 % ácido acético en 95% de etanol.
4. Azul de bromofenol: 1mg/ml en H20 bidestilada.
5. Solución de persulfato de amonio: persulfato de amonio 10% en H20 bidestilada.
6. TEMED

Procedimiento
- Se preparan los soportes planos.
- Se preparan las soluciones del gel separador. Se cargan los soportes con la solución
de acrilamida-bisacrilamida.
- Se agrega agua en el borde superior, se deja gelificar.
- Se preparan las soluciones del gel concentrador. Se agrega sobre el primer gel,
previo secado del agua. Se deja gelificar.
- Se preparan las muestras para la corrida, diluyendo en cantidad suficiente del buffer
de preparación de muestras, se calienta a baño maría a 100º C durante un minuto y
medio.

- 17 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

- Se arma el aparato de electroforesis, se coloca el buffer de corrida en las cubas


respectivas.
- Se siembran 25l de cada muestra.
- Se corre en el gel de concentración a 17 mA durante aproximadamente ½ hora y a
25 mA en el gel de resolución.

TEÑIDO CON PLATA

Este protocolo describe el uso del DNA Silver Staining System de Promega. Un sistema
contiene suficiente reactivo para teñir 10 medidas de gel e incluye: ,

. 500 µl de silano en pasta


. 20µl de nitrato de plata (10 x 2g)
. 60 ml de formaldehído, 37 % (20 x 3ml)
. 10 ml de tiosulfato de sodio, 10 mg/ml (10 x 1 mi)
. 600 g de carbonato de sodio (10 x 60 g)

Reactivos no provistos:
. Solución fix/stop,
. Solución de manchado
. Solución reveladora

Procedimiento

1. Después de la electroforesis, vaciar la cámara de buffer y afloje con cuidado los


sujetadores del gel. Retire los platos de vidrio del aparato.
2. Ubique el gel (platos de vidrio) en una superficie plana. Remueva el peine y los
espaciadores del costado. Use una cuña de plástico para separar dcon cuidado los
dos platos de vidrio. El gel debería estar fuertemente adherido al plato de vidrio
corto.
3. Ubique el gel (adherido al plato corto) en una bandeja de plástico poco profunda
(tina de lavado NALGENE®).
NOTA. EL USO DE Silver Múltiple Holder permite simultáneamente el teñido de
plata de dos o más geles usando aproximadamente la misma cantidad de tiempo uy
reactivos. Si dos geles son teñidos, ubique el lado expuesto del gel de ambos platos
hacia arriba mientras está la solución.
Para el teñido de plato:
Paso Solución Tiempo
a. solución fix/stop 20 minutos
b. agua desionizada 2 minutos
c. repita paso b dos veces 2 x 2 minutos
d. solución de teñido 30 minutos
e. agua desionizada 10 segundos
f. solución reveladora (4-10ºC) hasta 5 minutos

- 18 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

g. solución fix/stop 5 minutos


b. agua desionizada 2 minutos
4. Posicione el gel verticalmente y deje secar durante toda la noche.

ELECTROFORESIS DE CAMPO PULSADO

La electroforesis de campo pulsado se basa en la reorientación periódica del campo


eléctrico que permite la separación de moléculas de ADN del orden de las 2 megabases
(Mb). Las moléculas de ADN de mayor tamaño se resuelven porque son selectivamente
retardadas en el campo pulsado. Las alternancias en la polaridad de los electrodos producen
cambios en la dirección de migración; la velocidad de reorientación de las moléculas de
ADN varía en función del tamaño. Una explicación de ésto es que una molécula de ADN
de elevado peso molecular utiliza una porción considerable de cada ciclo reorientándose
con respecto al campo. Existen diferentes tipos de electroforesis de campo pulsado: FIG,
RGE, TAFE y CHEF. Actualmente el más empleado es el CHEF (Contour-clamped
homogeneous electric field) emplea un arreglo geométrico de los electrodos para producir
un campo que es reorientado electrónicamente. Múltiples electrodos dispuestos alrededor
de un círculo están sujetos a potenciales iguales en un campo uniforme. El grado de
uniformidad del campo aumenta con el número de electrodos, en consecuencia los geles
pueden correrse libres de cualquier distorsión significativa.
El primer equipo de CHEF fue construido con los electrodos dispuestos en un cuadrado de
tal manera que el campo estaba reorientado por 90º. Aunque la migración de las moléculas
de ADN fue uniforme a lo largo del gel, la resolución fue pobre. Posteriormente se ensayó
un diseño en donde los electrodos estaban dispuestos en forma hexagonal, originando un
ángulo de reorientación de 120º, lo cual produjo una excelente resolución en moléculas de
ADN por arriba de las 10 Mb.

- 19 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

3- Actividades prácticas

A- Búsqueda del gen pcoA en cepas de actinomycetes mediante PCR


Los genes pcoA y pcoR forman parte del operon pco (plamid-borne copper resistance)
presente en el plasmido pRJ1004 detectado en una cepa de E. coli resistente a cobre. A su
vez, dichos genes fueron detectados mediante PCR en aislamientos de suelo lo cual sugiere
la posible transferencia de los genes pcoA y pcoR en cepas de actinomycetes tolerantes a
cobre.

Materiales:
o Buffer STR
o DNA polimerasa
o Primers: pcoA1- pcoA2
o ADN
o Agua bidestilada estéril
o Micropipetas – Tips – Tubos de PCR – Termociclador.
o Agarosa – Cuba de electroforesis – Marcador de PM 1kb
o Bromuro de etidio - Analizador de imagenes

Metodología
1. Preparar la mezcla de reaccion (volumen final 25 ul)

Buffer STR 10X 2,5 ul


Primers
F (pcoA1) 0,2 ul
R (pcoA2) 0,2 ul
DNA polimerasa 0,2 ul
ADN 1 ul
H2O bd esteril 20,9 ul

2. Realizar la PCR usando las siguientes condiciones

95ºC 5‟
95ºC 90‟‟
57ºC 90‟‟ 35 ciclos
72ºC 2‟
72ºC 7‟
4ºC inf

3. Visualizar los productos de PCR en gel de agarosa al 0,8%. Usar el marcador de


peso molecular 1kb (Promega).

4. Una muestra de los resultados que se consiguen aparece en la gráfica siguiente:

- 20 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

1 2 3 4 5 6 7 8 9 10

Primera banda: Amplificación de 300pb esperada


Segunda banda: Dímero de cebadores

Calle 1: marcador de 1 kpb ("ladder")


Calle 2: control positivo
Calle 3: control negativo
Calles 4 a 10: resultado de la PCR de distintas colonias

- 21 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Trabajo Práctico N2


VECTORES DE CLONADO

1- Objetivos

• Que el alumno comprenda la importancia del uso de los vectores de clonado para la
tecnología del ADN recombinante.
• Que el alumno conozca las aplicaciones y usos de los vectores de clonado.
• Que el alumno adquiera destrezas conducentes a la manipulación de vectores de
clonado en el laboratorio.
• Que el alumno pueda interpretar los resultados obtenidos en relación al objetivo del
experimento planteado.

2- Introducción

TECNOLOGIA DEL ADN RECOMBINANTE

La tecnología del ADN recombinante constituye una suma de técnicas siendo las más
importantes:
 La rotura específica del ADN mediante nucleasas de restricción, que facilita el
aislamiento y la manipulación de los genes individuales.
 La secuenciación rápida de todos los nucleótidos de un fragmento purificado de
ADN, que posibilita determinar los límites de un gen y la secuencia de aminoácidos
que codifica.
 La hibridación de los ácidos nucleicos que hace posible localizar secuencias
determinadas de ADN o ARN, utilizando la capacidad que tienen estas moléculas
de unirse a secuencias complementarias de otros ácidos nucleicos.
 La clonación del ADN, mediante la cual se puede conseguir que un fragmento de
ADN se integre en un elemento génico autorreplicante (vectores de clonado y
expresión) que habita en una bacteria, de tal manera que una molécula simple de
ADN puede ser producida generando muchos miles de millones de copias idénticas.
 La ingeniería genética mediante la cual se pueden alterar secuencias de ADN
produciendo versiones modificadas de los genes, los cuales se pueden insertar a
células u organismos.

VECTORES DE CLONADO

Un Vector es un agente que lleva un fragmento de ADN foráneo a una célula huésped. Si
se lo utiliza con el fin de reproducir el fragmento de ADN, se llama vector de clonado. Si

- 22 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

se usa para expresar un gen de interés, se llama vector de expresión. Los vectores
comúnmente utilizados son plásmidos, fago Lambda, cósmidos y cromosoma artificial de
levadura (YAC).

Un típico vector de clonado. Contiene un sitio de policlonado( polilinker), un gen de


resistencia a Ampicilina (ampr) como marcador y un origen de replicación (ORI). Modelo
de clonado. Utilizando un plásmido se inserta y liga un fragmento con un gen de interés.
Capacidad de almacenaje: hasta 25 Kb.

Los plásmidos se utilizan en ingeniería genética como vectores de clonado por la facilidad
con la que se manipulan.
Un vector plasmídico se fabrica a partir de plásmidos naturales cuyos segmentos
innecesarios son eliminados, agregándose en cambio secuencias esenciales. Para clonar una
muestra de la ADN, se debe utilizar la misma enzima de restricción para cortar el vector y
la muestra de ADN. Por lo tanto, un vector contiene generalmente una secuencia
(polylinker) que pueda reconocer varias enzimas de restricción para poder utilizar el vector
para clonar diversos fragmentos de ADN.

PLÁSMIDOS.

DEFINICIÓN. REPLICACIÓN. TAMAÑO Y NÚMERO.

- 23 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Son moléculas de ADN extracromosómico circular o lineal, independientes del ADN


cromosómico. Están presentes normalmente en bacterias, y más raramente en organismos
eucariotas.

Tienen capacidad de replicación autónoma, es decir, constituyen replicones propios.


Todos los plásmidos bacterianos estudiados son de ADN de cadena doble. La inmensa
mayoría son circulares cerrados covalentemente (C.C.C.) y superenrollados aunque en
Borrelia y algunos actinomycetes existen plásmidos lineares. Algunos plásmidos poseen,
además, la capacidad de integrarse reversiblemente en el cromosoma bacteriano: en esta
situación se replican junto con el cromosoma (bajo el control de éste), y reciben el nombre
de episomas.

En cuanto al tamaño, existe una amplia gama: desde plásmidos muy pequeños (de unas 2
kb) hasta plásmidos muy grandes (ciertos plásmidos de Pseudomonas tienen 500 kb).
Incluso existen “megaplásmidos” en ciertos Rhizobium que llegan a tener 1600 kb.

Cada tipo de plásmido tiene un número medio de copias por célula característico. Por
regla general, los grandes plásmidos tienen una o dos copias por célula (plásmidos con
control estricto de la replicación), mientras que los pequeños suelen estar presentes como
varias copias (>10), denominándose plásmidos de control relajado.

En función de que los plásmidos sean o no transmisibles de una bacteria a otra por medio
de contactos intercelulares, se pueden distinguir:

- 24 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

 plásmidos conjugativos (autotransmisibles), que son aquellos que se transfieren


entre cepas por medio de fenómenos de conjugación. Algunos de estos plásmidos
no sólo se transfieren entre cepas de la misma especie, sino que son capaces de
hacerlo entre especies y géneros muy diversos, recibiendo el muy apropiado nombre
de plásmidos promiscuos o de amplio espectro de hospedadores, permitiendo
transferencia horizontal de información genética entre grupos bacterianos
filogenéticamente alejados.
 plásmidos no conjugativos, carentes de esta propiedad de conjugación. Dentro de
esta categoría existe un subgrupo, el de los plásmidos movilizables: son aquellos no
autotransmisibles que pueden ser transferidos por la acción de un plásmido
conjugativo coexistente en la misma bacteria.

Los plásmidos no suelen ser indispensables para la viabilidad de la bacteria, y muchos de


ellos se pierden en ausencia de una presión selectiva. Una bacteria puede ser “curada” de
su(s) plásmido(s), cuando desaparecen de forma espontánea o por una serie de tratamientos
experimentales (incubando las bacterias a temperaturas cercanas a la máxima o por agentes
químicos como el naranja de acridina, que se insertan entre las bases del ADN). La razón
de esta curación de los plásmidos es que esos tratamientos interfieren con su replicación sin
afectar a la replicación del cromosoma. Esto hace que en sucesivas divisiones de una
bacteria, el plásmido se vaya “diluyendo” en la población resultante.

FENOTIPOS Y FUNCIONES DETERMINADOS POR PLÁSMIDOS

Los plásmidos no suelen determinar productos esenciales para el crecimiento (por eso son
dispensables), pero en la naturaleza parece que resultan favorecidas las bacterias con algún
plásmido, quizá porque acarrean ventajas selectivas en determinados ambientes o en
determinadas condiciones. Existe una variedad de fenotipos y funciones determinados
por plásmidos:

 Resistencia a antibióticos (plásmidos R; los estudiaremos en la sección de


Genética).
 Resistencia a metales pesados (por ejemplo, resistencia a mercurio).
 Plásmidos de virulencia: producción de toxinas, factores de penetración en tejidos,
adherencia a tejidos del hospedador, etc., en ciertas bacterias patógenas.
 Producción de bacteriocinas (proteínas tóxicas producidas por bacterias que matan a
otras de la misma especie).
 Producción de sideróforos (quelatos para secuestrar iones Fe3+).
 Utilización de determinados azúcares.
 Utilización de hidrocarburos, incluyendo algunos cíclicos recalcitrantes
(degradación de tolueno, xileno, alcanfor, etc.) en Pseudomonas.
 Inducción de tumores en plantas (plásmido Ti de Agrobacterium tumefaciens).
 Interacciones simbióticas y fijación de nitrógeno en ciertos Rhizobium.

- 25 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Hay plásmidos que, aunque se pueden evidenciar por métodos físicos (p. ej., electroforesis),
no se ha podido demostrar que determinen ningún rasgo fenotípico: tales plásmidos se
califican como crípticos, constituyendo un ejemplo de “ADN egoísta” (sólo se mantienen
por su capacidad de replicación, sin necesidad de aportar ventaja selectiva clara a la
bacteria que los alberga).

REPLICACIÓN

Los plásmidos son replicones, es decir, unidades de replicación autónoma, pero no


codifican toda la maquinaria para su propia replicación. La mayoría de los plásmidos sólo
codifican unas pocas proteínas para este fin, y aprovechan la maquinaria de replicación de
la bacteria huésped (ADN polimerasas, ligasas, primasas, etc), que actúa sobre unas
secuencias del plásmido denominadas secuencias oriV, donde tiene lugar el inicio de esa
replicación. Cada tipo de plásmido se replica por uno de dos principales tipos de
mecanismos:

 Modelo de replicación en  (theta): comienza por la separación de las dos cadenas


en el sitio oriV, creando una estructura que se parece a la letra griega  (theta). En
algunos plásmidos, la replicación es unidireccional (sólo hay una horquilla de
replicación , que avanza a lo largo de la molécula, hasta que vuelve al sitio oriV, en
el que las dos moléculas hijas se separan). Otros plásmidos se replican en  por un
modelo bidireccional (dos horquillas de replicación de sentidos opuestos, que se
encuentran cerca de la mitad de la molécula). La replicación en  es frecuente en
plásmidos de bacterias Gram-negativas.

 Modelo de replicación en σ (sigma), o modelo del círculo rodante: una de las dos
cadenas es rota a nivel de oriV, de modo que el extremo 3‟ suministra el cebador
para la replicación de la “cadena adelantada”. La cadena desplazada (cadena
“menos”) funciona como cadena retrasada (“lagging”) y debe ser replicada a partir
de sitios de cebado especiales. Este tipo de replicación es frecuente en plásmidos de
bacterias Gram-positivas.

NÚMERO DE COPIAS Y SU REGULACIÓN

La regulación del número medio de copias de cada plásmido en cada bacteria es una
propiedad característica dependiente de cómo se controla el inicio de replicación, siendo
diferentes los mecanismos en los plásmidos de alto número de copias (con control relajado)
y en los plásmidos de bajo número de copias (de control estricto).

En general, los plásmidos de control relajado tienen mecanismos que inhiben el inicio de
replicación sólo cuando el número de copias ha llegado a un cierto nivel.

En cambio, los plásmidos de control estricto tienen mecanismos que logran que sólo se
repliquen una vez o un pequeño número de veces en cada ciclo celular.

- 26 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

REPARTO DE LAS COPIAS A LAS CÉLULAS HIJAS

Muchos plásmidos poseen sistemas de reparto (= partición), que tienden a asegurar que una
vez que el plásmido ha sido replicado, cada una de las células hijas va a recibir al menos
una copia. A falta de un tal sistema, y si el reparto fuera aleatorio, de vez en cuando, las
propias fluctuaciones de la segregación aleatoria harían que parte de la progenie no
recibiera una copia, con lo que quedaría curada de ese plásmido.

El reparto de las copias a las células hijas se suele deber a las llamadas funciones par, que
están cerca de los genes rep y de la zona ori. Se trata de cortas secuencias de ADN que de
alguna manera aún no aclarada, debe unirse a alguna zona de la membrana de la bacteria
que se duplica durante la división celular, de modo que cada copia, unida a una de esas
zonas, se segrega a una célula hija.

INCOMPATIBILIDAD ENTRE PLÁSMIDOS Y GRUPOS DE INCOMPATIBILIDAD

Cada plásmido, dentro de la amplia diversidad de los que se conocen, se suele clasificar
según el grupo de incompatibilidad al que pertenece (los grupos de incompatibilidad se
suelen denominar con las siglas Inc seguidas de una letra mayúscula (por ejemplo IncP,
IncFII, etc.). Se dice que dos plásmidos son incompatibles cuando no pueden coexistir
establemente en la misma bacteria en ausencia de una presión selectiva permanente. Grupo
de incompatibilidad es el conjunto de plásmidos incompatibles entre sí. La
incompatibilidad depende del hecho de que los distintos miembros de un mismo grupo
poseen el mismo tipo de sistema de control del número de copias y de reparto de dichas
copias a las células hijas. En cada célula con dos plásmidos distintos del mismo grupo de
incompatibilidad, el número total de copias nA+nB = N (determinado por el sistema de
control) no varía, pero por fluctuaciones aleatorias en el reparto, algunas células heredan
más copias de uno de los plásmidos que del otro, y tras varias generaciones aparecen
células carentes de uno o del otro plásmido (nA = 0 y nB = N, o viceversa).

BACTERIÓFAGOS

Los bacteriófagos (fago lambda) constituyen otra forma de transporte de secuencias de


interés de un organismo a otro. En este caso, el gen es ligado con el ADN viral que luego se
empaqueta y por el mecanismo de transducción, se introduce a una célula huésped. La
ventaja principal del fago λ es su alta eficacia de transformación, cerca de 1000 veces más
eficiente que el vector plasmídico. Las extremidades del ADN del fago lambda se conocen
como sitios cos, cada uno simple cadena de 12 nucleótidos de largo. Debido a que sus
secuencias son complementarias entre sí, las secuencias terminales del DNA del fago
pueden aparearse, formando concatámeros. Los dos extremos del DNA del fago pueden
también ligarse, formando una ADN circular. Capacidad de almacenaje: hasta 25 Kb.

- 27 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

CÓSMIDOS

Los cósmidos surgen de una combinación de vectores plasmídicos con fragmentos de ADN
derivados del genoma del fago lambda que poseen un borde cohesivo (extremos cos). Estos
extremos permiten que el ADN se circularice y asemeje un plásmido con capacidad de
empaquetar fragmentos largos de ADN en el interior de un fago (hasta 45 kb). Otra ventaja
lo constituye su alta eficiencia de transformación.

- 28 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Clonación usando cósmidos. (a) Además de Ampr, de ORI, y de polylinker como en el


vector plasmídico, el cósmido también contiene un sitio cos. (b) Después de que los
cósmidos son cortados con enzimas de restricción, se ligan con los fragmentos de ADN.
Los pasos subsecuentes de ensamblaje y transformación son iguales que en la clonación
con fagos λ.

YACs

Los cromosomas artificiales de levadura (YAC) son vectores capaces de llevar largos
fragmentos de DNA (hasta 2 Mb) pero su eficiencia de transformación es muy baja.

- 29 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Una vez ligado el ADN de interés con el vector se transforman células de levadura para
obtener un gran número de copias.

Secuencias esenciales en YAC

o Centrómeros (CEN), telómeros (TEL) y secuencias de replicación autónomas


(ARS) para proliferación in la célula huésped.
o ampr para amplificación selectiva y marcadores tales como TRP1 y URA3 para
identificar células conteniendo vectores YAC.
o Sitios de reconocimiento de enzimas de restricción (por ej: EcoRI y BamHI)

MARCADORES

Los vectores de clonado deben llevar otros genes denominados marcadores, que sirven
para identificar las células que contienen el vector de clonación. Se suelen utilizar como
marcadores:

 Genes de resistencia a antibióticos. Sirven para identificar bacterias que contienen


el vector de clonación, porque estas bacterias serán resistentes al antibiótico del gen
marcador.
 Genes de luminiscencia (GFP, EGFP).. En este caso, la célula que contenga el gen
que se quiere clonar, tendrá la propiedad de emitir luz, ya que el marcador que se le
incorpora determina que se exprese esa característica. Este sistema se emplea
cuando la célula hospedadora es una célula eucariota.
 Gen lacZ (operón β glucosidasa). El gen lacZ’ presente en el plásmido contiene un
sitio de policlonado. En ausencia de inserto, la bacteria en medio con el inductor
IPTG y del sustrato X-gal, produce -galactosidasa, que convierte el sustrato X-gal
a una sustancia azul, por lo que las colonias aparecen de este color. Si hay un inserto
interrumpiendo el gen lacZ’, la bacteria no produce -galactosidasa, y las colonias
aparecen blancas.

- 30 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

3- Actividades prácticas

EXTRACCIÓN DE ADN PLASMIDICO


SOLUCIONES PARA AISLAMIENTO Y PURIFICACIÓN DE ADN PLASMÍDICO.
1. Pellet obtenido a partir de 1 ml de medio de cultivo de E. coli overnight.
2. Solución I: glucosa 50 mM; Tris HCl 25 mM pH 8; EDTA 10 mM pH 8,0.
3. Solución II: SDS 1%; NaOH 0,2 N.
4. Solución III: Acetato de potasio, 5 M; ácido acético, pH 4,8
5. Fenol-cloroformo- alcohol isoamílico (25:24:1).
6. Cloroformo- alcohol isoamílico 24:1 (v/v).
7. Isopropanol.
8. 70 % etanol.

PROTOCOLO PARA AISLAMIENTO Y PURIFICACIÓN DE ADN PLASMÍDICO.

- Se inocula 10 ml de un medio LB con una cepa de E. coli de interés y se incuba a


37º C durante toda la noche.
- - Las células se recuperan por centrifugación. El precipitado celular se resuspende
en 200 l de solución I fría. Se incuba 5 minutos en hielo.

- 31 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

- Se agrega 400 l de solución II Se homogeneiza suavemente y se incuba 5 minutos


en hielo. Esta solución produce lisis celular y desnaturaliza el ADN y las proteínas. Tiene
el pH entre 12 y 12,5, en el cual el ADN cromosómico es selectivamente desnaturalizado,
mientras que el ADN plasmídico covalentemente cerrado no es afectado. Las proteínas
también son desnaturalizadas a este pH, reduciendo la posibilidad de degradación
enzimática del ADN plasmídico. El SDS lisa las células y desnaturaliza las proteínas.
- Se agrega 300 l de solución III fría. Se mezcla por inversión varias veces y se
incuba 5 minutos en hielo. En este paso la mezcla es neutralizada por adición de la solución
de acetato de sodio con un pH 4,8. Al descender bruscamente el pH, el ADN cromosomal
forma un complejo insoluble, que junto con el complejo formado por la proteína y el SDS
es precipitado en un medio con alta concentración salina.
- Se centrífuga a temperatura ambiente durante 5 a 7 minutos y se recupera el
sobrenadante en un nuevo tubo.
- Se agrega un volumen de fenol, se mezcla, se centrífuga y se recupera la porción
superior. El fenol desnaturaliza las proteínas y remueve selectivamente el ADN
desnaturalizado a partir de la solución acuosa.
- Se agrega un volumen de cloroformo: alcohol isoamílico para extraer el fenol, se
mezcla, se centrífuga y se recupera la parte superior. Este paso se repite dos veces.
- Al sobrenadante se le agrega un volumen de isopropanol frío. Se mezcla invirtiendo
varias veces y se incuba en freezer a –20º C durante 2 horas. Se centrífuga 15 minutos y se
elimina el sobrenadante.
- Se agrega 500 l de etanol 70%. Se deja a temperatura ambiente por 15 minutos y
se centrífuga 30 segundos.
- Se seca al vacío y se resuspende en 20l de TE ( Tris HCI 10 mM; EDTA 1 mM;
pH 8,0 ) estéril. Se conserva en freezer a –20º C.
- Visualizar los plásmidos en gel de agarosa al 0,8%. Usar el marcador de peso
molecular 1kb (Promega).
- Cuando se realizá la extracción los plásmidos pueden presentarse de tres formas
(que coexisten o no): superenrollados (supercoiled), lineales (linear; con dos hebras
cortadas)y circulares abiertos (open circular; con una hebra cortada). En la figura siguiente,
se pueden observar los tres tipos de conformaciones que Ud. puede visualizar en el gel
luego de la extracción y corrida de los plásmidos en el práctico:

- 32 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

- 33 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Trabajo Práctico N3


BIOINFORMÁTICA

1- Objetivos

• Que el alumno comprenda los conceptos teóricos y prácticos que son área de
estudio de la bioinformática.
• Que el alumno comprenda la importancia de esta disciplina en la labor del biólogo
contemporáneo.
• Que el alumno conozca las aplicaciones de esta disciplina en las ciencias biológicas.
• Que el alumno sea capaz de manejar bases de datos disponibles on line.
• Que el alumno conozca y tenga un manejo básico de los distintos tipos de
programas bioinformáticos disponibles on line.

2- Introducción

La bioinformática es la aplicación de la tecnología de computadoras a la gestión y


análisis de datos biológicos. Esta disciplina requiere el uso y/o el desarrollo de
diferentes técnicas entre las que se incluyen informática, matemática aplicada,
estadística, ciencias de la computación, inteligencia artificial, química y bioquímica.

Es una disciplina muy utilizada actualmente para resolver problemas experimentales en


las ciencias biológicas, y tiene utilidad para muchas especialidades desde la taxonomía,
pasando por la fisiología hasta la biología molecular. Y es por ello que el biólogo
contemporáneo debe conocer y trabajar con esta herramienta desde los primeros años de
su formación universitaria.

Hay tres sub-disciplinas importantes dentro de la bioinformática:

 El desarrollo de nuevos algoritmos y estadísticas para evaluar relaciones entre


miembros de colecciones grandes de datos.
 El análisis y la interpretación de varios tipos de datos, incluyendo secuencias de
nucleótidos y de aminoácidos, dominios y estructuras de proteínas.
 El desarrollo y la puesta en práctica de herramientas que permitan el acceso y
manejo eficiente de diversos tipos de información para correlacionarlos
exactamente.

El uso de la bioinformática en el área de la Biología Molecular es importante porque:

 La sencillez de los métodos de clonado y secuenciación del ADN ha generado


una enorme cantidad de datos de secuencias de nucleótidos. Pese a que satisface

- 34 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

las ambiciones de precisión química de muchos biólogos, esta información es


inútil hasta que puedan deducirse las características significativas de las
secuencias. Los posibles patrones son difíciles de determinar, y las secuencias
que contienen muchos pares de bases resultan de un análisis difícil de realizar.
Este crecimiento explosivo en la cantidad de información biológica hizo
necesario el uso de computadoras y el desarrollo de nuevos programas para
poder almacenar, clasificar y acceder a los datos almacenados.
 Es posible realizar el análisis de expresión de miles de genes en un solo
experimento. Mientras que antes un científico investigaba la expresión de un
gen en particular implicado en una determinada enfermedad actualmente puede
estudiarse la expresión de varios genes simultáneamente. La utilización de la
bioinformática permite realizar este tipo de análisis.
 Permite la recuperación u obtención de mayores números de datos. Facilita el
proceso por el cual se desarrollan hipótesis con respecto a la función o
estructura de un gen o una proteína de interés. Hace posible la identificación de
secuencias similares en diversos organismos. Por ejemplo, el descubrimiento de
nuevas relaciones filogenéticos y nuevos patrones evolutivos.
 Durante los últimos quince años, el desarrollo de herramientas eficientes para el
almacenamiento y manejo de datos ha permitido un aumento sin precedente de
información acerca de secuencias, de estructuras y de la literatura.
 La similitud de secuencias entre genes de enfermedades humanas y genes en
organismos modelos tales como levaduras y E. coli, en los que los estudios
genéticos son mas fáciles de realizar, permite la generación de hipótesis con
respecto al posible papel de los genes humanos. En este caso, el gen asociado
con un tipo de cáncer de colon hereditario resultó ser similar a los genes MSH2
de la levadura y E. coli, que se saben están involucrados en la reparación del
ADN. El conocimiento de la función normal del gen es la base fundamental para
comprender la base molecular de la enfermedad, y posiblemente desarrollar
estrategias de tratamiento y/o prevención.

Las aplicaciones de las técnicas bioinformáticas son múltiples pero se pueden citar
algunos ejemplos:

 Comparación y alineamiento de secuencias de ADN y proteínas, para


determinar homología y relaciones de parentesco entre especies (Taxonomía-
Sistemática).
 En base a las secuencias de genes presentes en las bases de datos se pueden
hacer predicciones sobre la secuencia, estructura y propiedades de las proteínas
codificadas por los mismos de genes (Biología Molecular).
 Análisis de genomas.
 Interacciones proteína-proteína teniendo en cuenta las animaciones 3D
generadas a partir de las secuencias de aminoácidos presentes en las bases de
datos.

- 35 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

En esta clase te presentaremos direcciones de utilidad en Internet para el análisis de


secuencias y búsquedas de información y realizaremos algunas actividades prácticas de
tal manera que puedas hacer uso de los recursos de algunas de estas páginas:

PARA BÚSQUEDA DE SECUENCIAS HOMÓLOGAS

 http://www.ncbi.nlm.nih.gov/BLAST/
 http://seqtool.sdsc.edu/CGI/BW.cgi#!
 http://www.fasta.genome.ad.jp/
 http://www.ebi.ac.uk/embl/
 http://147.47.212.35:8080/index.jsp

PARA ALINEAMIENTOS MÚLTIPLES

 http://www.ebi.ac.uk/Tools/msa/clustalw2/
 http://www.toulouse.intra.fr/multalin.html
 http://dot.imagen.bcm.tmc.edu:9331/multi-align/multi-align.html

PARA COMPARACIÓN DE DOS SECUENCIAS

 http://www.ncbi.nlm.nih.gov/gorf/bl2.html

DISEÑO DE PRIMERS PARA SER UTILIZADOS EN PCR Y/O RT-PCR

 http://seqtool.sdsc.edu/CGI/BW.cgi#!
 http://www.genome.wi.mit.edu/cgi-bin/primers/primers3_www.cgi
 http://insilico.ehu.es/

TRADUCCIÓN ADN A PROTEÍNAS

 http://expasy.cbr.nrc.ca/tools/dna.html
 http://www2.ebi.ac.uk/translate/

IDENTIFICACIÓN DE PAUTAS DE LECTURAS Y ANÁLISIS DE PROTEÍNAS

 http://seqtool.sdsc.edu/CGI/BW.cgi#!

IDENTIFICACIÓN DE SECUENCIAS CONSENSO Y DOMINIO ESTRUCTURALES

 http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi
 http://www.smart.embl.heidelberg.de/
 http://www.expasy.ch/

- 36 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

3- Actividades prácticas

3.1. Búsqueda y comparación de secuencias de ADN en bases de datos.

El ARN ribosómico (ARNr) 16S es la macromolécula más ampliamente utilizada en


estudios de filogenia y taxonomía bacterianas. Su aplicación como cronómetro molecular
fue propuesta por Carl Woese (Universidad de Illinois) a principios de la década de 1970.
Woese introdujo el término dominio para sustituir al reino como categoría taxonómica de
rango superior, y distribuyó a los organismos celulares en tres dominios: Bacteria, Archaea
y Eukarya, el último de los cuales engloba a todos los seres eucariotas. Desde entonces, el
análisis de los ARNr 16S se ha utilizado ampliamente para establecer las relaciones
filogenéticas dentro del mundo procariota, causando un profundo impacto en nuestra visión
de la evolución y, como consecuencia, en la clasificación e identificación bacteriana.

En este primera actividad, vamos a buscar la secuencia de ADN que codifica para el ARNr
16S de una bacteria en la base de datos NCBI y la vamos a comparar utilizando el
algoritmo BLAST con las secuencias cercanas para construir un árbol filogenético.

El National Center for Biotechnology Information (NCBI) es parte de la Biblioteca


Nacional de Medicina de Estados Unidos (National Library of Medicine), una rama de los
Institutos Nacionales de Salud (National Institutes of Health o NIH). Está localizado en
Bethesda, Maryland y fue fundado el 4 de noviembre de 1988 con la misión de ser una
importante fuente de información de biología molecular. Almacena y actualiza la
información referente a secuencias genómicas en GenBank, un índice de artículos
científicos referentes a biomedicina, biotecnología, bioquímica, genética y genómica en
PubMed, una recopilación de enfermedades genéticas humanas en OMIM, además de otros
datos biotecnológicos de relevancia en diversas bases de datos.

Todas las bases de datos del NCBI están disponibles en línea de manera gratuita, y son
accesibles usando el buscador Entrez. El NCBI ofrece además algunas herramientas
bioinformáticas para el análisis de secuencias de ADN, ARN y proteínas, siendo BLAST
una de las más usadas.

El BLAST (Basic Local Alignment Search Tool) es un programa informático de


alineamiento de secuencias de tipo local, ya sea de ADN o de proteínas. El programa es
capaz de comparar una secuencia problema (también denominada en la literatura secuencia
query) contra una gran cantidad de secuencias que se encuentren en una base de datos. El
algoritmo encuentra las secuencias de la base de datos que tienen mayor parecido a la
secuencia problema. Es importante mencionar que BLAST usa un algoritmo heurístico por
lo que no nos puede garantizar que ha encontrado la solución correcta. Sin embargo,
BLAST es capaz de calcular la significación de sus resultados, por lo que nos provee de un
parámetro para juzgar los resultados que se obtienen.

- 37 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Normalmente el BLAST es usado para encontrar probables genes homólogos. Por lo


general, cuando una nueva secuencia es obtenida, se usa el BLAST para compararla con
otras secuencias que han sido previamente caracterizadas, para así poder inferir su función.
El BLAST es la herramienta más usada para la anotación y predicción funcional de genes o
secuencias proteicas.

Ingresa a http://www.ncbi.nlm.nih.gov

Elige la opción “Nucleotide” y en el buscador ingresa “Amycolatopsis tucumanensis strain


ABO 16S ribosomal RNA gene”.

Copia la secuencia y entra nuevamente a la página principal.

Una vez allí, elige el link “Blast”

- 38 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Dentro de esa página, elige la opción “nucleotide blast” (compara nuestra secuencia de
ADN con otras secuencias de ADN en la base de datos).

Pegar la secuencia en el casillero vacío y poner las opciones “others” y “highly similar
sequences”, luego pinche en “blast” como se indica:

- 39 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Se obtendrá una nueva página con el alineamiento y las secuencias:

Selecciona 10 secuencias y clickea “get selected sequences”.

- 40 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Obtendrás un archivo con las secuencias en formato FASTA (este formato permite trabajar
con las secuencias en todos los programas bioinformáticos). Guárdalo para la siguiente
actividad.

Ejemplo de secuencia en formato FASTA:

>gi|113957095|gb|DQ886938.1| Amycolatopsis tucumanensis strain ABO 16S ribosomal RNA


gene, partial sequence
AGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGA
ACGCTGAAGCACCTTCGGGTGTGGATGAGTGGCGAACGGGTGAGTAACACGTGGGTAA
CCTGCCCTGTACTTTGGGATAAGCCCTGGAAACGGGGTCTAATACCGAATATGACTCGC
TAAGGCATCTTGGTGGGTGGAAAGTTTCGGCGGTACAGGATGGGCCCGCGGCCTATCA
GCTTGTTGGTGGGGTAGTGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGT
GACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGG
GAATATTGCACAATGGGCGGAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGC
CTTCGGGTTGTAAACCTCTTTCGCCAGGGACGAAGCGCAAGTGACGGTACCTGGAGAA
GAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTGT
CCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTCGCGTCTGCTGTGAAAATC
CGGGGCTTAACTCCGGACCTGCAGTGGATACGGGCAGGCTTGAGTTCGGTAGGGGAGA
CTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGA
AGGCGGGTCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAG
GATTAGATACCCTGGTAGTCCACGCTGTAAACGTTGGGCGCTAGGTGTGGGCGACTTCC
ACGTTGTCCGTGCCGTAGCTAACGCATTAAGCGCCCCGCCTGGGGAGTACGGCCGCAA
GGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGATTA
ATTCGATGCAACGCGAAGAACCTTACCTGGGCTTGACATGCACTGGAAACCGGCAGAG
ATGTCGGCCCCCTTGTGGCCGGTGTGCAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCG

- 41 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

TGAGATGTTGGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTGTGTTGCCAGCGCG
TAATGGCGGGGACTCGCGGGAGACTGCCGGGGTCAACTCGGAGGAAGGTGGGGATGA
CGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACACATGCTACAATGGCTGGTACA
GAGGGCTGCGATACCGTGAGGTGGAGTGAATCCCTTAAAGCCGGTCTCAGTTCGGATC
GCAGTCTGCAACTCGACTGCGTGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACG
CTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACGTCATGAAAGTCGGT
AACACCCGAAGCCCATGGCCCAACCCCGCTTGCGGGGAGGGAGTGGTCGAAGGTGGG
ACTGGCGATTGGGACGAAGTCGTAACAAGGTAACCGTA

3.2. Alineamiento múltiple de secuencias y construcción de arbol filogenético.

Un árbol filogenético es un árbol que muestra las relaciones evolutivas entre varias
especies u otras entidades que se cree que tienen una ascendencia común.

En biología se utilizan árboles parecidos a los genealógicos para representar cómo se


encuentran emparentados los organismos vivos, se les conoce como árboles filogenéticos.
A diferencia de los árboles genealógicos, en los que se utiliza información proporcionada
por los familiares, para los árboles filogenéticos se usa información proveniente de fósiles,
así como aquélla generada por la comparación estructural y molecular de los organismos.
Tanto los árboles genealógicos como los filogenéticos tienen un tronco y ramas, pero en los
últimos se muestran las relaciones entre taxas y no entre individuos.

Los árboles filogenéticos se construyen tomando en cuenta la teoría de la evolución, que


nos indica que todos los organismos son descendientes de un ancestro común. Así, todos
los organismos, ya sean vivos o extintos, se encuentran emparentados en algún grado.
Para la construcción de árboles se consideran un conjunto de taxas representadas por un
conjunto de carácteres. Las taxas pueden ser distintos niveles jerárquicos: especies,
familias, géneros, y se llaman generalmente Unidades Taxonómicas Operacionales (OTUs).
Un carácter es cualquier característica bien definida de la OTU que permita dividir el
conjunto de OTUs en grupos, según el valor que toma el carácter para cada OTU. Así un
subconjunto de las OTUs formará un grupo respecto a dicho carácter si comparten una
misma forma o valor de dicho carácter.

En la filogenia clásica, los caracteres utilizados para la construcción de árboles son


elementos del fenotipo, por ejemplo: tipo de anexos tegumentarios epidérmicos (escamas,
plumas, pelos, etc.). En la filogenia molecular, los caracteres son las secuencias de
nucléotidos del ADN o las secuencias de aminoácidos de una proteína.

Para la construcción de un árbol filogenético se deben seguir los siguientes pasos:

1. Definir conjunto de secuencias a analizar (DNA, RNA o proteínas) provenientes de


distintos organismos.

2. Alinear correctamente esas secuencias (Alineamiento múltiple).

- 42 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Alineamiento múltiple. La premisa básica de un alineamiento múltiple es que para


cada columna en el alineamiento cada residuo de cada secuencia es homólogo. Esto
significa que ha evolucionado desde la misma posición en una secuencia ancestral
común sin inserción ni deleción.
Los alineamientos se realizan mediante agrupamiento y comparación de secuencias
entre sí, proceso que se denomina clustering. Hace un tiempo, estos agrupamientos
se realizaban manualmente, hoy en día se utilizan programas de computación. Por
ejemplo, el Programa CLUSTALW permite el alineamiento global para un conjunto
de secuencias. Las secuencias son alineadas de a pares y los pares con puntaje
(score) más alto son luego agrupados con otras secuencias y los grupos (clusters)
son armados de acuerdo a la similitud.

3. Aplicar métodos adecuados para la construcción de árboles filogenéticos.

Para la creación de árboles en estudios filogenéticos existen básicamente dos


categorías de métodos:
 Métodos basados en distancia
o Método de agrupamiento de pares con la media aritmética no
ponderada (UPGMA)
o Método del vecino más cercano (NJ)
o Método de Minima Evolución (ME).
 Métodos basados en la composición de las secuencias
o Método de máxima parsimonia (MP)
o Método de máxima probabilidad (ML)

Cada uno de estos métodos tiene sus fortalezas y sus debilidades, pero es más
ampliamente usado NJ, ya que ha probado ser bastante eficaz.

Una vez construidos, los árboles pueden visualizarse como enraizados (tomando
una de las OTUs como referencia o outgroup) o no enraizados.

A su vez, los árboles pueden construirse como filogramas, cladogramas o


dendrogramas.

Cladograma: es el modelo básico y simplemente muestra la distancia al antecesor


común en términos relativos. Las ramas son de igual longitud por lo cual no indican
el tiempo evolutivo.

Filograma: contiene información adicional dada por la longitud de las ramas. Los
números asociados con cada rama corresponden a un atributo de las secuencias, tal
como cantidad de cambio evolutivo. Es aditivo. Métricos.

- 43 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Dendrograma: tipo especial de árbol aditivo en el cual los extremos del árbol son
equidistantes de la raíz y son proporcionales al tiempo de divergencia.
Ultramétricos.

4. Evaluar estadísticamente el árbol filogenético obtenido.

El test más simple para probar si el conjunto de datos “soportan” el árbol obtenido
es el del bootstrap.
Es un método estadístico que puede estimar las distribuciones por creación repetida
y análisis de conjuntos de datos artificiales.
Una forma de medir el error de muestreo es tomar muchas muestras de la población
estudiada y compararlas. Bootstrap simula esto pero en lugar de muestrear de una
población “remuestrea” los datos originando pseudorréplicas. Por ejemplo, un
boostrap de 100 implica que el árbol se construyó 100 veces, para determinar si
estadísticamente la constitución final del árbol fue la acertada.

Ahora procedemos a hacer el alineamiento múltiple para construir el árbol:

Ingresa a http://www.ebi.ac.uk/Tools/msa/clustalw2/

Copia y pega las secuencias obtenidas en el ejercicio anterior, en el espacio de Step 1


como a continuación:

Luego presione el botón rojo en el step 4, esto iniciará el alineamiento múltiple:

- 44 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Se obtendrá el siguiente alineamiento, debes guardarlo en tu computadora utilizando la


opción “Download Alignment File”.

Ahora debes ir a la opción Philogeny, y dentro de esa opción debes subir tu archivo de
alineamiento que guardaste anteriormente, luego presiona el botón rojo “Submit”, lo cual te
permitirá construir el árbol filogenético. Por default, utilizamos el método de NJ para
construir el árbol.

- 45 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Obtendras el siguiente árbol, donde se pueden observar las relaciones de parentezco del
organismo problema en relación a otros organismos que existen en la base de datos.

3.3. Identificación de secuencia de proteínas en base de datos.

- 46 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Tomando una secuencia de proteínas, podemos llevarla a la base de datos para compararla e
identificar la función de la misma. La secuencia de aminoácidos de la proteína X es la
siguiente (el docente se la facilitará via electrónica en formato fasta):

>Proteína X
TAAYQIEGAYNEDGRGMSIWDTFAHTPGKVKNGDNGNVACDSYHRVEEDVQLLK
DLGVKVYRFSISWPRVLPQGTGEVNRAGLDYYHRLVDELLANGIEPFCTLYHWDL
PQALQDQGGWGSRITIDAFAEYAELMFKELGGKIKQWITFNEPWCMAFLSNYLGV
HAPGNKDLQLAIDVSHHLLVAHGRAVTLFRELGISGEIGIAPNTSWAVPYRRTKED
MEACLRVNGWSGDWYLDPIYFGEYPKFMLDWYENLGYKPPIVDGDMELIHQPIDF
IGINYYTSSMNRYNPGEAGGMLSSEAISMGAPKTDIGWEIYAEGLYDLLRYTADKY
GNPTLYITENGACYNDGLSLDGRIHDQRRIDYLAMHLIQASRAIEDGINLKGYMEW
SLMDNFEWAEGYGMRFGLVHVDYDTLVRTPK

Siendo tu un especialista en bioinformática, debes comparar y otorgar toda la información


posible acerca de la secuencia más cercana (con mayor identidad) que encuentres por
comparación en la base de datos (NCBI).

Para ello completa los datos que se requieren a continuación:

LOCUS __________________________________________________

DEFINITION _____________________________________________

ACCESSION ______________________________________________

VERSION ________________________________________________

KEDWORDS _______________________________________________

SOURCE _________________________________________________

ORGANISM _____________________________________________

REFERENCE ______________________________________________

AUTHORS ______________________________________________

- 47 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

TITLE ________________________________________________

JOURNAL _______________________________________________

3.4. Diseño de oligonucléotidos

Para la detección de un gen específico dentro de un genoma se pueden utilizar diversas


estrategias (por ej.: hibridación, análisis de expresión, PCR, etc.).

El empleo de la PCR implica varias etapas, y su complejidad depende de varios factores,


entre ellos podemos considerar, por ejemplo si:

 ¿Es un gen ampliamente distribuído o es específico de un grupo de organismos en


particular?
 ¿Se conoce la secuencia de ADN completa del gen o sólo se conoce la secuencia de
la proteína codificada por ese gen?
 ¿Es un gen altamente conservado o varía considerablemente entre organismos
relacionados?

En el TP Nº1 (PCR) se encuentran las consideraciones más importantes a tener en cuenta


para el diseño de primers. En este práctico, aprenderemos a cómo diseñar los
oligonucleótidos para realizar una reacción de PCR para detectar el gen de la enzima
Superóxido Dismutasa de Niquel (SodN) en la cepa Streptomyces sp. BM.

1. Búsqueda en base de datos de secuencias de la SodN.


a. Abrir un navegador de internet
b. En la barra de direcciones pegar: http://www.ncbi.nlm.nih.gov/
c. En la pestaña All databases seleccionar Nucleotide (se conoce la secuencia
del gen SodN)
d. En la pestaña Search escribir Ni-containing superoxide dismutase. Presionar
Search.

- 48 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

2. Seleccionar la 4º opción de la lista (para este caso es apropiado, porque sabemos


que corresponde a la enzima que estamos buscando).

- 49 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

3. Buscar en la página SodN

- 50 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

4. Seleccionar gene

5. Copiar la secuencia resaltada y pegarla en un archivo de texto.


>SodN
Atgctttcccgcctgtttgcccccaaggtcacggtcagcgcccactgcgacctgccctgcggcgtgtacgaccctgcccagg
cccgcatcgaggcggagtcggtgaaggccgtccaggagaagatggccggcaacgacgacccgcacttccagacgcgcg
ccacggtcatcaaggagcagcgcgccgagctcgcgaagcaccacgtctccgtgctgtggagcgactacttcaagcccccg
cacttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggccctgtcggccgccaagggctcgaagga
cccggcgaccggccagaaggccctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga

- 51 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

6. Seleccionar BLAST y pegar la secuencia. Correr el BLAST.

- 52 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

7. Seleccionar y copiar las secuencias de ADN de:


a. Streptomyces avermitilis MA-4680
b. Streptomyces acidiscabies strain E13
c. Streptomyces flavogriseus ATCC 33331
d. Streptomyces peucetius ATCC 27952

>S. coelicolor A3(2)


atgctttcccgcctgtttgcccccaaggtcacggtcagcgcccactgcgacctgccctgcggcgtgtacgaccctgcccagg
cccgcatcgaggcggagtcggtgaaggccgtccaggagaagatggccggcaacgacgacccgcacttccagacgcgcg
ccacggtcatcaaggagcagcgcgccgagctcgcgaagcaccacgtctccgtgctgtggagcgactacttcaagcccccg
cacttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggccctgtcggccgccaagggctcgaagga
cccggcgaccggccagaaggccctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga

>S. avermitilis MA-4680


atgctctcccgcctgtttgcccccaaggtcaaggtcagcgcgcactgcgacctgccctgcggtgtgtacgacccggcccagg
cccgcatcgaggcggagtcggtgaaggccgtccaggaaaagatggccggcaacgacgacccgcacttccaggctcgcgc
cacggtcatcaaggagcagcgcgccgagctcgccaagcaccacgtgtcggtgctctggagcgactacttcaagcccccgc
acttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggccctctcggccgccaaggcgtccacggac
ccggccacgggccagaaggcgctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctgactttcc
cgcctgtttgcccccaaggtcaaggtcagcgcgcactgcgacctgccctgcggtgtgtacgacccggcccaggcccgcatc
gaggcggagtcggtgaaggccgtgcaggacaagatggccgccaacgacgaccctcacttccaggctcgcgcgaccgtca
tcaaggagcagcgcgccgagctcgccaagcaccacgtctcggtgctgtggagcgactacttcaagcctccgcacttcgaga
agtacccggagctgcaccagctggtcaacgacgccctgaaggccctctcggccgccaaggcgtccaccgacccggcgac

- 53 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

gggccagaaggcgctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga

>S. acidiscabies E13


atgctctcccgcctgtttgcccccaaggtgaaggtcagcgcgcactgcgacctgccctgcggcgtgtacg
acccggcccaggcccgcatcgaggcggagtcggtgaaggccgtccaggaaaagatggccggaaacgacga
ccctcggttccagacgcgcgccgtcgtcatcaaggagcagcgcgccgagctcgccaagcaccacgtgtcg
gtgctctggagcgactacttcacgcccccgcacttcgagaagtacccggagctgcaccagctggtcaacg
acaccctgaaggccctctcggccgccaaggcgtccgccgacccggcgaccggccagaaggccctcgacta
catcgcccagatcgacaagatcttctgggagaccaagcaggcttga

>S. flavogriseus
atgctttcccgcctgtttgcccccaaggtgaaggtcagcgcccactgcgacctgccctgcggcgtgtacgacccggcccagg
cccgcatcgaggccgagtccgtcaaggccgtccaggagaagtaccaggccaatgaggacgcggacttccgcacccgcgc
cgttctgatcaaggaacagcgtgccgagctcgcgaagcaccacgtctcggtgctctggagcgactacttcaagcccccgcac
ttcgagaagtacccggagctgcaccagctggtcaacgacaccctgaaggcgctctccgcggccaagggctcgaacgaccc
ggccacgggccagaaggctctggacctgatcgcccagatcgacacgatcttctgggagaccaagaaggcctga

>S .peucetius ATCC27952


atgctctcccgcctgtttgcccccaaggtgaaggtcagcgcccactgcgacctgccttgcggtgtgtacgacccggcccagg
cccgcatcgaggcggagtcggtcaaggccgtccaggagaagtaccaggccaacgaggacccgcacttccgcgcccgcg
ccacggtcatcaaggagcagcgcgcggagctcgccaagcaccacgtctcggtgctgtggagcgactacttcaagcccccg
cacttcgagaagtacccggagctgcaccagctcatcaacgacacgctcaaggcgctctcggccgccaagggctcgacgga
cccggcgaccggccagaaggccctggactacatcgcccagatcgacaagatcttctgggagaccaagaaggcctga

8. Abrir el programa DNAMAN y cargar todas las secuencias.

9. Realizar el alineamiento de las 5 secuencias. Seleccionar el ícono alineamiento y


luego presionar Channel y seleccionar las 5 secuencias.

- 54 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

10. Analizar el alineamiento. Ir a Output/Sequence File/ DNAMAN 2

- 55 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

11. Copiar la secuencia consenso y pegarla en el canal 6.

12. Ir a Primer/Design PCR Primers for DNA y seguir los pasos indicados en las
pantallas siguientes:

- 56 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

- 57 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

- 58 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

13. Evaluar las características de los pares de primers generados por el programa.
a. Copiar la secuencia del primer cebador, ir a Primer/Load primer/ From input
y pegar la secuencia.
b. Ir a Primer/Self complementary. Analizar.
c. Ir a Primer/Two primer complentarity/Second primer from input y pegar el
segundo primer. Analizar.
d. Para este primer repetir el punto b
e. Repetir para todos los pares de primers obtenidos.
f. Seleccionar el par de primer más adecuado.

3.5. PCR in silico.

Para saber si los oligos diseñados permiten amplificar la secuencia de interés, tienes que
realizar una PCR in silico (virtual, utilizando herramientas bioinformáticas) utilizando el
genoma disponible del organismo similar al modelo que tienes. Para ello, debes ingresar en
http://insilico.ehu.es/PCR/

- 59 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

De la lista de genomas que se te despliega debes elegir “Streptomyces” y luego ingresas a


una página donde debes pegar la secuencia de los primers que diseñaste anteriormente.

Luego de apretar el botón “Amplify” te aparecerá una nueva ventana, contesta las
siguientes preguntas:

- 60 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

a- ¿Cuántas bandas se amplifican?


b- ¿Qué tamaño tienen?
c- Si haces un BLAST de esas secuencias, ¿a qué genes corresponden?

- 61 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Trabajo Práctico N4


SECUENCIACIÓN Y GENÓMICA

1- Objetivos

• Que el alumno comprenda y maneje términos referentes a procesos de


secuenciación y análisis de genomas.
• Que el alumno comprenda la importancia de la era genómica en la revolución de las
ciencias biológicas.
• Que el alumno conozca las aplicaciones de esta disciplina en las ciencias biológicas.
• Que el alumno sea capaz de analizar genomas mediante programas y bases de datos
disponibles on line.
• Que el alumno conozca y tenga un manejo básico de los programas bioinformáticos
más usados, disponibles para anotaciones de genes.

2- Introducción

SECUENCIACIÓN

La secuenciación del ADN es la técnica que permite determinar la secuencia, es decir, el


orden de bases de nucleótidos en una determinada porción continua de ADN, pudiendo ser
esta porción parte de un gen, un gen completo o incluso un genoma.
La primera generación de técnicas para efectuar la secuenciación del ADN empezó en 1975
con la metodología de Sanger y Coulson, la “más y menos” (del inglés, “plus and minus”),
la cual necesitaba clonar cada lectura inicial para producir un ADN de cadena simple. En
1977, Maxam y Gilbert publicaron la metodología de secuenciación de ADN mediante
degradación química. Este método estaba basado en la modificación química y posterior
rotura del ADN, y empezó a ser el método de secuenciación más utilizado porque permitía
utilizar un ADN purificado sin necesidad de clonarlo. El mismo año Sanger publico el
método de secuenciación de ADN por síntesis química o enzimática, que estableció un
nuevo estándar para los próximos 30 años. El método de Sanger permitía leer 25 bases (b) y
más tarde, 80 b, utilizando los terminadores dideoxi. El método fue optimizado con la
utilización de dideoxinucleótidos fluorescentes en vez de productos tóxicos y radioisótopos,
detección automatizada, mayor rendimiento y precisión, permitiendo leer 1.000 b.
Estos avances representaron una revolución fascinante, porque permitieron descifrar
inicialmente genes y eventualmente los genomas completos, aunque con un alto costo para
el segundo caso.

El método de Maxam y Gilbert para secuenciar ADN


El método de Sanger para secuenciar ADN.

- 62 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

La segunda generación de plataformas de secuenciación de ADN (también llamada de


siguiente generación; del inglés, “next-generation”) fue desarrollada hace sólo cinco años,
aumentando la efectividad de la secuenciación del ADN algunos ordenes de magnitud. Así,
permitió generar lecturas de gigabases en una sola corrida o experimento (del inglés,
“run”). Cuatro plataformas de segunda generación han sido comercializadas por el
momento:
1) El instrumento 454 (454 Life Sciences), está basado en emulsión, secuenciación por
síntesis (SBS; del inglés, “sequencing-by-synthesis”) y pirosecuenciación. Este desarrollo
fue publicado en 2005, comprado por Roche Diagnostics en 2007 y vendido como el
“Genome Sequencer 20 System” y el “Genome Sequencer FLX System” (Roche Applied
Sciences) <https://www.roche-appliedscience. com/sis/sequencing/index.jsp>. La
tecnología 454 empezó leyendo 100 b, después de 16 meses podía leer 250 b, y ahora más
de 400 b.
2) El protocolo de secuenciación de „polonias‟ multiplexadas (del inglés, “multiplex polony
sequencing protocol”) es parecido al método mencionado anteriormente, pero es más barato
porque usa instrumentos y reactivos estándar. Las bibliotecas genómicas obtenidas por la
técnica de perdigonazos (del inglés, “shotgun genomic libraries”) son amplificadas en
microesferas mediante PCR por emulsión. Después, son utilizadas como sustratos para
hacer la secuenciación con las reacciones fluorescentes de ligación nonamérica sobre un
portaobjetos de microscopio, generando millones de lecturas de 26 pares de bases (pb), de
modo que cualquier laboratorio pueden desarrollar este método.
3) El “Genome Analyzer System” (Solexa) combina la química SBS con terminadores y
tecnología de grupos (del inglés, “cluster”). La compañía fue adquirida por Illumina en
2007, produciendo el “Genome Analyzer Sequencing System”
<http://www.illumina.com/pages.ilmn?ID=204>. Este tipo de tecnología genera diez veces
más lecturas que la 454, pero con solamente 35 b o menos en longitud.
4) El “SOLiD System” (Applied Biosystems) usa una química basada en ligasa y fue
producido en 2007 <http://solid.appliedbiosystems.com>.
La segunda generación de plataformas de secuenciación de ADN difiere de los métodos
tradicionales de secuenciación en dos aspectos:
a) En vez de hacer una secuenciación de clones de ADN de algunos individuos (p. ej., 96
secuenciaciones de sustratos en un secuenciador capilar Sanger), cientos de miles (sistema
454) o miles de millones (Solexa y SOLiD) de moléculas de ADN son secuenciadas en
paralelo, usando volúmenes de reacción menores.
b) Las secuencias obtenidas son generalmente mucho más cortas (25-50 nucleótidos para
las tecnologías de „polonias‟, Solexa y SOLiD, aunque pueden alcanzar 200- 400
nucleótidos para el sistema 454) que las generados por secuenciación tradicional.
No obstante, el costo de los nuevos instrumentos es mayor
(aproximadamente, unos 500.000 dólares) que los que usan el método de Sanger (de 10.000
a 100.000 dólares), que también pueden realizarse con instrumentación manual más barata
usando radioisótopos o fluoróforos. Métodos de Secuenciación de DNA y equipos de
secuenciación masiva. Como ejemplo práctico de estos avances, la primera secuenciación
del genoma humano ( Homo sapiens sapiens) ha requerido cientos de máquinas trabajando
24 horas al día, durante 13 años, con un costo de más de 300 millones de dólares. Más

- 63 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

tarde, el genoma diploide de una sola persona (J. Craig Venter) fue leído mediante
secuenciación de genomas completos por perdigonazos (del inglés, “wholegenome shotgun
sequencing”), necesitando 10 años y 70 millones de dólares, usando la tecnología
optimizada de Sanger. Por su parte, el genoma de Watson fue secuenciado en sólo dos
meses y un costo de un millón de dólares, usando la maquina “454 Life Sciences”.
Otro ejemplo es la secuenciación del genoma del “ornitorrinco” ( Ornithorhynchus
anatinus), revelando marcas únicas de su evolución, con genes que aparecen en reptiles, o
aves y otros de mamíferos. Esta mezcla fascinante de características en el genoma del
“ornitorrinco” proporciona pistas sobre el rol y la evolución de los genomas de los
mamíferos.
La tercera generación (también llamada “next-next-generation”) de la secuenciación de
ADN ha sido producida en 2008, con químicas revolucionarias de una sola molécula:
1) El secuenciador HeliScope de molécula única (del inglés, “HeliScope Single Molecule
Sequencer”), de Helicos BioSciences <http://www.helicosbio.com>, fue anunciado este
año. Ofrece lecturas muy precisas de 25 a 45 bases para miles de millones (millardos) de
cadenas en un solo experimento (produciendo más que 2 Gb de datos de secuenciación por
día), y hasta un millardo de bases por hora en el futuro
<http://www.helicosbio.com/Portals/0/Vid eos/tSM S-How_It_Works.flv> Ello es debido
al uso de la verdadera secuenciación de molécula única (del inglés, “true Single Molecule
Sequencing” (tSMS), para leer hebras individuales de ADN.
2) “VisiGen Biotechnologies” <http://visigenbio.com> no ha sido producido todavía, pero
promete micromatrices masivamente paralelas (del inglés, “microarrays”) de
nanomáquinas, con una tasa de secuenciación de un Mb/s/maquina (más de 86 Gb de
secuencia de datos por día)
<http://visigenbio.com/flash/stream/visigen_movie_6mb.swf>, leyendo también moléculas
simples.
Estos avances permitirán reducir el precio de la secuenciación de uno a dos órdenes de
magnitud, lo cual propiciará el desarrollo del “la genómica personal”: hacer la
secuenciación de todo el genoma humano de cualquier persona en menos de un día, por
1.000 dólares o menos.
Por otra parte, la tercera generación de métodos de secuenciación es tan poderosa que
permite hacer estudios no solamente de genómica estructural, sino también de genómica
funcional y consenso de secuencias, incluyendo : i) ChIP-Seq, que está basado en la
inmunoprecipitación de cromatina (ChIP), para mapear in vivo las secuencias del ADN
ocupadas por proteínas de unión al ADN; ii) Sec-ARNm (del inglés, “mRNA-Seq”), para
estudiar la expresión de genes; y iii) Sec-Metil (del inglés, “Methyl-Seq”), para analizar los
patrones de metilación. Estos procedimientos se pueden aplicar también al ADN antiguo,
siempre que ADN, ADN-proteína o ARNm pueda ser aislado de tales muestras.

GENÓMICA
Un genoma es el conjunto de secuencias de ADN que caracterizan a un individuo. Por
extensión a las secuencias de ADN características de una especie se les conoce igualmente
como genoma.
La secuenciación del genoma, es un proceso de laboratorio que determina la secuencia el

- 64 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

total del ADN del genoma de un organismo de una sola vez. Esto implica la secuenciación
de todo el ADN cromosómico, así como el ADN contenido en la mitocondria y, en el caso
de las plantas, en el cloroplasto del organismo. Casi cualquier muestra biológica, incluso
una cantidad muy pequeña de ADN o de ADN antiguo, puede proporcionar el material
genético necesario para la secuenciación del genoma completo. Las muestras podrán
incluir la saliva, células epiteliales, médula ósea, el pelo (siempre y cuando el pelo
contiene un folículo del pelo), semillas, hojas de plantas, o cualquier otra parte con
células que contienen ADN. Debido a que la secuencia de datos que se produce puede ser
muy grande (por ejemplo, hay aproximadamente seis mil millones de pares de bases en
cada genoma diploide humano), los datos genómicos se almacenan electrónicamente y
requieren una gran cantidad de potencia informática y capacidad de almacenamiento. Es
por ello que la secuenciación del genoma completo habría sido casi imposible antes de la
llegada de los microprocesadores, los ordenadores y la era de la información.
A diferencia de la genética clásica que a partir de un fenotipo, generalmente por un
mutante, busca el o los genes responsables de dicho fenotipo, la genómica tiene como
objetivo predecir la función de los genes a partir de su secuencia o de sus interacciones
con otros genes. Así, la genómica tiene un enfoque distinto para responder preguntas
biológicas cuando se compara a otras ramas de la biología más tradicionales. Por lo tanto
genómica es el conjunto de ciencias y técnicas dedicadas al estudio integral del
funcionamiento, el contenido, la evolución y el origen de los genomas. Es una de las áreas
más vanguardistas de la Biología. La genómica usa conocimientos derivados de distintas
ciencias como son: biología molecular, bioquímica, informática, estadística, matemáticas,
física, etc. Muchas veces, la genómica es usada como sinónimo de otras áreas de estudio
relacionadas, como la proteómica y la transcriptómica, por ejemplo.
Las ciencias genómicas han tenido un importante auge en los últimos años, sobre todo
gracias a las tecnologías avanzadas de secuenciación de ADN, a los avances en
bioinformática, y a las técnicas cada vez más sofisticadas para realizar análisis de
genomas completos. El desarrollo de la genómica ha contribuido al avance de distintos
campos de la ciencia como la medicina, la agricultura, etc; gracias al descubrimiento de
secuencias de genes necesarias para la producción de proteínas de importancia médica y
a la comparación de secuencias genómicas de distintos organismos. Por ejemplo en varios
países como Estados Unidos, la Unión Europea y Japón se han realizado enormes
proyectos para secuenciar el genoma de diversos organismos modelo. Probablemente el
más conocido es el Proyecto Genoma Humano. En la actualidad se cuenta además con
importantes servidores de acceso público, como el del NCBI (National Center for
Biotechnology Information), que permiten que cualquier usuario con conexión a Internet
acceda a la secuencia completa del genoma de decenas de organismos y a las secuencias
de cientos de miles de genes de distintos organismos.
De acuerdo a la página web
http://www.genomenewsnetwork.org/resources/sequenced, hasta el presente se han
secuenciado el genoma completo de 189 organismos.
LA GENÓMICA EN EL FUTURO
Los genomas que han sido secuenciados han sido muy útiles para la humanidad, pero es
una mínima parte del total de genomas existentes. La secuenciación de estos genomas

- 65 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

aportará una información muy valiosa para el tratamiento de enfermedades, la


agricultura y la biotecnología. Las secuencias genómicas completas de mamíferos
ayudarán al entendimiento de la evolución y función del genoma humano. En el futuro,
la información sobre la secuencia genómica completa podrá aplicarse en el tratamiento
individual de pacientes, incluso en recién nacidos, dando lugar a una medicina más
individualizada. El conocimiento de secuencias completas también tiene un aspecto
negativo, ya que puede llevar a la discriminación de algunas personas identificadas como
portadores de secuencias que determinen enfermedades, trastornos y rasgos físicos.
PROGRAMAS BIOINFORMÁTICOS PARA ANOTACIÓN Y ANÁLISIS DE
GENOMAS
P lataforma RAST
Es un servicio totalmente automatizado para la anotación de genomas. El servicio
identifica la codificación de la proteína de genes, rRNA y tRNA, le asigna funciones,
predice que los subsistemas están representados en el genoma, usa esta información para
reconstruir la vía metabólica, y hace que sea fácil descargar toda la información.
Además, de la anotación del genoma, se puede navegar en un entorno para apoyar el
análisis comparativo de los genomas anotados que están presente en el entorno del
sistema SEED.
La anotación completa se produce normalmente dentro de las 12-24 horas, y la actual
aplicación puede realizarla a un promedio de entre 50 a 100 genomas por día. Sin
embargo, es importante tener en cuenta que la velocidad no es el tema central, sino los
requisitos de ese sistema son, exactitud, integridad y la coherencia, en última
instancia, serán los criterios utilizados para evaluar el éxito o fracaso de un
servicio. Hasta la fecha, el servidor ha sido utilizado por más de 120 de los usuarios
externos para anotar más de 350 genomas.
Por otra parte los bancos de datos NMPDR y la SEED facilitan el acceso a todos los
genomas público sin necesidad de tener una cuenta de usuario. Para acceder al RAST, en
cambio, se debe abrir una cuenta gratuita de usuario para que el acceso a sus datos
y puedan ser mantenido bajo control del interesado. Las herramientas disponibles en el
RAST para comparar sus datos privados con nuevos genomas ya publicados
son en su mayoría las mismas que las disponibles para el análisis de genomas público
presentes en la plataforma NMPDR (www.nmpdr.org org).
La plataforma RAST pretende lograr la precisión, consistencia, y la integridad en el uso
de una creciente biblioteca de subsistemas que son manualmente controladas, y en las
familias de proteínas en gran parte derivados de los subsistemas (FIGfams).
S ubsistemas del RAST
Un gen es asignado a una determinada categoría de genes, las cuales se denominan como
subsistemas. Un subsistema es un conjunto abstracto de funciones orgánicas. Por ejemplo,
la siguiente figura muestra un caso muy simple en el que un subsistema llamado
"Utilización tricarbalilato" se compone de cuatro roles funcionales.
El subsistema lo que hace es conectar los roles funcionales
de genes específicos en los genomas, produciendo una hoja de cálculo en el subsistema,
donde cada fila representa un genoma y cada columna corresponde a un papel funcional.
El esfuerzo cooperativo del desarrollo de los subsistemas ha producido una disponibilidad

- 66 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

al público de un conjunto de subsistemas que ahora incluye más de


600. Estos subsistemas incluyen afirmaciones de la función de más de 500.000 genes
codificadores de proteínas en más de 500 genomas de bacterias y arqueas (en relación
con más de 6.200 roles funcionales). Si bien es cierto que la calidad de las afirmaciones
varía sustancialmente, también es cierto que estos conjuntos estructurados de
afirmaciones representan un recurso importante en la construcción de los sistemas de
anotación automática.
Programa ARTEMIS.
rograma Artemis es una herramienta de visualización y anotación libre de genoma que
permite la
visualización de las características de la secuencia y los resultados del análisis en el
contexto de la secuencia y su traducción de sus seis-marcos de lectura. Puede leer las
entradas o secuencias de base de datos en EMBL y GENBANK, en FASTA o en un
formato
no procesado. Las características de la secuencia adicionales pueden ser en formato
EMBL, GENBANK o GFF.
ARTEMIS lee las características y secuencia desde el archivo y muestra las características
en una traducción de la secuencia en sus seis-marcos de lectura. Dos vistas de la
secuencia se exhiben y las dos pueden ser ampliadas al nivel de base, o disminuidas para
mostrar la secuencia completa. También hay una lista de características en la parte
inferior de la ventana.
Además de esta pantalla básica, ARTEMIS puede trazar los resultados de los cálculos en la
secuencia, o en cualquiera de las características de CDS (secuencias de ADN
codificantes). Los marcos de la secuencia están atados a la visualización de la secuencia y
ampliados o disminuidos al cambiar el nivel del enfoque. Para cada uno de los marcos,
podrás ajustar el tamaño de la ventana para adaptarse al nivel del enfoque.
Además de las capacidades de visualización de la secuencia descritas anteriormente,
ARTEMIS puede mostrar los resultados de numerosos análisis de la secuencia; las
predicciones CDS, BLASTN, BLASTX en-marco, tRNA y las búsquedas por motivo, etc.
pueden ser todos vistos e incorporados en la anotación. ARTEMIS también ejecuta los
análisis en los conjuntos de características CDS, tales como las búsquedas FASTA y
BLASTP
y permite que los resultados sean visualizados directamente desde el objeto seleccionado.
La información adicional, así como la función en colores, las clasificaciones funcionales,
etc. también se puede añadir a la anotación, y el archivo final escrito con todas estas
características intactas y para uso interno, o con características no-EMBL puede ser
guardadas o no.
La característica de alejamiento de la imagen se puede utilizar para mirar los genes en el
contexto de amplias cantidades de secuencias.
3- Actividades prácticas
3.1. Analizar los resultados de un genoma anotado y disponible mediante la Plataforma
RAST.
1. Entrar a la página http://rast.nmpdr.org/
2. Introducir Login: LACTOCINA y password:

- 67 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

IZ8jbAW
3. Seleccionar SeedViewer
4. Seleccionar el organismo del que se quiere analizar el genoma completo
5. Seleccionar Anopheles gambiae
6. En esta página, se abre una tabla que muestra cuantos contig (fragmentos vecinos
derivados de una fuente de secuenciación simple) hay, el número de genes que se
asignan para completar los subsistemas y las categorías de subsistemas representados
en su genoma. Ahora, copia esos datos y realiza una tabla con esta información en un
archivo word.
7. La página de la información del genoma muestra un gráfico circular de subsistemas
completos identificados en el genoma. Se puede ampliar las categorías para ver las
subcategorías y nombres de subsistema, junto con el número o las proteínas asignadas
a cada uno. La tabla (haga clic en el botón verde "Características de los subsistemas")
y ello ofrece un acceso similar, y usted puede seleccionar la categoría de
los "carbohidratos", desde la parte superior de la columna. Desde la categoría
carbohidratos, ya sea en el gráfico o tabla, puede hacer clic para abrir los
subsistemas de la glucólisis y de la Gluconeogénesis.
8. Haciendo clic en cualquiera de los genes del genoma recién anotado se abre la página
de “Información general de anotación”, por lo que se abre en una nueva ventana o
pestaña. Copia y realiza un resumen de la información de los genes que seleccionaste.
3.2. Anotación de genes mediante Programa ARTEMIS.
1. Abre la secuencia FASTA (Ava1) que te facilita el docente, utilizando el comando
File/Open. Observa que al abrir el archivo, aparecen tres ventanas, una inferior
vacía y dos superiores que muestran la secuencia nucleotídica y las secuencias
aminoacídicas correspondientes a las traducciones en los seis marcos de lectura
posibles (tres marcos de lectura por hebra) (Figura 1).
2. Utilizando la opción Create/Mark ORF (open reading frames), se establecen los
posibles ORFs, con un largo superior a 100 aminoácidos
3. El programa identifica diversas regiones de una secuencia, como unidades con un
determinado significado, a las cuales se les pueden asignar nombres y anotar datos
acerca de ellas. Estas regiones se denominan “features” (características o marcas),
y pueden ser ORFs, exones, etc.
4. Analiza los features (en este caso ORFs) obtenidos utilizando BLAST. Los features
aparecen indicados en la ventana inferior como CDS. Debes seleccionar cada uno
de los CDS y presionando el botón derecho del mouse sobre el feature, y utilizando
la opción View/Amino Acids of selection as FASTA (también se puede seleccionar
la secuencia nucleotidíca View/Bases of selection as FASTA) podrás obtener la
secuencia de cada CDS para su análisis.
5. Utilizando la información obtenida mediante BLAST, ahora puedes editar la
información contenida en los features, haciendo click con el botón derecho, y
seleccionando la opción Edit/Selected feature in editor. En la ventana que se abre
se puede modificar el nombre del feature con la opción Key, y agregar
información, colores, etc., con la opción Add Qualifiers.
6. Los features pueden estar separados de la secuencia en un archivo aparte

- 68 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

denominado “entry”. Abre la entry localizada en el archivo Ava1_entry y observa


los features ahí contenidos (File/read an entry). Este archivo fue realizado por el
investigador que depositó la secuencia en el GenBank.
7. Compara el tamaño de los ORFs obtenidos con los anotados en Ava1_entry. ¿Se
encuentran diferencias? Si es así, explica por qué. Si es necesario, modifica el
tamaño de los ORF de acuerdo a los datos obtenidos mediante BLAST.
8. Tu también puedes bajar el archivo con todas las anotaciones o features
directamente del Genbank. Para esto utilice la opción File/Open from EBI y
coloque el número de accessión (Acc. Number: DQ985395). Para obtener
información adicional sobre los features anotados dirigete a View/view selected
features. ¿Qué información posee el tercer CDS?. Incluye la información adicional
en el panel de features (panel 5, Figura 1).
Figura 1. Ventana principal de artemis.
1. Menú desplegable principal
2. “entry” activas. Las “entry” actúan como capas o layers en las que puedo
realizar anotación. Puedo crear tantas como desee y se utilizan para organizar la
información en unidades independientes.
3. Panel principal de visualización de las secuencias. Las líneas grises representan
las hebra forward (superior) y reverse (inferior). Se representa también las
secuencias aminoacídicas correspondientes a las traducciones en los seis marcos
de lectura posibles (tres marcos de lectura por hebra). Las líneas negras verticales
representan los codones stop. Las regiones coloreadas representan los distintos
“features” que han sido anotados en la secuencia.
4. Este panel tiene la misma estructura que el panel principal de visualización
pero ha sido aumentado para visualizar las secuencias nucleotídicas y
aminoacídicas.
5. Este panel indica los distintos “features” que presenta la secuencia.
6. Barras para aumentar o disminuir los paneles
7. Barras para movilizarse en la secuencia
8. Barras para desplazar los “features”.

- 69 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Trabajo Práctico N °5
TAXONOMÍA MOLECULAR

1- Objetivos

• Que el alumno conozca las técnicas moleculares que se utilizan en taxonomía


molecular.
• Que el alumno comprenda la importancia de las técnicas de biología molecular en el
desarrollo de la taxonomía moderna.
• Que el alumno conozca las enzimas de restricción y sus aplicaciones.
• Que el alumno sea capaz de manejar bases de datos de marcadores moleculares
disponibles on line.
• Que el alumno sea capaz de utilizar programas bioinformáticos para realizar
digestiones in silico.

2- Introducción

TAXONOMÍA Y SISTEMÁTICA

Los términos taxonomía y sistemática marcan en su significado matices diferenciales


claros. La taxonomía estudia los principios de clasificación de los organismos según las
semejanzas y diferencias de sus caracteres. La sistemática trata de los resultados que se
obtienen al aplicar tales principios.
Uno de los objetivos de la taxonomía es descubrir un orden en el aparente caos de
diversidad de formas vivas. Así, el taxonomista intenta preparar un esquema conveniente de
clasificación para los organismos.
Las unidades sistemáticas de cualquier categoría se designan con el nombre de taxones o
estirpes. De todas ellas la Especie es la categoría taxonómica más importante. Se reúnen en
una especie todos los individuos particulares, incluyendo sus antepasados y descendientes
(filogenia), que concuerdan entre sí en numerosos caracteres y en especial en todos los
esenciales.
Las especies que poseen una serie de caracteres comunes se agrupan en Géneros, éstos de
forma análoga en Familias; las familias en Órdenes, éstos en Clases y las clases en
Divisiones. Dentro de las especies suelen distinguirse Subespecies, Variedades, Líneas y
Clones o Cepas. Estas últimas para designar la población de células genéticamente
idénticas, procedentes de una sola. Todas ellas constituyen las diferentes categorías
taxonómicas.
Conviene distinguir también entre Taxonomía y Nomenclatura. Esta última trata,
evidentemente, de la denominación o descripción detallada de cada especie de
microorganismo. El nominar una especie es una práctica conveniente que expresa a modo
de taquigrafía las propiedades colectivas de un organismo.

- 70 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

El método usado actualmente para designar científicamente una especie microbiana es la de


la nomenclatura binomial.

TAXONOMÍA MICROBIANA

En la taxonomía microbiana existen varias formas de abordar los estudios. La primera de


ellas es la taxonomía clásica; aplicada durante más de un siglo, su metodología consiste en
determinar varios caracteres de diferentes microorganismos y, para usarlos después en la
separación de grupos.
Los primeros caracteres determinados suelen ser los morfológicos y estructurales; después
los funcionales.
La importancia del carácter morfológico se debe, por una parte, a la mayor facilidad en su
determinación por técnicas microscópicas y, por otra, a su mayor estabilidad genética.
Además de la morfología, suelen utilizarse numerosas pruebas de carácter estructural,
fisiológico, reproductivo y ecológico.

Otra forma de abordar el procedimiento taxonómico es la taxonomía numérica, en la cual


se da la misma importancia a todos los caracteres determinados; un ordenador analiza los
datos determinados para un gran número de microorganismos reconociendo las diferencias
y analogías entre ellos.
Las primeras separaciones se hacen también atendiendo a caracteres morfológicos y
estructurales, realizando a continuación un gran número de pruebas de naturaleza variada,
anotando los resultados de las mismas con un signo positivo o negativo; los datos se
recogen en tablas y son codificados; hay que calcular un coeficiente de confianza para las
cepas en estudio; éste será mayor cuanto más semejante sean los microorganismos
analizados. Los caracteres negativos comunes a las cepas no se toman en consideración a la
hora de calcular dicho coeficiente, ya que la ausencia común de un carácter no implica
necesariamente un parentesco.
La taxonomía numérica, al analizar muchos caracteres, obtiene resultados poco equívocos y
determina categorías taxonómicas estables; sin embargo, la correlación entre taxonomía
clásica y numérica no es siempre muy satisfactoria.

La tercera forma de abordar el estudio para la clasificación de microorganismos es la


taxonomía molecular y genética, que parte de la idea de que cuanto más parecidos son dos
organismos, mayores su semejanza genética, tratando de demostrar que las secuencias de
bases del DNA de dos células son parecidas o exactamente iguales.

Para estudios de este tipo pueden utilizarse varias alternativas:

Estudio de la composición de bases del ADN


Aunque no se conozcan las secuencias de bases púnicas y pirimídicas, sí pueden
determinarse las proporciones de las mismas en el DNA total.

- 71 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Se ha calculado que si dos organismos difieren en el contenido de Guanina-Citosina en más


del 10% tienen pocas secuencias de bases en común. Por tanto, no se considerarán
estrechamente relacionadas, al no ser descendientes de un antepasado común. Sin embargo,
puede ocurrir a veces que dos células con proporciones de bases idénticas no estén
relacionadas, ya que en ácidos nucleicos de la misma composición de bases son posibles
muchas secuencias diferentes.

Estudios de hibridación y homología de los ácidos nucleicos


Cuando se calienta una preparación de DNA, las dos cadenas que lo forman se separan,
siendo una complementaria de la otra.
Cuando la mezcla se enfría lentamente, las dos cadenas complementarias se vuelven a
asociar, formándose otra vez la doble hélice. Como la nueva asociación requiere que las
secuencias de bases sean complementarias, la presencia de secuencias iguales de dos
microorganismos diferentes puede detectarse midiendo el grado en que sus ácidos nucleicos
son capaces de interaccionar específicamente.
El grado de hibridación de los ácidos nucleicos es menor cuando los microorganismos no
están estrechamente relacionados, aunque la composición conjunta de bases púnicas y
pirimídicas sea la misma.

Estudios de marcadores moleculares

La aplicación de marcadores moleculares en la resolución de problemas genéticos es un


campo en auge permanente que se ha desarrollado y acelerado en los últimos años gracias a
la tecnología de PCR.
Los marcadores moleculares permiten analizar y medir la diversidad de individuos,
poblaciones y especies, evaluando directamente la variación genética que se produce a
nivel de ADN.
Los ácidos nucleicos y las proteínas, macromoléculas comunes a todos los seres vivos,
cambian con el tiempo. Por ello, pueden considerarse como cronómetros moleculares o
documentos de la historia evolutiva. Asumiendo que los cambios se producen al azar y que
aumentan con el tiempo de manera lineal, las diferencias en la secuencia de los monómeros
(nucleótidos o aminoácidos) que integran macromoléculas homólogas, presentes en dos
formas de vida, reflejan la distancia evolutiva existente entre ellas. Esta idea, introducida
por Zuckerkandl y Pauling, se ha venido utilizando durante décadas para establecer las
relaciones filogenéticas entre los seres vivos, creando un marco apropiado para su
clasificación e identificación.
El ARN ribosómico (ARNr) 16S es la macromolécula más ampliamente utilizada en
estudios de filogenia y taxonomía bacterianas. Su aplicación como cronómetro molecular
fue propuesta por Carl Woese (Universidad de Illinois) a principios de la década de 1970.
Los estudios de Woese originaron la división de los procariotas en dos grupos o reinos:
Eubacteria y Archaeobacteria, cuya divergencia es tan profunda como la encontrada entre
ellos y los eucariotas. Además, permitieron establecer las divisiones mayoritarias y
subdivisiones dentro de ambos reinos.

- 72 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Posteriormente, Woese introdujo el término Dominio para sustituir al reino como categoría
taxonómica de rango superior, y distribuyó a los organismos celulares en tres dominios :
Bacteria, Archea y Eukarya, el último de los cuales engloba a todos los seres eucariotas.
Desde entonces, el análisis de los ARNr 16S se ha utilizando ampliamente para establecer
las relaciones filogenéticas dentro del mundo procariota, causando un profundo impacto en
nuestra visión de la evolución y, como consecuencia, en la clasificación e identificación
bacteriana. De hecho, las ediciones vigentes de los dos tratados fundamentales de
bacteriología, Bergey‟s Manual of Systematic Bacteriology (http://www.springer-
ny.com/bergeysoutline/main.htm) y The Prokaryotes (http://www.prokaryotes.com), basan
su estructuración del mundo procariota en las relaciones filogenéticas establecidas con esta
macromolécula.
Los ARNr 16S pueden actualmente mediante amplificación por PCR y posterior
secuenciación por método enzimático.

LOS RIBOSOMAS, LOS OPERONES RIBOSÓMICOS Y EL ARNR 16S

Ribosomas
Son orgánulos complejos, altamente especializados, que utilizan los organismos para el
complicado proceso de síntesis de proteínas. El ribosoma bacteriano tiene un coeficiente de
sedimentación de 70S (expresado en unidades Svedberg), y puede disociarse en dos
subunidades, la subunidad grande (50S) y la subunidad pequeña (30S). Cada subunidad es
un complejo ribonucleoproteico constituido por proteínas ribosómicas y moléculas de
ARNr específicas.
La subunidad 30S contiene el ARNr 16S y 21 proteínas diferentes (numeradas desde S1-
S21, donde S procede de small l), mientras que la subunidad 50S contiene los ARNr 5S y
23S junto con unas 34 proteínas (L1-L34; L: large). En bacterias, los genes que codifican
los ARN ribosomales están organizados en operones (conjunto de genes que se transcriben
a partir de la misma región promotora). Cada operón ribosómico incluye genes para los
ARNr 23S (rrl), 16S (rrs) y 5S (rrf), separados por regiones espaciadoras o intergénicas
(IG), y contiene además genes para uno o más ARN de transferencia (ARNt). El producto
de la transcripción del operón a partir de dos promotores, P1 y P2, situados en la región
anterior a rrs, será procesado por el enzima ARNasa III mediante cortes en sitios
específicos que separan las tres clases de ARNr, el/los ARNt y las dos IG.

ARNr 16S
Es un polirribonucleótido de aproximadamente 1.500 nt, codificado por el gen rrs, también
denominado ADN ribosomal 16S (ADNr 16S), a partir de cuya secuencia se puede obtener
información filogenética y taxonómica. Como cualquier secuencia de nucleótidos de
cadena sencilla, el ARNr 16S se pliega en una estructura secundaria, caracterizada por la
presencia de segmentos de doble cadena, alternando con regiones de cadena sencilla. En
eucariotas, el ARNr 18S es la macromolécula equivalente. Dado que los ARNr 16S y 18S
proceden de las subunidades pequeñas de los ribosomas, el acrónimo ARNr SSU (del
inglés, small subunit) se utiliza para ambos. Los ARNr SSU se encuentran altamente

- 73 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

conservados, presentando regiones comunes a todos los organismos, pero contienen además
variaciones que se concentran en zonas específicas. El análisis de la secuencia de los ARNr
16S de distintos grupos filogenéticos reveló un hecho adicional de gran importancia
práctica: la presencia de una o más secuencias características que se denominan
oligonucleótidos firma. Se trata de secuencias específicas cortas que aparecen en todos (o
en la mayor parte de) los miembros de un determinado grupo filogenético, y nunca (o sólo
raramente) están presentes en otros grupos, incluidos los más próximos. Por ello, los
oligonucleótidos firma pueden utilizarse para ubicar a cada bacteria dentro de su propio
grupo.
El número de copias del operón ribosómico por genoma bacteriano varía
considerablemente, de 1 a 15, siendo relativamente constante a nivel de especie, género e
incluso familia. Entre las copias de los ARNr 16S codificadas por un mismo genoma se ha
detectado un cierto grado de heterogeneidad (denominada microheterogeneidad).

Aunque existen cronómetros moleculares alternativos al ARNr 16S, hasta el momento


ninguno ha conseguido desplazarlo. De hecho, esta macromolécula presenta una serie de
características, en base a las cuales fue considerado por Woese como cronómetro molecular
definitivo:

1. Se trata de una molécula muy antigua, presente en todas las bacterias actuales.
Constituye, por tanto, una diana universal para la identificación.
2. Su estructura y función han permanecido constantes durante un tiempo muy
prolongado, de modo que las alteraciones en la secuencia reflejan probablemente
cambios aleatorios.
3. Los cambios ocurren de manera suficientemente lenta, como para aportar
información acerca de todos los procariotas y, junto con las variaciones en los
ARNr 18S, a lo largo de toda la escala evolutiva. Los ARNr SSU contienen, sin
embargo, suficiente variabilidad para diferenciar no sólo los organismos más
alejados, sino también los más próximos.
4. El tamaño relativamente largo de los ARNr 16S (1.500 nt) minimiza las
fluctuaciones estadísticas.
5. La conservación en estructura secundaria puede servir de ayuda en las
comparaciones, aportando una base para el alineamiento preciso.
6. Dado que resulta relativamente fácil secuenciar los ADNr 16S existen bases de
datos amplias, en continuo crecimiento.

Una vez determinada la secuencia de nucleótidos y establecidas las comparaciones, el


grado de similitud entre las secuencias de los ADNr 16S de dos bacterias será lo que
indique su relación evolutiva. Además, el análisis comparativo de secuencias permite
construir árboles filogenéticos, que reflejan gráficamente la genealogía molecular de la
bacteria, mostrando su posición evolutiva en el contexto de los organismos comparados.

Hay que tener en cuenta, no obstante, que es la comparación de genomas completos, y no la


comparación de los ADNr 16S, la que aporta una indicación exacta de las relaciones

- 74 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

evolutivas. En su ausencia, la especie bacteriana se define, en taxonomía, como el conjunto


de cepas que comparten una similitud del 70% o más, en experimentos de reasociación
ADN-ADN. Stackebrandt y Goebel demostraron que cepas con este nivel de relación
presentan típicamente una identidad del 97% o más entre sus genes ARNr 16S. Así, cepas
con menos del 97% de identidad en las secuencias de sus ADNr 16S es improbable que
lleguen a estar relacionadas a nivel de especie. Sin embargo, existen cepas que comparten
una similitud inferior al 50% en experimentos de reasociación, y son por tanto clasificadas
en especies diferentes, pero presentan una identidad del 99-100% a nivel de ADNr 16S. Por
ello, en taxonomía, actualmente se recomienda la identificación polifásica, que utiliza
criterios fenotípicos junto con datos de secuenciación.

ENZIMAS DE RESTRICCIÓN

Definición y origen
Las enzimas de restricción son endonucleasas que reconocen una secuencia de ADN doble
cadena de entre 4 y 8 pb. El sitio de reconocimiento se llama sitio de restricción, y la
enzima rompe un enlace fosfodiester en cada hebra. Las secuencias de reconocimiento son
repeticiones invertidas perfectamente simétricas conocidas como palíndromos.
Las enzimas de restricción se encuentran en muchas especies de bacterias. Las bacterias
desarrollaron las enzimas de restricción como una defensa frente a la infección por fagos
(virus bacterianos). Se denominan de restricción porque estas enzimas restringen la
invasión del ADN exógeno cortándolo en pedazos. En cambio, el ADN propio no es
reconocido por sus enzimas de restricción, ya que puede protegerse del corte por metilación
específica de la secuencia mediante una metiltransferasa (enzima que transfiere grupos
metilo desde S-adenosilmetionina a bases específicas). Los sitios de reconocimiento de las
metiltransferasas corresponden a los de las endonucleasas. Este sistema es análogo a un
sistema inmune, y le permite distinguir a la bacteria entre su ADN y el ADN exógeno.

Estás enzimas son aprovechadas para la tecnología del ADN recombinante. Se denomina
ADN recombinante al que se ha formado al intercalar un segmento de ADN extraño en un
ADN receptor por enzimas denominadas ligasas. Por ejemplo, la integración de un ADN
vírico en un ADN celular.

La tecnología del ADN recombinante permite el desarrollo de plantas y animales


transgénicos así como microorganismos modificados genéticamente para producir
fármacos u otros productos de utilidad para el hombre, entre los que se pueden citar: la

- 75 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

insulina humana, la hormona del crecimiento, interferones, la obtención de nuevas vacunas


o la clonación de animales.

Tipos de enzimas de restricción


Las endonucleasas de restricción se clasifican en tres categorías:

Tipo I: es una enzima formada por 3 subunidades que reconoce el sitio de ADN. Esta
enzima metila y corta. La restricción no ocurre en el sitio de reconocimiento, sino que es al
azar y en sitios distantes al de reconocimiento.

Tipo II: dos enzimas diferentes realizan la restricción y la metilación. La restricción ocurre
en el sitio de reconocimiento. Estas enzimas son las utilizadas en ingeniería genética debido
a que permiten romper el ADN en sitios específicos.

Tipo III: es similar al sistema tipo I, utilizan una enzima oligomérica que realiza todas las
actividades enzimáticas, y rompen el ADN 25-27 pb, más allá del sitio de reconocimiento.

Endonucleasas de restricción tipo II


Se han identificado más de 2300 endonucleasas de restricción de tipo II. Se denominan
isoesquizómeros a aquellas enzimas que han sido obtenidas de diferentes especies de
bacterias, pero que reconocen la misma secuencia de ADN.

Las enzimas tipo II, dependiendo de su especificidad, al romper el ADN provocan 2 tipos
de cortes:
A.Cortes pegajosos, dejando productos con extremos cohesivos (sticky) Ej: Eco RI y Pst I
B.Cortes simétricos, dejando productos con extremos romos (blunt). Ej: Pvu II

En este esquema se ve el resultado de la actuación de la enzima de restricción que corta la


molécula de ADN en forma escalonada, quedando bordes pegajosos (cohesivos) por donde
puede unirse este ADN, con otro aunque sea de una especie diferente.

- 76 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

En este esquema se ve el resultado de la actuación de la enzima de restricción que corta la


molécula de ADN justo en el centro de la secuencia, quedando bordes romos (blunt).

Aunque se utilizan ambas clases de fragmentos (con extremos romos y con extremos
cohesivos), en ingeniería genética se prefieren aquellos con extremos cohesivos, puesto que
permiten la unión espontánea del gen a clonar con el vector. Si las moléculas a utilizar
presentan extremos romos, hay que conferirles extremos cohesivos, por ejemplo utilizando
la enzima transferasa terminal.

La nomenclatura utilizada para designar las enzimas de restricción es la siguiente:

Eco RI

- 77 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

E = Escherichia, género
co = coli, especie
R = factor R, variedad
I = orden de aparición

En las siguientes tablas se pueden observar las enzimas más comúnmente usadas en
biología molecular, nomenclatura, fuentes y sitios de corte.

- 78 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Isoesquizómeros y las familias de enzimas


Los isoesquizómeros son enzimas que reconocen un mismo sitio, pero que no lo cortan en
el mismo lugar, como Asp 718 y Kpn1.

Las familias de enzimas comprenden enzimas que no reconocen necesariamente los


mismos sitios, pero producen extremos adhesivos iguales. Hay familias por ejemplo que
producen extremos adhesivos GATC ó CTAG.

GATC: Sau3AI, BglI, BamHI, BclI et XhoII


CTAG: MaeI, SpeI, NheI, AvrI et XhaI

En la figura se muestra cómo Sau3AI y BamH1 producen los mismos extremos:

- 79 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

Mapa de restricción. Patrón de restricción.


Un mapa de restricción es una secuencia lineal de los sitios de restricción contenidos en
una secuencia de ADN.

Un patrón de restricción es el patrón o perfil de ADN generado mediante electroforésis


que se obtiene después de cortar con una enzima de restricción.

Los fragmentos obtenidos después de la actuación de las distintas enzimas de restricción, se


pueden separar por tamaños, es decir, según el número de pares de nucleótidos que llevan,
mediante la técnica de electroforesis y así estudiar los distintos trozos. Según donde se
hallen las secuencias de reconocimiento, un gen determinado puede estar fragmentado en
varios trozos, o bien un trozo puede contener varios genes.

Para obtener un patrón de restricción se podría emplear el siguiente procedimiento:


1. Utilizar muestras de ADN bicatenario con concentración de 0,1 µg/µL y longitud de
10.000 bp.

2. Poner 10 µl de ADN en los tubos de microcentrífuga, 7 µl de agua, 1 µl de enzima


de restricción EcoRI (por ej.) y 2 µl del buffer 10X para enzimas de restricción
EcoRI.

3. Mezclar y centrifugar.
4. Poner a baño María (37°C) durante 1 hora.

- 80 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

5. Con la ayuda de una pipeta, pasar los hidrolizados a un pocillo de electroforesis en


gel de agarosa En uno de los tubos adyacentes, depositar una muestra de ADN no
hidrolizado y en otros dos, una mezcla de moléculas de ADN de tamaño conocido
(marcadores), que servirán para calcular las tallas de los fragmentos obtenidos.
6. Realizar la electroforesis y revelar
7. Usar un transiluminador UV para visualizar las moléculas de ADN. El marcador de
peso molecular permite analizar que la EcoRI cortó la molécula original de 10.000
bp en dos fragmentos, de 7.500 y 2.500 bp respectivamente.

Tamaño de los fragmentos de restricción


Si los sitios de restrición fueran distribuidos al azar en la longitud de una molécula de
ADN, una enzima que reconocería una secuencia de 4 nucleótidos, cortaría 1/256
nucleótidos (es decir, hallaría 1 sito de corte cada 256 nucleótidos), mientras que una
enzima que reconocería 6 nucleótidos cortaría en promedio 1/4.096 nucleótidos.

- 81 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

La digestión por EcoRI (secuencia de reconocimiento de 6 nucleótidos) de una molécula de


ADN bacteriano de 4 millones de pares de bases producirá alrededor 103 fragmentos
diferentes, mientras que la digestión total de ADN de un mamífero va a producir alrededor
de 106 fragmentos.
Es por esto que la frecuencia de aparición de un sitio depende de su secuencia de
nucleótidos. Por ejemplo, la enzima NotI que reconoce un sitio de 8 nucleótidos 5'-
GCØGGCCGC-3' realiza sólo 3 cortes en el ADN de mamíferos: produce fragmentos de
talla media de 1 a 1,5 millones de pares de bases. Esta enzima se utiliza en los trabajos de
cartografía física del ADN.

RFLP: RESTRICTION FRAGMENT LENGTH POLYMORPHISM (RFLP):


POLIMORFISMO DE LA LONGITUD DE LOS FRAGMENTOS DE
RESTRICCIÓN:

El análisis del patrón de restricción del ADN es una de las técnicas más utilizadas para la
identificación y agrupación de bacterias. Esta técnica puede ser usada para separar especies
pertenecientes al mismo género, o para distinguir cepas bacterianas que presenten gran
similitud dentro de la misma especie o subespecie.
Los fragmentos resultantes de la digestión del ADN total por la acción de las enzimas de
restricción pueden ser separados por electroforesis generando un patrón de bandas, el cual
es la huella dactilar de la cepa, ya que el número y localización de los sitios de restricción
es específico para cada genoma.

ARDRA: AMPLIFIED RIBOSOMAL DNA RESTRICTION ANALYSES:


ANÁLISIS DE RESTRICCIÓN DEL ADN RIBOSOMAL AMPLIFICADO

El análisis de restricción del ADN ribosomal amplificado es una técnica muy útil para la
identificación y clasificación de bacterias, incluso a nivel de especie, además permite la
clasificación de aislamientos y clones de manera simple, rápida y económica

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8

2000
2000
1500
1500
1000
1000
750
750
500
500

250 250

- 82 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

A B
1 2 3 4 5 6 7 8

2000

1500
1000
750

500

250

C
(Extraído con permiso Albarracín, 2007-Tesis Doctoral)
Patrones de restricción de los fragmentos de ADN que codifican para el ARNr 16S. A. Calles: 1. Marcador 1Kb (Promega). 2, 3 y 4.
ADNr 16S del aislamiento AB0, digerido con Kpn I, Pst I y Sau3AI, respectivamente. 6, 7 y 8. ADNr 16S del aislamiento AB2C,
digerido con Kpn I, Pst I y Sau3AI, respectivamente. B. Calles: 1. Marcador 1Kb (Promega). 3 y 5. ADNr 16S digerido con Sau3AI de
los aislamientos AB2A y AB3, respectivamente. 7 y 8. ADNr 16S digerido con Kpn I de los aislamientos AB3 y AB5F, respectivamente.
C. Calles: 1. Marcador 1Kb (Promega). ADNr 16S amplificado a partir de ADN del aislamiento AB0 y digerido con: 2. Sal I. 3. Sau3A
El poder resolutorio del ARDRA depende de la/s enzima/s utilizada/s. Primero se debe
realizar una PCR para amplificar el ADNr 16s y luego se cortan los amplicones con
enzimas de restricción. Los amplicones digeridos se separan por electroforesis. El método
se basa en la variación en la posición de sitios de restricción entre las secuencias y en la
determinación de la longitud de fragmentos de restricción.

Los patrones obtenidos se pueden comparar con los ARDRA de bacterias conocidas,
usando las secuencias de ADNr presentes en bases de datos, empleando la digestión in
silico. La digestión in silico permite realizar una selección adecuada de las enzimas a
utilizar.

La digestión in silico involucra la utilización de programas de computación para simular la


actividad de las enzimas de restricción sobre secuencias disponibles en bases de datos. Las
secuencias de ADNr son importadas desde las bases a datos a la computadora y con ayuda
de programas apropiados (por ej. DNAMAN) se simula la restricción y se analizan los
fragmentos obtenidos. De esta manera se pueden seleccionar las enzimas más apropiadas
para el análisis del género o especie en estudio.

- 83 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

3- Actividades prácticas

Amplificación de genes de ADNr 16s in silico y posterior restricción con enzimas.

Se realizará la digestión in silico del ADNr de 3 cepas pertenecientes al género


Mycoplasma, para poder diferenciar las especies, teniendo en cuenta los ARDRA obtenidos
a partir de especies conocidas.
De acuerdo a Stakenborg y col. (2005), todas las especies de Mycoplasma pueden
diferenciarse de acuerdo a los ARDRA obtenidos usando en forma secuencial las enzimas
de restricción AluI, BfaI y HpyF10VI.

1) Secuencias de ADNr de 9 cepas de Mycoplasma de referencia en formato FASTA, que


pueden ser diferenciadas usando la enzima AluI:

>gi|3413492|emb|AJ002269.1| Mycoplasma hominis 16S rRNA, rrnB operon, strain 7488


TTTTTTATAAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCTGTGTGCCTAAT
ACATGCATGTCGAGCGAGGTTAGCAATAACCTAGCGGCGAATGGGTGAGTAAC
ACGTGCTTAATCTACCTTTTAGATTGGAATACCCATTGGAAACAATGGCTAATG
CTGGATACGCATGGAACCGCATGGTTCCGTTGTGAAAGGCGCTGTAAGGCGCC
ACTAAAAGATGAGGGTGCGGAACATTAGTTAGTTGGTGAGGTAATGGCCCACC
AAGACTATGATGTTTAGCCGGGTCGAGAGACTGAACGGCCACATTGGGACTGA
GATACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATATTCCACAATGAG
CGAAAGCTTGATGGAGCGACACAGCGTGCACGATGAAGGTCTTCGGATTGTAA
AGTGCTGTTATAAGGGAAGAACATTTGCAATAGGAAATGATTGCAGACTGACG
GTACCTTGTCAGAAAGCGATGGCTAACTATGTGCCAGCAGCCGCGGTAATACA
TAGGTCGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGTTCGTAGGCTGTTT
GTTAAGTCTGGAGTTAAATCCCGGGGCTCAACCCCGGCTCGCTTTGGATACTAG
CAAACTAGAGTTAGATAGAGGTAAGCGGAATTCCATGTGAAGCGGTGAAATGC
GTAGATATATGGAAGAACACCAAAGGCGAAGGCAGCTTACTGGGTCTATACTG
ACGCTGAGGGACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGT
CCACGCCGTAAACGATGATCATTAGTCGGTGGAGAATCACTGACGCAGCTAAC
GCATTAAATGATCCGCCTGAGTAGTATGCTCGCAAGAGTGAAACTTAAAGGAA
TTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTTGAAGATACAC
GGAAAACCTTACCCACTCTTGACATCCTTCGCAAAGCTATAGAGATATAGTGG
AGGTTATCGGAGTGACAGATGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGAT
GTTTGGTCAAGTCCTGCAACGAGCGCAACCCCTATCTTTAGTTACTAACATTAA
GTTGAGGACTCTAGAGATACTGCCTGGGTAACTGGGAGGAAGGTGGGGATGAC
GTCAAATCATCATGCCTCTTACGAGTGGGGCCACACACGTGCTACAATGGTCG
GTACAAAGAGAAGCAATATGGCGACATGGAGCAAATCTCAAAAAGCCGATCTC
AGTTCGGATTGGAGTCTGCAATTCGACTCCATGAAGTCGGAATCGCTAGTAATC
GCAGATCAGCTATGCTGCGGTGAATACGTTCTCGGGTCTTGTACACACCGCCCG
TCACACCATGGGAGCTGGTAATACCCAAAGTCGGTTTGCTAACCTCGGAGGCG
ACCGCCTAAGGTAGGACTGGTGACTGGGGTGAAGTCGTAACAAGGTATCCCTA
CGAGAACGTGGGGATGGATCACCTCC

- 84 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

>gi|6066195|gb|AF132740.1| Mycoplasma pneumoniae strain ATCC 15531 16S ribosomal


RNA gene and 16S-23S rRNA intergenic spacer, complete sequence
TTAACGCTGGCGGCATGCCTAATACATGCAAGTCGATCGAAAGTAGTAATACT
TTAGAGGCGAACGGGTGAGTAACACGTATCCAATCTACCTTATAATGGGGGAT
AACTAGTTGAAAGACTAGCTAATACCGCATAAGAACTTTGGTTCGCATGAATC
AAAGTTGAAAGGACCTGCAAGGGTTCGTTATTTGATGAGGGTGCGCCATATCA
GCTAGTTGGTGGGGTAACGGCCTACCAAGGCAATGACGTGTAGCTATGCTGAG
AAGTAGAATAGCCACAATGGGACTGAGACACGGCCCATACTCCTACGGGAGGC
AGCAGTAGGGAATTTTTCACAATGAGCGAAAGCTTGATGGAGCAATGCCGCGT
GAACGATGAAGGTCTTTAAGATTGTAAAGTTCTTTTATTTGGGAAGAATGACTT
TAGCAGGTAATGGCTAGAGTTTGACTGTACCATTTTGAATAAGTGACGACTAAC
TATGTGCCAGCAGTCGCGGTAATACATAGGTCGCAAGCGTTATCCGGATTTATT
GGGCGTAAAGCAAGCGCAGGCGGATTGAAAAGTCTGGTGTTAAAGGCAGCTGC
TTAACAGTTGTATGCATTGGAAACTATTAATCTAGAGTGTGGTAGGGAGTTTTG
GAATTTCATGTGGAGCGGTGAAATGCGTAGATATATGAAGGAACACCAGTGGC
GAAGGCGAAAACTTAGGCCATTACTGACGCTTAGGCTTGAAAGTGTGGGGAGC
AAATAGGATTAGATACCCTAGTAGTCCACACCGTAAACGATAGATACTAGCTG
TCGGGGCGATCCCCTCGGTAGTGAAGTTAACACATTAAGTATCTCGCCTGGGTA
GTACATTCGCAAGAATGAAACTCAAACGGAATTGACGGGGACCCGCACAAGTG
GTGGAGCATGTTGCTTAATTCGACGGTACACGAAAAACCTTACCTAGACTTGAC
ATCCTTGGCAAAGTTATGGAAACATAATGGAGGTTAACCGAGTGACAGGTGGT
GCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAG
CGCAACCCTTATCGTTAGTTACATTGTCTAGCGAGACTGCTAATGCAAATTGGA
GGAAGGAAGGGATGACGTCAAATCATCATGCCCCTTATGTCTAGGGCTGCAAA
CGTGCTACAATGGCCAATACAAACAGTCGCCAGCTTGTAAAAGTGAGCAAATC
TGTAAAGTTGGTCTCAGTTCGGATTGAGGGCTGCAATTCGTCCTCATGAAGTCG
GAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTTCTCGGGTCT
TGTACACACCGCCCGTCAAACTATGAAAGCTGGTAATATTTAAAAACGTGTTGC
TAACCATTAGGAAGCGCATGTCAAGGATAGCACCGGTGATTGGAGTTAAGTCG
TAACAAGGTACCCCTACGAGAACG

>gi|12698861|gb|AF332744.1| Mycoplasma agalactiae strain 847.121 16S ribosomal RNA


gene, partial sequence
CTGGCTGTGTGCCTAATACATGCATGTCGAGCGATGATAGCAATATCATAGCG
GCGAATGGGTGAGTAACACGTACTCAACGTACCTTTTAGATTGGGATAGCGGA
TGGAAACATCCGATAATACCGAATACTTATTATTTTTGCATGAAAGTAATATAA
AAGGAAGCGTTTGCTTCGCTAGAAGATCGGAGTGCGCAACATTAGCTAGTTGG
TGAGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGATTGATC
CGCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGG
GAATATTCCACAATGGACGAAAGTCTGATGGAGCGACACAGCGTGCAGGATGA
AGGCCCTATGGGTTGTAAACTGCTGTGGTTAGGGAAGAAAAAGTAGCGTAGGA
AATGACGCTACCTTGACGGTACCTGATTAGAAAGCAACGGCTAACTATGTGCC
AGCAGCCGCGGTAATACATAGGTTGCAAGCGTTATCCGAAATTATTGGGCGTA

- 85 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

AAGCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCC
AAAACGCGTTGGATACTGGCAGACTAGAGTTATGTAGAGGTTAGCGGAATTCC
TTGTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACATCAATATGGCGAAGG
CAGCTAACTGGGCATACACTGACACTGAGAGACGAAAGCGTGGGGAGCAAAC
AGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGTTGATGG
GGAACTCATCGACGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTC
GCAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCA
TGTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTG
CAAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTT
GTCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCC
TTATCCTTAGTTACTACCATTTAGTTGAGCACTCTAAGGAGACTGCCCGAGTAA
TCGGGAGGAAGGTGGGGACGACGTCAAATCATCATGCCTCTTACGAGTGGGGC
TACACACGTGCTACAATGGACGGTACAAAGAGAAGCGAAGTGGTGACATGGA
GCAAACCTCAAAAAACCGTTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCA
TGAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGTT
CTCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAA
GTCGGTTTATTAAGAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCG
TAACAAGGTATCCCTACGAGAAC

>gi|175468|gb|M24289.1|MYCRRNAF M.fermentans ribosomal RNA small subunit


NNTTTTTCGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCTGTGTGCCTAAT
ACATGCATGTCGAGCGAAGGTAGCAATACCTTAGCGGCGAATGGGTGAGTAAC
ACGTGCTCAACGTACCCTTCAGTTTGGCATAGCGACTGGAAACAGTCGATAATT
TCAAATACTCGTAGTTTTCGCATGAAGATTACGGAAAAGAAGCNTTTCTTCGCT
GGAGGAGCGGGGTGCGTAACATTAGCTAGTTGGTGAGGTAACGGCCCACNAAG
GCGATAATGTTTNGCGGGGTTGAGAGACTGAACCGCCACACTGGGACTGAGAT
ACGGCCNNGACTCCTACGGGAGGCNGCNGTAGGGAATNTTCCACNATGGGCGA
AAGCCTGATGGAGCGACACAGCGTGAAGGATGAAGGTCCTATGGATTGTAAAC
TTCTGTGGTAAGGGAAGAAAAGACAGAATAGGAAATGATTTTGTTTTGACGGT
ACCTNATTNGAAAGCAACGGCTAACTATGTGCCAGCAGCCGCGGTAATACATA
GGTTGCNAGCGTTATCCGGAATTNTTGGGCGTAAAGCGTCTGTAGGTTGTTTGT
TAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCAAAACGCGTTGGATACTGGCA
GGCTAGAGTTGTGTNGAGGTTAGCGGAATTCCTTGTGAAGCGGTGAAATGCGT
AGATATAAGGAAGAACACCAAGATGGCGAAGGCAGCTAACTGGACATATACT
GACACTGAGAGACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAG
TCCACGCCCTAAACGATGATCATTAGCTGATGGGGAACTCATCGGCGCAGCTA
ACGCATTAAATGATCCGCCTGAGTAGTACGTTCGCAAGAATAAAACTTAAAGG
AATTGACGGGGATCCGCACAAGCGGTGGAGCATGTGGTTTAATTTGAAGATAC
GCGTAGAACCTTACCCACTCTTGACATCTTCTGCAAAGCTATGGAGACATAGTG
GAGGTTAACAGAATGACAGATGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAG
ATGTTTGGTTAAGTCCTGCAACGAGCGCAACCCTTATCCTTAGTTACTACCATT
TAGTTGAGGACTCTAAGGAGACTGCCCGAGTAATCGGGAGGAAGGTGGGGATG
ACGTCAAATCATCATGCCTCTTACGAGTGGGGCAACACACGTGCTACAATGGC
CGGTACAAAGAGAAGCGAAGTGGTGACATGGAGCAAACCTCAAAAAACCGGT

- 86 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

CTCAGTTCGGATTGTAGTCTGCAACTCGACTACATGAAGTCGGAATCGCTAGTA
ATCGTAGATCNCGTACGCTACGGTGAATACGTTCTCGGGTCTTGTACACACCGC
CCGTCAAACCATGGGAGCTGGTAATGCCCGAAGTCGGTTTATNAACAAATCGC
CTAAGGCAGGACTGGTGACTGGGG

>gi|862689|gb|U26047.1|MCU26047 Mycoplasma capricolum capricolum E570 16S


ribosomal RNA (rrnA) gene, partial sequence
CTGGCGGCATGCCTAATACATGCAAGTCGAACGGGGGTGCTTGCACCTCAGTG
GCGAACGGGTGAGTAACACGTATCTAACCTACCTTATAGCGGGGGATAACTTT
TGGAAACGAAAGATAATACCGCATGTAGATCTTATTATCGCATGAGAAAAGAT
CAAAAGAACCGTTTGGTTCACTATGAGATGGGGATGCGGCGTATTAGCTAGTA
GGTGAGATAATAGCCCACCTAGGCGATGATACGTAGCCGAACTGAGAGGTTGA
TCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTA
GGGAATTTTTCACAATGGACGAAAGTCTGATGAAGCAATGCCGCGTGAGTGAT
GACGGCCTTCGGGTTGTAAAGCTCTGTTGTAAGGGAAGAAAAAATAAAGTAGG
AAATGACTTTATCTTGACAGTACCTTACCAGAAAGCCACGGCTAACTATGTGCC
AGCAGCCGCGGTAATACATAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTA
TAGGGTGCGTAGGCGGTTTTGCAAGTTTGAGGTTAAAGTCCGGAGCTCAACTCC
GGTTCGCCTTGAAAACTGTTTTACTAGAATGCAAGAGAGGTAAGCGGAATTCC
ATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCTGTGGCGAAAGCG
GCTTACTGGCTTGTTATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAATAGG
ATTAGATACCCTAGTAGTCCACGCCGTAAACGATGAGTACTAAGTGTTGGGGT
AACTCAGCGCTGCAGCTAACGCATTAAGTACTCCGCCTGAGTAGTATGCTCGCA
AGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTGGTGGAGCATGT
GGTTTAATTCGAAGCAACACGAAGAACCTTACCAGGGCTTGACATCCAGTGCA
AAGCTATAGAGATATAGTAGAGGTTAACATTGAGACAGGTGGTGCATGGTTGT
CGTCAGTTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAACGCAACCCTT
GTCGTTAGTTACTAACATTAAGTTGAGAACTCTAACGAGACTGCTAGTGTAAGC
TAGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCCTGGGCTA
CACACGTGCTACAATGGCTGGTACAAAGAGTTGCAATCCTGTGAAGGGGAGCT
AATCTCAAAAAACCAGTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCATGA
AGCCGGAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTTCTC
GGGTCTTGTACACACCGCCCGTCACACCATGAGAGTTGGTAATACCAGAAGTA
GGTAGCTTAACCATTTGGAGAGCGCTTCCCAAGGTAGGACTAGCGATTGGGGT
GAAGTCGTAACAAGGTATCCGTACGGGAAC

>gi|4883887|gb|AF125586.1| Mycoplasma buccale strain CH20247(T) 16S ribosomal RNA


gene, partial sequence
CTGGCTGTGTGCCTAATACATGCATGTCGAGCGGAAGTAGCAATACTTTAGCG
GCGAATGGGTGAGTAACACGTGCTTAATCTACCTTTTAGATTGGAATACCCAAT
GGAAACATTGGTTAATGCCGGATACGCATAGAATCGCATGATTCTGTTGTGAA
AGAAGCGTTTGCTTCACTAAGAGATGAGGGTGCGGAACATTAGCTTGTTGGTG
AGGTAATGGCCCACCAAGGCTATGATGTTTAGCCGGGTCGAGAGACTGAACGG
CCACATTGGGACTGAGATACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGA

- 87 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

ATATTCCACAATGAGCGAAAGCTTGATGGAGCGACACAGCGTGCATGATGACG
GTCTTCGGATTGTAAAGTGCTGTTATAAGGGAAGAACACTTAGTTGAGGAAAT
GCTTCTAAGCTGACGGTACCTTATTAGAAAGCGATGGCTAACTATGTGCCAGCA
GCCGCGGTAATACATAGGTCGCAAGCGTTATCCGGAATTATTGGGCGTAAAGC
GTTCGTAGGCTGTTTATTAAGTCTGAAGTCAAATCCCAGGGCTCAACCCTGGTT
CGCTTTGGATACTGGTAAACTAGAGTTGGATAGAGGTAAGCGGAATTCCATGT
GAAGCGGTGAAATGCGTAGATATATATGGAAGAACACCAAAGGCGAAGGCAG
CTTACTGGGTCTATACTGACGCTGAGGGACGAAAGCGTGGGGAGCAAACAGGA
TTAGATACCCTGGTAGTCCACGCCGTAAACGATGATCATTAGTCGGTGGAGAA
TCACTGACGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTATGCTCGCAAG
AGTGAAACTTAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGT
TTAATTTGAAGATACACGGAGAACCTTACCCACTCTTGACATCCTTCGCAATAC
TATAGAGATATAGTGGAGGTTAACGGAGTGACAGATGGTGCATGGTTGTCGTC
AGCTCGTGTCGTGAGATGTTTGGTCAAGTCCTGCAACGAGCGCAACCCCTATCT
TTAGTTACTAACGAGTCATGTCGAGGACTCTAGAGATACTGCCTGGGTAACTGG
GAGGAAGGTGGGGATGACGTCAAATCATCATGCCTCTTACGAGTGGGGCAACA
CACGTGCTACAATGGTCGGTACAAAGAGAAGCAATATGGCGACATGGAGCAA
ATCTCAAAAAGCCGATCTCAGTTCGGATTGAAGTCTGCAATTCGACTTCATGAA
GTCGGAATCGCTAGTAATCGCAGATCAGCTATGCTGCGGTGAATACGTTCTCGG
GTCTTGTACACACCGCCCGTCACACCATGGGAGCTGGTAATACCCAAAGTCGG
TTTGCTAACCTCGGAGGCGACTGCCTAAGGTAGGACTGGTGACTGGGGTGAAG
TCGTAACAAGGTATCCCTACGAGAAC

>gi|18151396|dbj|AB069815.1| Mycoplasma lipophilum gene for 16S rRNA, partial


sequence
ATTTTGGGGCTCAACCCCAACTCGCGTTGGATACTGGCAAGCTAGAGTTATGTA
GAGGTTAGCGGAATTCCATGTGAAGCGGTGAAATGCGTAGATATATGGAAGAA
CACCAAGATGGCGAAGGCAGCTAACTGGACATACACTGACACTGAGAGACGA
AAGCATGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGA
TGATCATTAGTTGATGGGAGACTCATCGACGCAGCT

>gi|7008158|gb|AF221111.1| Mycoplasma caviae isolate G122(T) 16S ribosomal RNA


gene, partial sequence
CTGGCTGTGTGCCTAATACATGCATGTCGAGCGAAGGTAGCAATACCTTAGCG
GCGAATGGGTGAGTAACACGTGCTCAACGTACCCTTCAGTTTGGCATAGCGAC
TGGAAACAGTCGATAATTCCAAATACTCGTAATTTTCGCATGAAGATTACGTAA
AAGARGCGTTTGCTTCGCTGRAGGATCGGGGTGCGTAACATTAGCTAGTTGGTG
AGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGACTGAACCG
CCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGA
ATATTCCACAATGGGCGAAAGCCTGATGGAGCGACACAGCGTGAAGGATGAA
GGTCCTATGGATTGTAAACTTCTGTGGTGAGGGAAGAAAAGACAGAATAGGAA
ATGATTTTGTTTTGACGGTACCTTATTAGAAAGCAACGGCTAACTATGTGCCAG
CAGCCGCGGTAATACATAGGTTGCAAGCGTTATCCGGAATTATTGGGCGTAAA
GCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCAA

- 88 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

AACGCGTTGGATACTGGCAGACTAGAGTTGTGTAGAGGTTAGCGGAATTCCTT
GTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACACCAATATGGCGAAGGC
AGCTAACTGGACATATACTGACACTGAGAGACGAAAGCGTGGGGAGCAAACA
GGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGCTGATGGG
GAACTCATCGGCGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTCG
CAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCAT
GTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTGC
AAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTTG
TCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCCT
TATCCTTAGTTACTACCATTTAGTTGAGGACTCTAAGGAGACTGCCCGAGTAAT
CGGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCTCTTACGAGTGGGGCA
ACACACGTGCTACAATGGCCGGTACAAAGAGAAGCGAAGTGGTGACATGGAG
CAAACCTCAAAAAACCGGTCTCAGTTCGGATTGTAGTCTGCAACTCGACTACAT
GAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGTTC
TCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAAG
TCGGTTTATAAACAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCGT
AACAAGGTATCCCTACGAGAAC

>gi|3294488|gb|U67946.1|MYU67946 Mycoplasma yeatsii strain GIH 16S ribosomal RNA


(rrn) gene, partial sequence
CTGGCGGCATGCCTAATACATGCAAGTCGAACGGGGGTGCTTGCACCCCAGTG
GCGAACGGGTGAGTAACACGTATCTAACCTACCTCATAGCGGGGGATAACTTT
TGGAAACGAAAGATAATACCGCATGTGAATCTTATTATCGCATGAGAAAAGAT
TGAAAGGACCGTTTGGTTCACTATGAGATGGGGATGCGGCGTATTAGCTAGTA
GGTGAKGTAATGGCTCACCTAGGCGATGATACGTAGCCGAACTGAGAGGTTGA
TCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTA
GGGAATTTTTCACAATGGACGAAAGTCTGATGAAGCAATGCCGCGTGAGTGAT
GACGGCCTTCGGGTTGTAAAGCTCTGTTGTAAGGGAAGAAAAAATAGAGTAGG
AAATGCCTCTATATTGACGGTACCTTACCAGAAAGCCACGGCTAACTATGTGCC
AGCAGCCGCGGTAATACATAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTA
TAGGGTGCGTAGGCGGTTTTGCAAGTTTGAGGTTAAAGCCCGGAGCTCAACTC
CGGTTCGCCTTGAAAACTGCATTACTAGAATGCAAGAGAGGTAAGCGGAATTC
CATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCTGTGGCGAAAGC
GGCTTACTGGCTTGTTATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAATAG
GATTAGATACCCTAGTAGTCCACGCCGTAAACGATGAGTACTAGGTGTTGGGG
TCATCTCAGCGCCGCAGCTAACGCATTAAGTACTCCGCCTGAGTAGTATGCTCG
CAAGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTGGTGGAGCAT
GTGGTTTAATTCGAAGCAACACGAAGAACCTTACCAGGGCTTGACATCCAGTG
CAAAGCTATAGAGATATAGTGGAGGTTAACATTGAGACAGGTGGTGCATGGTT
GTCGTCAGTTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAACGCAACC
CTTGTCGTTAGTTACTAACATTAAGTTGAGGACTCTAACGAGACTGCTAGTGTA
AGCTAGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCCTGGG
CTACACACGTGCTACAATGGCTGGTACAAAGAGTCGCAATCTCGCGAGGGGGA
GCTAATCTCAAAAAGCCAGTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCA

- 89 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

TGAAGCCGGAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTT
CTCGGGTCTTGTACACACCGCCCGTCACACCACGAGAGTTGGTAATACCAGAA
GTGGGTAGCTTAACCGCAAGGAGAGCGCCTCCCAAGGTAGGACTGGCGATTGG
GGTGAAGTCGTAACAAGGTATCCGTACGGGAAC

>gi|409968|gb|U02968.1|U02968 Mycoplasma bovis 16S ribosomal RNA (rrnA) gene,


complete sequence
CAATTTTTCGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCTGTGTGCCTAA
TACATGCATGTCGAGCGATGATAGCAATATCATAGCGGCGAATGGGTGAGTAA
CACGTACTCAACGTACCTTTTAGATTGGGATAGCGGATGGAAACATCCGATAA
TACCGAATACTTATTATTTTTGCATGAAAGTAATATAAAAGGAAGCGTTTGCTT
CGCTAAAAGATCGGAGTGCGCAACATTAGCTAGTTGGTGAGGTAACGGCCCAC
CAAGGCGATGATGTTTAGCGGGGTTGAGAGATTGATCCGCCACACTGGGACTG
AGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTCCACAATGG
ACGAAAGTCTGATGGAGCGACACAGCGTGCAGGATGAAGGCCCTATGGGTTGT
AAACTGCTGTGGTTAGGGAAGAAAAAGTAGCATAGGAAATGATGCTACCTTGA
CGGTACCTGATTAGAAAGCAACGGCTAACTATGTGCCAGCAGCCGCGGTAATA
CATAGGTTGCAAGCGTTATCCGAAATTATTGGGCGTAAAGCGTCTGTAGGTTGT
TTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCAAAACGCGTTGGATACT
GGCAGACTAGAGTTATGTAGAGGTTAGCGGAATTCCTTGTGAAGCGGTGAAAT
GCGTAGATATAAGGAAGAACATCAATATGGCGAAGGCAGCTAACTGGGCATAC
ACTGACACTGAGAGACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGG
TAGTCCACGCCCTAAACGATGATCATTAGTTGATGGGGAACTCATCGACGCAG
CTAACGCATTAAATGATCCGCCTGAGTAGTACGTTCGCAAGAATAAAACTTAA
AGGAATTGACGGGGATCCGCACAAGCGGTGGAGCATGTGGTTTAATTTGAAGA
TACGCGTAGAACCTTACCCACTCTTGACATCTTCTGCAAAGCTATAGAGACATA
GTGGAGGTTAACAGAATGACAGATGGTGCATGGTTGTCGTCAGCTCGTGTCGT
GAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCCTTATCCTTAGTTACTACC
ATTTAGTTGAGCACTCTAAGGAGACTGCCCGAGTAATCGGGAGGAAGGTGGGG
ACGACGTCAAATCATCATGCCTCTTACGAGTGGGGCTACACACGTGCTACAAT
GGACGGTACAAAGAGAAGCGAAGTGGTGACATGGAGCAAACCTCAAAAAACC
GTTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCATGAAGTCGGAATCGCTA
GTAATCGTAGATCAGCTACGCTACGGTGAATACGTTCTCGGGTCTTGTACACAC
CGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAAGTCGGTTTATAAAGAAAC
TGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCGTAACAAGGTATCCCTACG
AGAACGTGGGGATGGATTACCTCCTTTCT

2) Secuencias de ADNr de 3 cepas de Mycoplasma en formato FASTA:

>Secuencia 1
CTGGCTGTGTGGCTAATACATGCATGTCGAGCGAAGGTAGCAATACCTTAGCG
GCGAATGGGTGAGTAACACGTGCTCAACGTACCCTTCAGTTTGGCATAGCGAC
TGGAAACAGTCGATAATTCCAAATACTCGTAATTTTCGCATGAAGATTACGTAA
AAGAGGCGTTTGCTTCGCTGRAGGATCGGGGTGCGTAACATTAGCTAGTTGGT

- 90 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

GAGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGACTGAACG
GCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGG
AATATTCCACAATGGGCGAAAGCCTGATGGAGCGACACAGCGTGAAGGATGA
AGGTCCTATGGATTGTAAACTTCTGTGGTGAGGGAAGAAAAGACAGAATAGGA
AATGATTTTGTTTTGACGGTACCTTATTAGAAAGCAACGGCTAACTATGTGCCA
GCAGCCGCGGTAATACATAGGTTGCAAGCGTTATCCGGAATTATTGGGCGTAA
AGCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCCA
AAACGCGTTGGATACTGGCAGACTAGAGTTGTGTAGAGGTTAGCGGAATTCCT
TGTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACACCAATATGGCGAAGG
CAGCTAACTGGACATATACTGACACTGAGAGACGAAAGCGTGGGGAGCAAAC
AGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGCTGATGG
GGAACTCATCGGCGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTC
GCAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCA
TGTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTG
CAAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTT
GTCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCTGCAACGAGCGCAACCC
TTATCCTTAGTTACTACCATTTAGTTGAGGACTCTAAGGAGACTGCCCGAGTAA
TCGGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCTCTTACGAGTGGGGC
AACACACGTGCTACAATGGCCGGTACAAAGAGAAGCGAAGTGGTGACATGGA
GCAAACCTCAAAAAACCGGTCTCAGTTCGGATTGTAGTCTGCAACTCGACTAC
ATGAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGT
TCTCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGA
AGTCGGTTTATAAACAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTC
GTAACAAGGTATCCCTACGAGAAG

>Secuencia 2
CTGGCTGTGTGCCTAATACATGCATGTCGAGCGATGATAGCAATATCATAGCG
GCGAATGGGTGAGTAACACGTACTCAACGTACCTTTTAGATTGGGATAGCGGA
TGGAAACATCCGATAATACCGAATACTTATTATTTTTGCATGAAAGTAATATAA
AAGGAAGCGCTTGCTTCGCTAGAAGATCGGAGTGCGCAACATTAGCTAGTTGG
TGAGGTAACGGCCCACCAAGGCGATGATGTTTAGCGGGGTTGAGAGATTGATC
CGCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGG
GAATATTCCACAATGGACGAAAGTCTGATGGAGCGACACAGCGTGCAGGATGA
ATGCCCTATGGGTTGTAAACTGCTGTGGTTAGGGAAGAAAAAGTAGCGTAGGA
AATGACGCTACCTTGACGGTACCTGATTAGAAAGCAACGGCTAACTATGTGCC
AGCAGCCGCGGTAATACATAGGTTGCAAGCGTTATGCGAAATTATTGGGCGTA
AAGCGTCTGTAGGTTGTTTGTTAAGTCTGGCGTTAAATTTTGGGGCTCAACCCC
AAAACGCGTTGGATACTGGCAGACTAGAGTTATGTAGAGGTTAGCGGAATTCC
TTGTGAAGCGGTGAAATGCGTAGATATAAGGAAGAACATCAATATGGCGAAGG
CAGCTAACTGGGCATACACTGACACTGAGAGACGAAAGCGTGGGGAGCAAAC
AGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGATCATTAGTTGATGG
GGAACTCATCGAGGCAGCTAACGCATTAAATGATCCGCCTGAGTAGTACGTTC
GCAAGAATAAAACTTAAAGGAATTGACGGGGATCCGCACAAGCGGTGGAGCA
TGTGGTTTAATTTGAAGATACGCGTAGAACCTTACCCACTCTTGACATCTTCTG

- 91 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

CAAAGCTATGGAGACATAGTGGAGGTTAACAGAATGACAGATGGTGCATGGTT
GTCGTCAGCTCGTGTCGTGAGACGTTCGGTTAAGTCCTGCAACGAGCGCAACCC
TTATCCTTAGTTACTACCATTTAGTTGAGCACTCTAAGGAGACTGCCCGAGTAA
TCGGGAGGAAGGTGGGGACGACGTCAAATCATCATGCCTCTTACGAGTGGGGC
TACACACGTGCTACAATGGACGGTACAAAGAGAAGCGAAGTGGTGACATGGA
GCAAACCTCAAGAAACCGTTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCA
TGAAGTCGGAATCGCTAGTAATCGTAGATCAGCTACGCTACGGTGAATACGTT
CTCGGGTCTTGTACACACCGCCCGTCAAACCATGGGAGCTGGTAATGCCCGAA
GTCGGTTTATTAAGAAACTGCCTAAGGCAGGACTGGTGACTGGGGTTAAGTCG
TAACAAGGTATCCCTACGAGAAC

>Secuencia 3
CTGGCGGCATGCCTAATACATGCAAGTCGAACGGGGGTGCTTGCACCTCAGTG
GCGAACGGGTGAGTAACACGTATCTAACCTACCTTATAGCGGGGGATAACTTT
TGGAAACGAAAGATAATACCGCATGTAGATCTTATTATCGCATGAGAAAAGAT
CAAAAGAACCGTTTGGTTCACTATGAGATGGGGATGCGGCGTATTAGCTAGTA
GGTGAGATAATAGCCCACCTAGGCGATGATACGTAGCCGAACTGAGAGGTTGA
TCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTA
GGGAATTTTTCACAATGGACGAAAGTCTGATGAAGCAATGCCGCGTGAGTGAT
GACGGCCTTCGGGTTGTAAAGCTCTGTTGTAAGGGAAGAAAAAATAAAGTAGG
AAATGACTTTATCTTGACAGTACCTTACCAGAAAGCCACGGCTAACTATGTGCC
AGCAGCCGCGGTAATACATAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTA
TAGGGTGCGTAGGCGGTTTTGCAAGTTTGAGGTTAAAGTCCGGAGCTCAACTCC
GGTTCGCCTTGAAAACTGTTTTACTAGAATGCAAGAGAGGTAAGCGGAATTCC
ATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCTGTGGCGAAAGCG
GCTTACTGGCTTGTTATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAATAGG
ATTAGATACCCTAGTAGTCCACGCCGTAAACGATGAGTACTAAGTGTTGGGGT
AACTCAGCGCTGCAGCTAACGCATTAAGTACTCCGCCTGAGTAGTATGCTCGCA
AGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTGGTGGAGCATGT
GGTTTAATTCGAAGCAACACGAAGAACCTTACCAGGGCTTGACATCCAGTGCA
AAGCTATAGAGATATAGTAGAGGTTAACATTGAGACAGGTGGTGCATGGTTGT
CGTCAGTTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAACGCAACCCTT
GTCGTTAGTTACTAACATTAAGTTGAGAACTCTAACGAGACTGCTAGTGTAAGC
TAGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCCTGGGCTA
CACACGTGCTACAATGGCTGGTACAAAGAGTTGCAATCCTGTGAAGGGGAGCT
AATCTCAAAAAACCAGTCTCAGTTCGGATTGAAGTCTGCAACTCGACTTCATGA
AGCCGGAATCACTAGTAATCGCGAATCAGCTATGTCGCGGTGAATACGTTCTC
GGGTCTTGTACACACCGCCCGTCACACCATGAGAGTTGGTAATACCAGAAGTA
GGTAGCTTAACCATTTGGAGAGCGCTTCCCAAGGTAGGACTAGCGATTGGGGT
GAAGTCGTAACAAGGTATCCGTACGGGAAC

3) Con ayuda del programa DNAMAN, realizar la digestión in silico de las 13 secuencias:
1. Al abrir el programa se verá la siguiente pantalla:

- 92 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

2. Agregar las secuencias: seleccionar el canal y pegar la secuencia en la parte inferior

3. Abrir Sequence/Current channel/Analysis definition. En Name reemplazar


Unknown por el nombre de la cepa
4. Cargar las 13 cepas, una en cada canal

- 93 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

5. Para realizar el corte con la enzima AluI, ir a Restriction/Restriction Analysis y


seleccionar Restriction pattern in graphic window (presenta un esquema con el
patrón de restricción en gel de agarosa) y All DNA in sequence channe (realiza el
corte para todas secuencias agregadas). Seleccionar Siguiente

- 94 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

6. Seleccionar Cutter: All (número de pares de bases que reconoce la enzima)


End: All (tipo de corte que realiza)
De la lista de la izquierda seleccionar (con doble clic) la enzima AluI
Seleccionar siguiente

7. Comparar el perfil de restricción obtenido para las secuencias desconocidas con el


perfil de las cepas de referencia y determinar a qué especies pertenecen la Secuencia
1, la Secuencia 2 y la Secuencia 3.

- 95 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-

- 96 -

También podría gustarte