Está en la página 1de 26

Fr

an
Microarrays de ADN
Permiten determinar y cuantificar la expresión de miles de genes simultáneamente y analizar su expresión

ja
bajo distintas condiciones experimentales.
Un microarray de ADN es un arreglo ordenado de muchas secuencias de ADN que se encuentran

M
inmovilizadas sobre una superficie sólida. Cada secuencia, representa un gen diferente, que se encuentra en
una posición determinada y conocida del microarray.

or
Se utiliza ARNm de un tejido o línea celular para generar una muestra marcada (target) con la cual se hibridan

ad
esa cantidad de moléculas inmovilizadas denominadas sondas. Así, decenas de miles de transcriptos se
pueden determinar y cuantificar de manera simultánea en un solo experimento.
Son opuestos a los experimentos de Northern, donde solo detecto un gen por vez y la muestra se encuentra

a
inmovilizada en la fase solida mientras que la sonda se encuentra en la fase liquida y es la que está marcada.
En un microarray de ADN, la sonda se encuentra en la fase sólida y no está marcada, mientras que la
muestra se encuentra en la fase liquida y está marcada.
Se pueden clasificar de acuerdo a diferentes características pero se dividen en dos grupos principales de
acuerdo al tipo de molécula inmovilizada.
1. Microarreglos de ADNc
Fueron los primeros en desarrollarse. Se construían utilizando bibliotecas genómicas y se inmovilizaban
colecciones de clones sobre soportes sólidos para luego hibridarlos con muestras marcadas.
En la actualidad, es posible inmovilizar más de 30.000 ADNc diferentes, mientras que los primeros tenían de
30-50 ADNc.
En estos experimentos, a partir de las muestras a analizar, se hacen reacciones de RT-PCR, en condiciones tal
que las muestras se marcan con colorantes fluorescentes diferentes.
Una vez realizada la marcación de las muestras, combino muestras en cantidades equivalentes e hibrido
sobre el microarreglo. Luego de la hibridizacion, se produce el lavado del microarreglo en forma similar a los
experimentos de Northern. El microarreglo se seca, y se escanea excitando al microarreglo con longitudes de
onda diferentes correspondientes cada una a cada fluoroforo. La fluorescencia que se emite es captada por
una cámara confocal laser que toma esa imagen en escala de grises y luego la convierte en escala de colores,
en donde se ven colores diferentes correspondientes a cada spot.
Estos experimentos se conocen como experimentos de hibridación competitiva.
En la imagen. Se observa verde: muestra normal,
roja: línea celular tumoral, amarilla: en ambas
muestras cantidades equivalentes del
transcripto. Luego hay una gama de colores que
indican cantidades relativas de un transcripto
determinado en una muestra y en la otra. Si se
acerca más a un color a otro, va a expresarse
más en la línea celular normal o tumoral.

Desventajas de la hibridación competitiva:


- Hibridizacion cruzada: un cDNA inmovilizado en el microarreglo (una misma sonda) puede hibridar con
distintos transcriptos presentes en la muestra que son parecidos.
Fr
2

an
- Los colorantes fluorescentes fluorescen con intensidades distintas. Entonces la analogía de que a una misma
intensidad se hibrida la misma cantidad de muestras en el chip, resulta no tan acertada.
Hay que hacer correcciones de fondo para equiparar intensidad de señal con concentración de un transcripto

ja
en la muestra.
- Solo se puede estudiar la expresión de genes conocidos. Identificados y depositados en el microarreglo, o

M
muestras provenientes de organismos para los cuales el genoma se haya secuenciado.

or
ad
a
Si se observan espacios negros, significa
que no hubo hibridación. Ese transcripto no
se expresa en ninguna de las dos muestras.

Se desarrollaron robots que por capilaridad o micro-inyección depositan las gotitas de ADNc sobre el chip,
reemplazando los porta-objetos recubiertos con membranas de nylon.
2. Microarreglos de oligonucleótidos
Se inmovilizan oligonucleótidos diseñados de manera específica para que sean específicos para cada ARNm
que existe en las muestras. Cada oligonucleótido es diseñado de manera de maximizar especificidad por
target.
Diseño de oligonucleótidos
 Oligonucleótidos sintetizados in-situ.
- Empresa Affimetrix. Sintetizar oligonucleótidos por fotolitografia.
Te permite sintetizar in situ y generar oligonucleótidos de alta densidad. Una gran cantidad de oligos
confinados en un área muy pequeña.
Se generan oligonucleótidos de 20-25 nucleótidos.
Cada gen es detectado por 11 a 20 oligonucleótidos diferentes que constituyen probe set.
Muestras se marcan con el mismo colorante fluorescente, pero cada muestra se hibrida sobre un chip
diferente y la señal que produce cada chip se superpone y se compara.
- Tecnología Ink-jet (Agilent Technologies)
60 nt. Optimización secuencia (mayor selectividad, menos hibridizacion cruzada con el target, pero alto
background, hibridizacion inespecífica porque las secuencias son más largas).
Fr
3

an
Dos colorantes (usada en microarreglos de ADNc, las muestras se marcan con colorantes fluorescentes
diferentes, se combinan e hibridan en microarreglo).
Mejora uniformidad de spots.

ja
 Oligonucleótidos pre-sintetizados (codelink).
Oligonucleótidos se sintetizan en forma separada. 30 nt, depositados piezoeléctricamente sobre el chip.

M
Optimización de cada oligonucleótido en longitud y secuencia para maximizar especificidad por los targets (<

or
background).
Proceso general de un experimento de microarray

ad
a
1- Diseño del microarray
Ejemplo: genechip (Affimetrix).
Se producen microarreglos de alta densidad de oligos, porque cada sonda del microarray está compuesta por
millones de oligonucleótidos de igual longitud y secuencia que están confinados en un pequeño cuadrado de
área que hibrida con 25nt de un gen X en particular y no con otros.
Para generar estos arreglos de tan alta densidad pegados uno al lado del otro, se utiliza litografia.
Se embebe la superficie del chip con moléculas linker con un grupo prostético fotolábil. Se coloca una
máscara sobre el microarreglo, perforada en determinados lugares, se ilumina con luz UV que atraviesa
perforaciones. Esta iluminación del chip produce la desprotección de determinados linkers en el
microarreglo, que quedan liberados para que se puedan acoplar nucleótidos. Se agregan nucleótidos que se
van a acoplar a esos lugares. Se remueve exceso de nucleótidos y coloca otra mascara con perforaciones en
otros lugares, se expone a la luz, se desprotegen otras áreas del microarreglo, y se agrega el nucleótido que
sigue. Así se procede para realizar la síntesis de oligonucleótidos de 25nt. En esta tecnología, los nucleótidos
que se agregan, están protegidos por un grupo fotolábil. Esto significa que cuando un nucleótido se acopla a
un linker desprotegido, no se puede acoplar otro nt por detrás porque tiene grupo protectivo. Como el grupo
protectivo es fotolabil, cuando irradio con luz UV se degrada permitiendo el acople de otro nt.
a
ad
4

or
M
ja
an
Fr
Fr
5

an
ja
M
or
ad
a

Puede pasar que un nucleótido no se incorpore a un grupo desprotegido. Entonces lo que se hace entre un
nucleótido y otro, es agregar un agente de capping. Se acopla al grupo desprotegido, pero no es fotolabil por
lo tanto la síntesis de oligonucleótidos se detiene en este punto, evitando que se generen oligonucleótidos
con secuencia distinta a la que debe tener la sonda en esta área.
a
ad
6

or
M
ja
an
Fr
Fr
7

an
ja
M
or
ad
a

Esta imagen es la que se observa en el chip luego del escaneo una vez hecha la hibridación. Los chips son muy
pequeños y en cada spot hay millones de moléculas de ADN simple cadena que se encuentran confinados en
un área diminuta. Dentro de cada chip hay alrededor de 200 a 400mil sondas diferentes. Cada sonda está
formada por millones de oligonucleótidos y entonces a partir de un microarray con 400mil sondas puedo
detectar unos 20mil genes.
Estrategia para minimizar crosstalk:
 Para cada gen, existen dos conjuntos de sondas.
Cada transcripto es detectado por un set de sondas (10-20 oligont de secuencias diferentes) que tienen
homología perfecta (PM, Perfect Match), a su vez, cada sonda tiene un contrapar en el cual la secuencia de
Fr
8

an
oligont tiene un mismatch en la zona central (MM, MisMatch). Entonces, no solo que para un determinado
transcripto debe haber hibridación con la mayoría de las sondas, sino que además no tiene que hibridar con
la sonda con mismatch en el medio.

ja
Entonces, para cada sonda hay un oligonucleótido que matchea perfecto con el target y otro con el mismatch
en la sonda central que no debería hibridar con la muestra. Entonces, un transcripto no solo es detectado por

M
11-15 sondas, sino que a su vez no tiene que hibridar con la sonda control con mismatch.

or
ad
a
 Sobre-representación extremos 3’ de los mRNA.
A su vez, los oligos están diseñados para hibridar hacia la región 3’ del ARNm. De manera que la no
hibridizacion de la muestra en el chip no sea consecuencia de la transcripción reversa. Es decir, por problemas
de procesividad de la enzima, pureza de muestras, etc. Que esa transcriptasa reversa no llegue a generar la
copia completa del ARNm.
De esta manera uno se asegura que la no hibridizacion no sea porque no se pudo generar el cDNA del
transcripto sino simplemente porque el transcripto no está en la muestra.
 Seleccionadas para maximizar las temperaturas de hibridación y la especificidad.
 Presencia de numerosos genes de control (permite una casi perfecta normalización entre diferentes
experimentos).
2. Preparación de las muestras
• Extracción de ARN (de tejido o cultivo de células).
Puedo trabajar con ARN total y luego hacer extracción de ARNm (generalmente con kit para que sea de buena
calidad).
– Muestra escasa: amplificación por PCR (lineal).
– Importante: control calidad ARN (métodos tradicionales o agilent bioanalizer).
Preparadas las muestras, que para experimentos de microarreglos se trabaja con 0,5µg ARNm (100-200µh
ARN total), luego de la extracción de RNA y el chequeo de calidad, se procede a la marcación. Marcación
difiere del tipo de chip con el cual se va a hibridar.
• Marcación.
– Fluorescencia
Cyanide-3 vs. Cyanide-5
Fluoresceína vs. Rhodamina
– Radioactividad (3H vs. 35S o 33P vs. 14C)
– Biotina vs. Streptavidina
– Quimiolumiscencia
Fr
9

 Más común: fluorocromos de cianina

an
Cy3, absorción 554 nm, emisión 568 nm (verde)
Cy5, absorción 650 nm, emisión 672 nm (rojo)

ja
3. Hibridación (sobre el chip)

M
– Según protocolos convencionales.
– Temperatura: 42-50ºC (arrays de ADNc).

or
– Volúmenes: 0.02 - 1 mL.
– Cámara de hibridación: temperatura y humedad constantes.

ad
Comparación de los tipos de microarreglos:
Lo principal, más allá del tipo de molécula inmovilizada, en el caso de los microarreglos de cDNA, es que las

a
dos muestras se marcan con colorantes diferentes, se mezclan e hibridan sobre el chip. Mientras que en la
mayoría de los microarreglos de oligont que se generan, cada muestra es marcada de manera independiente
pero con el mismo colorante fluorescente y cada muestra se hibrida en microarrays diferentes y luego se
comparan los datos generados por los dos microarreglos. Esto permite que, además de evitar todos los
problemas acarreados por utilizar dos colorantes diferentes, se puedan comparar no solo dos microarreglos
sino más (hasta cientos de microarreglos).

– En arrays de cDNA las muestras problema se juntan y se hibridan en un único microarray.


– En arrays de oligonucleótidos las muestras se hibridan por separado en dos microarrays idénticos.
– Tras la hibridación, el microarray se lava para eliminar el material que no se ha hibridado.
– La intensidad de la señal de hibridación resultante es proporcional a la cantidad de mRNA que corresponde
a esa secuencia en la muestra original.
Fr
10

an
4. Escaneo
Una vez que se realiza la hibridizacion de los microarreglos, se lavan para eliminar el material o la muestra

ja
que no se ha hibridado, y luego se secan para ser escaneados.
• Microscopio de fluorescencia acoplado a cámara digital que registra la señal fluorescente.

M
• Cantidad señal detectada:
– Proporcional a cantidad de colorante en ese spot  proporcional a concentración de ARN.

or
– Imagen generada: archivo monocromático (formato TIFF) de 16 bits.
– En el caso de los microarreglos de cDNA o en los cuales se utilizan dos colorantes para marcar las muestras

ad
y que se superponen y luego con eso se hibridizan los chips, se utiliza un software especializado: transforma
a una imagen a color (falsa) para mejor visualización de los resultados (rojo – verde – amarillo).

a
5. Análisis de la imagen
En el caso de dos colorantes fluorescentes diferentes, se coloca una
parrilla sobre la imagen para poder localizar cada uno de los spots,
segmentarlos y evaluar la calidad de los datos que se producen.
La identificación y cuantificación de los spots del chip puede
hacerse de forma manual, automática o semiautomática. Cada uno
de los spots del microarreglo está formado por numerosos pixels.
Una vez identificado cada spots se debe determinar para cada pixel,
que es señal y que es ruido, y la calidad de cada spot.
Una vez analizada la imagen y generados los datos de intensidad de
señal, se generan matrices de datos de expresión génica. Cada una
de las filas corresponde a una sonda diferente, se indica que gen
detecta, la señal promedio de ese spot y la señal de background.
Programas

6. Normalización
• Cada valor de intensidad proviene de una imagen independiente y es necesario hacer que estos valores
sean comparables.
• Las intensidades no son únicamente concentraciones de mRNA, hay múltiples fuentes de variación que
pueden afectar y desviar seriamente la interpretación de los resultados:

La normalización de datos se realiza en dos partes:


- Normalización “intra” array: dentro del mismo chip. Por ejemplo ver cuantas sondas hibridaron con el
target. Ver como se expresan genes de referencia.
- Normalización “entre” arrays: para que puedan compararse entre sí.
Fr
11

an
• Varios algoritmos:
– Intensidad total: ARN inicial y ARN hibridado = en 2 muestras. La cantidad de ARN es constante entre las
muestras. El ARN inicial y el que se hibrido en el chip es igual en las dos muestras. En los algoritmos de

ja
intensidad total lo que se genera es la señal de un spot en relación a la señal total producida por el
microarreglo. Se relativiza a la intensidad total la señal de cada uno de los spots.

M
– Regresión lineal: niveles de expresión son similares entre muestras. La mayoría de los genes que van a

or
detectarse en el microarreglo se expresan igual en las dos muestras y solo una pequeña proporción de los
genes cambian su expresión.

ad
Cada punto corresponde a un gen diferente.
Todos los puntos van a caer sobre una diagonal.

a
Esos genes se están expresando en la misma
proporción en ambas muestras.
Los que están por arriba se expresan más en una
muestra que en la otra, y los que están por
debajo se expresan menos en una muestra que
en la otra.

– Relación entre muestras: ARN es aprox. igual para genes esenciales.


Cuando se generan estos gráficos en la vida real, se generan nubes que
no son lo esperado. Los datos deben ser normalizados. Los datos del
grafico normalizado se grafican con los parámetros de M vs A, en donde
M representa la expresión relativa de un gen en una muestra respecto
de la otra y A los valores promedio de ese gen entre ambas muestras.
C representa la intensidad de señal de una
muestra versus la otra.
Cuando el valor de M da cero, indica que
el gen se expresa en los mismos niveles en
ambas muestras.
Valores positivos de M: mayor expresión
en R que en G.
Valores negativos de M: mayor expresión en G que en R.
Con respecto al valor de A, cuanto menor es, menor se expresa el gen.
La mayoría de los genes deberían caer alrededor de un M=0.
7. Filtración de datos
Para reducir el número de genes a analizar.
• Microarray: > 10.000 genes/spots/sondas.
- Softwares muy costosos.
- Mucho tiempo de procesamiento.
Reducir número de genes a analizar (Software: GeneSpring).
• Estrategias:
Descartar -> genes con expresión muy alta o muy baja.
-> No cambios significativos entre muestras.
Retener genes: que caigan por fuera de un valor arbitrario.
Fr
12

an
8. Análisis estadístico
El problema es que los tratamientos estadísticos fallan porque se tiene un N muy chico. En la normalización

ja
de los datos hay que permitir que esos datos a analizar estadísticamente puedan considerarse una población
normal.

M
• Para análisis estadísticos de pequeña escala se utiliza t-student y ANOVA.
• Para gran escala, se realizan cluster analysis (analizar cientos de microarrays). Los cluster analysis pueden

or
darse por condición o por genes. Pueden ser sin supervisación o con supervisación.
Métodos sin supervisación:

ad
a

- Otra forma de representar los datos:


Se observa la variación en la expresión de un gen entre distintos experimentos.
Existen tantos gráficos como genes en el array. Cada curva corresponde a un gen diferente, y cada punto de
la curva es un microarreglo diferente. Luego de generar esta curva se realiza un análisis de componentes
principales. En donde se forman clusters en donde se agrupan los genes de acuerdo a las características que
tengan.
Fr
13

an
ja
M
or
ad
a
Aplicaciones de microarrays
Detectar cambios en patrones epigeneticos y de metilación
Se trabaja con dos muestras (de estudio y control). Se corta el ADN genómico con enzimas sensibles a la
metilación. Una vez que el ADN se digiere en sitios de restricción que no están metilados, se liga adaptadores
a los fragmentos de ADN. Luego se hace un corte con enzimas que son específicas para cortar ADN metilado.
Se realizan amplificaciones específicas, en donde las muestras amplificadas se marcan con colorantes
diferentes. En el caso donde la enzima haya clivado el ADN no va a quedar ya el adaptador de un lado pero
si del otro, este fragmento no se va a amplificar porque se usan primers específicos para ambos adaptadores.

Estudio de las interacciones proteína-ADN: ChIP-chip


Permite determinar in vivo los sitios de unión en el genoma de una proteína.
Se trabaja con un tejido el cual se trata con un agente crosslinking, para un linking reversible.
El formaldehido crosslinkea proteínas entre sí y con ADN. Se aíslan los núcleos de esas muestras. El DNA se
cliva en fragmentos muchos más pequeños y se divide en dos partes. Una parte de esa muestra se
Fr
14

an
inmunoprecipita con un anticuerpo específico para la proteína en estudio, y otro con un anticuerpo no
específico para esa proteína, que va a ser el control.
Se revierte el crosslinking para separar el ADN de las proteínas, se amplifica y marca con colorantes

ja
fluorescentes y esas dos muestras se hibridan juntas en un chip. Aquellas regiones del genoma a las cuales
las proteínas se hayan unido van a inmunoprecipitar mientras que no deberían inmunoprecipitar aquellas

M
con el anticuerpo no específico.

or
ad
a

Estudio de las interacciones proteína-ADN: Protein binding microarrays


Determinar la especificidad de unión proteína-ADN in vitro.
Se utiliza una proteína que puede ser reconocida por un anticuerpo particular o taggeada con un anticuerpo
fluorescente. Esta proteína se hibridiza con un chip de ADN que tiene representadas todas las secuencias
Fr
15

an
posibles de 20 nucleótidos. Se detecta en que spot la proteína se unió y cuál es la secuencia de ADN que esa
proteína reconoce.

ja
M
or
ad
a
Fr
16

an
Secuenciación de ADN
Las primeras metodologías de secuenciación de ADN aparecieron en 1977.

ja
- Método químico: Maxam and Gilbert.
- Método enzimático: Frederick Sanger y col.

M
Se utilizaban electroforesis en geles de poliacrilamida desnaturalizantes, es decir que se corrían a altas
temperaturas y en presencia de urea. De muy alta resolución. Permitían resolver fragmentos de ADN simple

or
cadena de más de 800pb pero que difieran entre sí en un desoxinucleotido, se los denomino geles de

ad
secuencia.
En la estrategia de secuenciación se realizaban 4 reacciones de secuenciación diferentes, una para cada base.
Se generaban set de oligonucleótidos que poseían un extremo 5’ fijo y un extremo 3’ variable que terminaban

a
secuencialmente en cada una de las bases, según la reacción de secuenciación. Estos oligonucleótidos que
se generaban se resolvían en calles adyacentes en geles de secuencia, y como todos los oligonucleótidos
posibles estaban representados, se podía leer la secuencia de ADN directamente desde el gel.
La estrategia de ambos grupos es muy similar, difiere en la técnica que se utiliza para generar el ladder de
oligonucleótidos que tiene un extremo 5’ fijo y un extremo 3’ variable.
El método enzimático fue el que prevaleció a lo largo de los años, se continuó utilizando y dio pie a la
generación de secuenciadores automáticos, y el que se utilizó de base para nuevas tecnologías que se
conocen como métodos no Sanger o plataformas de arreglos cíclicos, los métodos de secuenciación de nueva
generación.
Método químico (Maxam-Gilbert, 1977)
Útil para secuenciar oligonucleótidos, aunque ya casi no se utiliza. Los cuatro grupos de oligonucleótidos se
obtienen exponiendo el ADN molde a reactivos químicos específicos de base que clivan el ADN en forma
base-especifica.
En estos experimentos se utiliza ADN doble cadena o simple cadena, marcado en un extremo. El ADN doble
cadena se desnaturaliza y se trata con reactivos específicos que modifican determinadas bases en el ADN y
luego se trata con piperidina que lo que hace es clivar el
ADN en las bases modificadas.
Se realizan cuatro reacciones de secuenciación, en donde el
ADN simple cadena se trata con:

- DMS: metila N7 de guaninas (G).

- Ácido fórmico: protona N de anillos de


purina (G+A).

- Hidrazina: rompe anillos de pirimidinas


(T+C).

- Hidrazina + NaCl: sólo reacciona con


citosinas (C).
Fr
17

an
Luego de la modificación de las bases, se hace un tratamiento con piperidina que lo que hace es catalizar la
ruptura de los enlaces fosfodiester luego de cualquier base modificada. Una vez que se realiza la ruptura de
las bases modificadas, las cuatro reacciones de secuenciación se siembran en calles adyacentes en un gel de

ja
secuencia y se realiza la electroforesis.
Al final de la corrida, el gel de secuencia se expone a una plata radiográfica que se revela en el caso de que

M
DNA ya estaba marcado con radioactivo, y se procede a la lectura del gel.

or
En este caso como la marca estaba en el extremo
5’ y los fragmentos más pequeños son los que

ad
corren más adelante en una electroforesis,
aquellos fragmentos que correspondan a una

a
región cercana al extremo 5’ de la secuencia que se
quiere leer van a estar en la parte inferior del gel,
mientras que los fragmentos más largos, que se van
a ubicar en la parte superior del gel, van a
corresponder a la región 3’ del gen que se quiere
secuenciar.
Una vez que se realizan las cuatro reacciones de
modificación y clivado de las bases modificadas, se
procede a la siempre y al final se realiza la lectura ingresando por la zona central del gel y desde abajo para
poder leer la secuencia en sentido 5’ a 3’.
Método enzimático (Sanger y col., 1977)
Se utiliza una DNA polimerasa para sintetizar una copia marcada de ADN simple hebra que es
complementaria al ADN molde que se quiere secuenciar. Esta elongación ocurre a partir del extremo 3’ de
un primer que se anilla al ADN molde que se quiere secuenciar y esta metodología de secuenciación se basa
en la capacidad que tienen las polimerasas de incorporar análogos de nucleótidos y en este caso de
incorporar dideoxinucleotidos, que son aquellos que en el extremo 3’ no tienen un hidróxido sino que tienen
un átomo de hidrogeno. Por lo tanto, si se incorpora un dideoxinucleotido no va a poder catalizarse el enlace
fosfodiester entre el extremo 3’ de este nucleótido y el extremo fosfato 5’ del nucleótido siguiente. La
elongación se detiene.
Por esta capacidad que tienen las polimerasas de no discriminar entre desoxinucleotidos y
dideoxinucleotidos, cuando durante la polimerización se incorpora un dideoxinucleotido, la elongación de la
cadena de ADN que está naciendo se detiene.

En una reacción de secuenciación para detectar adeninas, el ADN molde se hibrida con el primer, se agrega
la polimerasa, se agregan los cuatro a dNTPs y además se agregan los cuatro dideoxiNTPs. Entonces, en la
mezcla para detectar adeninas se encuentran presentes tanto el desoxinucleotido desoxiATP como el
didesoxiATP, por lo que puede incorporarse cualquiera de los dos. Durante la polimerización, puede ocurrir
Fr
18

an
que se incorpore un desoxiATP, por lo tanto la elongación continúa. Si se incorpora un didesoxiATP la
elongación de esa cadena se detiene.
Al final de estas reacciones de extensión, se genera una población de oligonucleótidos que tienen extremo

ja
5’ fijo y extremo 3’ variable que termina cada uno en un desoxinucleotido específico.
Si estas cuatro reacciones de secuenciación se siembran en calles adyacentes en un gel de secuencia, de

M
nuevo uno puede leer la secuencia de ADN directamente desde el gel.

or
ad
a
Método original o de Sanger
El primer se hibrida con ADN molde simple cadena que luego se divide en cuatro reacciones, en donde se
agrega el fragmento Klenow de la ADN polimerasa de E. coli, los cuatro dNTPs, en donde uno se encuentra
marcado radioactivamente, y además en cada una de las reacciones se agrega el didesoxinucleotido para la
base que se quiere leer. Se realizan las reacciones de extensión y se siembran en calles adyacentes en un gel
de secuencia.
Como la marcación de la hebra de ADN se produce mientras la polimerasa va extendiendo la secuencia, los
fragmentos en donde se incorporaron didesoxinucleotidos mas cerca del primer, van a ser los fragmentos
más pequeños que se van a detectar en la parte inferior del gel. Los fragmentos más grandes se encuentran
arriba en el gel. Por lo tanto la lectura de la secuencia en sentido 5’ – 3’ se realiza de la misma forma que en
el método químico. Se ingresa por la parte inferior del gel, pero cada calle corresponde a la reacción para
identificar una base en particular, por lo tanto se va leyendo la secuencia según a que base corresponda cada
una de las reacciones.
Fr
19

an
ja
M
or
ad
a
Cuando se realiza una secuenciación por el método enzimático de Sanger, la hebra que se lee es la hebra que
corresponde al primer, es decir la hebra complementaria al ADN molde.
Método de Sanger modificado o de Tabor-Richardson
Incorpora dos modificaciones:
1. Se utiliza una T7 DNA polimerasa, comercialmente llamada secuenasa.
2. Se separa en dos pasos diferentes las reacciones de marcación radioactiva del ADN y las reacciones de
terminación con los didesoxinucleotidos.
En este método, el ADN molde se anilla al primer y luego se procede a la reacción de marcación, añadiendo
el buffer de la enzima, la secuenasa, los 4 dNTPs en bajas concentraciones, entre los cuales uno de ellos está
marcado, y en estas condiciones en donde la concentración de dNTPs es baja con respecto al ADN molde, la
sequenasa tiene baja procesividad, por lo tanto, la reacción de marcación o la polimerización ocurre por unos
pocos nucleótidos.
Luego de la etapa de marcación, la reacción se divide en cuatro tubos a los cuales se les agrega los 4 dNTPs
en concentraciones más altas, y a cada tubo de reacción se agrega un didesoxinucleotido correspondiente a
la base que se quiere leer.
Fr
20

an
Luego del proceso de extensión y marcado, y luego de que se pasa a las reacciones de terminación, en donde
se produce la incorporación o no de los didesoxinucleotidos, se agrega un paso final en el cual se agregan
concentraciones altas de todos los dNTPs, para que aquellos fragmentos que no se terminaron de elongar

ja
por un desprendimiento prematuro de la enzima se terminen de elongar. De esta manera se generan
fragmentos de ADN muy largos que durante la corrida quedan en la parte superior del gel, no ingresan, y de

M
esta manera se evita durante la corrida fragmentos donde la terminación fue prematura, y que podrían

or
provocar leer una banda que no corresponde a una base en particular sino a una terminación prematura de
la enzima, se evita cometer un error de lectura.

ad
Marcación del ADN en el método enzimático
Métodos radioactivos

a
- [α32 P] dATP
- [α35 S] dATP
- [α33 P] dATP
- Extremo 5’ del primer
Métodos no radioactivos
- Quimioluminiscencia
- Fluorescencia
Primeros desarrollos en tecnología de secuenciación
Kits comerciales
Los laboratorios no tenían que generar sus propios reactivos para hacer las secuenciaciones sino que
comenzaron a comercializarse kits en donde se vendía la enzima, las mezclas de dNTPs mas didesoxiNTPs y
demás para poder realizar las reacciones de secuenciación.
Secuenciación multiplex
Varias muestras se secuenciaban en un mismo gel. Se realizaban las reacciones de secuenciación para
diferentes muestras que se sembraban en las mismas calles en un gel de secuencia.
Por ejemplo si se deseaba secuenciar tres muestras diferentes, las tres reacciones para detectar adenina se
realizaban en forma separaba pero se sembraban en la misma calle, lo mismo para el resto de los nucleótidos.
Una vez terminada la corrida, lo que se hacía era revelar el gel con sondas específicas para cada uno de los
fragmentos que se querían secuenciar. Se exponía a la sonda, se revelaba, después esa membrana se lavaba,
la sonda se despegaba y se volvía a hibridar la membrana con la sonda siguiente.
Caminata con el primer
Para leer fragmentos más largos de ADN, porque con el método enzimático en una buena corrida se pueden
leer como máximo unos 300 nucleótidos, se puede secuenciar con un primer que venga desde el otro lado.
Por otro lado lo que se puede hacer es una caminata con el primer, es decir, leer primero en una secuencia
utilizando los primers universales que pegan hacia los costados de los sitios múltiples de clonado de los
vectores para leer una parte del inserto que esta clonado y luego con la información de esta secuencia diseñar
un nuevo primer para seguir avanzando en la lectura de la secuencia que tiene el inserto clonado.
Permitía leer entre 1300 y 7000 pb.
Fr
21

an
Ciclación térmica
Surgió con la invención de la PCR. Es una estrategia de secuenciación que emplea DNA polimerasas que son

ja
termoestables, como la taq.
El uso de esta estrategia de secuenciación que es por ciclación térmica tiene dos ventajas:

M
1. Las reacciones de secuenciación se pueden realizar a temperaturas altas porque la enzima es termoestable,
y por lo tanto el primer se puede anillar a temperaturas más adecuadas para que no se produzcan

or
hibridaciones inespecíficas. Además, permite que las estructuras secundarias que se pudieron ir formando
en el ADN molde que generaran el desprendimiento prematuro de la enzima no por una incorporación de un

ad
dideoxinucleotido se eviten por la temperatura alta que se utiliza durante la polimerización (62ºC).
2. Además de secuenciar el ADN deseado, la muestra se puede amplificar. Muy útil cuando la cantidad de

a
muestra que se tiene es pequeña. Es una amplificación lineal.

Polimerasas utilizadas en secuenciación enzimática


Propiedades relevantes
• No deben tener actividad 3´- 5´ exonucleasa. De tenerla, podrían remover el extremo 3’ del primer.
Además esta característica le permite corregir sus errores, es decir que va a discriminar más entre análogos
de nucleótidos y por lo tanto va a incorporar los dideoxinucleotidos con menos eficiencia.
• No deben tener actividad 5´- 3´ exonucleasa. Para que la enzima no remueva el primer, y que
entonces la polimerasa o no tenga cebador para iniciar la polimerización o que al final de las reacciones de
secuenciación se generen fragmentos de ADN que no cuenten todos con un extremo 5’ fijo, lo que provocaría
que el tamaño aparente con el que migre un gen no corresponda al esperado, y por lo tanto la lectura sea
errónea.
• Procesividad. Las enzimas deben ser lo más procesivas posibles para obtener lecturas largas de la
secuencia.
• Velocidad de elongación. Cuanto mayor, menor.
• Capacidad de incorporar análogos de nucleótidos. Además de ser importante para la incorporación
de dideoxinucleotidos, es importante para los casos en donde hay regiones altamente palíndromas o con
riesgo de formar estructuras secundarias estables. Se los incorpora durante la polimerización impidiendo la
formación de estas estructuras. Se utilizan enzimas que no tengan una buena capacidad de discriminar entre
estos análogos de nucleótidos.
Fr
22

an
• Rango de Temperatura. Cuanto mayor sea la temperatura optima de trabajo de la enzima, mejor.
Polimerasas utilizadas

ja
SECUENASA (T7 ADN Fragmento KLENOW de la Taq polimerasa AMV-RT (Transcriptasa reversa)
polimerasa modificada) ADN polimerasa I de E. coli

M
– No actividad – Act 3´-5´ débil; no 5´-3´ – No 3´-5´; – No posee actividad exonucleasa
endonucleasa – Baja procesividad – Versiones modificadas – Procesividad intermedia

or
– Procesividad y velocidad – Alta discriminación contra que carecen de act. 5´-3´ – No discrimina contra análogos
de elongación altas ddNTPs (Thermosecuenasa, de dNTP

ad
– No discrimina análogos de – Utiliza dITP y 7-deaza- Amplitaq) – Temperatura 37 - 42ºC
nucleótidos comparado con dGTP – Procesividad moderada

a
Taq y Klenow – Temperatura hasta 50ºC – Discriminación contra
– Terminación 37ºC < T < ddNTPs
55ºC – Utiliza 7-deaza-dGTP pero
no dITP
– Temperatura 55-70ºC
Inconvenientes al realizar una secuenciación enzimática
Mala calidad del ADN molde
El ADN puede presentar impurezas que lleven a una terminación prematura, que la enzima se desprenda
antes de la incorporación de dideoxinucleotidos.
Por otro lado, si el ADN esta nickeado, es decir si las hebras de ADN presentan rupturas en los enlaces
fosfodiester y se rompen los enlaces entre un nucleótido y el otro, cuando uno desnaturalice el ADN se van
a generar dos hebras diferentes. Los nicks que se generan pueden servir como cebadores para las
polimerasas, por lo tanto la polimerasa va a empezar a polimerizar en cualquier otra región del fragmento
que se quiere secuenciar, y va a generar un ladder de oligonucleótidos que nada tiene que ver con la
secuencia que uno quiere leer.
Compresiones en el patrón de bandas de los geles o terminaciones prematuras
Las compresiones en las bandas se dan cuando no se ve una distribución o migración esperada. Esto se debe
a que se forman estructuras secundarias en el ADN que se genera por la polimerización, que son tan estables
y soportan las condiciones desnaturalizantes del gel de poliacrilamida (se corre a temperaturas altas y tiene
urea en altas concentraciones para mantener el ADN desnaturalizado).
En una reacción de secuenciación primero se desnaturaliza el ADN y luego se lo siembra en los geles y a su
vez esas moléculas de ADN se mantienen desnaturalizadas porque el gel es desnaturalizante. Si las muestras
que uno siembra en el gel forman estructuras secundarias que son estables a la temperatura o a la urea que
está presente en el gel, el ADN va a empezar a formar estructuras que van a hacer que migre con un peso
molecular aparente diferente, y por lo tanto, las bandas van a aparecer en partes superiores del gel y no en
las regiones en las que deberían estar. Se ve en los geles varias bandas que no permiten leer un nucleótido
específico, o las bandas tienen un espaciamiento irregular.
Terminación prematura
Estas estructuras secundarias estables probablemente también se formen en el ADN molde, provocando una
terminación prematura de la polimerización. Por lo tanto, cuando uno corra las reacciones de secuenciación
en los geles de secuencia va a encontrarse con zonas de los geles que estén transparente, sin ninguna banda.
Ocurre que la enzima se desprende en una región del ADN y luego vuelve a unirse.
Fr
23

an
Desarrollos en tecnología de secuenciación
Secuenciación automática

ja
Automatización de la siembra, la corrida electroforética (PAGE desnat. Tradicional o electroforesis capilar),
en la detección del patrón de bandas y en el análisis de las bandas – “lectura”-.

M
or
ad
a
En los secuenciadores automáticos la lectura de la secuencia se hace en la base de la corrida, ya sea en un
gel de poliacrilamida o en un capilar.
Secuenciación automática con primers fluorescentes
En los secuenciadores automáticos el ADN ya no se
marca con radioactivo, sino con colorantes
fluorescentes. Puede hacerse utilizando primers que
tengan marcas fluorescentes, marcados con
fluoroforos diferentes. Cada primer marcado con un
fluoroforo es utilizado para una reacción de
secuenciación diferente.
En las reacciones de secuenciación en donde se
agrega dideoxiATP para detectar adeninas se utiliza
un primer que está marcado con un fluoroforo que
fluoresce en el verde, como se muestra en la imagen.
Se realizan cuatro reacciones de secuenciación
distintas, cada una con el oligonucleótido marcado en
5´ con una sonda fluorescente distinta. Además se
agregan la polimerasa, los dNTPs y el ddNTP
correspondientes.
Durante la electroforesis las bandas del ADN de
cadena sencilla pasan a través de un láser de argón
que excita las sondas fluorescentes, la señal de emisión de fluorescencia, una vez amplificada, es detectada
a través de un filtro y asignada a la base correspondiente.
Secuenciación automática con terminadores fluorescentes
Además de utilizar primers marcados con colorantes fluorescentes diferentes, uno para cada reacción de
secuenciación, se pueden utilizar terminadores fluorescentes.
Lo que se hace es hacer las reacciones de secuenciación en cuatro tubos diferentes en los cuales se utilizan
los dideoxinucleotidos como terminadores en las reacciones de polimerización, pero cada uno de ellos está
marcado con un fluoroforo diferente. Según la longitud de onda emitida por el fragmento de ADN que se lee,
se va a corresponder a una base en particular.
Fr
24

an
ja
M
or
ad
a
Tanto en la secuenciación que utiliza primers y en la que utiliza terminadores fluorescentes, se siembra todo
en una misma calle del gel, o en un mismo capilar, y la lectura se realiza en la base del gel o del capilar, donde
hay un láser de argón que excita las moléculas de ADN que van pasando y del otro lado hay un detector que
recibe la longitud de onda que emiten los fluoroforos excitados, y lo que hace es amplificar la señal que lo
manda a una computadora, y asigna la longitud de onda que recibe a un color y genera gráficos.

El detector capta la fluorescencia emitida por cada fluoroforo y la envía a una computadora donde un
software grafica la intensidad de señal recibida con un color diferente según la longitud de onda de esa señal
que recibe. Como cada fluoroforo corresponde a una reacción de secuenciación diferente, se puede asignar
una base a cada pico de fluorescencia que se detecta con el detector.
En general los primeros nucleótidos después del primer no se pueden leer bien, porque hay errores en la
lectura, en la emisión de los fluoroforos. Las secuencias se empiezan a leer bien alrededor de los 50-60
Fr
25

an
nucleótidos después del primer. La secuencia que uno puede leer de un determinado fragmento de ADN
comienza unos nucleótidos después que el primer.
Calidad de la secuencia obtenida

ja
A veces las corridas no salen tan bien. La calidad depende de diferentes cuestiones.

M
Alta calidad

or
ad
a
Sin ambigüedades. Cada pico que se detecta está separado de los picos adyacentes y se puede asignar la base
correspondiente.
Media calidad

Algunas ambigüedades. Con superposiciones de pico. Es difícil establecer a que base corresponde ese
fragmento de ADN.
Baja calidad.
Fr
26

an
Picos muy pequeños y superpuestos. Corresponde a problemas en la hibridación del primer, o formación de
estructuras secundarias en el ADN. O muestras contaminadas con DNA distinto.
Causas de baja calidad de la secuencia obtenida

ja
- Calidad de las muestras.
- Primer no específico o altamente específico para la secuencia que se quiera leer.

M
- Que las secuencias correspondan a genomas de organismos con alto contenido GC, que generan estructuras

or
secundarias muy fuertes, que hacen que la enzima se desprenda, y por lo tanto se producen perdidas de
lecturas de regiones.

ad
- Regiones palíndromas que generan bucles en la estructura secundaria del ADN que generan la perdida de
regiones, tanto en ADN molde como en cadena de ADN que se genera.

También podría gustarte