Metodos de Secuenciacion de Acidos Nucleicos PDF

Métodos de secuenciación de ácidos nucleicos.

Gonzalo Greif .
Unidad de Biología Molecular. Institut Pasteur Montevideo.

1. Un poco de historia
2. Secuenciación por método de Maxxam y Gilbert
3. Secuenciación por método de Sanger
a. Avances en el método de Sanger (1986‐1996)
b. Proyecto Genoma Humano
4. Algunos Métodos de secuenciado masivo
a. Pirosecuenciación
b. Secuenciado por hibridización (Illumina)
c. Otro métodos
d. Aplicaciones

1. Un poco de historia.
Pasaron 15 años desde el descubrimiento de la estructura de doble hélice del ADN en 1953
hasta la determinación de la primera secuencia de ADN de forma experimental. Algunas de las
razones que provocaron esta demora fueron:
1. Las propiedades químicas similares de las diferentes moléculas de ADN dificultaban su
aislamiento.
2. El largo de las moléculas de ADN, mucho mayores que las cadenas polipeptídicas de las
proteínas, hacían inabordable la secuenciación completa.
3. No se conocían ADNasas específicas. La secuenciación de proteínas se basaba en el uso
de proteasas que cortaban en determinados aminoácidos.
Sin embargo, algunas moléculas de ARN no ofrecían estas dificultades, en particular las
moléculas de ARN de transferencia eran pequeñas y se podían purificar individualmente.
Además se conocían ARNasas base‐específicas y se desarrollaron métodos análogos a los
utilizados para proteínas. La primer secuencia de un ácido nucleico fue obtenida por Holley y
sus colaboradores en 1965 y correspondía al ARN de transferencia de alanina de Escherichia
coli.
Un evento importante en el desarrollo de los métodos de secuenciación de ADN fue el
descubrimiento de las enzimas de restricción de tipo II en 1970. Estás enzimas reconocen y
cortan el ADN en secuencias específicas (en general entre 4 y 6 bases de largo). Estas enzimas
proporcionaron un método general para fragmentar largas moléculas de ADN en pequeñas
piezas para luego ser separadas por electroforesis en geles de agarosa. A mediados de la
década del 70, Frederick Sanger publica el método “más‐menos” (“plus‐minus” method) que
permitía la secuenciación de fragmentos de ADN utilizando la enzima ADN polimerasa de E.
coli. A fines de esta misma década, Maxxam y Gilbert publican un método alternativo de
secuenciación de ADN (método químico) y el mismo Frederick Sanger publica el método que
luego se convertiría en el más utilizado durante los siguientes 30 años (método enzimático),
como veremos en el punto 3.
Méto
odos de secuenciación dee ácidos nuclleicos. 2
Gonzalo
o Greif

2
2. Secuenciación químicca.
El método de seecuenciación n química propuesto

p po or Maxxam y Gilbert, fue
f publicad
do en
febreero de 1977 en el Volumen 74 (nº 2) de la reevista PNAS, 10 meses antes
a que Sanger
S
publicara el métoodo de secueenciación enzzimática quee veremos en n la siguientee sección.
En eel artículo deescriben el procedimientto de esta m manera: “Desarrollamos u una nueva téécnica

para secuenciar u una moléculla de ADN. EEl procedimiento determ mina la secue encia nucleo
otídica
de unn ADN marccado radioactivamente en e un extrem
mo, cortándoolo con agen
ntes químico
os” en
cada una de las b bases. El corrte parcial de cada basee, genera un set de fragm
mentos marrcados
desdee el extrem mo marcado o hasta la base dóndee fueron clivados. Utilizando gelees de
poliaccrilamida y sseparando dichos fragmeentos por tamaño, es po osible determ minar la secu
uencia
de essta molécula.
El método prop puesto estab ba limitado por la cap
pacidad de resolución de los gelees de
poliaccrilamida, y en este prim
mer artículo muestran laa posibilidad
d de secuenciar 100 basses de
ADN.
El método utiliizaba 4 reaccciones químiicas. Una reaacción
quíímica produ uce cortes específicame
e ente en Citoosinas
(18
8M hidracinaa, 2M NaCl. Una reaccción con 50 0 mM
metil‐sulfato corta en Adeeninas y Guaaninas; si lueego de
dim
este tratamientto químico se calienta la reacción a 9 90ºC a
pH neutro, enttonces se obtiene
o un patrón
p de bandas
inteenso para lass guaninas y tenues paraa las adeninaas. Por
el contrario, el
e tratamien nto posterior a un pH ácido
proovoca un pattrón inverso (bandas inteensas de adeeninas
y tenues
t de guaninas). El
E último tratamiento (18M
hid
dracina) prod duce el clivajje tanto en ccitosinas commo en
tim
minas.
En la Figura 1, se muestra e

el patrón de
e bandas obttenido
durrante la secu d un fragmento de 64 bases
uenciación de
(moostrado en eel artículo de 1977).
ura 1. Se muestran

Figu m los cuatro carrriles del gel de
poliacrilamida con
c cada unaa de las reaccciones de cliivaje.
Interpretación: La secuencia se lee de abajo hacia arrriba.
Una banda inteensa en la primera
p colummna y una banda
ten
nue en la segu unda correspo onden a una A Adenina, mientras
quee la situación inversa correesponde a un na Guanina en n esa
possición. Una b
banda que apparece en la tercera y cu uarta
columna en la misma posición indica una C. y una banda
sólo presente en n la última columna corresp ponde a una TT.

Méto
Gonzalo
o Greif

33. Secuenciación enzimática.
En dicciembre de 1 1977 se publica el trabajo de Sanger,, Nicklen y Co oulson que ppropone un n nuevo

méto odo para detterminar la ssecuencias d de bases en una molécula de ADN. Sanger y Co oulson
habíaan ya publiccado dos años antes, un n método de
d secuenciaación (métod do más‐men nos) a
partirr del cual haabían logradoo obtener do os secuenciaas de 70 basees del bacteriófago φX174. La
dificu
ultad en la interpretació
ón de los resultados y aalgunos erro dían ocurrir en la
ores que pod
secueencia hiciero olaboradores siguieran trabajando para mejoraar los
on que Sangger y sus co
méto odos de secuenciación dee ácidos nucleicos.
Así, eel método propuesto

p por Sanger en
e 1977 se convirtió
c en el método más utilizad
do de
dad. La incorporación de mejoras en
secueenciación dee ácidos nuccleicos hastaa la actualid e los
aspecctos tecnológicos y meto odológicos (aautomatización, método os de detecciión, electrofforesis
undamental,, la secuencciación del genoma humano
capilaar, etc.) perrmitieron, como hito fu
(finalizado en el año 2003) por este méétodo. En 19980 Fredericck Sanger ob
btuvo su seggundo
premmio Nobel en Química por la invención de este méétodo (ver re ecuadro). Reecién en 2005 5, con
la aparición de lo os secuenciadores 454 se e dio un cam mbio en la te ecnología de secuenciación de
ácidoos nucleicos. Aun así, muchas de las n nuevas tecno ologías de seecuenciación masiva utilizan el
principio de nucleótidos term minadores, descrito
d mo veremos más adelan
por Sanger, com nte en
los seecuenciadorees de Illumin na.
Fred
derick Sange
er (1918‐)
Frederick Sanger nació en n Rendcombee, Inglaterra en

e 1918. De padre médico, se
esperaba quee Fred siguierra sus pasos, ssin embargo een la Universidad de Cambridge
ó su formación en Cambridge
decidió realiizar una carrera en Cienccias. Continuó
realizando un n Ph.D. con A Albert Neuberger, en metab bolismo de am minoácidos. LLuego
continuó trab bajando con C C. Chibnall ideentificando loss aminoácidoss de la insulin
na, en
el transcursoo de la investigación, Sanger imaginó ó las formas en las cuálees se
ordenan los aaminoácidos e en la proteínaa.
Fuee la primera p
persona en ob btener la secuencia de amin noácidos de u una proteína ((la insulina). PProbó
que las proteínass eran molécu
ulas ordenadaas y, por analogía, los gen
nes y el ADN que codifica estas
protteínas deberían tener un orden o secu
uencia. Por esste trabajo obtuvo su prim mer premio N Nobel
(19558).
En 1
1962, Sanger ccomienza a trrabajar en el laboratorio dee Biología Molecular, también en Cambrridge,
dón
nde Francis Crick, John Keendrew y otro os trabajabann con problemmas relacionaados con el ADN.
A
Resoolver como obtener la secu uencia de ADN era la exten nsión natural de su trabajoo anterior. Fuee así,
com
mo estudiando o primero la forma
f de secuenciar ARN (una moléculla más pequeeña) logró obttener
una técnica apliccable luego all ADN (el méttodo de secuenciación porr dideoxinucleeótidos). En 1980,
1
obtuuvo por ello su segundo premio Nobel también en e Química compartido
c co
on Walter Giilbert
(méétodo de secue enciación química) y Paul B Berg (ADN reccombinante).
En 11992, el Wellccome Trust y el Medical Research Coun ncil establecieeron el Sangerr Institute, un

no de
los ccentros de seccuenciación d
dónde se llevó
ó adelante el p
proyecto Geno oma Humano.
En 1
1985 se retiró y se dedica p
principalmente
e al cuidado d
de su jardín.
ntes:http://www..dnaftb.org/23/bio.html/ http://w
Fuen nger.html
www.sanger.ac.ukk/about/people/biographies/fsan
Lectu das: Nobel Lecture (Frederick Sanger, 1980).
uras recomendad
Méto
Gonzalo
o Greif

El méétodo enzim mático de Saanger, utilizaa una ADN polimerasa
p e
e inhibidores que finalizzan la
caden na de ADN que está siendo sintetizada en luggares especííficos, particcularmente utiliza
dideooxinucleótido os (es decir nnucleótidos que en su caarbono 3´ no o contienen el grupo hid droxilo
–Figuura 2‐ ). La incorporación de una basee con estas ccaracterísticaas en un mollécula nacien nte de
ADN impide que e una nuevaa base pueda incorporasse y la sínte
esis de ADN
N es interrummpida
(Figura 3).
Figura 22. Estructura de un nucleótido (ej. dATP) y un di‐deoxinucleó
ótido (ddATP).
Figura 3. Esquema de m mecanismo de ssíntesis de ADNN (1), y (2) impo
osibilidad de continuar elongacción de cadenaa
nacientee luego de la inccorporación dee un didoxinucleeótido.
En el artículo ejeemplifican, de

d forma claara, que sucede cuándo utilizan di‐d deoxiTimina en la
reaccción: “Debido o a que el ddT no contie ene grupo 3’ hidroxilo, la cadena no o puede conttinuar
exten ndiéndose, entonces
e la terminación
t ocurre espeecíficamentee en las possiciones dónde dT
debería haberse incorporado. Si un cebad dor y un mollde son incub bados con ADN polimeraasa en
preseencia de unaa mezcla dee ddTTP y dTTP, así co
omo los otrros tres deooxiribonucleo osidos
trifossfato (uno de ellos marcado radiiactivamentee con 32p),, se obtiene un mezccla de
Méto
Gonzalo
o Greif

mentos todoss con el mism
fragm mo extremo 5´ y con residuos ddT en n el extremo o 3´. Si esta m
mezcla
es fraaccionada poor electroforresis desnatu
uralizante enn geles de accrilamida el patrón de bandas
muesstra la distrib
bución de los residuos TTimina en el ADN sintetizzado. Utilizanndo terminaadores
d los cuatrro nucleótidos en reaccciones indep
para cada uno de pendientes, y corriendo cada
mezccla en paralelo en el gel, se obtiene u
un patrón dee bandas a p partir del cuaal se puede leer la
secueencia de basees” (Figura 4
4 y 5).
Figura 4. Esta imagen
n se encuentra en la Nobel Leecture de F. Saanger de 1980. En la misma se
s ejemplifica el
e
pio del método de dideoxinucleeótidos terminadores.
princip
Figura 5. Esta imagen co orresponde a laa segunda figura del artículo de Sanger (PNASS, 1977).

Se trata de un autorad
diografía dóndee se muestra laa migración dee las cuatro differentes
mezclas (una para cad da dideoxinucleeótido terminaador utilizado).. A la derech ha de la
imagen se leen las secueencias de ADN (en este caso u un fragmento del bacteriófago o φX174.
Las lecturas se realizan de abajo (fraggmentos más pequeños) haciaa arriba (más ggrandes),
de acuerd ón de las bandas. La resolución
do a la aparició n del gel, permiite separar bandas de 1
nucleótiddo de diferenciaa en tamaño.
Las seecuencias ob
btenidas con este método alcanzaban
n hasta 200 bases de larggo.

Méto
Gonzalo
o Greif

aa. Avances yy mejoras en
n el método de Sanger (1
1977‐1996).

I.. Secuenciaciión con term
minadores flu uorescentes ((dye‐terminaator sequenccing).

En 19 986 Hood y
y colaborado ores, en colaaboración con Applied Biosystems (ABI) publiccan el
primeer reporte de e automatizaación de la ssecuenciación de ADN, q que establece e la secuenciación
con terminadoress fluorescenttes como variante del m método de Saanger. Está vaariante utilizza una
molécula fluoresccente diferente unida a cada dideoxinucleótido, y permite reealizar la reaacción
en un n único tuboo (Figura ). Assimismo, la ssecuencia puuede ser leídda a través de un computtador.
Las ssecuencias obtenidas,
o co
on esta nueeva variante eran de un
n largo de entre
e 500 y 1000
nucleeótidos.

a. b. c.

Figura 6. En estaa figura se ejem mplifica como en lugar de 4 carriles (uno
paara cada base) (a), se corren todas las reacciones en un único
ú carril
deel gel (cada colo
or representa u una base) (b) y se desarrollan aalgoritmos
paara convertir essas señales en ““electroferograamas” que reprresentan la
se
ecuencia de ADDN (c). La flech
ha a la izquierd
da indica la dirrección de
lectura 5’‐3’.

III. Secuenciacción automáttica.
La em
mpresa Appllied Biosysteems, fue la pionera
p y líd umentos de secuenciación. El
der en instru
primeer secuenciaador automáático (ABI 37 70A) aparecce en 1987, y con él se logra conocer la
secueencia del primer gen porr Craig Venteer y sus coleegas del National Institutte of Health (NIH,
USA). La aparición de los secuenciadores automático os permitió laa instalación n de facilidad des de
secueenciación. El primero dee ellos fue el NIH, dóndee se instalaro on 6 secuencciadores ABII3700.
En 19
992, Venter funda el Institute for Genomic
G Ressearch (TIGR R) y expandee la capacidad de
secueenciación con 30 equiposs.

Con eesta plataforrma instalad da, se demueestra el poder de la secuenciación aautomática ccon el
desarrrollo de la eestrategia EST (expressed d sequence ttag) para el d descubrimien nto de geness. Esta
estrategia consiste en hacer copias de ADN
A a partirr del ARN mensajero
m ceelular (ADNcc=ADN
copiaa) y clonarlaas de forma aleatoria para luego seecuenciar. En E 1991, con n esta estraategia,
Venteer reporta 337 genes hu umanos no conocidos. La base de daatos de EST contiene hoy más
de 433 millones dee secuencias correspondientes a 1300 organismo os diferentes.

Métodos de secuenciación de ácidos nucleicos. 7
Gonzalo Greif

b. Proyecto Genoma humano:

La secuenciación del genoma humano se volvió un objetivo realizable una vez establecidas las
metodologías de secuenciación de ADN. La discusión formal comenzó en 1985 en Estados
Unidos. En 1990, se presentó un proyecto de 5 años en el congreso de Estados Unidos (Human
Genome Project). Se estimaba que el proyecto duraría 15 años y el costo rondaría los 3 mil
millones de dólares. El proyecto establecía el objetivo de mapear y secuenciar diferentes
organismos modelo además de humano. Entre ellos E. coli, S. cerevisiae, C. elegans, D.
melanogaster y el ratón (Mus domesticus). El proyecto se convirtió en un esfuerzo de
colaboración internacional entre diversos centros de secuenciación en Estados Unidos, Europa
y Japón. Cada centro se focalizó en regiones particulares del genoma, que permitieran obtener
un mapa. En 1994 se publicó un mapa detallado del genoma humano que incluía el mapeo de
5840 loci con una media de espaciado de 0,7 cM (1 centiMorgan = 106 bases).

En 1998, el proyecto público, compitiendo ahora con la empresa Celera (propiedad de Craig
Venter) adopta los secuenciadores capilares de Applied Biosystems (ABI3700).
En 1999 el proyecto Genoma humano había secuenciado más de mil millones de bases y se
publicó la secuencia completa de un cromosoma humano (el cromosoma 22).

Para el mismo tiempo, Celera, comenzó a Cobertura (Coverage):
secuenciar el genoma humano con la estrategia
de “whole genome shotgun sequencing” La cobertura es el número promedio de
desarrollada por C. Venter (explicada más secuencias que representan a un
adelante). La secuenciación comenzó en
determinado nucleótido en la secuencia
setiembre de 1999 y en junio de 2000 se realizó
un ensamblaje inicial de las secuencias total reconstruida. Puede ser calculada a
obtenidas. Los datos de Celera permitieron el partir del largo original del genoma (G), el
ensamblaje del genoma humano con una número de secuencias (N) y el largo
cobertura de 5X (ver Cobertura). Además se promedio de las secuencias (L) como:
aumentó la cobertura 3X con los datos públicos.
Cobertura = N x L/G
El 25 de junio de 2000, en la Casa Blanca, el
presidente Clinton junto a Francis Collins Ejemplo. Un genoma hipotético de 2000
(responsable del proyecto público, NIH) y Craig bases, secuenciado con 24 secuencias de
Venter, anunciaron públicamente la versión 350 bases de promedio de largo tiene
borrador del genoma humano realizada tanto una cobertura de:
por el esfuerzo público como privado (Figura 7).
24 x (350/2000) = 4,2 X.
En febrero de 2001, se publicaron los borradores
del consorcio público y del privado en Science y Este valor significa que el genoma fue
Nature (Figura 8). Finalmente en el año 2004 se secuenciado 4,2 veces. Cuánto mayor
publicó la versión final del genoma humano. cobertura, menor posibilidades de
errores en la secuencia final.

Méto
Gonzalo
o Greif

Figura 7. Fo
oto de lanzam
miento de borrrador del geno
oma
humano en Washington
n (Clinton, Ven
nter, Collins).
Figura 8. Tapas de revisttas Nature y S
Science de 200
01 con
los borraddores del genooma humano.
Whole genome Sho
otgun sequen
ncing y Craig V
Venter:
El método de Whole Genome Sh hotgun consisste en la fragm mentación al aazar del ADN de todo el geenoma,

clonarlo en plásmiidos y secuen
nciar ambas hebras
h (el passo de clonado
o luego fue eliminado).
e Una vez
obten nidas, las secu
uencias se alin
nean y ensam mblan para forrmar contigs b basándose en n las secuenciaas que
solapaan (Figura 9). El método fue utilizado po or Sanger en 1 1982 para enssamblar el faggo lambda (48 8,5 kb),
sin emmbargo Venter fue el prim
mero en utilizarlo para seecuenciar un genoma de mayor tamañ ño (H.
influeenzae, 1,8Mb) y proponerlo o como estrateegia para secu uenciar el genoma humano o.

ra 9. Esquemaa de secuenciaación con la eestrategia de SShotgun. Secu
uenciación de fragmentos
erados al azarr y ensamblaje de la secuen ncia utilizando
o procesamiennto informáticco.
En 1995, Venter y ssu grupo decid den utilizar nuuevas herram
mientas compuutacionales assí como los méétodos
mejorrados de seccuenciación para realizarr la primer secuencia de
e un organissmo de vidaa libre
(Haemmophilus influ
uenzae). En TIGR analizar más
m de 50 geenomas micro
obianos. Ventter y alguno de
d sus
colabo
oradores, commenzaron entonces la seccuenciación de
d genomas de
d mayor tam maño (mosca, rata,
ratón).
En 20006 se fundó el J. Craig Venter Institutee (JCVI) por laa unión de varias organizacciones (TIGR, TCAG,

JCVSFF, etc.). Se trata de una orgganización lídeer en genómica a nivel muundial con máás de 400 cienntíficos
trabajjando.

Gonzalo Greif

4. Algunos Métodos de secuenciado masivo
Pasaron cerca de 30 años desde la publicación del método de Sanger, hasta que apareciera
una nueva tecnología de secuenciación de ácidos nucleicos que no fuera el método de
dideoxinucleotidos terminadores. La principal característica de estas nuevas metodologías es
la posibilidad de secuenciado masivo de forma paralela, esto significa que el número de
secuencias obtenidas durante una corrida supera muchas veces el máximo de 96 secuencias
por corrida que se obtienen con los secuenciadores capilares de última generación que utilizan
el método de secuenciado de Sanger.

A partir del desarrollo del método de pirosecuenciación (primer método de secuenciado
masivo utilizado, 2005), surgen nuevas alternativas de secuenciación que utilizan el mismo
principio de dideoxinucleotidos terminadores en sus protocolos, aunque con mejoras
innovadoras.

Estos nuevos métodos de secuenciado masivo no ofrecen lecturas tan largas como el método
clásico de Sanger, aunque en pocos años se ha mejorado sustancialmente el largo de las
secuencias obtenidas y en algunos casos alcanzan longitudes comparables a Sanger.

a. Pirosecuenciación:

El primer método de secuenciado masivo o “next generation sequencing” (NGS), fue publicado
en 2005 en Nature, y llevado al mercado por la empresa 454 (luego adquirida por Roche). El
resumen de este artículo explica: “Describimos un método escalable, un sistema de
secuenciación altamente paralelizable con un rendimiento significativamente mayor que los
instrumentos de electroforesis capilar. El aparato permite secuenciar 25 millones de bases, con
99% de precisión en una corrida de 4 horas” (este rendimiento es 100 veces superior a la
cantidad de bases secuenciadas en ese tiempo en un secuenciador de 96 capilares).

En el primer artículo, publican la secuenciación de novo del genoma de Mycoplasma
genitalium alcanzando cubrir el 96% del genoma y con una precisión de 99,96% en una corrida.

El método consiste en 4 pasos:
1. Fragmentación del ADN (o ARN).
2. Ligación de oligonucleótidos (adaptadores) en cada uno de los extremos.
3. Amplificación clonal (mediante PCR en emulsión).
4. Secuenciado por síntesis usando un protocolo de pirosecuenciación optimizado en un
soporte sólido y en escala de picolitros.

Más en detalle, luego de fragmentar el ADN, se ligan oligonucléotidos adaptadores a cada
extremo del ADN. Estas secuencias adaptadoras comunes a todos los fragmentos serán
utilizadas, tanto para ligar cada fragmento a las esferas, como secuencias donde se unirán los
cebadores de la PCR y además presenta la secuencia donde se unirá el cebador de
secuenciación. Una vez ligados los adaptadores, se ligan a las beads (esferas que contienen el
complementario a uno de los adaptadores en su superficie), por un método de dilución límite,
de modo de obtener un único fragmento unido a una esfera. Se busca, entonces, obtener en
cada bead un único fragmento de ADN, el mismo es amplificado mediante PCR en emulsión.

Méto
Gonzalo
o Greif

PCR een emulsión (emPCR):
La PCR en emu ulsión permite realizar en un úniico tubos miles
m de reacciones dee PCR
indeppendientes. U Una vez obteenida la libreería de fragmmentos que sserán secuen nciados, se u unen a
esferas que conttienen uno de los adapptadores preesentes en los
l fragmentos, de mod do de
obtenner un único fragmento o por esferaa. Luego la población de
d esferas (cada una co on un
fragm
mento de AD DN) es emulssionada en u una mezcla d de agua y acceite, de modo tal de ob btener
micellas de aceite
e independientes –cadaa uno de elloos con una única esferaa y con todo
os los
reacttivos necesaarios para llevar adelante la reaccción‐. El re
esultado finaal, son milees de
microoreactores dónde se llevaa adelante laa reacción dee PCR de form ma independ diente (Figurra 10).

Figuraa 10. Esquema de la PCR en n emulsión. (11) Se liga a caada bead un fragmento
f meddiante las secu uencias
complementarias a uno
u de los adaaptadores que se encuentran en la superficie de las mism mas. (2) Se realiza una
emulsión (agua‐aceitte) de tal form
ma que en cadaa gota de aceitte encontremo os una única beead unida a unn único
framgeento y encontrramos además todos los reacctivos necesario os para llevar adelante
a la PCR
R (dNTPs, Polimmerasa,
cofactores). (3) Luegoo se realiza unaa PCR convencional, pero en ccada tubo de reeacción se realiizan simultáneaamente
miles de reacciones en paralelo. (4
4) Luego de n ciclos de reaccción, se obtiene una amplificcación clonal de
d cada
fragmeento unido a un na bead.

Luego o de finalizada esta reeacción, se rompe la emulsión
e y se recuperaan las beadss que
preseentaron amp plificación. Las
L mismas son deposittadas en la placa de seecuenciación. Esta
placaa (picoTiter pplate), tiene 1,6 milloness de pocillos, y en cada u
uno de ellos sólo puede eentrar
un beead (Figura 1 11). En cada pocillo suced derá una reaacción de seccuencia, por lo cual en la placa
podemos decir que tenem mos 1,6 millones de secuenciado
s res de 1 capilar,
c o 16000
1
secueenciadores d de 96 capilarees aproximad damente.
Méto
Gonzalo
o Greif

Figuraa 11. Pico‐Titre plate. Arriba: esquema de dep
posición de esfeeras en los pociillos. Abajo: miccrografía electrrónica
de los pocillos y ejem
mplo de carga dee una placa.

Reaccción de secuenciación:

Este método no utiliza nucleó ótidos
terminadores. En n este caso, se realizan ciclos
dónde se ofrece en cada poccillo una base por
vez, secuenciaalmente. Durante la
incorporación dee una base en una molécula
nacieente de AD DN se liberaa pirofosfatto, el
pirofoosfato liberrado se co onvierte en n luz
mediante dos procesos
p enzzimáticos. La
L luz
emitida en cada p pocillo, dóndde se incorpo oró la
base ofrecida, es monittoreada po or la
deteccción lumino ométrica de la liberación del
pirofoosfato durante la reaccción de sín ntesis
(Figura ). Una cám mara CCD colecta los dattos de
cada base, en cad da ciclo y en cada posició ón. Figuraa 12. Esquema de reacción de pirosecuenciacción

En ell caso de ho
omopolimero os (tractos de
d secuenciaa con el missmo nucleóttido), el larggo del
homo opolimero ess determinado a partir d de la cantidaad de pirofossfato liberad do (proporcio onal a
la can
ntidad de bases incorporrada).

Ejemplo:
En el primer cicloo se ofrece la base A, en todos los pocillos. En aquellos qu ue se incorpoora se
obserrva la emisió ón de luz (deependiendo la cantidad d de A incorpo orada, será la intensidad d de la
luz emmitida). Lueggo de obtenidas las imágenes, se reemueve la baase, y se ofreece la base TT y se
obserrvan los pocillos que inco orporan T. Se vuelve a eliminar la baase no incorp porada y se o ofrece
la base G, y luego o la C para tterminar el p primer ciclo. Luego de 100 ciclos finaliza la corriida. El
Gonzalo Greif

tamaño promedio de cada lectura es de 400 bases y en una corrida se obtienen cerca de 1
millón de secuencias (es decir 400 millones de bases/10 horas de corrida).
b. Illumina:
La segunda tecnología de secuenciación masiva que salió al mercado (2006) fue la de Solexa

(luego adquirida por Illumina). En esta tecnología, se utilizan nucleótidos terminadores
marcados con moléculas fluorescentes al igual que en la Secuenciación de Sanger. Además de
la paralelización masiva (es decir la capacidad de realizar millones de secuencias en cada
corrida), la diferencia con el método convencional es la posibilidad de eliminar la fluorescencia
una vez obtenida la imagen, y desbloquear carbono 3’ de modo que pueda aceptar una nueva
base para continuar la reacción de secuenciación, haciendo que la incorporación de un
nucleótido terminador sea reversible. En este caso, las longitudes obtenidas son menores que
los secuenciadores 454 (en la actualidad hasta 150 bases), sin embargo la capacidad de realizar
secuencias en paralelo es mucho mayor que en 454 (hasta 250 millones de secuencias). Como
resultado es posible obtener hasta 6 x 1012 en una sola corrida. Para dimensionar este número,
el genoma humano tiene aproximadamente 3 x 109 bases de largo.

Al igual que el método de secuenciación de Roche, los primeros pasos consisten en la
fragmentación del ADN y ligación de adaptadores. Luego hay un paso de amplificación (en este
caso, la amplificación es en una superficie sólida: “flow cell”, dónde también se dará luego la
reacción de secuenciación).

Amplificación y Reacción de secuenciación:

En el primer paso, la librería se deposita en la flow cell por complementariedad con los
adaptadores (1). Luego se produce la amplificación en puente (2 y 3) en sucesivos ciclos
(4,5,6,7,8) hasta obtener un cluster con la amplificación clonal del fragmento inicial (8) (Figura
13).

1 2 3 4 5 6 7 8

Figura 13. Amplificación en puente. Ver descripción en el texto.

En la reacción de secuenciación, se bloquea uno de los adaptadores (1), y se comienza la
reacción de secuenciación desde el otro extremo (2) mediante un cebador específico (Figura
14).

1 2

Figura 14. Reacción de secuenciación de Illumina.
Ver descripción en el texto.

Gonzalo Greif

Durante la reacción, a diferencia de la pirosecuenciación, se ofrecen los cuatro nucleótidos
terminadores marcados cada uno con un fluorocromo diferente (1), al igual que el método de
Sanger. Luego de un lavado (2), se obtienen las imágenes y se obtiene la primera base de cada
cluster (3). Luego, se elimina el fluorocromo y se desbloquea el Carbono 3, permitiendo que un
nuevo nucleótido pueda extender la cadena de ADN naciente (4). Otra vez los cuatro
nucleótidos terminadores marcados son ofrecidos a los clusters, comenzando un nuevo ciclo
(Figura 15).
1 2 3 4
Figura 15. Reacción de secuenciación de Illumina. Primer ciclo de secuenciación (1), incorporación de
dideoxinucleótidos marcados (2), adquisición de imagen (3), y lavado, desbloqueo, y eliminación de marcado (4).
Los últimos modelos de Illumina permiten secuenciar en paralelo más de 3000 millones de
clusters con largos desde 35 a 150 bases (www.illumina.com).
c. Otros métodos:
Desde 2005 hasta la fecha, otras tecnologías de secuenciación masiva han sido desarrolladas y
otras se encuentran en desarrollo y constituyen una nueva generación de secuenciadores
(Tabla 1). Es imposible en este capítulo el desarrollo en profundidad de cada una de ellas, por
lo tanto en la siguiente tabla se muestran otras tecnologías y las fuentes dónde obtener mayor
información de cada una de ellas.
Algunas de estas tecnologías (SMRT, Helicos) proponen la secuenciación a partir de una única
molécula de ADN en tiempo real. Una de ellas (Pacific Biosciences) en teoría no tiene límite en
cuánto al largo de las secuencias generadas y eventualmente podría secuenciar cromosomas
enteros en una única lectura (www.pacificbiosciences.com).
Otras, como Oxford nanopore e Ion Torrent (recientemente lanzada al mercado) ofrecen
novedosas soluciones y no requieren marcación fluorescente ni cámaras registradoras de
imágenes. En particular, Ion Torrent (ver recuadro J. Rothberg), se basa en el registro de los
cambios de pH producidos durante la incorporación de bases durante la síntesis de ADN. Se
trata de micropHímetros que reducen notablemente los costos de secuenciación
(www.iontorrent.com) y prometen ser herramientas útiles en el área de diagnóstico.
Méto
Gonzalo
o Greif

Plataforma Teecnología Longgitud de read
ds Añoo Web
www.ap
ppliedbiosystems.co
om
SOLiD (Applieed Biosystemm) Ligación
n 50 basses 2007
www
w.helicosbio.com
Genetic
G Anaalysis Systeem true Siingle Moleccule 25 a 55 bases 2008
(H
Helicos) Sequencing
www.paacificbiosciences.com
SMRT (Pacificc Biosciencess) Single Molecule Real
R >1000 bases D
ND
time (en teo
oría sin límite)
www
w.iontorrent.com
Io
on Torrent Micro ppHímetros >200 bbases 2011
www.nanoporetech.com
Oxford Nanop
O pore Label free, electrical ND ND
D
Tabla 1. Información sobre otras teccnologías de seecuenciación maasiva en el merrcado o cerca de
e salir.
Jonathan M M. Rothbergg, Ph.D. (19 963 ‐ )

Fundador y CEO de Ion TTorrent.

Rothberg naació en 1963 3 en New Haaven, Conneccticut. Se graaduó en inge eniería química con opcióón en
Ingeniería B Biomedica en n Carnegie M Mellon University, y realizzó luego su m maestría y dooctorado en la
Universidad d de Yale.

El Dr. Rothb berg es el piionero en el desarrollo d de tecnologíías de secuenciación masiva. Según cuenta en laa
página web (www.ionto orrent.com), la primera id dea sobre el secuenciado o masivo en paralelo surge luego quee
su hijo fuerra internado o en cuidado
os intensivoss y se cuestio
onara la imp
portancia deel genoma humano en laa
salud. Subssecuentemen nte, funda 454
4 Life Scieences, lanzan ndo al mercado el primer secuenciaador masivo o.
Dirigió la seecuenciación del primer ggenoma hum mano de un individuo (secuenciando exitosamentte el genomaa
del Dr. Wattson). Ademáás inició el p primer proyecto de secueenciado massivo de un AD DN antiguo ((Neanderthaal
Genome Pro oject, en colaboración co on el Dr. Paabo).

La contribución de Roth hberg al secuenciado maasivo incluyee el desarrollo del primeer sistema dee clonado no o
bacterial (emPCR).

En 2007, Rothberg com menzó un nu uevo negocio, a raíz de un comentario de su hijo.
h Rothberg funda Ion
n
Torrent y deesarrolla el cconcepto de secuenciació ón con pHím metros.
Además es ffundador de e otras empreesas, vinculaadas a la tecn
nología y me
edicina. Es también fundaador de The
Rothberg In
nstitute for C
Childhood Dissease.
Fuente: http://www.ionto
orrent.com/teeam/jonathan‐rothberg/

Gonzalo Greif

d. Aplicaciones
La producción de un gran número de lecturas a bajo costo permite la aplicación de las
plataformas de secuenciado masivo en muchas aplicaciones, y es imposible describir todas
ellas aquí. La primera aplicación obvia es la secuenciación de genomas (ver recuadro Genoma
Humano y Secuenciación masiva) y la precisa anotación de genes (sitios de splicing,
poliadenliación, secuencias 5’ y 3’ UTR, etc). Dentro de las primeras aplicaciones encontramos
la secuenciación de ARN (ej. descubrimiento de ARN pequeños, nuevas variantes génicas,
nuevos genes, etc.) y amplicones de PCR (secuenciado de ARNr16S y su aplicación en
metagenómica como veremos en el siguiente párrafo). Asimismo, la posibilidad de
cuantificación de transcriptos que ofrece esta tecnología (RNA‐seq), la vuelve una alternativa a
los experimentos de microarreglos. La secuenciación para identificar marcadores epigenéticos,
identificar interacción ADN‐proteína, determinar estructura de cromatina (ChIP‐Seq, Methyl‐
seq, DNase‐seq) son aplicaciones cada vez más utilizadas.

La metagenómica es el estudio genómico de microorganismos por la extracción directa de ADN
de una comunidad microbiana. La aparición de la secuenciación masiva ha facilitado a los
investigadores la tarea de identificación y caracterización de diferentes microogranismos, en
diferentes ambientes.

En la sección de lecturas recomendadas se ofrecen revisiones bibliográficas de cada una de
estas aplicaciones para que el lector profundice en ellas.

Genoma Humano y Secuenciación masiva:
Como ya vimos antes, la secuencia del genoma humana se publicó en 2004. La secuenciación de este
genoma tuvo un costo aproximado de 3000 millones de dólares y cerca de 20 años de trabajo. En
octubre de 2007, se publica el primer genoma de un único individuo (J. Craig Venter), realizado por el
método de shotgun y secuenciación Sanger. El costo de este genoma fue aproximadamente 70 millones
de dólares y una duración de 4 años.
El primer genoma humano secuenciado con la tecnología 454 fue el del Dr. James Watson, a un costo
de 1 millón de dólares y en dos meses (2008). El costo ha continuado bajando y se han reportado la
secuenciación de un genoma humano por menos de 100.000 dólares.
Varios proyectos tienen como objetivo la secuenciación de más individuos, entre el ellos “The Cancer
Genome Atlas” y “1000 Genome project”.
Hace tan solo 10 años, 2 dedos eran suficientes para contar el número de genomas secuenciados. En
2009, alcanzaban los dedos de ambas manos. Hoy, es difícil de saberlo exactamente, pero un
relevamiento realizado por la revista Nature, indica que cerca de 30.000 genomas humanos estarán
secuenciados para finales de 2011.
Gonzalo Greif

Lecturas recomendadas:

1. Sanger F. Coulson R. A rapid method for determining sequences in DNA by primed
synthesis with DNA polymerase. J. Mol. Biol., 94, 441‐448 (1975). Método “más‐menos”
de Sanger.
2. Maxam A. and Gilbert. A new method for sequencing DNA. PNAS, 74 (2), 560‐564, (1977).
Articulo dónde se describe método químico de secuenciación de ácidos nucleicos.
3. Sanger, F., Nicklen, S. and Coulson, A.R. DNA sequencing with chain‐terminating inhibitors
4. PNAS, 74 (12), 5463‐5467 (1977). Artículo de Sanger dónde describe el método de
secuenciación utilizando dideoxinucleótidos.
5. Sanger, F. Determination of nucleotide sequences in DNA. Nobel lecture, 8 December
1980.
6. Venter, C. et al. The Diploid Genome Sequence of an Individual Human. PLOS Biology, 5
(10), (2007). Publicación de genoma de Craig Venter.
7. International Human Genome Consortium. Finishing the euchromatic sequence of the
human genome. Nature 431, 931–945 (2004).
8. Margulies, M. et al. Genome sequencing in microfabricated high‐density picolitre reactors.
Nature 437, 376–380 (2005). Los autores describen el desarrollo de la primer tecnología
de secuenciado masivo, y realizan el ensamblaje de novo del genoma de Mycoplasma
genitualium utilizando pirosecuenciación.
9. Bentley, D. R. et al. Accurate whole human genome sequencing using reversible terminator
chemistry. Nature 456, 53–59 (2008). Artículo de los desarrolladores de Illumina,
reportando el uso de esta tecnología para la secuenciación de un cromosoma humano.
10. Wang, Z., Gerstein, M. & Snyder, M. RNA‐Seq: a revolutionary tool for transcriptomics.
Nature Rev. Genet. 10, 57–63 (2009). Review sobre uso de tecnologías de secuenciado
masivo para análisis de transcriptomas (RNA‐seq).
11. Park, P. J. ChIP–seq: advantages and challenges of a maturing technology. Nature Rev.
Genet. 10, 669–680 (2009). Revisión sobre ChIP‐seq.
12. Morozova, O.,Hirst, M., Marra, M. Applications of New Sequencing Technologies for
Transcriptome Analysis. Annu. Rev. Genomics Hum. Genet. 10,135–51 (2009). Revisión
NGS.
13. Petrosino, J. F., Highlander, S., Luna, R. A., Gibbs, R. A. & Versalovic, J. Metagenomic
pyrosequencing and microbial identification. Clin. Chem. 55, 856–866 (2009). Se trata de
un review sobre metagenómica.
14. Zhou, X., Ren, L., Meng, Q., Li, Y., Yu, Y., Yu, J. The next‐generation sequencing technology
and application. Protein Cell, 1(6), 520–536 (2010). Revisión NGS.
15. Metzker, M.L. Sequencing technologies — the next generation. Nature Reviews Genetics
11, 31‐46 (2010). Revisión NGS.
16. Human genome: Genomes by the thousand. Nature 467, 1026‐1027 (2010). Revisión
secuenciadores instalados y genomas secuenciados.
17. Zhanga, J., Chiodinic, R., Badra, A., Zhang G. The impact of next‐generation sequencing on
genomics. Genet. Genomics. 38(3), 95–109 (2011). Revisión NGS.

Otros recursos interesantes:

1000 Genomes Project: http://www.1000genomes.org
The Cancer Genome Atlas: http://cancergenome.nih.gov
The Exome Project: http://www.nhlbi.nih.gov/resources/exome.htm
Human Microbiome Project: http://nihroadmap.nih.gov/hmp
Personal Genome Project: http://www.personalgenomes.org
Craig Venter Institute: www.jcvi.org

Metodos de Secuenciacion de Acidos Nucleicos PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Metodos de Secuenciacion de Acidos Nucleicos PDF

Cargado por

Copyright:

Formatos disponibles

Métodos de secuenciación de ácidos nucleicos.

El método de seecuenciación n química propuesto

En eel artículo deescriben el procedimientto de esta m manera: “Desarrollamos u una nueva téécnica

En la Figura 1, se muestra e

ura 1. Se muestran

En dicciembre de 1 1977 se publica el trabajo de Sanger,, Nicklen y Co oulson que ppropone un n nuevo

Así, eel método propuesto

Frederick Sanger nació en n Rendcombee, Inglaterra en

En 11992, el Wellccome Trust y el Medical Research Coun ncil establecieeron el Sangerr Institute, un

En el artículo ejeemplifican, de

Figura 5. Esta imagen co orresponde a laa segunda figura del artículo de Sanger (PNASS, 1977).

El método de Whole Genome Sh hotgun consisste en la fragm mentación al aazar del ADN de todo el geenoma,

En 20006 se fundó el J. Craig Venter Institutee (JCVI) por laa unión de varias organizacciones (TIGR, TCAG,

La segunda tecnología de secuenciación masiva que salió al mercado (2006) fue la de Solexa

Jonathan M M. Rothbergg, Ph.D. (19 963 ‐ )

También podría gustarte