Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Gonzalo Greif .
Unidad de Biología Molecular. Institut Pasteur Montevideo.
1. Un poco de historia
2. Secuenciación por método de Maxxam y Gilbert
3. Secuenciación por método de Sanger
a. Avances en el método de Sanger (1986‐1996)
b. Proyecto Genoma Humano
4. Algunos Métodos de secuenciado masivo
a. Pirosecuenciación
b. Secuenciado por hibridización (Illumina)
c. Otro métodos
d. Aplicaciones
1. Un poco de historia.
Pasaron 15 años desde el descubrimiento de la estructura de doble hélice del ADN en 1953
hasta la determinación de la primera secuencia de ADN de forma experimental. Algunas de las
razones que provocaron esta demora fueron:
1. Las propiedades químicas similares de las diferentes moléculas de ADN dificultaban su
aislamiento.
2. El largo de las moléculas de ADN, mucho mayores que las cadenas polipeptídicas de las
proteínas, hacían inabordable la secuenciación completa.
3. No se conocían ADNasas específicas. La secuenciación de proteínas se basaba en el uso
de proteasas que cortaban en determinados aminoácidos.
Sin embargo, algunas moléculas de ARN no ofrecían estas dificultades, en particular las
moléculas de ARN de transferencia eran pequeñas y se podían purificar individualmente.
Además se conocían ARNasas base‐específicas y se desarrollaron métodos análogos a los
utilizados para proteínas. La primer secuencia de un ácido nucleico fue obtenida por Holley y
sus colaboradores en 1965 y correspondía al ARN de transferencia de alanina de Escherichia
coli.
Un evento importante en el desarrollo de los métodos de secuenciación de ADN fue el
descubrimiento de las enzimas de restricción de tipo II en 1970. Estás enzimas reconocen y
cortan el ADN en secuencias específicas (en general entre 4 y 6 bases de largo). Estas enzimas
proporcionaron un método general para fragmentar largas moléculas de ADN en pequeñas
piezas para luego ser separadas por electroforesis en geles de agarosa. A mediados de la
década del 70, Frederick Sanger publica el método “más‐menos” (“plus‐minus” method) que
permitía la secuenciación de fragmentos de ADN utilizando la enzima ADN polimerasa de E.
coli. A fines de esta misma década, Maxxam y Gilbert publican un método alternativo de
secuenciación de ADN (método químico) y el mismo Frederick Sanger publica el método que
luego se convertiría en el más utilizado durante los siguientes 30 años (método enzimático),
como veremos en el punto 3.
Méto
odos de secuenciación dee ácidos nuclleicos. 2
Gonzalo
o Greif
2
2. Secuenciación químicca.
El método prop puesto estab ba limitado por la cap
pacidad de resolución de los gelees de
poliaccrilamida, y en este prim
mer artículo muestran laa posibilidad
d de secuenciar 100 basses de
ADN.
El método utiliizaba 4 reaccciones químiicas. Una reaacción
quíímica produ uce cortes específicame
e ente en Citoosinas
(18
8M hidracinaa, 2M NaCl. Una reaccción con 50 0 mM
metil‐sulfato corta en Adeeninas y Guaaninas; si lueego de
dim
este tratamientto químico se calienta la reacción a 9 90ºC a
pH neutro, enttonces se obtiene
o un patrón
p de bandas
inteenso para lass guaninas y tenues paraa las adeninaas. Por
el contrario, el
e tratamien nto posterior a un pH ácido
proovoca un pattrón inverso (bandas inteensas de adeeninas
y tenues
t de guaninas). El
E último tratamiento (18M
hid
dracina) prod duce el clivajje tanto en ccitosinas commo en
tim
minas.
odos de secuenciación dee ácidos nuclleicos. 3
Méto
Gonzalo
o Greif
33. Secuenciación enzimática.
Fred
derick Sange
er (1918‐)
Fuee la primera p
persona en ob btener la secuencia de amin noácidos de u una proteína ((la insulina). PProbó
que las proteínass eran molécu
ulas ordenadaas y, por analogía, los gen
nes y el ADN que codifica estas
protteínas deberían tener un orden o secu
uencia. Por esste trabajo obtuvo su prim mer premio N Nobel
(19558).
En 1
1962, Sanger ccomienza a trrabajar en el laboratorio dee Biología Molecular, también en Cambrridge,
dón
nde Francis Crick, John Keendrew y otro os trabajabann con problemmas relacionaados con el ADN.
A
Resoolver como obtener la secu uencia de ADN era la exten nsión natural de su trabajoo anterior. Fuee así,
com
mo estudiando o primero la forma
f de secuenciar ARN (una moléculla más pequeeña) logró obttener
una técnica apliccable luego all ADN (el méttodo de secuenciación porr dideoxinucleeótidos). En 1980,
1
obtuuvo por ello su segundo premio Nobel también en e Química compartido
c co
on Walter Giilbert
(méétodo de secue enciación química) y Paul B Berg (ADN reccombinante).
En 1
1985 se retiró y se dedica p
principalmente
e al cuidado d
de su jardín.
ntes:http://www..dnaftb.org/23/bio.html/ http://w
Fuen nger.html
www.sanger.ac.ukk/about/people/biographies/fsan
Lectu das: Nobel Lecture (Frederick Sanger, 1980).
uras recomendad
Méto
odos de secuenciación dee ácidos nuclleicos. 4
Gonzalo
o Greif
El méétodo enzim mático de Saanger, utilizaa una ADN polimerasa
p e
e inhibidores que finalizzan la
caden na de ADN que está siendo sintetizada en luggares especííficos, particcularmente utiliza
dideooxinucleótido os (es decir nnucleótidos que en su caarbono 3´ no o contienen el grupo hid droxilo
–Figuura 2‐ ). La incorporación de una basee con estas ccaracterísticaas en un mollécula nacien nte de
ADN impide que e una nuevaa base pueda incorporasse y la sínte
esis de ADN
N es interrummpida
(Figura 3).
Figura 22. Estructura de un nucleótido (ej. dATP) y un di‐deoxinucleó
ótido (ddATP).
Figura 3. Esquema de m mecanismo de ssíntesis de ADNN (1), y (2) impo
osibilidad de continuar elongacción de cadenaa
nacientee luego de la inccorporación dee un didoxinucleeótido.
Figura 4. Esta imagen
n se encuentra en la Nobel Leecture de F. Saanger de 1980. En la misma se
s ejemplifica el
e
pio del método de dideoxinucleeótidos terminadores.
princip
Las seecuencias ob
btenidas con este método alcanzaban
n hasta 200 bases de larggo.
odos de secuenciación dee ácidos nuclleicos. 6
Méto
Gonzalo
o Greif
aa. Avances yy mejoras en
n el método de Sanger (1
1977‐1996).
I.. Secuenciaciión con term
minadores flu uorescentes ((dye‐terminaator sequenccing).
En 19 986 Hood y
y colaborado ores, en colaaboración con Applied Biosystems (ABI) publiccan el
primeer reporte de e automatizaación de la ssecuenciación de ADN, q que establece e la secuenciación
con terminadoress fluorescenttes como variante del m método de Saanger. Está vaariante utilizza una
molécula fluoresccente diferente unida a cada dideoxinucleótido, y permite reealizar la reaacción
en un n único tuboo (Figura ). Assimismo, la ssecuencia puuede ser leídda a través de un computtador.
Las ssecuencias obtenidas,
o co
on esta nueeva variante eran de un
n largo de entre
e 500 y 1000
nucleeótidos.
a. b. c.
Figura 6. En estaa figura se ejem mplifica como en lugar de 4 carriles (uno
paara cada base) (a), se corren todas las reacciones en un único
ú carril
deel gel (cada colo
or representa u una base) (b) y se desarrollan aalgoritmos
paara convertir essas señales en ““electroferograamas” que reprresentan la
se
ecuencia de ADDN (c). La flech
ha a la izquierd
da indica la dirrección de
lectura 5’‐3’.
III. Secuenciacción automáttica.
La em
mpresa Appllied Biosysteems, fue la pionera
p y líd umentos de secuenciación. El
der en instru
primeer secuenciaador automáático (ABI 37 70A) aparecce en 1987, y con él se logra conocer la
secueencia del primer gen porr Craig Venteer y sus coleegas del National Institutte of Health (NIH,
USA). La aparición de los secuenciadores automático os permitió laa instalación n de facilidad des de
secueenciación. El primero dee ellos fue el NIH, dóndee se instalaro on 6 secuencciadores ABII3700.
En 19
992, Venter funda el Institute for Genomic
G Ressearch (TIGR R) y expandee la capacidad de
secueenciación con 30 equiposs.
Con eesta plataforrma instalad da, se demueestra el poder de la secuenciación aautomática ccon el
desarrrollo de la eestrategia EST (expressed d sequence ttag) para el d descubrimien nto de geness. Esta
estrategia consiste en hacer copias de ADN
A a partirr del ARN mensajero
m ceelular (ADNcc=ADN
copiaa) y clonarlaas de forma aleatoria para luego seecuenciar. En E 1991, con n esta estraategia,
Venteer reporta 337 genes hu umanos no conocidos. La base de daatos de EST contiene hoy más
de 433 millones dee secuencias correspondientes a 1300 organismo os diferentes.
Métodos de secuenciación de ácidos nucleicos. 7
Gonzalo Greif
b. Proyecto Genoma humano:
La secuenciación del genoma humano se volvió un objetivo realizable una vez establecidas las
metodologías de secuenciación de ADN. La discusión formal comenzó en 1985 en Estados
Unidos. En 1990, se presentó un proyecto de 5 años en el congreso de Estados Unidos (Human
Genome Project). Se estimaba que el proyecto duraría 15 años y el costo rondaría los 3 mil
millones de dólares. El proyecto establecía el objetivo de mapear y secuenciar diferentes
organismos modelo además de humano. Entre ellos E. coli, S. cerevisiae, C. elegans, D.
melanogaster y el ratón (Mus domesticus). El proyecto se convirtió en un esfuerzo de
colaboración internacional entre diversos centros de secuenciación en Estados Unidos, Europa
y Japón. Cada centro se focalizó en regiones particulares del genoma, que permitieran obtener
un mapa. En 1994 se publicó un mapa detallado del genoma humano que incluía el mapeo de
5840 loci con una media de espaciado de 0,7 cM (1 centiMorgan = 106 bases).
En 1998, el proyecto público, compitiendo ahora con la empresa Celera (propiedad de Craig
Venter) adopta los secuenciadores capilares de Applied Biosystems (ABI3700).
En 1999 el proyecto Genoma humano había secuenciado más de mil millones de bases y se
publicó la secuencia completa de un cromosoma humano (el cromosoma 22).
Para el mismo tiempo, Celera, comenzó a Cobertura (Coverage):
secuenciar el genoma humano con la estrategia
de “whole genome shotgun sequencing” La cobertura es el número promedio de
desarrollada por C. Venter (explicada más secuencias que representan a un
adelante). La secuenciación comenzó en
determinado nucleótido en la secuencia
setiembre de 1999 y en junio de 2000 se realizó
un ensamblaje inicial de las secuencias total reconstruida. Puede ser calculada a
obtenidas. Los datos de Celera permitieron el partir del largo original del genoma (G), el
ensamblaje del genoma humano con una número de secuencias (N) y el largo
cobertura de 5X (ver Cobertura). Además se promedio de las secuencias (L) como:
aumentó la cobertura 3X con los datos públicos.
Cobertura = N x L/G
El 25 de junio de 2000, en la Casa Blanca, el
presidente Clinton junto a Francis Collins Ejemplo. Un genoma hipotético de 2000
(responsable del proyecto público, NIH) y Craig bases, secuenciado con 24 secuencias de
Venter, anunciaron públicamente la versión 350 bases de promedio de largo tiene
borrador del genoma humano realizada tanto una cobertura de:
por el esfuerzo público como privado (Figura 7).
24 x (350/2000) = 4,2 X.
En febrero de 2001, se publicaron los borradores
del consorcio público y del privado en Science y Este valor significa que el genoma fue
Nature (Figura 8). Finalmente en el año 2004 se secuenciado 4,2 veces. Cuánto mayor
publicó la versión final del genoma humano. cobertura, menor posibilidades de
errores en la secuencia final.
Méto
odos de secuenciación dee ácidos nuclleicos. 8
Gonzalo
o Greif
Figura 7. Fo
oto de lanzam
miento de borrrador del geno
oma
humano en Washington
n (Clinton, Ven
nter, Collins).
Figura 8. Tapas de revisttas Nature y S
Science de 200
01 con
los borraddores del genooma humano.
Whole genome Sho
otgun sequen
ncing y Craig V
Venter:
ra 9. Esquemaa de secuenciaación con la eestrategia de SShotgun. Secu
uenciación de fragmentos
erados al azarr y ensamblaje de la secuen ncia utilizando
o procesamiennto informáticco.
En 1995, Venter y ssu grupo decid den utilizar nuuevas herram
mientas compuutacionales assí como los méétodos
mejorrados de seccuenciación para realizarr la primer secuencia de
e un organissmo de vidaa libre
(Haemmophilus influ
uenzae). En TIGR analizar más
m de 50 geenomas micro
obianos. Ventter y alguno de
d sus
colabo
oradores, commenzaron entonces la seccuenciación de
d genomas de
d mayor tam maño (mosca, rata,
ratón).
Métodos de secuenciación de ácidos nucleicos. 9
Gonzalo Greif
4. Algunos Métodos de secuenciado masivo
Pasaron cerca de 30 años desde la publicación del método de Sanger, hasta que apareciera
una nueva tecnología de secuenciación de ácidos nucleicos que no fuera el método de
dideoxinucleotidos terminadores. La principal característica de estas nuevas metodologías es
la posibilidad de secuenciado masivo de forma paralela, esto significa que el número de
secuencias obtenidas durante una corrida supera muchas veces el máximo de 96 secuencias
por corrida que se obtienen con los secuenciadores capilares de última generación que utilizan
el método de secuenciado de Sanger.
A partir del desarrollo del método de pirosecuenciación (primer método de secuenciado
masivo utilizado, 2005), surgen nuevas alternativas de secuenciación que utilizan el mismo
principio de dideoxinucleotidos terminadores en sus protocolos, aunque con mejoras
innovadoras.
Estos nuevos métodos de secuenciado masivo no ofrecen lecturas tan largas como el método
clásico de Sanger, aunque en pocos años se ha mejorado sustancialmente el largo de las
secuencias obtenidas y en algunos casos alcanzan longitudes comparables a Sanger.
a. Pirosecuenciación:
El primer método de secuenciado masivo o “next generation sequencing” (NGS), fue publicado
en 2005 en Nature, y llevado al mercado por la empresa 454 (luego adquirida por Roche). El
resumen de este artículo explica: “Describimos un método escalable, un sistema de
secuenciación altamente paralelizable con un rendimiento significativamente mayor que los
instrumentos de electroforesis capilar. El aparato permite secuenciar 25 millones de bases, con
99% de precisión en una corrida de 4 horas” (este rendimiento es 100 veces superior a la
cantidad de bases secuenciadas en ese tiempo en un secuenciador de 96 capilares).
En el primer artículo, publican la secuenciación de novo del genoma de Mycoplasma
genitalium alcanzando cubrir el 96% del genoma y con una precisión de 99,96% en una corrida.
El método consiste en 4 pasos:
1. Fragmentación del ADN (o ARN).
2. Ligación de oligonucleótidos (adaptadores) en cada uno de los extremos.
3. Amplificación clonal (mediante PCR en emulsión).
4. Secuenciado por síntesis usando un protocolo de pirosecuenciación optimizado en un
soporte sólido y en escala de picolitros.
Más en detalle, luego de fragmentar el ADN, se ligan oligonucléotidos adaptadores a cada
extremo del ADN. Estas secuencias adaptadoras comunes a todos los fragmentos serán
utilizadas, tanto para ligar cada fragmento a las esferas, como secuencias donde se unirán los
cebadores de la PCR y además presenta la secuencia donde se unirá el cebador de
secuenciación. Una vez ligados los adaptadores, se ligan a las beads (esferas que contienen el
complementario a uno de los adaptadores en su superficie), por un método de dilución límite,
de modo de obtener un único fragmento unido a una esfera. Se busca, entonces, obtener en
cada bead un único fragmento de ADN, el mismo es amplificado mediante PCR en emulsión.
Méto
odos de secuenciación dee ácidos nuclleicos. 10
Gonzalo
o Greif
PCR een emulsión (emPCR):
La PCR en emu ulsión permite realizar en un úniico tubos miles
m de reacciones dee PCR
indeppendientes. U Una vez obteenida la libreería de fragmmentos que sserán secuen nciados, se u unen a
esferas que conttienen uno de los adapptadores preesentes en los
l fragmentos, de mod do de
obtenner un único fragmento o por esferaa. Luego la población de
d esferas (cada una co on un
fragm
mento de AD DN) es emulssionada en u una mezcla d de agua y acceite, de modo tal de ob btener
micellas de aceite
e independientes –cadaa uno de elloos con una única esferaa y con todo
os los
reacttivos necesaarios para llevar adelante la reaccción‐. El re
esultado finaal, son milees de
microoreactores dónde se llevaa adelante laa reacción dee PCR de form ma independ diente (Figurra 10).
Figuraa 10. Esquema de la PCR en n emulsión. (11) Se liga a caada bead un fragmento
f meddiante las secu uencias
complementarias a uno
u de los adaaptadores que se encuentran en la superficie de las mism mas. (2) Se realiza una
emulsión (agua‐aceitte) de tal form
ma que en cadaa gota de aceitte encontremo os una única beead unida a unn único
framgeento y encontrramos además todos los reacctivos necesario os para llevar adelante
a la PCR
R (dNTPs, Polimmerasa,
cofactores). (3) Luegoo se realiza unaa PCR convencional, pero en ccada tubo de reeacción se realiizan simultáneaamente
miles de reacciones en paralelo. (4
4) Luego de n ciclos de reaccción, se obtiene una amplificcación clonal de
d cada
fragmeento unido a un na bead.
Luego o de finalizada esta reeacción, se rompe la emulsión
e y se recuperaan las beadss que
preseentaron amp plificación. Las
L mismas son deposittadas en la placa de seecuenciación. Esta
placaa (picoTiter pplate), tiene 1,6 milloness de pocillos, y en cada u
uno de ellos sólo puede eentrar
un beead (Figura 1 11). En cada pocillo suced derá una reaacción de seccuencia, por lo cual en la placa
podemos decir que tenem mos 1,6 millones de secuenciado
s res de 1 capilar,
c o 16000
1
secueenciadores d de 96 capilarees aproximad damente.
Méto
odos de secuenciación dee ácidos nuclleicos. 11
Gonzalo
o Greif
Figuraa 11. Pico‐Titre plate. Arriba: esquema de dep
posición de esfeeras en los pociillos. Abajo: miccrografía electrrónica
de los pocillos y ejem
mplo de carga dee una placa.
Reaccción de secuenciación:
Este método no utiliza nucleó ótidos
terminadores. En n este caso, se realizan ciclos
dónde se ofrece en cada poccillo una base por
vez, secuenciaalmente. Durante la
incorporación dee una base en una molécula
nacieente de AD DN se liberaa pirofosfatto, el
pirofoosfato liberrado se co onvierte en n luz
mediante dos procesos
p enzzimáticos. La
L luz
emitida en cada p pocillo, dóndde se incorpo oró la
base ofrecida, es monittoreada po or la
deteccción lumino ométrica de la liberación del
pirofoosfato durante la reaccción de sín ntesis
(Figura ). Una cám mara CCD colecta los dattos de
cada base, en cad da ciclo y en cada posició ón. Figuraa 12. Esquema de reacción de pirosecuenciacción
En ell caso de ho
omopolimero os (tractos de
d secuenciaa con el missmo nucleóttido), el larggo del
homo opolimero ess determinado a partir d de la cantidaad de pirofossfato liberad do (proporcio onal a
la can
ntidad de bases incorporrada).
Ejemplo:
En el primer cicloo se ofrece la base A, en todos los pocillos. En aquellos qu ue se incorpoora se
obserrva la emisió ón de luz (deependiendo la cantidad d de A incorpo orada, será la intensidad d de la
luz emmitida). Lueggo de obtenidas las imágenes, se reemueve la baase, y se ofreece la base TT y se
obserrvan los pocillos que inco orporan T. Se vuelve a eliminar la baase no incorp porada y se o ofrece
la base G, y luego o la C para tterminar el p primer ciclo. Luego de 100 ciclos finaliza la corriida. El
Métodos de secuenciación de ácidos nucleicos. 12
Gonzalo Greif
tamaño promedio de cada lectura es de 400 bases y en una corrida se obtienen cerca de 1
millón de secuencias (es decir 400 millones de bases/10 horas de corrida).
b. Illumina:
En la reacción de secuenciación, se bloquea uno de los adaptadores (1), y se comienza la
reacción de secuenciación desde el otro extremo (2) mediante un cebador específico (Figura
14).
1 2
Figura 14. Reacción de secuenciación de Illumina.
Ver descripción en el texto.
Métodos de secuenciación de ácidos nucleicos. 13
Gonzalo Greif
Durante la reacción, a diferencia de la pirosecuenciación, se ofrecen los cuatro nucleótidos
terminadores marcados cada uno con un fluorocromo diferente (1), al igual que el método de
Sanger. Luego de un lavado (2), se obtienen las imágenes y se obtiene la primera base de cada
cluster (3). Luego, se elimina el fluorocromo y se desbloquea el Carbono 3, permitiendo que un
nuevo nucleótido pueda extender la cadena de ADN naciente (4). Otra vez los cuatro
nucleótidos terminadores marcados son ofrecidos a los clusters, comenzando un nuevo ciclo
(Figura 15).
1 2 3 4
Figura 15. Reacción de secuenciación de Illumina. Primer ciclo de secuenciación (1), incorporación de
dideoxinucleótidos marcados (2), adquisición de imagen (3), y lavado, desbloqueo, y eliminación de marcado (4).
Los últimos modelos de Illumina permiten secuenciar en paralelo más de 3000 millones de
clusters con largos desde 35 a 150 bases (www.illumina.com).
c. Otros métodos:
Desde 2005 hasta la fecha, otras tecnologías de secuenciación masiva han sido desarrolladas y
otras se encuentran en desarrollo y constituyen una nueva generación de secuenciadores
(Tabla 1). Es imposible en este capítulo el desarrollo en profundidad de cada una de ellas, por
lo tanto en la siguiente tabla se muestran otras tecnologías y las fuentes dónde obtener mayor
información de cada una de ellas.
Algunas de estas tecnologías (SMRT, Helicos) proponen la secuenciación a partir de una única
molécula de ADN en tiempo real. Una de ellas (Pacific Biosciences) en teoría no tiene límite en
cuánto al largo de las secuencias generadas y eventualmente podría secuenciar cromosomas
enteros en una única lectura (www.pacificbiosciences.com).
Otras, como Oxford nanopore e Ion Torrent (recientemente lanzada al mercado) ofrecen
novedosas soluciones y no requieren marcación fluorescente ni cámaras registradoras de
imágenes. En particular, Ion Torrent (ver recuadro J. Rothberg), se basa en el registro de los
cambios de pH producidos durante la incorporación de bases durante la síntesis de ADN. Se
trata de micropHímetros que reducen notablemente los costos de secuenciación
(www.iontorrent.com) y prometen ser herramientas útiles en el área de diagnóstico.
odos de secuenciación dee ácidos nuclleicos. 14
Méto
Gonzalo
o Greif
Plataforma Teecnología Longgitud de read
ds Añoo Web
www.ap
ppliedbiosystems.co
om
SOLiD (Applieed Biosystemm) Ligación
n 50 basses 2007
www
w.helicosbio.com
Genetic
G Anaalysis Systeem true Siingle Moleccule 25 a 55 bases 2008
(H
Helicos) Sequencing
www.paacificbiosciences.com
SMRT (Pacificc Biosciencess) Single Molecule Real
R >1000 bases D
ND
time (en teo
oría sin límite)
www
w.iontorrent.com
Io
on Torrent Micro ppHímetros >200 bbases 2011
www.nanoporetech.com
Oxford Nanop
O pore Label free, electrical ND ND
D
Tabla 1. Información sobre otras teccnologías de seecuenciación maasiva en el merrcado o cerca de
e salir.
Además es ffundador de e otras empreesas, vinculaadas a la tecn
nología y me
edicina. Es también fundaador de The
Rothberg In
nstitute for C
Childhood Dissease.
Fuente: http://www.ionto
orrent.com/teeam/jonathan‐rothberg/
Métodos de secuenciación de ácidos nucleicos. 15
Gonzalo Greif
d. Aplicaciones
La producción de un gran número de lecturas a bajo costo permite la aplicación de las
plataformas de secuenciado masivo en muchas aplicaciones, y es imposible describir todas
ellas aquí. La primera aplicación obvia es la secuenciación de genomas (ver recuadro Genoma
Humano y Secuenciación masiva) y la precisa anotación de genes (sitios de splicing,
poliadenliación, secuencias 5’ y 3’ UTR, etc). Dentro de las primeras aplicaciones encontramos
la secuenciación de ARN (ej. descubrimiento de ARN pequeños, nuevas variantes génicas,
nuevos genes, etc.) y amplicones de PCR (secuenciado de ARNr16S y su aplicación en
metagenómica como veremos en el siguiente párrafo). Asimismo, la posibilidad de
cuantificación de transcriptos que ofrece esta tecnología (RNA‐seq), la vuelve una alternativa a
los experimentos de microarreglos. La secuenciación para identificar marcadores epigenéticos,
identificar interacción ADN‐proteína, determinar estructura de cromatina (ChIP‐Seq, Methyl‐
seq, DNase‐seq) son aplicaciones cada vez más utilizadas.
La metagenómica es el estudio genómico de microorganismos por la extracción directa de ADN
de una comunidad microbiana. La aparición de la secuenciación masiva ha facilitado a los
investigadores la tarea de identificación y caracterización de diferentes microogranismos, en
diferentes ambientes.
En la sección de lecturas recomendadas se ofrecen revisiones bibliográficas de cada una de
estas aplicaciones para que el lector profundice en ellas.
Genoma Humano y Secuenciación masiva:
Como ya vimos antes, la secuencia del genoma humana se publicó en 2004. La secuenciación de este
genoma tuvo un costo aproximado de 3000 millones de dólares y cerca de 20 años de trabajo. En
octubre de 2007, se publica el primer genoma de un único individuo (J. Craig Venter), realizado por el
método de shotgun y secuenciación Sanger. El costo de este genoma fue aproximadamente 70 millones
de dólares y una duración de 4 años.
El primer genoma humano secuenciado con la tecnología 454 fue el del Dr. James Watson, a un costo
de 1 millón de dólares y en dos meses (2008). El costo ha continuado bajando y se han reportado la
secuenciación de un genoma humano por menos de 100.000 dólares.
Varios proyectos tienen como objetivo la secuenciación de más individuos, entre el ellos “The Cancer
Genome Atlas” y “1000 Genome project”.
Hace tan solo 10 años, 2 dedos eran suficientes para contar el número de genomas secuenciados. En
2009, alcanzaban los dedos de ambas manos. Hoy, es difícil de saberlo exactamente, pero un
relevamiento realizado por la revista Nature, indica que cerca de 30.000 genomas humanos estarán
secuenciados para finales de 2011.
Métodos de secuenciación de ácidos nucleicos. 16
Gonzalo Greif
Lecturas recomendadas:
1. Sanger F. Coulson R. A rapid method for determining sequences in DNA by primed
synthesis with DNA polymerase. J. Mol. Biol., 94, 441‐448 (1975). Método “más‐menos”
de Sanger.
2. Maxam A. and Gilbert. A new method for sequencing DNA. PNAS, 74 (2), 560‐564, (1977).
Articulo dónde se describe método químico de secuenciación de ácidos nucleicos.
3. Sanger, F., Nicklen, S. and Coulson, A.R. DNA sequencing with chain‐terminating inhibitors
4. PNAS, 74 (12), 5463‐5467 (1977). Artículo de Sanger dónde describe el método de
secuenciación utilizando dideoxinucleótidos.
5. Sanger, F. Determination of nucleotide sequences in DNA. Nobel lecture, 8 December
1980.
6. Venter, C. et al. The Diploid Genome Sequence of an Individual Human. PLOS Biology, 5
(10), (2007). Publicación de genoma de Craig Venter.
7. International Human Genome Consortium. Finishing the euchromatic sequence of the
human genome. Nature 431, 931–945 (2004).
8. Margulies, M. et al. Genome sequencing in microfabricated high‐density picolitre reactors.
Nature 437, 376–380 (2005). Los autores describen el desarrollo de la primer tecnología
de secuenciado masivo, y realizan el ensamblaje de novo del genoma de Mycoplasma
genitualium utilizando pirosecuenciación.
9. Bentley, D. R. et al. Accurate whole human genome sequencing using reversible terminator
chemistry. Nature 456, 53–59 (2008). Artículo de los desarrolladores de Illumina,
reportando el uso de esta tecnología para la secuenciación de un cromosoma humano.
10. Wang, Z., Gerstein, M. & Snyder, M. RNA‐Seq: a revolutionary tool for transcriptomics.
Nature Rev. Genet. 10, 57–63 (2009). Review sobre uso de tecnologías de secuenciado
masivo para análisis de transcriptomas (RNA‐seq).
11. Park, P. J. ChIP–seq: advantages and challenges of a maturing technology. Nature Rev.
Genet. 10, 669–680 (2009). Revisión sobre ChIP‐seq.
12. Morozova, O.,Hirst, M., Marra, M. Applications of New Sequencing Technologies for
Transcriptome Analysis. Annu. Rev. Genomics Hum. Genet. 10,135–51 (2009). Revisión
NGS.
13. Petrosino, J. F., Highlander, S., Luna, R. A., Gibbs, R. A. & Versalovic, J. Metagenomic
pyrosequencing and microbial identification. Clin. Chem. 55, 856–866 (2009). Se trata de
un review sobre metagenómica.
14. Zhou, X., Ren, L., Meng, Q., Li, Y., Yu, Y., Yu, J. The next‐generation sequencing technology
and application. Protein Cell, 1(6), 520–536 (2010). Revisión NGS.
15. Metzker, M.L. Sequencing technologies — the next generation. Nature Reviews Genetics
11, 31‐46 (2010). Revisión NGS.
16. Human genome: Genomes by the thousand. Nature 467, 1026‐1027 (2010). Revisión
secuenciadores instalados y genomas secuenciados.
17. Zhanga, J., Chiodinic, R., Badra, A., Zhang G. The impact of next‐generation sequencing on
genomics. Genet. Genomics. 38(3), 95–109 (2011). Revisión NGS.
Otros recursos interesantes:
1000 Genomes Project: http://www.1000genomes.org
The Cancer Genome Atlas: http://cancergenome.nih.gov
The Exome Project: http://www.nhlbi.nih.gov/resources/exome.htm
Human Microbiome Project: http://nihroadmap.nih.gov/hmp
Personal Genome Project: http://www.personalgenomes.org
Craig Venter Institute: www.jcvi.org