Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Secuencia de Genomas
Secuencia de Genomas
Secuenciación de genomas
Introducción
Material g e n é t i c o
El G e n o m a
S e c u e n c i a c i ó n del D N A
T G c ' i ^ ^ ^ G TGCATAGAT
DMA poiimerasa ' ^ ^ ^ ^ a secusnelar
> * • '
• - A C G T A G G C A C G T A T C T ddA
Se rcofps'-í A ?
&Pîri-f>'5!OîaijaA
•-ACGTddA
*^ ÍhACGTAGGCACGTATÍÇTd«M
TGCATCCGTGCÀTAGAT
Pasos ïntennedios
de ia poiimerizacicm Producios finales El&cîroforésis
B
1 1 l 1 IJ IJ DNA poiimerasa
Nucleótídos
y y- \j= • y—-
+ + + + Molde
ddA ddC ddG ddT iniciador
t ? f f
1A n c n o n T r
A
T
——. C
T
A
T
....«-. C
— ' •
A
C
— G
— G
— A
S I 'cuencia i ieducida
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Fragmento de DNA
1^ Fragmentación
f
xxxxxxx xxxxxxxxxxxx
xxxxxxxxxxxxx xxxxxxxxxxxxxx
XXXXXXXXXXXí^^g^QQQQQQQQQQ^
xxxxxxxxxxxxx ^^^^^^^^^S8B8888888bo^
TGXXXXXXXXXXX XXXXXXXXXXXXXXX
Secuenciación
ACTTTTG ACTNTTGCATGA
TAGNACATGATCA TTTGCATGACTGAT
ATGACNGATCGTAC
GTACGTAGTACAT TGCATGACTGATC
CGTAGTACATGATCA
GCATGACTGATCGTAC
TGCATGACTGATC CGTAGTACATGATCA
Ensamblaje
\
ACÍfí)rTGCATGA
TGCATGACTGATC TAC^CATGATCA
TTTGCATGACTGAT GTACGTAGmCAT
ATGAC^ATCGTAC
TGCATGACTGATC CGTAGTACATGATCA
GCATGACTGATCGTAC
ACTTTTG CGTAGTACATGATCA
ACTTTTGCATGACTGATCGTACGTAGTACATGATCA
Secuencia consenso
Po = e-"''"
técnicas que permitan discriminar entre las regiones con DNA puramen-
te repetitivo y las regiones que contienen DNA no repetitivo, rico en ge-
nes, para obtener la secuencia únicamente de este último
S e c u e n c i a c i ó n al azar j e r á r q u i c a
c i,^ II
Genoma
actgcat actgcat se
actgcat actgcal actgcat actgcat actgcat actgcat acigcal actgcat actgcat
actgcat actgcat
BCtgcat actgcat actgcat actgcat actgcat actgcat actgcat actgcat actgcat actgcat actgcat actgcat actgcat
actgcat actgcat
jClgtgct¡iacígccgtgat8ct3gstcagatcst33caS3gclgc.3tagcaí3<¡ciMgaítac£<sat3cag3gac2tagac3tagacaaa»tagacag3tacag.3tagataS3gatacagat3cagatacai<. atagsíacgaclactagcgacatcgacfcscii
4»egagacccatcnt3t3ct8Ccs!naigctaggtcagatcol3acat3gctsC3t3ijcatagcaagtUacagalaca8a3acat3sacat33acagal«a5jacagal3cagatagatot3S8iaca{j«fat.;,ii atacaiagacatanatacgactactagcgacaít
:.tactgact;itQ390ü3CCí)tlac!9ccgtgatsct8ggtv.a{jatca5gacat;j3c}gcalagcatagc<i3gí!íac<i(jiU<)cagagacata3acaU«g3caga!ítaaa n;âg;iii)ca(jigac<itag3lî>cg»ctacla3Cua
!tî;i3aci3ctg3ct3e3.itgcgtîac.«ctgccgtgaîgct3ggtc<isatcaK<ac<-i1agctgc3t<sacaîagc3ag.itaogataca8a3acat3g?.c3tK-3ac<igatlisS9ac,'igat3ca83t<iQa i<itaí:<iÇiat3cat3gao3tagat.icg.ictactoc'
-aíctiactiKtaactscgaBgífiCtiacíaactgccñlyaígctaggícagsTMtgacatSffCfgcaíageaísñca-sgaíacaaatacasasacatagacaíagacaaatttagacaaatacañataBaías' 'acaijalsc-ifsatacataaacatasatacsa
FIGURA 3. Esquema del método de secuenciación al azar jerárquica. El DNA del ge-
noma se rompe en fragmentos de gran tamaño que son ordenados según su posición en el
genoma. De entre estos clones se selecciona una colección que abarca todo el genoma. A
continuación se obtiene la secuencia de estos fragmentos individuales empleando la téc-
nica de secuenciación al azar. Finalmente la secuencia del genoma se reconstruye en-
samblando la secuencia de estos fragmentos.
guientes pasos del proceso. E n general los vectores basados en BAC son
los más empleados para la generación de mapas físicos. E n ellos es posi-
ble introducir u n fragmento de DNA de unos 100-200 kb. P a r a la se-
cuenciación del genoma humano, el Consorcio Internacional para la Se-
cuenciación del Genoma Humano empleo 8 librerías de clones basados en
vectores BAC y PAC con un tamaño medio de unos 150 kb.
El siguiente paso es ordenar los clones de estas librerías según su
posición en el genoma (Figura 4). P a r a ello se emplean diferentes téc-
nicas que, en general, implican la identificación de ciertos marcadores
característicos (pequeñas secuencias únicas (STS), sitios de corte de en-
zimas de restricción e t c . . ) en cada uno de los fragmentos clonados. Me-
diante la comparación de la presencia de dichos marcadores en los di-
ferentes clones, estos son ordenados de forma inequívoca. E n general se
escoge u n número de clones elevado para que la misma zona del geno-
m a este r e p r e s e n t a d a en varios de ellos, es decir tener u n a alta redun-
dancia de la secuencia del genoma en la librería de BAC. E n el caso del
Proyecto Genoma Humano, el m a p a generado mediante los clones de
las librerías de BAC y PAC tenia u n a redundancia de 65 veces el geno-
ma.
Genoma
A # -Jl cr Q 0-.
m
~a r\ m
< o,
-03
m ù ^—•
m ûu-
#, n, -•—A-
A • JO^
I
Colección de clones a secuenciar
C T
Construcción úm m^pwi de tíones
Elección ele los clones a «ecuenciar
à t
Acabado
Verificación de la secuencia
• Û # # Ù^ Û #
act^eatttttgctgtagctagactagactagacttgacgatagctgactatcgatca
Secuencia del clon
c:tg*t<aííí.>0K;«í^:tç^:ííWgc->t>'j>:*3!S^t3C;('j-'t>';3ía3Kíwcíi^')3í':aUS»c«a»tUag;tc3>jo .íH«y.-ít;«,^¿>;tai
5<5<ííC9lt,ic;t£jf;.-.3ig»Í3rí.-
^•»3g*í^í'-335^3* g .-vr^^^igctgcstftíí c-ït;>gçM Oí» tac.>.>ita w ^
-:;íCiy;ttííota^âycçtcr.iXí3u<ítíííatií'>*4'^t'>Síííw9U*>icJtg3Cutâ8<íÈ|c-it-3Qi:aí^
150 kb en que hemos dividido el genoma (Figura 5). Este proceso co-
mienza con la purificación del DNA de cada uno de los clones selecciona-
dos y su posterior fragmentación al azar, en general mediante métodos
físicos como la sonicación o el paso forzado por pequeños orificios a gran
presión. Los fragmentos resultantes se separan por tamaños y los que se
encuentran en u n rango adecuado, por ejemplo de 2 a 5 kb, son poste-
riormente clonados en vectores derivados del bacteriófago M13 o de
plásmidos. La ventaja de estos últimos vectores es que el fragmento de
doble cadena de DNA clonado puede ser secuenciado por sus dos extre-
mos (al coste de u n a única preparación de DNA) y que las dos lecturas
derivadas de cada uno de ellos (lo que se conoce como pareja de lecturas)
puede ser usada p a r a facilitar y/o verificar el proceso de ensamblaje. Esto
es así porque conocemos la distancia a la que deben encontrarse las dos
secuencias de cada pareja de lecturas en la secuencia final, que además
deberá coincidir con el tamaño del fragmento clonado en el plásmido de
donde se h a n obtenido. Por otro lado, los vectores derivados del bacterió-
fago M13 tienen la ventaja de que el DNA es más fácil de preparar y de
que el molde resultante, de cadena sencilla produce unas secuencias de
mayor calidad. Ambos tipos de vectores, plásmidos y bacteriófagos, pro-
vocan cierta selección en las secuencias clonadas, siendo más fácil clonar
cierto tipo de secuencias en unos que en otros. Estas desviaciones del
azar deben ser minimizadas si quiere obtenerse u n a representación re-
almente aleatoria de la secuencia original del BAC. P a r a evitarlo, en
ciertos centros, se generan simultáneamente ambos tipos de librerías
minimizándose este tipo de problemas pero incrementándose la comple-
jidad del proceso de secuenciación, al tener que preparar dos tipos de li-
brerías y de purificar dos tipos de clones.
4. Secuenciación al azar
6. Verificación de la secuencia
S e c u e n c i a c i ó n al azar d e t o d o el g e n o m a
\ acgtt,
acgtgcatagca
...-acKtgcatagça "
>?
acgtgcatag«î^'''
acgtgcafagca acgtgcatagca/
"""^cgtgcatagcag^^
\
^
acgtgcatagca
acgtE, _ _ _ _
contigs
^tagca acgtgéatagca
acgtgcatagca acgtgcatagca acgtgcatagr-
acgtgcatagca ^ - -*
acgigcatagca acgtgcatagca acgtgcatagca
acgtgcatagca acgtgcatagca acgtgcatagca acgtgcatagca acgtgcatagca acgtgcatagca
Acabado
Verificación de la secuencia
jClgtgctgactgccgtgatgctagglcBgateafgacalagctgcafagcatagcaagatacagatBcagagacatBgacatagacagatttagacagatócagatagatatagatacagatacagatacat ,atagatacgoctoclagcgacatcgactacts.
^acaaaatccaccytgtacîsccgtgaîgctaggtcagatcataacataoctgcatagcalagcaagatacaijatacaaagacatagacalagscagamagacagatacâaatagatatagatacagatacai àtacalagacatagatacgactactagcgacaSc
UcgactactgartacgatgcgtUKactgccgtgatsctagglcagatcatgacataaclBcaliigcatngcaagatacagatacagagacatasacatag.icagatttagacagatacagatagatatagstìc? catara
-atcsacíacIgaclscgaagcgcttactaacígccgtgatgctsggtcagatcaJgacatagclBcataacatagcaagatacaaatacBgagacatagacatagacagatttagacagatacagatagatat- •acagatacagataeatagacatagalacga
Método h í b r i d o
Otras a l t e r n a t i v a s
iv. D e t e r m i n a r l o s m e c a n i s m o s c a u s a n t e s d e l a v a r i a c i ó n
e v o l u t i v a e n t r e e s p e c i e s . El genoma es u n a estructura diná-
mica que esta continuamente sujeta a las modificaciones causa-
das por los mecanismos evolutivos. Estos mecanismos, actuando
a lo largo de millones de años, son los responsables de la secuen-
cia de los genomas de los organismos que actualmente forman
nuestra biosfera. U n a comprensión profunda del funcionamiento
del genoma solo es posible con u n conocimiento paralelo de las di-
ferencias de secuencias entre especies y de los procesos y meca-
nismos responsables de la aparición de estas diferencias a lo lar-
go del tiempo.
Bibliografía
BROWN, T . A: Genomes. 2nd ed.. Oxford, UK: BIOS Scientific Publishers Ltd; 2002. El tex-
to completo de este libro de texto se puede consultar online gratuitamente en el NCBI
Bookshelf (http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?db=Books).
LoDiSH, HARVEY; BERK, ARNOLD; ZIPURSKY, S. LAWRENCE; MATSUDAIRA, PAUL; BALTIMORE,
DAVID; DARNELL, JAMES E: Molecular Cell Biology. 4th ed. New York: W. H. Free-
m a n & Co.; cl999. También disponible online en el NCBI Bookshelf de forma gra-
tuita.
Levadura: S. cerevisie
GOFFEAU, A. et al. The yeast genome directory. Nature 387, S1-S105 (1997).
Nematodo: C elegans
The C. elegans Sequencing Consortium. Genome sequence of the nematode C. elegans: a
platform for investigating biology. Science 282, 2012-2018 (1998).
Planta: A, thaliana
The Arabidopsis Genome Initiative. Analysis of the genome sequence of the flowering
plant Arabidopsis thaUana. Nature 408, 796-815 (2000).
Raton: M. inusculus
Mouse Genome Sequencing Consortium. Initial sequencing and comparative analysis of
the mouse genome. Nature. 2002 Dec 5;420(6915):520-62
Rata: R. norvégiens
Rat Genome Sequencing Consortium.Genome sequence of the Brown Norway rat yields
insights into mammaHan evolution. Nature. 2004 Apr 1;428(6982):493-521.
Otros o r g a n i s m o s
Un listado actualizado de los proyectos de secuenciación de organismos modelo se puede
encontrar en : http://www.ncbi.nlm.nih.gov/Genomes/index.html