Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Comparación de secuencias
Ejemplo 1
Alineamiento de palabras derivadas de la palabra original (PORTUS) en latín.
PORTUS
PORT
PORTO
PUERTO
“DotPlot”
También se pueden comparar dos secuencias gráficamente con el dotplot.
Definición de alineamiento.
Dadas dos o más secuencias de nucleótidos o aminoácidos, alinearlas consiste en
establecer una correspondencia entre los “residuos” (nucleótido, aminoácido) de manera
que el orden de los mismos en cada secuencia se mantenga. Se permite el uso de
huecos (gaps) que indican la correspondencia de un residuo con nada.
Los alineamientos de dos secuencias presentan problemas diferentes a los alineamientos
múltiples. Empezaremos por el caso de alinear dos secuencias.
2
Ejemplo 2
Si queremos alinear bajorrelieve y altibajo nos damos cuenta de que sólo hay un trozo de
ambas que tiene sentido alinear (bajo), por lo que haremos un alineamiento local.
En cambio, si queremos alinear oportunidad con la palabra francesa equivalente
opportunité para ver como ha sido su evolución desde la palabra latina opportunitas lo
más oportuno es hacer un alineamiento global de las dos palabras.
La idea principal es asociar a cada alineamiento posible una puntuación y quedarse con el
alineamiento que tiene la mejor puntuación. El problema es que el número posible de
alineamientos crece muy rápidamente a medida que aumentan las longitudes de las
secuencias.
Hay diversos algoritmos (procedimientos) para hacerlo, los más populares son el de
Needleman-Wunsch para alineamiento global y Smith-Waterman para alineamiento local.
(BLAST también puede usarse para hacer alineamiento local de secuencias.)
El algoritmo de Needleman-Wunsch.
Estudiaremos el algoritmo sobre un ejemplo. Alinearemos las palabras RADIX y RAIZ.
El sistema de puntuación.
Lo primero que se necesita es establecer un sistema de puntuación que nos permita
calificar cada posible alineamiento. Por ejemplo:
En el siguiente alineamiento:
R A D I X
R A - I Z
2 2 -2 2 -1
La puntuación es 3 puntos.
R A D I X
R A I Z -
2 2 -1 -1 -2
Para encontrar el mejor, tendríamos que calcular la puntuación de todos los alineamientos
posibles y escoger el mejor (si sólo hay uno), o, sino, uno entre los mejores.
El problema es que hay demasiados. Por ejemplo, para dos secuencias de longitud 1000,
hay aproximadamente 10600 posibles alineamientos. Por lo tanto hay que recurrir a algún
método que nos dé el mejor alineamiento en un tiempo razonable.
El algoritmo
La idea fundamental del algoritmo de Needleman-Wunsch es buscar alineamientos
óptimos de subsecuencias más pequeñas y luego reconstruir el alineamiento óptimo
global a partir de ellas.
La idea original (subdividir el problema en pequeños problemas, encontrar la solución de
los mismos y luego recomponer) es del matemático Richard Bellman quien la introdujo en
el año 1953; esta técnica es conocida como “programación dinámica”.
Empezamos por crear una tabla y ver en ella los alineamientos.
R A D I X
0 -2 -4 -6 -8 -10
R -2
A -4
I -6
Z -8
0 -2
R -2
Si venimos desde la izquierda significa que hemos añadido un hueco, es decir, -2 puntos
que sumaremos a los -2 que hay en la casilla de la izquierda (desde la que venimos), por
lo tanto, -4 puntos.
Si venimos “en diagonal” significa que avanzamos una posición en ambas palabras. Como
tenemos en ambos casos una “R” hay una coincidencia, sumamos 2 puntos a la
puntuación de la casilla de la que venimos y tenemos una puntuación total de 0+2=2
puntos.
De los tres movimientos posibles para llegar a la celda en blanco obtenemos tres
puntuaciones: -4, -4, 2. Tomamos la mayor y anotamos la dirección de la que hemos
venido.
R A D I X R A D I X
0 -2 -4 -6 -8 -10 0 -2 -4 -6 -8 -10
R -2 2 R -2 Diag
A -4 A -4
I -6 I -6
Z -8 Z -8
R A D I X R A D I X
0 -2 -4 -6 -8 -10 0 -2 -4 -6 -8 -10
RADIX
RA–IZ
A 1 -1 -1 -1
C -1 1 -1 -1
G -1 -1 1 -1
T -1 -1 -1 1
La puntuación de los huecos se suele dejar al criterio del investigador. Cuánto más
alejadas estén las especies de las que provienen las secuencias menos penalización se
debe poner a la inserción de uno o más huecos.