Está en la página 1de 3

ALINEAMIENTO DE SECUENCIAS

OBJETIVO
Discutir los aspectos teóricos y metodológicos del alineamiento de secuencias nucleotídicas. Reflexionar sobre
el impacto de diferentes estrategias de alineamiento en la reconstrucción de filogenias a partir de datos
moleculares.

Desarrollo del Trabajo Práctico


a) Abrir el programa MEGA y el archivo .fas (correspondiente a su proyecto de aula, en formato FASTA) con
File > Open A File/Session (seleccionar el archivo). Ante la pregunta que nos hace el programa, seleccionar
Align. Esta acción abrirá una ventana que muestra las secuencias coloreadas. ¿Qué indican los asteriscos
ubicados por encima de cada base?
b) Desplazarse sobre las secuencias usando las flechas o la barra de desplazamiento de la ventana. Cuando sea
necesario, agregar gaps cliqueando sobre la posición deseada e insertando un guión (-). Para borrar un gap
ubicar el cursor sobre el gap y simplemente borrarlo.
c) Una vez concluido el alineamiento, ir a Data > Phylogenetic Analysis, indicar que, en este caso, no son
secuencias de proteína. Esta acción minimiza una de las pantallas y genera, en la nueva ventana, un botón
identificado como “TA”. Cliquear ese botón e inspeccionar las secuencias alineadas, registre el número de
sitios conservados (C), el de sitios variables (V), el de sitios informativos para parsimonia (Pi) y el de
singletons (S). Esto puede realizarse desde el menú, en la pestaña Highlight, o alternativamente cliqueando
los botones C/ V/ Pi/ S. ¿Qué tipo de carácter serán los singletons?
d) Comparar los resultados obtenidos por toda la clase. ¿Por qué hay diferencias en los alineamientos? En caso de
encontrarlas, ¿cómo lo explicaría? ¿Cuál sería preferible?
f) ¿Un gap representa una inserción o una deleción?

Método de distancias y modelos de evolución molecular


Ejercicio 2.
Objetivo

Compararemos los efectos de utilizar una medida de distancia sencilla y un modelo de sustitución en la
corrección de las saturaciones y en la obtención de topologías, empleando el programa MEGA. En este
programa, las opciones modificables se muestran siempre coloreadas en amarillo.

a) Abrir el programa MEGA y el archivo ej1_dist_TP.fas

b) Alinear las secuencias utilizando el subprograma Clustal o el MUSCLE, incluidos en MEGA, dejando
todos los parámetros por defecto. Una vez obtenido el alineamiento, ir a Data > Phylogenetic analysis.
Recordar que estas secuencias corresponden al ADN ribosomal no codificante (ITS).

c) Ahora obtendremos un retículo de Neighbour-Joining y valores de soporte por remuestreo.


Para esto, en la 2da ventana del MEGA (que se abre y, en muchos casos, se minimiza automáticamente),
ir a Phylogeny > Construct/Test Neighbour–Joining Tree… Seleccionar un valor de remuestreo de
bootstrap de 1000 pseudoréplicas: en la opción Phylogeny test cliquear sobre la celda amarilla de Test of
phylogeny y seleccionar Bootstrap method y en el número de réplicas colocar 1000. Para especificar la
“distancia / modelo”, en la opción Substitution model > Model/Method seleccionar la medida p-distance,
especificar que se incluirán transiciones y transversiones en el cálculo. Luego en Rates and Patterns >
rates among sites, verificar que estén seleccionadas tasas uniformes.
El MEGA permite tres opciones de tratamiento de gaps/ missing data: 1) complete-deletion: remueve
todos los sitios con gaps o datos faltantes; 2) pairwise-deletion: retiene todos los sitios, pero los excluye
durante la estimación de las distancias pareadas; 3) partial deletion: remueve solo un porcentaje
determinado de gaps o datos faltantes.

Entones, para este ejercicio usaremos la opción complete-deletion. Por último, generaremos el retículo de
Neighbour-Joining cliqueando en Compute.

d) Una vez obtenida la topología, en el visor de árboles, enraizar en la rama de H_japonica. Para esto, cliquear
sobre la rama de H_japonica, y luego cliquear una sola vez la opción Subtree > Root. Alternativamente,
cliquear el segundo botón de la columna izquierda. Guarde la imagen de la topología (Image > Save as…)
como .emf o .pdf, Adicionalmente puede guardar la leyenda, generada automáticamente, que se encuentra
debajo de la topología o en la opción caption (Caption/ Save to text file…). Para ser visualizado en otro
editor (por ejemplo, Figtree), puede guardar la topología en formato NEWICK (que incluye el largo de
ramas): File> Export Current tree (NEWICK). Esto abrirá una ventana (text file editor and format
converter) en la cual podrá guardar la topología parentética en Save as…como .tre. El Figtree le pedirá
que le indique a qué corresponde el valor numérico que detecta (que sería el Bootstrap)

Analice la topología obtenida, indicando qué tipo de árbol ha obtenido. ¿Qué tipo de homologías ha
obtenido?

e) Ahora buscaremos el modelo de evolución molecular que mejor ajuste a los datos (y mucho más
complejo que la distancia p).
En la estimación del modelo, el MEGA evalúa 24 modelos diferentes para nucleótidos y 48 para proteínas,
y arroja un listado en el que el primer modelo es el más apropiado de acuerdo con cuatro estimadores
(Bayesian Information Criterion, Akaike Information Criterion corrected, el valor de Maximum
Likelihood y el número de parámetros). Asimismo, en caso de ser necesario, da cuenta de la no
uniformidad en las tasas entre sitios calculando el valor del parámetro alfa de la distribución gamma, y
asumiendo, una proporción de sitios invariantes. También se presentan los valores estimados de Ts/Tv,
las frecuencias nucleotídicas y las tasas de sustitución para cada par de bases. Para más información,
consultar la ayuda (help) del programa.

Entonces, en la 2da ventana del programa MEGA, ir a Models > Find Best DNA/Protein Models… En este
ejercicio elegiremos la opción Complete deletion para el tratamiento de gaps y un Branch Swap filter
moderado. Por último, cliquear en Compute (puede tardar unos milisegundos, por lo que practique la
CIENCIA DE LA PAZ, o sea…).
Guarde la tabla resultante como un archivo Excel para su eventual consulta posterior.

f) Obtenga un nuevo retículo de NJ y los valores de soporte, empleando el modelo de evolución seleccionado
en el paso anterior (cambie el valor de los parámetros de manera tal que concuerden con el modelo
seleccionado). Guarde imágenes (.emf o .pdf) y la topología en parentético (.tre). ¿Detecta diferencias con
su resultado anterior?
¿Esto es aplicable en todos los casos?
g) Compare las topologías obtenidas y conteste:
1. ¿Cuántos árboles obtuvo en cada caso?
2. ¿Qué significado tienen los largos de rama? ¿Qué representa la escala?
3. ¿Se mantienen las relaciones de grupos hermanos? ¿Puede afirmar que Ilex es monofilético?

También podría gustarte