Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lic. Bioq. Leonardo Delgado Unidad de Fitopatologa, Facultad de Agronoma, Universidad de la Repblica.
A partir de los cromatogramas de cada muestra debemos obtener la secuencia, lo ms limpia posible, sin Ns. Las secuencias para ser analizadas deben estar en formato FASTA.
Podemos tambin poner muchas secuencias, una a continuacin de la otra en un solo archivo y as tendramos un archivo multifasta.
Al abrir las secuencias en el programa las observamos pero a primera vista pocas cosas se pueden concluir. Para obtener ms datos y realizar anlisis procedemos a ALINEARLAS
ALINEAMIENTO
Dentro del MEGA tenemos la opcin de alinear las secuencias pero que significa alinear? Realizar un alineamiento consiste en enfrentar las regiones similares de cada secuencia formando bloques o columnas de regiones que tienen cierta similaridad en todas las secuencias. Ojo!! que hay regiones en algunas secuencias que no tienen ninguna similaridad con las dems y el programa coloca espacios o GAPS, para seguir alineando las otras regiones similares. Estos gaps se pudieron haber originado debido a inserciones o deleciones en el proceso de evolucin.
Ahora que alineamos la secuencia anterior podemos ver que las regiones similares de cada secuencia se encuentran formando columnas o bloques de regiones similares Los extremos que corresponden al inicio y al final de la secuenciacin son poco precisos y tienen Ns, por lo tanto cortaremos estos extremos. Al final todas las secuencias deben de quedar del mismo largo contando los gaps que estn entre medio de las secuencias.
El archivo alineado y con los extremos cortados est casi pronto para empezar a realizar anlisis de secuencias y filogenticos, pero algunas secuencias tienen N en el medio de la secuencia. Que hacer con esas Ns? Las N se intentarn corregir observando el pico correspondiente a esa secuencia en el cromatograma y observando las bases con las que se aline la N en el alineamiento.
En esta figura se observan los sitios variables de las secuencias, marcando en la V en la barra de heramientas bajo el men.
Mtodos para la obtencin de rboles filogenticos. Existen diferentes enfoques para construir rboles filogenticos:
1) Mtodos de distancia. (algortmicos) Basados en la estimacin de una matriz de distancia entre las secuencias. Por lo general estos mtodos son rpidos y obtienen un solo rbol, que no tiene porque ser el mejor.
NJ: Neighbor Joining UPGMA: Unweighted Pair-Group Method with Artirmetic Mean.
(En desuso, se ha remplazado con NJ)
2) Basados en la comparacin carcter-caracter de la misma columna. (tree-searching) Se obtienen varios rboles igual de buenos los cuales son evaluados por algn criterio determinado y se obtiene finalmente un rbol consenso o representativo si as se lo prefiere. Son ms costos desde el punto de vista computacional.
Bayes.
Inferencia Bayesiana, similar a ML, obtiene multiples rboles, enfoque estadstico basado en modelos de evolucin molecular, posee soporte de nodos, no es necesario bootstrap.
Qu mtodo utilizar?
Es una cuestin bastante filosfica el mtodo de eleccin para inferir rboles filogenticos, no existe un consenso en cual es el mejor mtodo, cada mtodo tiene sus ventajas y desventajas. Un factor a considerar en la eleccin del mtodo es el costo computacional (o sea el tiempo y consumo de recursos de la computadora) para obtener los rboles. El consumo de recursos computacionales es mayor en los mtodos basados en comparacin caractercarcter que en los de distancia. Los mtodos de distancia son ms rpidos pero no necesariamente dan el rbol verdadero o el mejor que se pudiera obtener. Si bien no nos asegura el mejor resultado nos muestra rpidamente las relaciones de las especies. Si queremos ver cual mtodo es mejor en nuestro caso se puede de consultar bibliografa de referencia, y/o comparar distintos mtodos y ver que tan dispares o similares son los resultados obtenidos.
La tendencia actual es la de utilizar los mtodos basados en la comparacin caracter-carcter como MP, ML o Bayes. Si bien el tiempo y costo computacional es mayor, las computadoras son cada vez ms veloces, dejando atrs el uso los mtodos de distancia como NJ que son ms rpidos.
Los valores de Bootstrap en los nodos se expresan en porcentaje. A mayor valor de bootstrap, mayor el apoyo estadstico que tiene cada clado o grupo.