Está en la página 1de 11

Métodos de reconstrucción filogenética

Métodos - Distancia
- Máxima parsimonia
- Máxima verosimilitud (maximum likehood)
- Inferencia bayesiana.
* Todos los metodos se pueden en los programas disponibles, eg. PAUP, PHYLIP, McClade, Mr. Bayes etc.

Comparación
de métodos
Distancia Máxima parsimonia Máxima verosimilitud (likelihood)

Utiliza sólo las distancias Utiliza solo caracteres derivados Utiliza todos los datos
pareadas compartidos

Minimiza la distancia entre Minimiza la distancia total Maximiza la probabilidad de un árbol dados
vecinos más cercanos los valores de parámetros específicos

Muy rápido Lento Muy lento

Atrapado fácilmente en Supuestos fallan cuando la Depende mucho del modelo de evolución
óptimos locales evolución es rápida asumido

Bueno para generar árboles Buena opción cuando <30 taxa y Bueno para conjuntos de datos pequeños y
tentativos, o elegir entre varios la homoplasia es rara para probar árboles construidos con otros
árboles métodos

Modelos - Máxima parsimonia no emplea modelos explícitos de evolución


explícitos de - Distancia, Máxima verosimilitud, e inferencia bayesiana si emplean modelos explícitos de evolución
evolución

Comparación del principio de los métodos

Distancia Los únicos en los cuales se construye un árbol → los demás se busca el mejor entre varios árboles.
- Los métodos de distancia son los únicos donde se reconstruye un árbol

Máxima - En los demás métodos se busca el árbol (de un número determinado de árboles existentes) que más se
parsimonia ajuste a nuestros datos (máxima parsimonia y máxima verosimilitud)
y máxima - Hay un montón de árboles y se escoge el árbol que mejor se ajuste a los datos que tenemos.
verosimilitu
d Parsimonia
- Primeros indicadores: cantidad de caracteres filogenéticos informativos para parsimonia.
- Los caracteres deben tener al menos 1 cambio y estar incluidos en al menos 2 taxas. si no cumple con estas
condiciones el programa no lo empleará para realizar la reconstrucción filogenética → Exceso de datos
- Se busca el que tenga menor número de pasos – Optimiza los números de datos.

Máxima verosimilitud
- El método de máxima verosimilitud busca el árbol máximo verosímil, es decir, el árbol que es más
probable que haya generado los datos que hemos observado.
En este método partimos un modelo de evolución

Longitud de - Tasa de cambio x tiempo


las ramas

Inferencia Encuentra una región de árboles que representan bien mis datos (un pull de árboles)
bayesiana - La inferencia bayesiana encuentra rasgos o árboles con base la mayor probabilidad con base en la
probabilidad anterior.
- La inferencia bayesiana en filogenia genera la probabilidad posterior de un parámetro, un árbol filogenético
y/o un modelo evolutivo, basada en la probabilidad anterior de ese parámetro y la función de verosimilitud
de los datos

Distancia

Selección - Los rasgos que mejoran la supervivencia o la reproducción se acumularán en la población


natural ● Cambio adaptativo
- Incluye depredación , selección fisiológica , sexual y coevolución

Deriva genética
- La frecuencia de los rasgos puede cambiar en una población debido a eventos fortuitos
● Cambio aleatorio
● Incluye efectos fundadores y de cuello de botella

Distancia La distancia genética es una medida de la divergencia entre especies o entre poblaciones dentro de una especie.
genética
distancia
- Por cada dos secuencias, la distancia es un valor único basado en la fracción de posiciones en las que las
dos secuencias difieren, definida como la distancia p
- Modelo evolutivo específico: Aplicación de un modelo evolutivo específico que hace suposiciones
particulares sobre la naturaleza de los cambios evolutivos

Especies - En especies lejanas: Puede ocurrir que el cambio sea tanto que eventualmente vuelve a lo mismo, esto
lejanas debido a que solo se tienen 4 bases nucleotídicas, por ello pueden haber pasado por todas o casi todas las
combinaciones y terminar regresando a lo mismo.

Modelo - Transiciones: Sucede cuando no hay un cambio químico en la composición de las bases A ↔ G y C ↔T
evolutivo - Transversiones Sucede cuando hay un cambio químico en la composición de las bases A ↔ C, A ↔ T, G
↔ C o G ↔T.
- Las seis posibles patrones de sustituciones para los datos nucleotídicos

Pasos para el - Estimación de las distancias evolutivas


método de - Conversión de disimilitudes en distancia evolutiva por corrección de múltiples eventos por sitio
distancia - Convertir la disimilitud en distancia evolutiva mediante la corrección de múltiples eventos por sitio
Princpio del - En principio, los métodos de distancia tratan de encajar un árbol a una matriz de distancias genéticas
metodo de pareadas(Felsenstein,1988).
distancia

Dos métodos - Los principales métodos de construcción de árboles basados en la distancia son:
● Clúster
● Mínima evolución.

Clúster Union Grupo Promedio → Fenogramas


(UPGMA - Ultra Metricidad dAC ≤ max (dAB, dBC)
WPGMA) - Los árboles ultrametricos son árboles que llegan hasta el presente

- 1 y 2 son las especies más disimilaridad


- Une promedia las distancias y lo divide en la mitad para poner el cambio igual en cada especie.

Pasos:
- Escoge primero las especies más cercanas.
- La distancia genética se divide a la mitad.
- Ahora ya están juntas, pongo la distancia genética de la especie 3 y lo resto con el valor del nodo de 1 y 2
(corresponde a la mitad de la distancia)
- El valor de la diferencia corresponde al valor de la línea que sale del nodo
- El valor de la distancia de 3 se pone en la línea que da hasta el presente
- Toma las especies más cercanas en la matriz donde 1 es idéntico y 0 distintas
Problema de Los métodos de agrupamiento son extremadamente sensibles a tasas desiguales en diferentes linajes.
cluster

Mínima Debido a las serias limitaciones de los métodos ordinarios de agrupamiento, se han desarrollado algoritmos para
evolución reconstruir los llamados árboles de distancia aditivos.
● Las distancia genéticas entre un par de OTUs es igual a la suma de las longitudes de las ramas que los
conectan, en lugar de un promedio.
● En ME, el árbol que minimiza las longitudes del árbol, que a su vez es la suma de las longitudes de las
ramas, es considerado como la mejor estimación filogenética.

Problemas ● Un inconveniente del método ME es que, en principio, todas las diferentes topologías de árboles tienen que
Mínima ser investigados para encontrar el árbol mínimo.
evolución
Solución heurística: Vecino más cercano

- Vecino mas cercano


Topología de árbol hipotético: desde la divergencia de las secuencias A y B, B ha acumulado cuatro veces más
mutaciones que la secuencia A.

Los métodos de agrupamiento agruparían erróneamente las secuencias A y C, ya que asumen un comportamiento
similar al de un reloj. Aunque las secuencias A y C parecen más similares, las secuencias A y B están más
estrechamente relacionadas → pues se tienen en cuenta los nodos y no las taxas

Maxima parsimonia

Presunción Presunción implícita : el cambio evolutivo es poco común → por que asume la menor cantidad de pasos
implicita

Meta Encontrar el árbol (es) que requiere la menor cantidad de pasos.

Que intenta Intenta maximizar la homología (Encuentra las presuntas homologias) y minimizar la homoplasia.
- ¿De que depende el arbol? El árbol depende solamente de los caracteres filogenéticamente informativos

Los sitios - Son aquellos que tengan → Al menos dos estados de carácter diferentes y con al menos dos taxa en cada
filogenéticam uno
ente - Estos son los caracteres usados para inferir la filogenia el árbol evolutivo.
informativos

Problema de - Con 9 taxa , es mas probable ser golpeado por un rayo (odds 3:100 000) que de encontrar y
parsimonia seleccionar el mejor árbol de manera aleatoria (odds 1:135, 135). Con un
- poco mas de 50 taxa , el numero de
- topologías supera la cantidad de átomos en
- el universo y aun así esto sigue siendo un
- problema filogenético pequeño.
-

Máxima verosimilitud (Maximum likelihood)

Elegir el modelo en el que me sienta menos sorprendido.


- Se escoge que todas las caras son 5.

Aplicacion queremos saber la P (árbol/datos), esto requiere considerar todos los árboles posibles, lo cual es prácticamente
de los arboles imposible. En lugar podemos calcular P (datos/árbol) y seleccionar el árbol en el cual la probabilidad sea la mayor.

- Esto requiere que se consideren todos los posibles sets de datos (del mismo tamaño).
-

Piezas de la teta= Parámetros del modelo de evolución de las secuencias


ecuación ramas = Topología y longitud de las ramas
Colores = Alineamiento

probabilidad de los datos (secuencias).......

1. Calcular el likelihood para cada sitio en un árbol específico


Sumar los valores de L para todos los sitios en el árbol.
2.
3. Comparar los valores de L para todos los posibles árboles
4. Seleccionar el árbol con el mayor

- Utilizan los árboles no enraizados.


Inverso del logaritmo del valor, debido a que los valores de probabilidad son muy pequeños

Verosimilitud - La probabilidad de los nucleotidos de cada secuencia en un sitio

- la probabilidad
- probabilidad

modelos de - muchos modelos propuestos


sustitución -

- Las tasas pueden variar en sitios

v: longitudes de las ramas


matriz de cambio
los mejores arboles están en la cima de los grandes picos.
para recordar la verosimilitud es una función para ser optimizada, con algunos aspectos particulares:
- La topología es un parámetro discreto pero extraño
- La longitud de las ramas no son equivalentes entre los diferentes árboles
- Los valores de los parámetros óptimos están fuertemente correlacionados.
Tema va hasta la diapositiva 70

Revisar las últimas dos diapositivas

También podría gustarte