Está en la página 1de 21

Apoyo de ramas

¿Cuánta precisión tiene la filogenia?

Diferentes ramas en un árbol están apoyados por


diferentes números de caracteres

Comúnmente, algunos caracteres son incongruentes con


el árbol actual (homoplasia)

Muestras limitadas de caracteres pueden carecer de


apoyo para algunas relaciones
Diferentes métodos
índice de descomposición (decay index)

Bremer, K. 1988. The limits of amino-acid sequence data in angiosperm


phylogenetic reconstruction. Evolution 42: 795-803.

jackknife
Wu, C.F.J. 1986. Jackknife, bootstrap and other resampling plans in regression
analysis. Annals of Statistics 14: 1261-1295.

remuestreo (bootstrap)

Efron, B. 1979. Bootstrap methods: another look at the jackknife. Annals of


Statistics 7: 1-26.

Felsenstein, J. 1985. Confidence limits on phylogenies, an approach using the


bootstrap. Evolution 39: 783-791.

probabilidad posterior
Para inferencia Bayesiana (otro clase)
Un ejemplo: Pinus subgénero Strobus

Consenso estricto de 55,536


árboles para la matriz
combinada de rbcL
y matK (2817 pb,
235 caracteres informativos,
L = 696 steps, CI = 0.740,
CIexc = 0.598, RI = 0.947
Decay Index
Apoyo de Bremer o índice de descomposición

Examina cuantos pasos extra se requieren para que se pierda una rama que está
presente en todos los AMPs

Ejemplo: si el árbol más parsimonioso de ((homo,chimp),gorilla) tiene 100 pasos (L =


100), y una relacion incongruente como la relación ((chimp, gorilla),homo) se
encuentra para la primera vez en un árbol de 103 pasos, entonces la relación
(homo,chimp) tiene un valor de Bremer = 3 (103-100). Este valor se coloca sobre
la rama que subyace (homo,chimp)

Para parsimonia

No tiene el mismo fundamento en la estadística como el bootstrap y el jackknife


Jackknife y Bootstrap

Son técnicas para aproximar la distribución verdadera de


un parámetro y así (p. ej. ), medir el error estadístico
Remuestreo

bootstrap “estirante de bota”?

una técnica para estimar el error estadística cuando la distribución de


muestreo está desconocido

Remuestreo con reemplazamiento de los datos originales

Fue aplicada la primera vez para filogenias por Felsenstein (1985)


Métodos para estimar el error de
muestreo en un promedio
Remuestreo para filogenias
Se obtiene n nuevas matrices con base en remuestreo del la matriz original

Cada replicado tiene la misma cantidad de caracteres (y taxa). Algunos caracteres


están representados una, dos o más veces y otros están ausentes

A partir de cada replicado se infiere el mejor (o los mejores) árboles

Se resume el conjunto de árboles de los replicados en un árbol de mayoría

El apoyo de una rama será el porcentaje de veces que el grupo que define aparece en
el conjunto de los árboles de todos los replicados
Posibles problemas con el remuestreo

Se supone que los sitios evolucionaron independientemente

Se supone que los sitios originan de una distribución común

La relación entre los valores de remuestreo y los valores p son poco claros

No corrige para sesgo en métodos filogenéticos (como atracción de ramas


largas)
matriz original
char 1 2 3 4 5 6 7 8 9 10 11 12
A 1 0 0 0 1 1 0 0 0 1 1 1
B 1 0 0 0 1 0 0 0 0 1 1 0
C 0 0 0 0 0 0 0 0 1 1 1 0
D 0 1 1 1 0 0 0 1 0 1 0 0
E 0 1 1 1 0 0 0 1 0 1 0 1
F 0 0 0 0 0 0 0 0 0 0 0 0

matriz para una réplica de bootstrap


char 1 1 3 4 4 4 6 7 10 10 11 11
A 1 1 0 0 0 0 1 0 1 1 1 1
B 1 1 0 0 0 0 0 0 1 1 1 1
C 0 0 0 0 0 0 0 0 1 1 1 1
D 0 0 1 1 1 1 0 0 1 1 0 0
E 0 0 1 1 1 1 0 0 1 1 0 0
F 0 0 0 0 0 0 0 0 0 0 0 0
Jackknife para filogenias
Se obtiene n nuevas matrices con base en deleción de (comúnmente) 50%
de los caracteres en la matriz original

Cada replicado tiene menos caracteres pero el mismo número de taxa de la


matriz original

A partir de cada replicado se infiere el mejor (o los mejores) árboles

Se resume el conjunto de árboles de los replicados en un árbol de mayoría

El apoyo de una rama será el porcentaje de veces que el grupo que define
aparece en el conjunto de los árboles de todos los replicados
Jackknife

50% jackknife
segundo orden = borrar caracteres
Propiedades estadísticas de métodos
de reconstrucción filogenéticos

consistencia: converge en el parámetro verdadero al agregar más datos


(al acercar a datos infinitos)

no sesgado: su valor promedio para muchos muestreos se centra en el


parámetro correcto

eficiencia: la varianza de los muestreos converge a un valor mínimo


(encuentra la respuesta correcta con menos datos)

robustez: si es consistente, no sesgado y/o eficiente bajo un rango amplio


de distribuciones de muestreo
Cambios sobreimpuestos

Mientras aumenta la distancia genética entre taxa, aumenta la


probabilidad que un sitio ha cambiado más de una vez

Parsimonia
Minimiza los cambios
implica que el número de pasos son subestimaciones de los cambios
verdaderos mientras aumenta la distancia evolutiva entre taxa

Distancias corregidas
Estiman la distancia evolutiva verdadera
Atracción de ramas largas

Felsenstein, J. 1978. Cases in which parsimony or compatibility methods


will be positively misleading. Systematic Zoology 27:401-410.
Atracción de ramas largas

“Zona de
Felsenstein”
inconsistente

consistente

Felsenstein (2004)
¿Dónde fallan los métodos?

UPGMA Parsimonia

Huelsenbeck et al. (1996)


Simulaciones con longitudes de ramas
iguales

Huelsenbeck et al. (1996)


Simulaciones con dos ramas externas
largas

Huelsenbeck et al. (1996)

También podría gustarte