Está en la página 1de 11

1/26/11!

Relojes Moleculares Fechacin con Datos Moleculares!

Taller Latinoamericano de Evolucin Molecular! 2011!

I. El concepto del Reloj Molecular! II. Fuentes de error del Reloj Molecular! III. Mtodos de estimacin de tiempos de divergencia!

Relojes Moleculares:!

A. Mtodos con tasas constantes - Relojes Moleculares Estrictos! B. Mtodos que implementan Relojes Moleculares Estrictos aunque las ! tasas de sustitucin sean heterogneas!

Fechacin de Clados con Datos Moleculares!

C. Mtodos que incorporan diferentes tasas de sustitucin entre linajes ! Relojes Moleculares Relajados!

Prof. Susana Magalln!

Enero 27, 2011!

Relojes Moleculares Fechacin con Datos Moleculares!

EL RELOJ MOLECULAR!
La distancia gentica entre los descendientes de un ancestro! incrementa conforme transcurre el tiempo.!

I. El concepto del Reloj Molecular! II. Fuentes de error del Reloj Molecular! III. Mtodos de estimacin de tiempos de divergencia! A. Mtodos con tasas constantes - Relojes Moleculares Estrictos! B. Mtodos que implementan Relojes Moleculares Estrictos aunque las ! tasas de sustitucin sean heterogneas! C. Mtodos que incorporan diferentes tasas de sustitucin entre linajes ! Relojes Moleculares Relajados!

1. La tasa de sustitucin molecular de genes! y protenas es aproximadamente constante,! por lo que reeja directamente el tiempo transcurrido.! 2. La distancia gentica entre dos especies! en un rbol logentico es proporcional al! tiempo transcurrido desde la divergencia de! su ancestro comn.! 3. Puesto que la sustitucin molecular ocurre ! como un Proceso de Poisson, el reloj molecular! posee una regularidad probabilstica, mas no! una precisin numrica. !

A!
t! t! t!
ANC!

B!

D!

D = 2t!
D = distancia gentica corregida! = tasa de sustitucin! t = tiempo!

Distancia gentica de magnitud D/2 ocurre en un tiempo t !

1!

1/26/11!

EL RELOJ MOLECULAR!
Regresin Lineal!
DA,B! A! tA,B! ?! B! DC,D! C! tC,D! D! DF,E! E! F! DG,H! G! H! DJ,K! J! K! tJ,K! I!

EL RELOJ MOLECULAR! Observaciones! Varianza bajo proceso de Poisson,! esperada: = 1! observada: > 1! Supuestos inverosmiles:! - constancia de tasas entre linajes! - hiptesis logentica correcta! - ausencia de error en distancias genticas! - ausencia de error en la calibracin! - ausencia de error en la regresin lineal! Poder estadstico insuciente para rechazar constancia de tasas,! an en su ausencia! Falta de independiencia entre nodos en rbol logentico!
Edad!

Edad de divergencia de E! DE,D! extrapolar en lnea de regresin - edad! mrgen de error!

tG,H !

tF,E!

DA,B conocida! tA,B conocido (registro fsil)! DC,D , DF,E , DG,H , DJ,K , tC,D! tF,E! tG,H! tJ,K!

Distancia gentica!

Incertidumbre asociada a la naturaleza estocstica del proceso de sustitucin!

Relojes Moleculares Fechacin con Datos Moleculares!

FUENTES DE ERROR DEL RELOJ MOLECULAR!


Proceso de Poisson sobredisperso! Clculo de distancia gentica! Seleccin del modelo de sustitucin! Estimacin logentica! Seleccin de muestra taxonmica! Calibracin temporal derivada del registro fsil! Regresin lineal para extrapolar edades! Poder insuciente para rechazar constancia de tasas! Dependencia entre los nodos de un rbol logentico! etc., etc., etc.!

I. El concepto del Reloj Molecular! II. Fuentes de error del Reloj Molecular! III. Mtodos de estimacin de tiempos de divergencia! A. Mtodos con tasas constantes - Relojes Moleculares Estrictos! B. Mtodos que implementan Relojes Moleculares Estrictos aunque las ! tasas de sustitucin sean heterogneas! C. Mtodos que incorporan diferentes tasas de sustitucin entre linajes ! Relojes Moleculares Relajados!

2!

1/26/11!

FUENTES DE ERROR DEL RELOJ MOLECULAR!


Proceso de Poisson sobredisperso! Clculo de distancia gentica! Seleccin del modelo de sustitucin! Estimacin logentica! Seleccin de muestra taxonmica! Calibracin temporal derivada del registro fsil! Regresin lineal para extrapolar edades! Poder insuciente para rechazar constancia de tasas! Dependencia entre los nodos de un rbol logentico! etc., etc., etc.!
t t t t t t t t t t t t t
Euphyllophytes

FILOGRAMA!

Ferns Gymnosperms

Seed Plants

Angiosperms

t t

A! B! C! D! E! F! G! H!

Relacin indisoluble entre la tasa de sustitucin! molecular () y el tiempo (t) en las ramas! de un rbol logentico.!

longitudes de rama corresponden al producto de tasa de sustitucin y el tiempo !

ARBOL FECHADO!

ARBOL DE TASAS!

FUENTES DE ERROR DEL RELOJ MOLECULAR!


Proceso de Poisson sobredisperso! Clculo de distancia gentica! Seleccin del modelo de sustitucin! Estimacin logentica! Seleccin de muestra taxonmica! Calibracin temporal derivada del registro fsil! Regresin lineal para extrapolar edades! Poder insuciente para rechazar constancia de tasas! Dependencia entre los nodos de un rbol logentico! etc., etc., etc.!
t t t t t t t t t t t t t t t A! B! C! D! E! F! G! H!

Ferns Gymnosperms Euphyllophytes

Ferns Gymnosperms Euphyllophytes

Seed Plants

Seed Plants

Angiosperms

Angiosperms

Relacin indisoluble entre la tasa de sustitucin! molecular () y el tiempo (t) en las ramas! de un rbol logentico.! Tasas de sustitucin variables entre! diferentes linajes.!
416 Dev 354 295 248 205 144 65 0 MY Carbonif Perm Trias Jurassic Cretaceous T Mesozoic Cenozoic Paleozoic

3!

1/26/11!

FUENTES DE ERROR! Heterogeneidad de Tasas

Heterogeneidad de Tasas
Pruebas de Constancia de Tasas Pruebas Relativas! Prueba de Tasas Relativas (Relative Rates Test - RRT)!

Los problemas mas serios en la estimacin de tiempos y tasas resultan de la! suposicin de un Reloj Molecular, cuando ste se encuentra ausente.! (Sanderson, 1998)! Numerosos estudios han mostrado que la diferencia de tasas entre linajes! es generalizada, mas que excepcional! Introduce sezgos impredecibles !

OG!

A!

B!

D (OG, A)! D (OG, B)!

D (OG, A) = D (OG, B)!

Heterogeneidad de Tasas
Pruebas de Constancia de Tasas Pruebas Globales! Prueba de Cociente de Verosimilitudes (Likelihood Ratio Test - LRT)!
A! B! Modelo sin constancia de tasas! -ln L(SC)! E! F! G! H! I! J! K! L! -ln L(RM) -ln L(RM) no sig < -ln L(SC) sig < -ln L(SC) " " aceptar Reloj Molecular y tiempos de divergencia ! rechazar Reloj Molecular! tiempos de divergencia! C! D! Modelo constante! -ln L(RM)!
E! G! H!

Heterogeneidad de Tasas
Pruebas de Constancia de Tasas Pruebas Globales! Prueba de Longitud de Ramas de Langley y Fitch (1974)!
1. Arbol con longitud de ramas!
B! A! C! D!

3. Usando la tasa de substitucin,! estimar longitudes de ramas! 2. Obtener (via ML)! - -ln L del rbol! - una sola tasa de sustitucin! - tiempos de divergencia!
A! B! C! E! F! G!

D!

F! I! K!

H! K!

J! L!

b(SC)!

I! J!

L!

b(RM)!

4. Comparar b(SC) y b(RM) mediante prueba de 2! b(SC) b(SC) no sig b(RM) " sig b(RM) " aceptar Reloj Molecular y tiempos de divergencia! rechazar Reloj Molecular!

2!

4!

1/26/11!

Heterogeneidad de Tasas
Pruebas de Constancia de Tasas Recomendaciones!

Relojes Moleculares Fechacin con Datos Moleculares!

I. El concepto del Reloj Molecular! II. Fuentes de error del Reloj Molecular!

(1) Utilizar una prueba global en un rbol logentico! Si el Reloj Molecular no es rechazado, considerar que se obtuvo un resultado conable. !

III. Mtodos de estimacin de tiempos de divergencia! A. Mtodos con tasas constantes - Relojes Moleculares Estrictos!

(2) Si el Reloj molecular es rechazado,! - llevar a cabo pruebas de constancia relativa deteccin de regiones con tasas diferentes!

B. Mtodos que implementan Relojes Moleculares Estrictos aunque las ! tasas de sustitucin sean heterogneas! C. Mtodos que incorporan diferentes tasas de sustitucin entre linajes ! Relojes Moleculares Relajados!

A. Mtodos con tasas constantes: Relojes Moleculares Estrictos! Supuesto:! La tasa de sustitucin molecular de genes y protenas es aproximadamente constante, por lo! que reeja linealmente el tiempo transcurrido. ! Mtodos:! 1. Regresin lineal:! La distancia gentica entre cada miembro de un par de especies y su ancestro comn es! la mitad de la distancia entre las dos secuencias (D).! Si conocemos el tiempo de divergencia entre dos especies (ej., del registro fsil), sta edad! absoluta representa una escala temporal para una distancia gentica de magnitud 1/2D.! Regresin lineal de distancias genticas respecto al tiempo.! 2. Optimizacin con mxima verosimilitud (ML) del Reloj Molecular:! Optimizacin de una sola tasa de sustitucin a un rbol con mxima verosimilitud.! Las edades (y el resto de los parmetros) pueden ser estimados con la tasa constante.! 3. Mtodo de Langley y Fitch! En un arbol con longitudes de rama, estimar con ML una sola tasa de sustitucin! Obtener longitudes de rama implementando la tasa de sustitucin constante! comparar mediante 2 las longitudes de rama observadas y esperadas con una sola tasa! 4. Mean path lengths (longitud media de senderos):! Estimar la longitud promedio entre un nodo calibrado, y todas sus terminales.! Obtener la relacin entre longitud (media) y tiempo transcurrido.! Extrapolar al resto del rbol! Relojes Moleculares Fechacin con Datos Moleculares!

I. El concepto del Reloj Molecular! II. Fuentes de error del Reloj Molecular! III. Mtodos de estimacin de tiempos de divergencia! A. Mtodos con tasas constantes - Relojes Moleculares Estrictos! B. Mtodos que implementan Relojes Moleculares Estrictos aunque las ! tasas de sustitucin sean heterogneas! C. Mtodos que incorporan diferentes tasas de sustitucin entre linajes ! Relojes Moleculares Relajados!

5!

1/26/11!

B. Mtodos con tasas heterogneas implementando Relojes Moleculares Estrictos! Supuesto:! A pesar de la ausencia de una constancia de tasas universal, ciertos linajes! comparten la misma tasa de sustitucin.! Mtodos:! 1. Arboles linearizados! 2. Mtodos de seleccin de modelos (Relojes Locales)! 3. Cuartetos (Quartets - Variacin de Relojes Locales incorporando verosimilitud)!

1. Arboles linearizados! (1) Identicar ramas que dieren de la tasa constante.!

A!

B!

C!

D!

E!

F!

G!

H!

I!

J!

K!

L! M!

N!

O!

1. Arboles linearizados! (1) Identicar ramas que dieren de la tasa constante.! (2) Excluir del rbol logentico.!

1. Arboles linearizados! (1) Identicar ramas que dieren de la tasa constante.! (2) Excluir del rbol logentico.! (3) Arbol linearizado distancia guarda una relacin lineal con el tiempo.!

A!

B!

C!

E!

F!

H!

I!

J!

K!

M!

O!

A!

B!

C!

E!

F!

H!

I!

J!

K!

M!

O!

6!

1/26/11!

1. Arboles linearizados! (1) Identicar ramas que dieren de la tasa constante.! (2) Excluir del rbol logentico.! (3) Arbol linearizado distancia guarda una relacin lineal con el tiempo.! (4) Mtodos de tasas constantes para estimar tiempos de divergencia.!
A! B! C! E! F! H! I! J! K! M! O!

1. Arboles linearizados! (1) Identicar ramas que dieren de la tasa constante.! (2) Excluir del rbol logentico.! (3) Arbol linearizado distancia guarda una relacin lineal con el tiempo.! (4) Mtodos de tasas constantes para estimar tiempos de divergencia.!
A! B! C! E! F! H! I! J! K! M! O!

Observaciones:! Necesario hacer varios pases de identicacin de tasas heterogneas! Utilidad limitada a casos de heterogeneidad contenida! Eliminacin de datos que no conforman a una hiptesis!

2. Mtodos de Seleccin de Modelos (Relojes Locales)! Supuesto: Los linajes cercanamente emparentados, o genes con similitud funcional, poseen tasas ! de sustitucin similares.!

2. Mtodos de Seleccin de Modelos (Relojes Locales)! Supuesto: Los linajes cercanamente emparentados, o genes con similitud funcional, poseen tasas ! de sustitucin similares.! (1) Identicar regiones en el rbol con tasas similares.!

A!

B!

C!

D!

E!

F!

G!

H!

I!

J!

K!

L! M!

N!

O!

A!

B!

C!

D!

E!

F!

G!

H!

I!

J!

K!

L! M!

N!

O!

7!

1/26/11!

2. Mtodos de Seleccin de Modelos (Relojes Locales)! Supuesto: Los linajes cercanamente emparentados, o genes con similitud funcional, poseen tasas ! de sustitucin similares.! (1) Identicar regiones en el rbol con tasas similares.! (2) Aplicar a cada region el Reloj Molecular de mejor ajuste.!

2. Mtodos de Seleccin de Modelos (Relojes Locales)! Supuesto: Los linajes cercanamente emparentados, o genes con similitud funcional, poseen tasas ! de sustitucin similares.! (1) Identicar regiones en el rbol con tasas similares! (2) Aplicar a cada region el Reloj Molecular de mejor ajuste! (3) Estimar edades en cada regin con mtodos de tasas constantes.!
M0! N! O! A! M0! B! C! M1! D! E! F! M0! G! H! I! M2! J! K! M3! L! M! N! M0! O!

M0! A! B! C!

M1! D! E! F!

M0! G! H! I!

M2! J! K!

M3! L! M!

2. Mtodos de Seleccin de Modelos (Relojes Locales)! Supuesto: Los linajes cercanamente emparentados, o genes con similitud funcional, poseen tasas ! de sustitucin similares.! (1) Identicar regiones en el rbol con tasas similares! (2) Aplicar a cada region el Reloj Molecular de mejor ajuste! (3) Estimar edades en cada regin con mtodos de tasas constantes.!
M0! A! B! C! M1! D! E! F! M0! G! H! I! M2! J! K! M3! L! M! N! M0! O!

3. Cuartetos (Quartets) Variacin de Relojes Locales incorporando verosimilitud! Supuesto: A pesar de la ausencia de una constancia de tasa universal, ciertos linajes! comparten la misma tasa de sustitucin.! (1) Delimitacin de dos pares de grupos hermanos (quartets) en un rbol logentico.! (2) Evaluacin de un modelo de dos tasas vs. modelo de tasas mltiples entre pares de! grupos hermanos, mediante prueba de razn de verosimilitudes.! (3) Si el modelo de tasas mltimpes es signicativamente mejor, el cuarteto es eliminado! del rbol.!

Observaciones:! Identicacin de regiones del rbol donde hay cambio de tasas requiere deuso de informacin externa.! Complejidad computacional asociada a la aplicacin de diferentes modelos.! A Heuristic Rate Smoothing (Yang, 2004. Acta Zoologica Sinica) mtodo que identica! regiones del rbol que pueden compartir un reloj molecular.!

8!

1/26/11!

Relojes Moleculares Fechacin con Datos Moleculares!

Relojes Moleculares Relajados! 1. Proceso compuesto de Poisson!

I. El concepto del Reloj Molecular! II. Fuentes de error del Reloj Molecular! III. Mtodos de estimacin de tiempos de divergencia! A. Mtodos con tasas constantes - Relojes Moleculares Estrictos! B. Mtodos que implementan Relojes Moleculares Estrictos aunque las ! tasas de sustitucin sean heterogneas! C. Mtodos que incorporan diferentes tasas de sustitucin entre linajes ! Relojes Moleculares Relajados! 1. Proceso compuesto de Poisson! 2. Autocorrelacin temporal! 3. Tasas de sustitucin obtenidas de alguna distribucin!

Huelsenbeck et al. 2000. PONER CITA COMPLETA! Mtodo paramtrico Bayesiano incluye MCMCs! La sustitucin molecular entre nodos es explicada por un proceso de Poisson! Un segundo proceso de Poisson modica la magnitud de la tasa de sustitucin en diferentes! ramas.! La magnitud y lugares de cambio son determinados por MCMC.! Parmetros de sustitucin que son modelados:! - nmero de eventos de cambios de tasa entre linajes! - rama del rbol en la que ocurren los cambios! - magnitud de cada evento de cambio! Parmetros del rbol:! - tasa de sustitucin molecular (nmero esperado de sustituciones por sitio,! por unidad de tiempo)! - edades de los nodos! - parmetro de Poisson que regula el cambio de tasas!

Relojes Moleculares Relajados! 2. Autocorrelacin temporal! Gillespie, J. 1991. PONER CITA COMPLETA! Supuesto:! Existe una probabilidad alta de que los linajes cercanamente emparentados tengan tasas! de sustitucin similares.! Justicacin:! Los linajes heredan de sus ancestros aquellos atributos que determinan las tasas de! sustitucin.! Mtodos:! (a) Evolucin de la tasa de evolucin molecular! (b) Nonparametric rate smoothing (NPRS)! (c) Verosimilitud Penalizada (Penalized likelihood, PL)!

Relojes Moleculares Relajados! 2. Autocorrelacin temporal! (a) Evolucin de la tasa de evolucin molecular! Thorne et al. 1998; Kishino et al. 2001; Thorne & Kishino 2002! Implementacin Bayesiana! Datos:! - rbol con longitud de ramas! - secuencias moleculares! . Parmetros a modelar:! - tasa de sustitucin en cada rama (r). Prior: distribucin lognormal alrededor de la tasa! del nodo inicial de una rama.! - tiempo en cada nodo (t). Prior: tasa de nacimiento de un proceso de Yule (nacimiento! puro = solo especiacin).! - parmetro de autocorrelacin (). Prior: distribucin gamma.! si es pequea, las tasas tienden a la constancia! si es grande, las tasas son mas heterogneas! Calculo de distribucines posteriores: MCMCs! Implementacin: Multidivtime Package (http:/ /statgen.ncsu.edu/thorne/)!

9!

1/26/11!

Relojes Moleculares Relajados! 2. Autocorrelacin temporal! (b) Nonparametric rate smoothing (NPRS)! Sanderson, M.J. 1997.! Implementacin totalmente numrica! Objetivo: Minimizar el cambio de tasa entre una rama y sus descendientes.! Datos:! - rbol con longitud de ramas! - calibracin temporal (absoluta o relativa)! Calculo de la tasa de sustitucin de cada rama:! - longitud de la rama: b = t! - tasa de la rama: = b/t! Minimizacin numrica:! - obtencin de correspondientes a las diferencias mnimas posibles entre ramas! - clculo de t asociadas a las m identicadas, con base en calibraciones temporales! absolutas! Implementacin: r8s (http:/ /loco.biosci.arizona.edu/r8s/)!

Relojes Moleculares Relajados! 2. Autocorrelacin temporal! (c) Verosimilitud penalizada (Penalized likelihood, PL)! Sanderson, M.J. 2002.! Implementacin que combina:! (a) una penalizacin numrica que evita cambios drsticos de tasas entre ramas; y! (b) un modelo paramtrico de ML que optimiza las tasas de sustitucin entre ramas.! Objetivo: Minimizar el cambio de tasa entre una rama y sus descendientes.! Datos:! - rbol con longitud de ramas! - calibracin temporal (absoluta o relativa)! Implementacin de heterogeneidad de tasas: Smoothing parameter ():! - si es grande: predomina la penalizacin numrica, y las tasas tienden a la constancia! - si es pequea: predomina el modelo paramtrico y hay mayor variacin de tasas! Determinacin de la magnitud del smoothing parameter ():! - validacin cruzada usando datos disponibles (longitudes de ramas terminales, o ! calibraciones temporales).! Implementacin: r8s (http:/ /loco.biosci.arizona.edu/r8s/)!

Verosimilitud Penalizada!
M. J. Sanderson (2002)!

Verosimilitud Penalizada!
M. J. Sanderson (2002)!

Reloj Molecular Relajado Semiparamtrico!

Reloj Molecular Relajado Semiparamtrico!

Modelo que optimiza las tasas en cada rama!

Penalizacin numrica que evita cambios drsticos !

10!

1/26/11!

Verosimilitud Penalizada!
M. J. Sanderson (2002)!

Verosimilitud Penalizada!
M. J. Sanderson (2002)!

Reloj Molecular Relajado Semiparamtrico!

Reloj Molecular Relajado Semiparamtrico!

Modelo que optimiza las tasas en cada rama!

Penalizacin numrica que evita cambios drsticos !

Modelo que optimiza las tasas en cada rama!

Penalizacin numrica que evita cambios drsticos !

Rate smoothing parameter ()

Rate smoothing parameter ()

pequea! predomina el modelo paramtrico )! permite amplias diferencias en la ! tasa de sustitucin entre linajes!

grande! predomina la penalizacin numrica! impide variacin de tasas de sustitucin! entre linajes, aproximndose al ! Reloj Molecular!

Relojes Moleculares Relajados! 3. Tasas de sustitucin obtenidas de alguna distribucin! Relaxed Phylogenetics and Dating with Condence! Drummond, A. and A. Rambaut, 2006.! Implementacin Bayesiana! Aproximacin novedosa a la estimacin logentica, que considera explcitamente que la ! sustitucin molecular ocurre a lo largo del tiempo.! Estimacin simultnea de logenia, tasas de sustitucin y tiempos de divergencia.! Datos:! - secuencias moleculares! - calibracin temporal (absoluta o relativa) (opcional)! - tasa de sustitucin (opcional)! - en la prctica, a veces se necesita un rbol fechado- para iniciar las bsquedas! Calculo de la tasa de sustitucin de cada rama:! Permite varios modelos. Si hay variacin de tasas entre linajes, las tasas de ramas! descendientes se toman estocsticamente de alguna distribucin! (e.g., normal, exponencial, lognormal).! Implementacin: BEAST y programas asociados (http:/ /beast.bio.ed.ac.uk/Main_Page)!

Y el registro fsil ?!
Crucial para establecer marco de referencia temporal absoluto!

Mtodos Paleobiolgicos (ejemplos):! Estimacin de intervalos de conanza a partir de primera y! subsecuentes apariciones en el registro fsil.! (Marshall 1990, 1994, 1997)! Evaluacin de la probabilidad de historia faltante! (Foote et al., 1999)! Pruebas de verosimilitud de duraciones postuladas! (Wagner, 2000)!

11!

También podría gustarte