Está en la página 1de 19

Mxima Verosimilitud y reconstruccin ancestral

Aproximacin de Mxima verosimilitud

Verosimilitud probablidad.
Verosimilitud: Funcin de los parmetros de un modelo
estadstico que permite realizar inferencias acerca de su valor a
partir de un conjunto de observaciones
Probabilidad Permite, a partir de una serie de parmetros
conocidos, realizar predicciones acerca de los valores que
toma una variable aleatoria
Es una forma de ajustar modelos, estimar parmetros a partir
de los datos. Usado en varios mbitos cientficos.
Requerimientos

Datos observados+modelo probabilistico de cmo surgieron los datos


observados.

Modelo Probabilistico: Permite calcular la probabilidad de cualquier


posible resultado (dado un set especfico de valores para los
parmetros del modelo)

Ejemplo de cara/cruz de una moneda

Datos:

Luego de lanzar una moneda al aire 10 veces, se obtienen 7


caras (h) y 3 cruces.

Modelo:

La probabilidad de obtener caras es p, mientras que la de


obtener cruces es 1-p. (Ignorando la posibilidad de que la
moneda caiga sobre su borde...)

Siguiendo una distribucin binomial, la probabilidad de obtener


h en n intentos es:

Objetivo: Encontrar el mejor estimador del parmetro desconocido


(p nico parametro en este ejemplo) en base a las observaciones

Aproximacin de Mxima verosimilitud

Verosimilitud (Modelo) = Probabilidad (Datos|Modelo)


Probabilidad de los datos
dado el modelo y sus parmetros

Mxima Verosimilitud: Los mejores estimadores son el set de


valores de parmetros que den la mxima verosimilitud
(probabilidad) de los datos.

Aproximacin de Mxima verosimilitud

P
h

Datos: 10 lanzamientos 7
caras, 3 cruces
Modelo: las caras ocurren
con probablidad p y las
cruces con 1-p

Se opta por una solucin


numrica

Obj: Encontrar el valor de p


que de la mejor probabildad
para los datos

Modelo probabilistico aplicado a filognia

Datos: alineamiento (ojo con los


errores)
Modelo: Una secuencia
ancestral evolucion en las
secuencias observadas (3 en
este ejemplo)
Parmetros:
Topologa y distancia en las
ramificaciones
Frecuencia de nucletidos
Tasas de sustitutcin
nucletido-nucletido
(Modelos de evolucin)

Para el caso de la moneda haba


una formula, pero aca??... Cmo
calcular los valores de los
parmetros?

Clculo de la probabilidad de una columna en un


alineamiento, dada la topologa y otros parmetros

Cada columna del alineamiento


contiene nucletidos homlogos.
Esto es, surgen a partir de un
solo ancestro comn
Objetivo: Calcular la
probabilidad del alineamiento
Parmetros:

Clculo para una


sola columna

Topologa, distancia de las


ramificaciones, frecuencia de
nt, tasas de sustitucin

Asignar valores aleatorios a


todos los parmetros y calcular
la probabildad a partir de
cualquier tip.
Aqui, arbitrariamente los
ancestros son A y A.

Clculo de la probabilidad de una columna en un


alineamiento, dada la topologa y otros parmetros

Se calcula la Probabilidad, pero


para cada una de las posibles
combinaciones (16 en este
ejemplo) de nucletidos ancestros.
L(j) es la probabildad total de la
suma de probabilidades para cada
combinacin de nt
El clculo se hace de la misma
forma para cada columna del
alineamiento
La probabilidad resultante
(Probabildad del modelo), viene de
la multiplicacin (eventos
independientes) de los valores de
suma anteriores
Como la multiplicacin de valores
pequeos entrega valores ms
pequeos an, puede producirse
un error underflow. Por eso se
aplica Ln a los resultados

Probabilidad de la columna en el alineamiento: clculo


para cada posible par de nucletidos ancestros

Una secuencia ancestral ha evolucionado


hacia los datos observados en el
alineamiento
Requerimientos
mnimos, pueden
incluirse ms
parmetros

(Parecido a la bsqueda heurstica)

Varios mximos
locales hasta obtener
el global

Probabilidad de la columna en el alineamiento: clculo


para cada posible par de nucletidos ancestros

Esta es la base para establecer


cmo pueden haber sido las
secuencias ancestrales
Por ejemplo, aca T-G>>>A-A
Este anlisis es necesario para
cada posicin del alineamiento
Es de inters establecer la
secuencia de cada nodo ancestro
(e.g. Mamferos, verterbrados,
proteobacteria, etc)

Probabilidad de la columna en el alineamiento: clculo


para cada posible par de nucletidos ancestros

Para el nodo 1, agrupar las


probabilidades de cada posible
ancestro y sumarlas.

Reconstruccin de Ancestros

Mxima probablidad:
100x ms que G/C
10000x ms que A

Reconstruccin de Ancestros

Este ancestro se ajusta a los


datos observados: ambos
descencientes son T

Reconstruccin Ancestral

El anlisis se hace para cada columna, por lo que al final se obtiene


una secuencia ancestral
Es posible sintetizar esta secuencia ancestral y experimentalmente
probar su funcin
Algunas protenas investigadas de esta forma son:

Ribonucleasas

Chymase proteasas

Factores de transcripcin Pax

Rodopsinas de vertebrados

Receptores esteroideos

Factor de elongacin EF-Tu

Edad de las protenas reconstruidad: 5 millones 1 billon de aos


atrs

Reconstruccin Ancestral: Rodopsinas en visin


nocturna de dinosaurios

Rodopsinas:
Transformacin de la luz
en energa y deteccin de
estimulos luminosos en el
ojo (a travs de la
protena G - transduccin de seales)
Rol en visin nocturna
(luz tenue)
Reconstruccin de la
secuencia de rodopsina
en un grupo de
dinosaurios
Protena funcional!
Sugiere que este
dinosaurio tenia
visibilidad nocturna y que
probablemente tena
hbitos nocturnos...

Reconstruccin Ancestral: Termoestabilidad de protenas


ancestrales

Resurreccin de factores
de elongacin proticos
Se midieron las T de
denaturacin para cada
uno de los ancestros
resucitados

Reconstruccin Ancestral: Termoestabilidad de protenas


ancestrales

Reconstruccin Ancestral: Manuscritos

Copias de textos realizadas en


conventos de monjes (copia de una
copia de otra copia, etc, etc...)
El proceso de copia se parece a la
replicacin del DNA (se introducen
errores)
Puede realizarse un anlisis
filogentico pra reconstruir los
rboles de las copias existentes
(Hay un agrupamiento).
Reconstruccin ancestral: permite
descifrar cual es la palabra original
ms probable y asi reconstruir el
manuscrito entero.
Ej: