Está en la página 1de 16

UNIVERSIDAD AUTÓNOMA DE SINALOA

FACULTAD DE CIENCIAS QUÍMICO- BIOLÓGICAS


LIC. BIOTECNOLOGÍA GENÓMICA

EVOLUCIÓN MOLECULAR
TEMA: Árboles Filogenéticos Método Bayesiano para el gen de la
Prolactina (PRL)
Dra.: Maricela Sarita Montaño Valdez
Alumnos:
Castro Esparza B. Daniel
Pérez Valenzuela Jahaziel
GRUPO: 5-1

Culiacán, Sinaloa, a 29 de noviembre de 2019


INTRODUCCIÓN

La Inferencia Bayesiana en filogenia genera la probabilidad posterior de un


parámetro, un árbol filogenético y/o un modelo evolutivo, basada en la
probabilidad anterior de ese parámetro y la función de verosimilitud de los datos.
La aplicación del análisis bayesiano en la inferencia filogenética presenta varias
ventajas en comparación con otros métodos de inferencia, como la fácil
interpretación de los resultados, la posibilidad de usar información apriorística y
algunas ventajas computacionales. Se calcula la probabilidad de que nuestro
árbol sea correcto condicionada por los datos que tenemos: P (árbol|datos). Lo
contrario a otros métodos, que calculan la probabilidad de que nuestros datos se
adapten al árbol: P (datos|árbol),

El Método Bayesiano se basa en la interrelación cuantitativa entre la función


de verosimilitud y las distribuciones anteriores y posteriores de probabilidad. Esta
interrelación viene dada por el Teorema de Bayes, el cual permite calcular la
probabilidad posterior a partir de la verosimilitud y probabilidad anterior de los
datos.

En la Inferencia Filogenética Bayesiana el objetivo no es determinar un solo


árbol filogenético de máxima probabilidad posterior (el objetivo de la MV), sino
más bien calcular una muestra de árboles filogenéticos de acuerdo con la
probabilidad posterior de distribución de los mismos. Dicha muestra de árboles se
procesa adicionalmente, para generar un único árbol de consenso. Esta
integración de árboles otorga la ventaja de incluir la incertidumbre presente en la
determinación de la topología, longitudes de rama y parámetros del modelo
evolutivo.

Sin embargo, los métodos de IB tienen una conexión fuerte con la MV, ya
que la hipótesis preferida es aquélla con la mayor probabilidad posterior, y éste es
un valor que se calcula en función de la verosimilitud. Puesto que la IB se basa
directamente en la verosimilitud, comparte sus propiedades de eficiencia y
consistencia.
METODOLOGÍA

Para descargar y ejecutar las secuencias de interés

Obtuvimos el formato .nex a partir del archivo fasta del alineamiento


obtenido en la práctica anterior
convirtiéndolo en una plataforma
online
(http://sequencecon version.bugaco.com
/converter/biology/s equences/fasta_to_
nexus.php)

Creamos la carpeta DCJV donde se encuentra las


secuencias en formato .nex y el programa Mr. Bayes para poder
ejecutar los comandos.

PRIMERA PARTE DE LA PRÁTICA

Para abrir las secuencias de interés


Fue tipeado el comando de DCJV.nexus en este caso denominado:
DCJV.nex. Que recaba los datos del archivo en el programa. Este archivo es
necesario que se encuentre en el mismo directorio que el programa de Mr. Bayes.
El archivo Nexus es un texto simple en código ASCII que contiene el número de
taxones y el número de caracteres en cada secuencia alineada. Se muestra una
matriz seguido de las secuencias alineadas.

Tipeamos ahora el comando lset nst=6 rates=invgamma, que prepara el


modelo evolutivo al modelo GTR con una tasa de variación de distribución gamma
de los sitios cruzados y una proporción de los sitios invariables. La estructura
general del modelo de sustitución se determina por el comando Nst. Al tipear este
comando para el modelo GTW, Mr. Bayes se configura para la configuración del
cambio de modelo.
Un punto importante aquí es que los parámetros lset y prset, se utilizan
para especificar el modelo evolutivo que se utilizará en el análisis, lset se usa para
definir la estructura del modelo y prset se usa para definir las distribuciones de
probabilidad anteriores en los parámetros del modelo.

En el siguiente paso, en la interfaz, fue tipeado ahora mcm ngen=10000


samplefreq=10, para asegurarnos que tengamos por lo menos 1,000 muestras de
distribución de probabilidad posterior. Para datos más grandes podría ser
necesario el análisis más largo y menos muestras. Si la desviación estándar de
las frecuencias divididas es menor de 0.01 después de 100,000 generaciones se
debe detener la corrida respondiendo "no" en el programa cuando éste
pregunte. Por tal, al haber obtenido XXXX, no fue necesario correr más tiempo el
análisis. No es hasta el comando mcm que el análisis inicia y Ngen indica el
número de generaciones para la cual se llevará a cabo el análisis. Se arrojaron los
siguientes resultados:
Los parámetros fueron resumidos por el tipeo del comando sump
burnin=250, donde este programa nos mostró una tabla del resumen de los
modelos de substitución de las muestras, incluyendo el promedio, modo y 95% de
intervalos de credibilidad en cada parámetro.
Fue realizado un resumen de los árboles mediante el comando sumt
burnin=250, donde el árbol mostró un cladograma con las probabilidades
posteriores de cada corte y un filograma con las longitudes de ramas promedio.
SEGUNDA PARTE DE LA PRÁCTICA

Resultados de Árboles Filogenéticos Método Bayesiano

CLADOGRAMA: Es un diagrama o esquema ramificado de las


características compartidas por un grupo de organismos, representando la historia
evolutiva más probable del linaje.

Los cladogramas se caracterizan porque agrupan a las taxa basándose en


sus sinapomorfías o caracteres derivados que son de carácter compartido,
permiten visualizar las relaciones filogenéticas entre un grupo o grupos de
organismos de interés.

En Evolución Molecular, estos diagramas hacen posible la elaboración de


los árboles filogenéticos y, por lo tanto, reconstruir la historia evolutiva de un
grupo, ayudando a definir su clasificación y rangos taxonómicos.
Además, ayuda a elucidar los mecanismos evolutivos examinando la
manera en la que los organismos cambian en el tiempo, la dirección de este
cambio y la frecuencia en que lo hacen.

FILOGRAMA: En Evolución Molecular representa la historia filogenética de


un grupo en forma de una secuencia de organismos ancestros y descendientes,
convencionalmente diagramado como líneas que representan los linajes, nodos
que representan los puntos de divergencia entre ellos, nodos terminales que
representan el ancestro (en el sector inferior) y los linajes derivados (en el sector

superior) y en sus ramas puede estar representada de diferentes formas la


modificación evolutiva dentro de cada linaje independiente luego de la divergencia.
Los linajes se caracterizan por ser "cohesivos" en cada momento y "continuos" en
el tiempo, su pool genético está integrado, pero cambia a lo largo del tiempo, por
lo que no necesariamente representan similitud fenotípica ni genotípica.

De manera general, en la figura de abajo se muestran los archivos que iban


generando cada uno de los comandos empleados en la práctica, esto
correspondiente a la generación de los árboles en el Método Bayesiano tanto el
Cladograma como el Filograma.

TERCERA PARTE DE LA PRÁCTICA

Visualización de los Árboles Filogenéticos por Tree View

TreeView sirve para mostrar datos jerárquicos, en una estructura de árbol,


el control TreeView se compone de uno o varios nodos. Cada entrada en el árbol
se conoce como nodo.

Tipos de Nodos

a. Raíz: Nodo que no tiene ningún nodo primario y tiene uno o varios nodos
secundarios. b. Primario: Nodo que tiene un nodo primario y uno o varios nodos
secundarios. c. Hoja: Nodo que no tiene ningún nodo secundario.
Aunque un árbol típico sólo tiene un nodo raíz, el control TreeView le

permite agregar varios nodos raíz a la estructura de árbol. Esto resulta útil cuando
se desean mostrar las listas de elementos sin mostrar un único nodo raíz principal,
como en los ejemplos de árboles generados durante esta práctica.

ÁRBOL 1 TREEVIEW

ARBOL 2 TREEVIEW
El árbol consenso que se arroja entre estos dos árboles del Método
Bayesiano es menos resolutivo, de mayor longitud y menos informativo, esto se
debe al hecho de que los caracteres sobre el árbol consenso tienden a cambiar
más veces que en un árbol cualquiera, en el que los cambios se minimizan y es
por eso que se pueden observar ciertas diferencias entre el cladograma y el
filograma obtenido por el Método Bayesiano y a su vez entre estos mismos.

Y si contrastamos estos resultados con los modelos utilizados


anteriormente también podemos observar algunas diferencias entre estos ya que
en la Inferencia Filogenética Bayesiana el objetivo no es determinar un solo árbol
filogenético de máxima probabilidad posterior, sino más bien calcular una muestra
de árboles filogenéticos de acuerdo con la probabilidad posterior de distribución de
los mismos.
CONCLUSIÓN
La Inferencia Bayesiana calcula una probabilidad posterior para cada árbol
posible dado un modelo de evolución y unas observaciones. Es decir, dadas unas
observaciones la inferencia bayesiana actualiza las probabilidades de que los
árboles sean correctos.

En caso de la Filogenia Bayesiana dados los datos que hemos observado,


normalmente una serie de secuencias, y unas probabilidades a priori se generan
unas probabilidades tanto para el conjunto de posibles árboles como para los
parámetros del modelo de mutación. En este caso el modelo de mutación también
debe ser elegido antes de comenzar la reconstrucción filogenética

En los Métodos Bayesianos los nodos tienen asociados una probabilidad


posterior que indica la confianza que podemos tener en ellos, pero en el resto de
metodologías debemos utilizar algún método para hacer esta evaluación. Un
método ideal consistiría en obtener varios conjuntos de datos independientes y
generar a partir de ellos distintos árboles. Comparando qué nodos son
compartidos por estos árboles y cuales no podríamos hacernos una idea de qué
resulta fiable y qué no. Desgraciadamente este método no resulta práctico en
muchas ocasiones por lo que se han desarrollado otros algoritmos que nos
ofrecen algo similar a tener varios conjuntos de datos para obtener distintos
árboles. Uno de los más utilizados es el Bootstrap.

Existen un gran número de modelos evolutivos y métodos para llevar a


cabo un análisis filogenético, la utilización de cualquiera de estos dependerá el
tipo de análisis y los resultados que queremos obtener, ya que estos presentan
ventajas y desventajas entre ellos. En el caso de la inferencia al ser métodos
estadísticos basados en modelos de evolución molecular, se toma en cuenta
conocimiento a priori acerca de los caracteres, especialmente cuando son
caracteres moleculares Y además la IB utiliza atajos para los cálculos al emplear
el algoritmo conocido como Markov Chain Monte Carlo (MCMC), el cual permite
realizar búsquedas a través de un número menor de árboles según sus valores de
probabilidades posteriores. Esto permite que la IB demande menos poder
computacional y sea más rápida.

También podría gustarte