Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Reconstrucción de árboles
filogenéticos
Estudiantes:
● Correa Trigoso, Sheila Paola
● Mendoza Chugnas, Leydi Thatiana
Docente:
● Juan Javier, Pedro Huaman
Asignatura:
● Bioinformática
2023-I 1
ÌNDICE
3
Objetivos 4
Importancia 5
Fig. 1. Visualización general de la página Sequence Matrix 6
Fig. 2. Visualización SequenceMatrix-Window-18.zip 7
Fig. 3. Visualización de los dos alineamientos en SequenceMatrix-Window-18.zip 8
Fig. 4. Ediciòn de GAPs en Aliview 9
Fig. 5. Guardar el archivo en formato Fasta 10
Fig. 6. Eliminaciòn de GAPs en UGENE 11
Fig. 7.Guardar el archivo en formato Fasta 12
Fig. 8.Descarga del programa JModelTesT 13
Fig. 9. Elección de nuestra secuencia 14
Fig. 10.Visualización de los parámetros en JMlodesTest 15
Fig. 11. Generando resultados en JMlodesTest 16
Fig. 12. Visualizaciòn de resultados en JMlodesTest 17
Fig. 13. Elección del mejor modelo evolutivo 18
Fig. 14. Instalación de programas en RStudio 19
Fig. 15. Generando la matriz de distancia 20
Fig. 16. Construcción del àrbol UPGMA en RStudio 21
Fig.17. Construcción del árbol Neighbor-Joining en RStudio 22
Fig.18. Construcción del árbol de Máxima Parsimonia en RStudio 23
Fig.19. Construcción del árbol de Máxima Verosimilitud en RStudio 24
Fig.20. Optimización de acuerdo al modelo evolutivo 25
Fig.21. Visualización página iTOL (Interactive tree of life) 26
Fig.22. Visualización del paso a seguir para crear un árbol 27
Fig.23. Visualización del panel de control para la edición de los árboles 28
Fig.24. Puntos importantes de un árbol filogenético 29
Fig.25. Visualización de árbol filogenéticos en UPGMA realizado en iTOL 30
Fig.26. Visualización de árbol filogenéticos en NJ realizado en iTOL 31
Fig.27. Visualización de árbol filogenéticos en ML realizado en iTOL 32
Investigaciones realizados con respecto a la reconstrucción de árbol filogenético 36
Conclusiones
2
OBJETIVOS
● Construcción de los árboles
filogenéticos utilizando el formato
NJ, Máxima Parsimonia y Maximum
Likelihood, en el programa RStudio.
● Visualización y edición de los árboles
filogenéticos en la plataforma iTOL.
IMPORTANCIA
La reconstrucción de árboles
filogenéticos es de importancia ya que
nos permite comprender la historia
evolutiva de las especies, además nos
ayuda a organizar y clasificar a estas
mismas en diferentes grupos.
Fig.1. Visualización general de la página Sequence Matrix
Ingresar a
Sequence Matrix
y descargar
“SequenceMatrix
-Window-18.zip”
http://www.ggvaidya.com/taxondna/ 5
Fig.2. Visualización SequenceMatrix-Window-18.zip
1 2
Exportamos el archivo en
“export Sequences
NEXUS” colocando al final
del nombre del archivo la
extensión “. nex”
8
Fig.5. Guardar el archivo en formato Fasta
Seleccionar
“file” y
guardarlo en
formato FASTA
para poder
usarlo en los
siguientes
programas.
9
Fig.6. Eliminaciòn de GAPs en UGENE
Para la eliminación
de GAPs ingresar a
“Actions”,
seleccionar “Edit”
y la opción
“Remove columns
of gaps”, y remover
los gaps en un
10%.
10
Fig.7. Guardar el archivo en formato Fasta
● Seleccionar “actions”.
● Opciòn “export”.
● Opciòn “Save subalignment”.
● Guardar en formato “FASTA”.
NOTA: Verificar que el archivo termine en “.fa” y esté
en formato FASTA.
11
Fig.8. Descarga del programa JModelTesT
1 4
13
Fig.10. Visualización de los parámetros en JMlodesTest
1 2
Seleccionar “analysis” para editar parámetros (en caso sea necesario), luego seleccionar la opciòn “compute likelhood”, y en una nueva
ventana se nos visualiza los ajustes tales como: El nùmero de procesadores requeridos, ajustes de probabilidad (número de esquemas
de sustituciòn, variaciòn de la tasa, búsqueda del árbol base). para la elección del mejor modelo evolutivo trabajaremos con máxima
verosimilitud optimizada.
14
Fig.11. Generando resultados en JMlodesTest
1 2
● Se visualizan los resultados de los valores de similitud con respecto a los modelos evolutivos. Se puede visualizar las
frecuencias y ratios de las bases del modelo.
● AIC (Akaike Information Criterion), y BIC (Bayesian Information Criterion), buscan la simplicidad del modelo mejor
modelo evolutivo.
15
Fig.12. Visualizaciòn de resultados en JMlodesTest
1 2
Se visualizan los resultados de los valores de similitud con respecto a los modelos evolutivos. Se puede
visualizar las frecuencias y ratios de las bases del modelo.
16
Fig.13. Elección del mejor modelo evolutivo
1 2
Para ordenar los resultados de menor a mayor dar click “AICc”, lo Para ordenar los resultados de menor a mayor dar click “BIC”, lo cual
cual nos indica el mejor modelo evolutivo. nos indica el mejor modelo evolutivo. Por defecto se trabajara con el
BIC 17
Fig.14. Instalación de programas en RStudio
Para la reconstrucción
Entorno: Se guardan todos los
de árboles
Script: Consola para ejecutar los
objetos y los valores que se filogèneticos es
comandos.
van creando en el programa. necesario la instalación
Se escriben los códigos para
estructurar el análisis de datos, que de los paquetes que se
se usan para realizar diferentes
funciones.
visualizan en “Script”,
así mismo se debe
activar en el “panel de
usos múltiples”.
RStudio es un software
de código abierto que
nos permite visualizar
Lìnea de comando: Lugar el análisis de datos y su
donde se observan los Panel de usos múltiples: representación gráfica.
resultados de los Scripts. Muestra los archivos que están
guardados en el disco duro, los
gráficos que vamos creando,
los paquetes.
18
Fig.15. Generando la matriz de distancia
Se visualiza la matriz de
distancia (cada entrada de la
matriz representa la distancia
entre dos secuencias), dónde el
color negro indica la distancia,
el color plomo nos indica la
mayor distancia que presentan
las especies, mientras que la
línea de color blanco que se
vizualisa verticalmente nos
indica las coincidencias (match).
19
Fig.16. Construcción del àrbol UPGMA en RStudio
● El UPGMA realiza
un agrupamiento
secuencial hasta
la raíz, además de
ser más rápido.
● Genera árboles
enraizados,
además de
agruparlos en
pares.
● Se basa en
distancias.
20
Fig.17. Construcción del árbol Neighbor-Joining en
RStudio
● Consiste en minimizar
la longitud total del
árbol, es decir la
cantidad de cambios
moleculares requeridos
a lo largo del árbol, es
eficiente ya que no
considera árboles
evolutivos.
● Basado en la evolución
mínima siendo más
rápido que este mismo.
● El árbol óptimo es el
que requiere la menor
longitud.
21
Fig.18. Construcción del árbol de Máxima Parsimonia en
RStudio
● El valor en máxima
parsimonia (MP) es el
mínimo número de
cambios requeridos o
cambios evolutivos,
pues seleccionan los
árboles que minimizan
el número de
sustituciones. Entonces
el árbol con la longitud
más baja es el árbol más
parsimonioso (el más
probable de ser el
correcto).
22
Fig.19. Construcción del árbol de Máxima Verosimilitud
en RStudio
● Trata de encontrar el
árbol más probable.
● Este método puede
generar árboles
enraizados y no
enraizados.
● Proporciona
información sobre el
ancestro común.
● Permite modelar las
relaciones evolutivas.
● Busca todas las
topologías.
23
Fig.20. Optimización de acuerdo al modelo evolutivo
● Para la optimizaciòn
del árbol se utiliza el
código “fitTR <-
pml_bb(seqbio1,
model=“TIM3+G(4)+
1””
● “TIM3+G(4)+1”, es el
valor màs bajo que
se obtuvo para
predecir el modelo
evolutivo, con el
código de “mt <-
modelTest(seqbio2)”
24
Fig.21. Visualización página iTOL (Interactive tree of life)
ITOL (Interactive
tree of life), Es
una herramienta
que nos ayuda con
la visualización,
anotación y
gestión de árboles
filogenéticos.
25
https://itol.embl.de/
Fig.22. Visualización del paso a seguir para crear un árbol
https://itol.embl.de/upload.cgi 26
Fig.23. Visualización del panel de control para la edición
de los árboles
https://itol.embl.de/tree/13215713197135781686507327 27
Fig.24. Puntos importantes de un árbol filogenético
28
Fig.25. Visualización de árbol filogenéticos en UPGMA realizado en iTOL
Puntos de
ramificaciòn
Ramas
30
Fig.27. Visualización de árbol filogenéticos en ML realizado en iTOL
32
1
Influencia de la selección del modelo de
sustitución en la reconstrucción de árboles
filogenéticos de proteínas.
Del Amparo, R., & Arenas, M. (2023). Influence of substitution model selection on protein
phylogenetic tree reconstruction. Gene, 865, 147336.
https://www.sciencedirect.com/science/article/pii/S0378111923001774
33
Reconstrucción de árboles filogenéticos
2
de procariotas utilizando intervalos
comunes máximos.
Heydari, M., Marashi, S. A., Tusserkani, R., & Sadeghi, M. (2014). Reconstruction of phylogenetic trees of
prokaryotes using maximal common intervals. Biosystems, 124, 86-94.
https://www.sciencedirect.com/science/article/abs/pii/S030326471400121X
34
La reconstrucción filogenética del cáncer de
3
mama revela dos rutas de diseminación
metastásica asociadas con resultados clínicos
distintos
Venet, D., et al. (2020). Phylogenetic reconstruction of breast cancer reveals two routes of metastatic
dissemination associated with distinct clinical outcome. EBioMedicine, 56, 102793.
https://www.sciencedirect.com/science/article/pii/S2352396420301687
35
CONCLUSIONES
En conclusión se logró construir árboles
filogenéticos en el formato NJ, Máxima
Parsimonia y Maximum Likelihood, en el
programa RStudio. Asimismo se logró
realizar la edición en la plataforma iTOL.