Bioinformatica 7 II Unidad

Universidad Nacional de Trujillo
Escuela de Ciencias Biológicas

Facultad de ciencias biológicas
Reconstrucción de árboles
filogenéticos
Estudiantes:
● Correa Trigoso, Sheila Paola
● Mendoza Chugnas, Leydi Thatiana
Docente:
● Juan Javier, Pedro Huaman
Asignatura:
● Bioinformática
2023-I 1
ÌNDICE
3
Objetivos 4
Importancia 5
Fig. 1. Visualización general de la página Sequence Matrix 6
Fig. 2. Visualización SequenceMatrix-Window-18.zip 7
Fig. 3. Visualización de los dos alineamientos en SequenceMatrix-Window-18.zip 8
Fig. 4. Ediciòn de GAPs en Aliview 9
Fig. 5. Guardar el archivo en formato Fasta 10
Fig. 6. Eliminaciòn de GAPs en UGENE 11
Fig. 7.Guardar el archivo en formato Fasta 12
Fig. 8.Descarga del programa JModelTesT 13
Fig. 9. Elección de nuestra secuencia 14
Fig. 10.Visualización de los parámetros en JMlodesTest 15
Fig. 11. Generando resultados en JMlodesTest 16
Fig. 12. Visualizaciòn de resultados en JMlodesTest 17
Fig. 13. Elección del mejor modelo evolutivo 18
Fig. 14. Instalación de programas en RStudio 19
Fig. 15. Generando la matriz de distancia 20
Fig. 16. Construcción del àrbol UPGMA en RStudio 21
Fig.17. Construcción del árbol Neighbor-Joining en RStudio 22
Fig.18. Construcción del árbol de Máxima Parsimonia en RStudio 23
Fig.19. Construcción del árbol de Máxima Verosimilitud en RStudio 24
Fig.20. Optimización de acuerdo al modelo evolutivo 25
Fig.21. Visualización página iTOL (Interactive tree of life) 26
Fig.22. Visualización del paso a seguir para crear un árbol 27
Fig.23. Visualización del panel de control para la edición de los árboles 28
Fig.24. Puntos importantes de un árbol filogenético 29
Fig.25. Visualización de árbol filogenéticos en UPGMA realizado en iTOL 30
Fig.26. Visualización de árbol filogenéticos en NJ realizado en iTOL 31
Fig.27. Visualización de árbol filogenéticos en ML realizado en iTOL 32
Investigaciones realizados con respecto a la reconstrucción de árbol filogenético 36
Conclusiones
2
OBJETIVOS
● Construcción de los árboles
filogenéticos utilizando el formato
NJ, Máxima Parsimonia y Maximum
Likelihood, en el programa RStudio.
● Visualización y edición de los árboles
filogenéticos en la plataforma iTOL.
IMPORTANCIA
La reconstrucción de árboles
filogenéticos es de importancia ya que
nos permite comprender la historia
evolutiva de las especies, además nos
ayuda a organizar y clasificar a estas
mismas en diferentes grupos.
Fig.1. Visualización general de la página Sequence Matrix
Ingresar a
Sequence Matrix
y descargar
“SequenceMatrix
-Window-18.zip”
http://www.ggvaidya.com/taxondna/ 5
Fig.2. Visualización SequenceMatrix-Window-18.zip
1 2
Ingresar a escritorio e ir a “descargas”, click derecho en el documento “SequenceMatrix-Window-18.zip” y

seleccionar en “extraer en SequenceMatrix-Window-18.zip”, lueo en Disco local (c), inresar a “windows” y
seleccionar la carpeta “SequenceMatrix.jar” y se nos abrirá la interfaz de “SequenceMatrix-18”, finalmente
copiar y pegar nuestros dos alineamientos descarados previamente. 6
Fig.3. Visualización de los dos alineamientos en
SequenceMatrix-Window-18.zip
Exportamos el archivo en
“export Sequences
NEXUS” colocando al final
del nombre del archivo la
extensión “. nex”
Se visualiza los dos alineamientos múltiples en

SequenceMatrix 1.8, asi mismo podemos
visualizar los dos marcadores moleculares
“SEPS16S” y “SEPSH3”, su longitud, Nombre
científico de las especies.
7
Fig.4. Ediciòn de GAPs en Aliview
Los GAPs se visualizan

en signos de “?” en
lugar de “-”, para esto
seleccionar “Edit” y la
opción “replace
messing char (?) into
GAP (-)”
8
Fig.5. Guardar el archivo en formato Fasta
Seleccionar
“file” y
guardarlo en
formato FASTA
para poder
usarlo en los
siguientes
programas.
9
Fig.6. Eliminaciòn de GAPs en UGENE
Para la eliminación
de GAPs ingresar a
“Actions”,
seleccionar “Edit”
y la opción
“Remove columns
of gaps”, y remover
los gaps en un
10%.
10
Fig.7. Guardar el archivo en formato Fasta
● Seleccionar “actions”.
● Opciòn “export”.
● Opciòn “Save subalignment”.
● Guardar en formato “FASTA”.
NOTA: Verificar que el archivo termine en “.fa” y esté
en formato FASTA.
11
Fig.8. Descarga del programa JModelTesT
1 4
Para considerar el modelo evolutivo a trabajar se utiliza

3 el programa “JModelTesT”, que nos ayuda al análisis y la
toma de decisión para el análisis filogenético. Hace
análisis paralelos usando un modelo de sustitución
nucleotídica diferente en cada uno. Además muestra
todos los valores evolutivos y las combinaciones de las
distribuciones Gamma (G+) y +I.
12
Fig.9. Elección de nuestra secuencia
Seleccionar “file” y luego la primera

opción “Load DNA alignment”, y
seleccionar nuestra secuencia que
se requiere estudiar; tener en
cuenta que la secuencia debe de
estar en formato FASTA.
13
Fig.10. Visualización de los parámetros en JMlodesTest
1 2
Seleccionar “analysis” para editar parámetros (en caso sea necesario), luego seleccionar la opciòn “compute likelhood”, y en una nueva
ventana se nos visualiza los ajustes tales como: El nùmero de procesadores requeridos, ajustes de probabilidad (número de esquemas
de sustituciòn, variaciòn de la tasa, búsqueda del árbol base). para la elección del mejor modelo evolutivo trabajaremos con máxima
verosimilitud optimizada.
14
Fig.11. Generando resultados en JMlodesTest
1 2
● Se visualizan los resultados de los valores de similitud con respecto a los modelos evolutivos. Se puede visualizar las
frecuencias y ratios de las bases del modelo.
● AIC (Akaike Information Criterion), y BIC (Bayesian Information Criterion), buscan la simplicidad del modelo mejor
modelo evolutivo.
15
Fig.12. Visualizaciòn de resultados en JMlodesTest
1 2
Se visualizan los resultados de los valores de similitud con respecto a los modelos evolutivos. Se puede
visualizar las frecuencias y ratios de las bases del modelo.
16
Fig.13. Elección del mejor modelo evolutivo
1 2
Para ordenar los resultados de menor a mayor dar click “AICc”, lo Para ordenar los resultados de menor a mayor dar click “BIC”, lo cual
cual nos indica el mejor modelo evolutivo. nos indica el mejor modelo evolutivo. Por defecto se trabajara con el
BIC 17
Fig.14. Instalación de programas en RStudio
Para la reconstrucción
Entorno: Se guardan todos los
de árboles
Script: Consola para ejecutar los
objetos y los valores que se filogèneticos es
comandos.
van creando en el programa. necesario la instalación
Se escriben los códigos para
estructurar el análisis de datos, que de los paquetes que se
se usan para realizar diferentes
funciones.
visualizan en “Script”,
así mismo se debe
activar en el “panel de
usos múltiples”.
RStudio es un software
de código abierto que
nos permite visualizar
Lìnea de comando: Lugar el análisis de datos y su
donde se observan los Panel de usos múltiples: representación gráfica.
resultados de los Scripts. Muestra los archivos que están
guardados en el disco duro, los
gráficos que vamos creando,
los paquetes.
18
Fig.15. Generando la matriz de distancia
Còdigo para gràficar la

matriz de distancia.
Se visualiza la matriz de
distancia (cada entrada de la
matriz representa la distancia
entre dos secuencias), dónde el
color negro indica la distancia,
el color plomo nos indica la
mayor distancia que presentan
las especies, mientras que la
línea de color blanco que se
vizualisa verticalmente nos
indica las coincidencias (match).
19
Fig.16. Construcción del àrbol UPGMA en RStudio
● El UPGMA realiza
un agrupamiento
secuencial hasta
la raíz, además de
ser más rápido.
● Genera árboles
enraizados,
además de
agruparlos en
pares.
● Se basa en
distancias.
20
Fig.17. Construcción del árbol Neighbor-Joining en
RStudio
● Consiste en minimizar
la longitud total del
árbol, es decir la
cantidad de cambios
moleculares requeridos
a lo largo del árbol, es
eficiente ya que no
considera árboles
evolutivos.
● Basado en la evolución
mínima siendo más
rápido que este mismo.
● El árbol óptimo es el
que requiere la menor
longitud.
21
Fig.18. Construcción del árbol de Máxima Parsimonia en
RStudio
● El valor en máxima
parsimonia (MP) es el
mínimo número de
cambios requeridos o
cambios evolutivos,
pues seleccionan los
árboles que minimizan
el número de
sustituciones. Entonces
el árbol con la longitud
más baja es el árbol más
parsimonioso (el más
probable de ser el
correcto).
22
Fig.19. Construcción del árbol de Máxima Verosimilitud
en RStudio
● Trata de encontrar el
árbol más probable.
● Este método puede
generar árboles
enraizados y no
enraizados.
● Proporciona
información sobre el
ancestro común.
● Permite modelar las
relaciones evolutivas.
● Busca todas las
topologías.
23
Fig.20. Optimización de acuerdo al modelo evolutivo
● Para la optimizaciòn
del árbol se utiliza el
código “fitTR <-
pml_bb(seqbio1,
model=“TIM3+G(4)+
1””
● “TIM3+G(4)+1”, es el
valor màs bajo que
se obtuvo para
predecir el modelo
evolutivo, con el
código de “mt <-
modelTest(seqbio2)”
24
Fig.21. Visualización página iTOL (Interactive tree of life)
ITOL (Interactive
tree of life), Es
una herramienta
que nos ayuda con
la visualización,
anotación y
gestión de árboles
filogenéticos.
25
https://itol.embl.de/
Fig.22. Visualización del paso a seguir para crear un árbol
Para crear nuestro

árbol copiar y pegar
el archivo del árbol
o seleccionar el
El título del archivo
árbol es directamente de la
opcional. carpeta de
documentos,
finalmente
seleccionar Upload
para visualizar
nuestro árbol.
https://itol.embl.de/upload.cgi 26
Fig.23. Visualización del panel de control para la edición
de los árboles
2 ● Se visualizan los ajustes necesarios

1 para la edición de árboles según la
preferencia del editor.
1. En opciones básicas se puede
modificar el modelo de árbol, ya sea
circular o rectangular, además se
puede cambiar el tamaño , tipo y
color de letra, así mismo podemos
cambiar la longitud de la rama del
árbol.
2. En opciones avanzadas se pueden
3 agregar los nodos internos y
externos, así mismo se puede
modificar la forma y color del nodo.
3. En “export”, descargamos la imagen
del árbol editado.
https://itol.embl.de/tree/13215713197135781686507327 27
Fig.24. Puntos importantes de un árbol filogenético
● Un árbol filogenético representa las relaciones evolutivas entre organismos.

● Si dos especies están más relacionadas tienen un ancestro común más
reciente y si se encuentran menos relacionadas tienen un ancestro común
menos reciente.
● Cada rama de un árbol nos habla de la ascendencia común de un clado de
especies.
● La longitud de la rama nos informa sobre el momento de los eventos de
especiación en el pasado.
● Las especies se encuentran ubicadas en las puntas de las ramas.
28
Fig.25. Visualización de árbol filogenéticos en UPGMA realizado en iTOL
Puntos de
ramificaciòn
Ramas
● Se visualiza un árbol enraizado.

● Cada punto de ramificación representa un evento de divergencia o
separación de un grupo en dos grupos descendientes. Además se
encuentra el ancestro común más reciente de todos los grupos que Especies de
descienden de esa ramificación.
● Cada línea horizontal en nuestro árbol representa una serie de
interès
ancestros que al final llevan una especie.
● La especie Willistoniella_pleuropunctata, forma OUTGROUP, pues es la
especie más lejana o que no pertenece a las especies estudiadas.
29
Fig.26. Visualización de árbol filogenéticos en NJ realizado en iTOL
● Se visualiza un árbol en forma

circular.
● Se visualizan los nodos internos y
estos representan los ancestros
comunes que comparten dos o más
taxones (especies)..
● Las ramas están representadas por
líneas y estas unen los nodos
internos.
● La raíz es el nodo más interno,
siendo este el ancestro común que
comparten todos los taxones.
● Cuando dos especies comparten un
ancestro común que no es
compartido con nadie más se les
denomina taxones hermanos.
30
Fig.27. Visualización de árbol filogenéticos en ML realizado en iTOL
● Se visualiza un árbol enraizado.

● Se visualizan los nodos internos de
color amarillo, y estos nodos
representan los ancestros comunes
que comparten dos o más taxones.
● Las ramas están representadas por
líneas y estas unen los nodos
internos.
● La raíz es el nodo más interno,
siendo este el ancestro común que
comparten todos los taxones.
31
Investigaciones realizados
con respecto a la
reconstrucción de árbol
filogenético
32
1
Influencia de la selección del modelo de
sustitución en la reconstrucción de árboles
filogenéticos de proteínas.
Se estudiaron las metodologías para evaluar

la influencia de la selección del modelo de
sustitución en la reconstrucción de árboles
filogenéticos de proteínas mediante el
análisis de datos de proteínas reales y
simuladas.
Del Amparo, R., & Arenas, M. (2023). Influence of substitution model selection on protein
phylogenetic tree reconstruction. Gene, 865, 147336.
https://www.sciencedirect.com/science/article/pii/S0378111923001774
33
Reconstrucción de árboles filogenéticos
2
de procariotas utilizando intervalos
comunes máximos.
En el presente trabajo, se aplicaron intervalos

comunes máximos (DCL) en dos o más genomas para
inferir su distancia y reconstruir su relación evolutiva.
Además, las medidas basadas en segmentos poco
comunes (UCS), es decir, aquellos segmentos
genómicos que no se detectan como parte de ninguno
de los DCL y también se utilizan para filogenética de
árboles de reconstrucción.
Heydari, M., Marashi, S. A., Tusserkani, R., & Sadeghi, M. (2014). Reconstruction of phylogenetic trees of
prokaryotes using maximal common intervals. Biosystems, 124, 86-94.
https://www.sciencedirect.com/science/article/abs/pii/S030326471400121X
34
La reconstrucción filogenética del cáncer de
3
mama revela dos rutas de diseminación
metastásica asociadas con resultados clínicos
distintos
Se realizaron investigaciones sobre las trayectorias

evolutivas de tumores primarios, ALN y muestras de
metástasis a distancia de 16 pacientes con BC con ganglios
linfáticos positivos para receptores de estrógeno (ER). Se
hizo secuenciación del genoma completo de peso bajo para
inferir aberraciones en el número de copias somáticas y se
obtuvieron los perfiles filogenéticos de todos los pacientes.
Venet, D., et al. (2020). Phylogenetic reconstruction of breast cancer reveals two routes of metastatic
dissemination associated with distinct clinical outcome. EBioMedicine, 56, 102793.
https://www.sciencedirect.com/science/article/pii/S2352396420301687
35
CONCLUSIONES
En conclusión se logró construir árboles
filogenéticos en el formato NJ, Máxima
Parsimonia y Maximum Likelihood, en el
programa RStudio. Asimismo se logró
realizar la edición en la plataforma iTOL.

Bioinformatica 7 II Unidad

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Bioinformatica 7 II Unidad

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional de Trujillo

Escuela de Ciencias Biológicas

Ingresar a escritorio e ir a “descargas”, click derecho en el documento “SequenceMatrix-Window-18.zip” y

Se visualiza los dos alineamientos múltiples en

Los GAPs se visualizan

Para considerar el modelo evolutivo a trabajar se utiliza

Seleccionar “ﬁle” y luego la primera

Còdigo para gràﬁcar la

Para crear nuestro

2 ● Se visualizan los ajustes necesarios

● Un árbol ﬁlogenético representa las relaciones evolutivas entre organismos.

● Se visualiza un árbol enraizado.

● Se visualiza un árbol en forma

● Se visualiza un árbol enraizado.

Se estudiaron las metodologías para evaluar

En el presente trabajo, se aplicaron intervalos

Se realizaron investigaciones sobre las trayectorias

También podría gustarte