Está en la página 1de 6

INFORME DE PRÁCTICA DE LABORATORIO CÓDIGO DE DOCUMENTO:

DCVI-INF-V1-2019-015

CIENCIAS DE LA VIDA Y DE LA
DEPARTAMENTO: CARRERA: ☐ Ing. Agropecuaria X Ing. Biotecnología
AGRICULTURA
PERíODO
ASIGNATURA: BIOINFORMÁTICA OCT-MARZO NIVEL: 5to
LECTIVO:
DOCENTE: MARIA EUGENIA ROMERO NRC: 9559 PRÁCTICA N°:

ESTUDIANTE(s): LOJAN LEONEL, MINA ADRIANA

TEMA: ALINEAMIENTO MÚLTIPLE


INTRODUCCIÓN
La alineación de secuencias es la base para varios tipos de análisis bioinformáticos, incluida la filogenia, el diseño de cebadores, la generación
de matrices de puntuación y la búsqueda de homologías. La alineación adecuada es esencial para obtener buenos resultados de cada uno de
los procedimientos anteriores, por lo que es importante comprender cómo funcionan los diversos procedimientos de alineación múltiple y sus
ventajas y desventajas. Además, es importante comprender cómo el cambio de varias variables afecta los resultados producidos por los
programas de ajuste múltiple.
Los ajustes múltiples son una herramienta importante. Estos alineamientos son esenciales para estudios posteriores como: estudios evolutivos,
análisis de dominios conservados, estructura secundaria, identificación de regiones conservadas en promotores, etc. Muchas de las
personalizaciones que genera el programa son archivos de texto que básicamente podemos editar con cualquier editor. Sin embargo, algunos
formatos no son prácticos para los editores de texto, o el número o la longitud de las secuencias dificulta la edición. Por lo tanto, cuando
hablamos de alineación múltiple (MSA), se refiere a más de dos secuencias.
Este tipo de alineamiento requiere un enfoque más sofisticado que los pares de secuencias, ya que el uso directo de estadísticas de
alineamiento globales y locales requiere un poder de cómputo significativo y solo es aplicable a problemas con unas pocas secuencias. El
principal problema de las alineaciones múltiples es la ubicación de los agujeros en la alineación. En la alineación, todas las secuencias deben
tener la misma longitud, lo que se consigue introduciendo espacios (Bioinformatics at COMAV, 2019).

OBJETIVOS
● Comparar los programas MEGA X, Clustal W, Muscle y T-COFFEE para múltiples personalizaciones.
● Analizar el alineamiento de las secuencias en cada uno de los programas bioinformáticos establecidos.
● Comprender la importancia de realizar múltiples alineaciones correctamente.

MATERIALES:
REACTIVOS: N/A INSUMOS: N/A
EQUIPOS: Computador
PROCEDIMIENTO:
● Alinear secuencias utilizando programas en MEGAX.
● Alinear las secuencias utilizando ClustalW.
● Alinear las secuencias utilizando MUSCLE.
● Alinear las secuencias utilizando el programa T-COFFEE.
● Probar distintos parámetros para revisar si el alineamiento mejora.
RESULTADOS:
Para el análisis de alineamiento de secuencias nos hemos guiado del paper “Secuencia del genoma de la bacteria reductora de iones metálicos
disimilatorios Shewanella oneidensis”, en donde hemos tomado como referencia 3 secuencias que ha sido depositada en GenBank con número
de acceso AE014299, AE014300 y NC_004347.2.
Para ello, en la tabla 1 se puede comparar cada uno de estos programas con herramienta bioinformática, indicando las diferencias y similitudes
de cada programa, para comprobar si es posible mejorar la calidad de alineamiento al modificar parámetros de algoritmos en los diferentes
programas establecidos (tabla 2), por otro lado se colocó el FASTA en un solo documentos de notas de las tres secuencias mencionadas para
poder cargarlas en cada programa. Sin embargo para T-COFFEE, se utilizaron dos secuencias diferentes ya que el programa supera el límite
requerido por el servidor.
Tabla 1: Diferencias y similitud de los programas
PROGRAMA DIFERENCIAS SIMILITUD

MEGA X ● Este es un programa para realizar múltiples Es un programa bioinformático, que se usa para un
alineaciones y árboles filogenéticos, además correcto alineamiento de secuencias.

Código de documento: DCVI-INF-V1-2019-015 Rev. UPDI: 2021-jul-29


Código de proceso: FRM.16.3
INFORME DE PRÁCTICA DE LABORATORIO CÓDIGO DE DOCUMENTO:
DCVI-INF-V1-2019-015

implementa muchos métodos analíticos y


herramientas para la filogenómica y filo
medicina. Para mayores ajustes, otro de los
programas más utilizados para esta tarea es
CLUSTAL, concretamente CLUSTALW, que
es la versión online.
● Puede agregar todas las secuencias a la vez
o una por una. Es posible que el programa no
traslade correctamente el nombre de la UBCl
por lo que habrá que corregirla a mano. Esto
es especialmente importante si agrega todas
las secuencias a la vez.

CLUSTAL W ● Este método puede contener más el error, si ● Es un programa bioinformático, que se usa
no es corregido del proceso de adaptación. para un correcto alineamiento de
● Utiliza el método de ajuste progresar, trabajar secuencias.
rápido, y también permite la regulación de
muchas secuencias cortas paras las
condiciones climáticas.

MUSCLE ● Este es un programa muy popular que,


debido a su precisión y velocidad, te permite ● Es un programa bioinformático, que se usa
utilizar menos espacio para la alineación de para un correcto alineamiento de
globina, aunque todavía hay problemas con secuencias.
la histidina. Es una flecha negra. que sirve
para calcular la alineación de la globina.
MUSCLE implementa un Algoritmo
progresivo y permite reoptimización de toda
la columna
● Ajusta 5000 proteínas
● El tamaño alcanza ~300 en 21 segundos. -
calcular la ruta pares entre secuencias
consideró.

T-COFFEE ● Algoritmo T-Coffee (función objetivo de ● Es un programa bioinformático, que se usa


consenso basada en árboles para la para un correcto alineamiento de
estimación de la alineación) tiene dos secuencias.
funciones principales:
●.1. 1. Proporcionar un método simple y ● Este algoritmo intenta minimizar los errores
flexible para generar alces. Uso introducidos por el árbol guía en el
múltiple de fuentes de datos alineamiento progresivo, teniendo en cuenta
heterogéneas: globales y locales información biológica contenida en las
generados por diferentes secuencias de entrada y extraída de una
programas, estructura etc, los datos serie de alineamientos globales y locales en
de estas fuentes se envían a través pares.
de una biblioteca de comparación
por pares.
●.2. Un método de optimización para
generar múltiples alineaciones de
mejor ajuste corresponde a los
almacenados en la biblioteca de
alineación por pares. Esta es una
estrategia de coincidencia
progresiva que considera la
información en toda la biblioteca
alns. Permite generar alces, varios
rápidos (más o menos más lento
que ClustalW) pero mucho menos
propenso a errores causados ​por

Código de documento: DCVI-INF-V1-2019-015 Rev. UPDI: 2021-jul-29


Código de proceso: FRM.16.3
INFORME DE PRÁCTICA DE LABORATORIO CÓDIGO DE DOCUMENTO:
DCVI-INF-V1-2019-015

mínimos locales en el primer paso


de aln.
● Una de las características especiales de
T-Coffee es que utiliza una gran cantidad de
recursos informáticos. Cálculos (tiempo de
cálculo y memoria) debido a la
implementación del algoritmo, dado que cada
secuencia requiere la creación de una
biblioteca de personalización (más el
conocimiento en el algoritmo da como
resultado más cálculos), lo que limita la
capacidad de procesar un cierto número de
secuencias de entrada en un período de
tiempo razonable. Este es un algoritmo lento.
para 100 secuencias, pero no para valores
muy superiores a eso.

Tabla 2: Alineamientos de las secuencias


Secuencias

MEGA X AE014299, AE014300 y NC_004347.2.

Secuencia alineada

Como se puede visualizar en las imágenes se tiene las tres secuencias mediante el programa MEGAX, el permitió
extraer información, es decir el alineamiento de las secuencias.

CLUSTAL W AE014299, AE014300 y NC_004347.2.

Código de documento: DCVI-INF-V1-2019-015 Rev. UPDI: 2021-jul-29


Código de proceso: FRM.16.3
INFORME DE PRÁCTICA DE LABORATORIO CÓDIGO DE DOCUMENTO:
DCVI-INF-V1-2019-015

Mediante estas imágenes, se puede observar las secuencias, es muy larga por ello, no se va a discernir tanto el
alineamiento, es decir si está bien alineada o no.

MUSCLE NR_075142.
HG323256.1

T-COFFEE NR_075142.
HG323256.1

Código de documento: DCVI-INF-V1-2019-015 Rev. UPDI: 2021-jul-29


Código de proceso: FRM.16.3
INFORME DE PRÁCTICA DE LABORATORIO CÓDIGO DE DOCUMENTO:
DCVI-INF-V1-2019-015

Secuencia alienada

Como se puede notar en la imagen, las regiones que estan de color rojo son las secuencias que son iguales o
identicas, es decir estan bajo una alta presion de seleccion, por otro lado las regiones que tiene un color verde, nos
dice que tiene un correcto funcionamiento y la estructura proteica, mientras tanto las regiones que tienen el color
amarllo no estan bajo una presion alta de seleccion, adicional se puede notar los asteriscos, los cuales nos indican
que en ese punto todos los aminoacidos son identicos y los puntos informan que todos los residuos universales no
son idénticos.
Nota: Para este programa de alineamiento T-Coffee se realizó de manera online ya que necesitaba de librerías y
paquetes externos que resultan difíciles de conseguir.

CONCLUSIONES:
Se conocen varias herramientas al alcance del público en general que se utilizan para la alineación de secuencias múltiples, pero no todas
producirán necesariamente los mismos resultados, además de que las alineaciones múltiples nos ayudan a encontrar características
importantes en las secuencias. El ajuste de relación múltiple por pares proporciona una imagen más amplia y precisa. Existen algunos

Código de documento: DCVI-INF-V1-2019-015 Rev. UPDI: 2021-jul-29


Código de proceso: FRM.16.3
INFORME DE PRÁCTICA DE LABORATORIO CÓDIGO DE DOCUMENTO:
DCVI-INF-V1-2019-015

parámetros que se pueden manipular en varios programas de ajuste. Estos parámetros afectan a la obtención del resultado de la comparación
directamente.

Bibliografía

Bioinformatics at COMAV. (2019, 03 12). ALINANEAMIENTOS MULTIPLES — Bioinformatics at COMAV 0.1 documentation. Bioinformatics at

COMAV. Retrieved January 23, 2023, from https://bioinf.comav.upv.es/courses/intro_bioinf/multiple.html

Heidelberg, J. F., & Et al. (2002, Octubre 07). Secuencia del genoma de la bacteria reductora de iones metálicos disimilatorios Shewanella

oneidensis. Retrieved Enero 23, 2023, from https://www.nature.com/articles/nbt749

Naranjo, Y., & Naranjo, Y. (2009, Julio 02). Alineamiento Múltiple de Secuencias con T-Coffee: Una Aproximación Paralela. ddd-UAB. Retrieved

January 23, 2023, from https://ddd.uab.cat/pub/trerecpro/2009/hdl_2072_41817/TR_YandiNaranjoBasalo.pdf

NIH, N. L. o. M. (n.d.). Home. NCBI. Retrieved January 23, 2023, from

https://www.ncbi.nlm.nih.gov/nuccore/?term=Shewanella+oneidensis+MR-1

Unam, V. (2006, March 2). Tema 3: Alineamientos múltiples con clustalW, clustalX, T-Coffee y Perl BGE-IV, LCG-UNAM, México © Pablo

Vinuesa 2006, vinues. Centro de Ciencias Genómicas. Retrieved January 23, 2023, from

https://www.ccg.unam.mx/~vinuesa/Cursos_PDFs/BGE4-Tema3_aln_multiples.pdf

Código de documento: DCVI-INF-V1-2019-015 Rev. UPDI: 2021-jul-29


Código de proceso: FRM.16.3

También podría gustarte