Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Integrantes
Amon Samantha, Ortega Josue, Reyes Daniel,
Siguencia Thalia, Vivar Paulina
Introducción Información
compleja: gran
Análisis de genomas Programas
cantidad, forma de
informáticos:
manejo,
- bacterias comparaciones y - recursos disponibles y
- levaduras
- S.Humano asociaciones locales en la red
- ratones
- etc - disminuir costos
- eliminar la limitación de
memoria
conocimiento : análisis
Gran IMPORTANCIA - incrementa
de I. biológica
estudios e investigación
in silico
- Diseño de fármacos, vacunas
- Secuencias de los
- Estudio de enfermedades
genomas ( DNA)
(nuevas, hereditarias)
- Secuencias de proteínas
Bioinformatica para analisis de DNA
Proyectos modernos: in silico
- análisis rutinario de
Ordenadores y secuencias de DNA o
Programas Informáticos proteínas
- analizar I. significativa en secuenciación de nueva
herramienta del biólogo conjuntos masivos generación (NGS)
cambio
- genética de poblaciones
- genética cuantitativa
- sistemática molecular
- ecología microbiana
- otros campos
LINEA DEL TIEMPO
50 años : ordenadores - 1960: 1 ensamblador de s. de péptidos
hipótesis de novo, 1 B.D de proteínas, 1 modelo
DNA - secuencia de sustitución de aa para la filogenia
algoritmos de
Incluyendo
alineamientos
- Análisis de la alineación de secuencias
- Búsqueda en la B.D de secuencias
Programación
- Descubrimiento de patrones
- Reconstrucción de las relaciones evolutivos dinámica
- Formacion y comparación del genoma
Alineamiento de secuencias biológicas
objetivo
-Coloca dos o más secuencias
clasificación Objeto de análisis
lograr máximo de simultaneidades
entre elementos-secuencias
Alineamientos locales
Alineamientos globales
-Secuencias enteras-aprox misma longitud. -Escudriñan:fragmentos secuencias— gran correlación.
-Caracteres o símbolos. -No acepta: 2 secuencias tengan igualdad en toda la longitud.
-Regiones locales iguales entre las dos secuencias. -Utiliza: alineamientos de secuencias más separadas.
Por
programación dinámica.
Ejemplo:
-Celda: valor calculado, considerando: coincidencia, no
coincidencia e introducción de un hueco(gap).
Homología en
Homologías
residuos individuales Secuencias ADN
(A,T,G,C)
Proteínas
(A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W, Y)
limitantes del alineamiento de secuencias
Topología en el espacio de Crecimiento = número de
búsqueda especies
Métodos exhaustivos
Entornos de
cómputo paralelo
Grandes bases de datos
de secuencias
limitantes del alineamiento de secuencias
Cinco secuencias con 10
residuos
1038 posibles
combinaciones
de alineamientos
Programación Uso de
Pares de secuencias
Dinámica metaheurística
● PRALINE
● MUSCLE
● T-Coffe and 3D-Coffe
● MAFFT
● ProbCons
● Kalign
● MSAProbs
● Clustal Omega
● ProDA
PRALINE Alineamiento múltiple de secuencias
Es un conjunto de secuencias de
Características
proteínas , que incluye un servidor
1. Preprocesamiento
web que ayuda a optimizar la 2. Información de estructuras
secundarias predichas
alineación de las secuencias de 3. Información de motif de
secuencia
entrada, estas pueden ser tanto 4. Estrategias de iteración
Es una técnica que se utiliza para minimizar los errores durante la ● Preprocesamiento Global, existe la posibilidad de seleccionar
otras secuencias según la puntuación de alineación mínima
alineación progresiva es decir es una técnica de optimización ,
establecida con la secuencia principal dentro de cada preperfil
secundaria predicha
Permite la incorporación de información los motif de secuencias son regiones en la Está se debe basar en la coherencia de una
secundaria definida por DSSP, secuencia tanto de proteína como de ADN que alineación multiple anterior,
tiene importancia funcional, ● consistencia es la concordancia
● Secuencias que no tienen PDB,
● estas regiones tienden a conservarse entre los aa emparejados en la
● Encontrar una lección de 7 métodos entre secuencias homólogas. alineación múltiple y por pares,
de predicción de estructura ● la generación automática de MSA es ● múltiples posiciones de alineación
muy difícil de conseguir es decir que consistentes,
secundaria para tratar de
estén alineadas correctamente . ● segmentos inconsistentes se
determinar la otra secuencia realineen.
putativa de las secuencias, ● Las iteraciones finaliza al alcanzar
la convergencia o el ciclo límite (es
● Predicción PSIPRED, PROsec,
decir, una serie de alineaciones
YASPIN múltiples cíclicamente recurrentes).
● El usuario también puede
especificar un número máximo de
iteraciones.
MUSCLE
MUSCLE es un algoritmo rápido,
descargar el programa y ejecutarlo
Es un software de que debe tenerse en cuenta al alinear
localmente
alineación múltiple grandes conjuntos de datos.
para secuencias de
El protocolo de alineación
nucleótidos y proteínas
progresiva se acelera mediante una
este incluye un servidor
comparación de secuencias por pares
en línea realiza cálculos utilizando
que evita la lenta técnica de DP para
parámetros predeterminados
la construcción del árbol guía.
predefinidos
VENTAJAS
● Rápido
● manejar grandes conjuntos de datos en un tiempo razonable.
● El usuario puede decidir para todas las etapas y acciones
● Relación entre velocidad y precisión.
● El usuario puede definir un rango de tiempo en el que el programa seleccionará la
mejor solución hasta el momento.
● acelerar el programa durante la alineación de k-mer por pares
● usuario puede apagar la extensión de las kpalabras mediante programación dinámica
● Optimización de anclaje, está diseñada para reducir los cálculos durante el
refinamiento dependiente del árbol dividiendo una alineación determinada en bloques
verticales y alineando los perfiles asociados por separado.
PASOS
Las secuencias se agrupan de acuerdo con el secuencias se alinean progresivamente
3
el árbol guía se programa al
número de k-merssegmentos contiguos de
utilizar UPGMA, 2 siguiendo el orden del árbol.
5 4
nuevo árbol aplicando la corrección de
que ha cambiado el
Refinamiento de la alineación utilizando la distancia de Kimura.
orden de ramificación.
topología fija de árbol,donde los bordes del
nueva alineación. 7
usuario. 8
Adecuado para la manipulación de
Método: MAFFT secuencias de ADN y proteínas
potencia de cómputo y memoria. Son de gran importancia por su papel en las investigaciones científicas y también por los
Existen ciertos aspectos a tener en cuenta para la obtención de buenos resultados con los distintos tipos de algoritmos. Dado
que uno de los problemas de los algoritmos genéticos es la existencia de los máximos locales, razón por la cual pueden ser
necesaria la aplicación de dichos algoritmos varias veces sobre el mismo conjunto de secuencias y escoger el mejor resultado.
También es necesario modificar ciertos parámetros del algoritmo, pueden ser, el número y longitud de gaps que pueden
Gauthier, J., Vincent, A. T., Charette, S. J., & Derome, N. (2018, Agosto 03). A brief history of bioinformatics. Oxford Academic. Retrieved 12 28, 2021, from
https://academic.oup.com/bib/article/20/6/1981/5066445
Meneses Escobar, C. A., Rozo Murillo, L. V., & Franco Soto, J. (2011, Diciembre). Vista de Tecnologías bioinformáticas para el análisis de secuencias de ADN.
Naranjo Basalo, Y. (2009, Julio). Alineamiento Múltiple de Secuencias con T-Coffee: Una Aproximación Paralela. Retrieved 12 28, 2021, from
https://ddd.uab.cat/pub/trerecpro/2009/hdl_2072_41817/TR_YandiNaranjoBasalo.pdf
Rezaei, S, Monwar, M.M., Bai, J. (2006). Performance Comparison of MPI -Based Parallel Multiple Sequence Alignment Algorithm Using Single and Multiple Guide Trees.
Cognitive Informatics, 2006. ICCI 2006. 5th IEEE International Conference on 2006;1:595-600.