Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anlisis de secuencias de ADN. Alineamientos. Alineamientos. Comparacin de secuencias entre especies. especies. Prediccin de zonas significativas (codones de inico, promotores, lugares de empalme intron/exn, seales poli-A o poliislas CpG). Bsqueda automtica de genes. genes. rboles filogenticos.
Sesin 3 Laboratorio on-line para Bachillerato. Protemica onCarlos de Paz y Julin Dorado
Carlos de Paz
Bioinformtica Redes de Informacin Recursos sobre genomas Anlisis de secuencias de ADN Tcnicas de alineamiento de pares de secuencias Alineamientos de secuencias mltiples Protocolo de bsqueda de secuencias
Bioinformtica
Bioinformtica
Abarca todas las aplicaciones de los ordenadores en las ciencias biolgicas, pero fue acuado a mediados de los aos 80 para el anlisis de datos de secuencias biolgicas.
Bioinformtica
La cantidad de datos de secuencias conocidas sobrepasa el de datos de estructuras proteicas en 100:1 y, gracias a los proyectos genoma, las bases de datos de secuencias duplican su tamao anualmente.
100
Bioinformtica
Un reto clave para la bioinformtica es analizar el caudal de datos de secuencias con el fin de comprender la informacin amasada en trminos de estructura, funcin y evolucin proteicas.
Bioinformtica
El Santo Grial de la Bioinformtica
Bioinformtica
Hay dos aproximaciones analticas importantes en bioinformtica: el reconocimiento de patrones y la prediccin.
Se ha conseguido un progreso considerable con los mtodos de reconocimiento de patrones debido a la disponibilidad de bases de datos de referencia y moldes de plegamiento.
La incompleta comprensin del problema del plegamiento de protenas determina una barrera a los intentos actuales de predecir la conformacin a partir de la secuencia.
Bioinformtica
La homologa es un concepto central: se dice que dos secuencias son homlogas si estn relacionadas por divergencia de un ancestro comn. Homologa no es un trmino sinnimo de similitud. La esencia del anlisis de secuencias es la deteccin de relaciones homlogas mediante bsquedas en bases de datos de secuencias. Ortologa Misma funcin Especies diferentes Paraloga Funciones diferentes Relacionadas en un mismo organismo
Bioinformtica
El trmino analoga se emplea en el contexto de plegamientos proteicos similares que no comparten similitud de secuencias detectables, o protenas que comparten grupos catalticos con las mismas geometras espaciales pero que por lo dems no guardan similitud estructural o de secuencias. Se piensa que tales divergencias han resultado del proceso evolutivo de convergencia.
Bioinformtica
Siempre que sea posible, debe emplearse un abanico de mtodos de anlisis diferentes, y los resultados deberan unirse con toda la informacin biolgica disponible.
Redes de Informacin
Redes de informacin
Redes de informacin
Suministrador lder americano de informacin. Abanico de diferentes bases de datos accesibles a travs de un interface nico.
Redes de informacin
EMBnet
NCBI
Sede de las bases de datos EMBL, SWISSEMBL, SWISS-PROT y TrEMBL. TrEMBL. Entrez
Alineamiento de secuencias
Las consultas a bases de datos pueden tomar la forma de consultas de texto o bsquedas de similitud de secuencias. Para identificar una relacin evolutiva entre una secuencia recin determinada y una familia gnica conocida debe evaluarse la cantidad de similitud compartida.
Alineamiento de secuencias
Un algoritmo es un conjunto de pasos que definen un proceso computacional; un programa es la implementacin de un algoritmo. Puede haber varias implementaciones diferentes del mismo algoritmo, que deberan (pero puede que no) dar los mismos resultados.
Alineamiento de secuencias
La forma ms simple de comparar dos secuencias es alinearlas insertando caracteres de hueco para hacer que estn en concordancia vertical. Contar las posiciones con caracteres coincidentes da una puntuacin simple para el alineamiento.
Alineamiento de secuencias
Las matrices de identidad son ralas(1) y en consecuencia tienen poca potencia para el diagnstico. Las diagnstico. matrices de similitud ponderan las coincidencias de resduos no idnticos segn tasas de sustitucin observadas a lo largo de grandes distancia evolutivas. evolutivas. Tales matrices dan lugar a ruido porque aumentan tanto las coincidencias aleatorias como las seales dbiles. dbiles. La distincin entre seales biolgicas de baja puntuacin y ruidos de puntuacin elevada es un desfo central en el anlisis de secuencias. secuencias.
Alineamiento de secuencias
Las puntuaciones de la Matriz de Datos de mutacin de Dayhoff se basan en el concepto de de mutuacin puntual aceptada (PAM). Una distancia evolutiva de 250 PAM da puntuaciones de similitud equivalentes a que quede un 20% de coincidencias entre dos secuencias. A menudo se emplea la PAM 250 como matriz por defecto en los programas de comparacin.
Alineamiento de secuencias
Un mtodo bsico para comparar dos secuencias es el grfico de puntos (dotplot). Este es un (dotplot). grfico en el que las secuencias se disponen sobre los ejes x e y y se dibujan cruces o puntos en todas las posiciones en las que se observan resduos coincidentes. Para secuencias idnticas, esto da lugar a una lnea diagonal ininterrumpida a travs de la grfica, mientras que secuencias similares originan diagonales discontnuas.
Alineamiento de secuencias
Los alineamientos son modelos que reflejan diferentes perspectivas biolgicas. Un modelo no es por tanto ms o menos correcto que otro. Dos enfoques generales consideran la similitud (a) a travs de toda la longitud de las secuencias(1) y (b) a travs de slo parte de las secuencias(2).
Alineamiento de secuencias
Los programas FastA y BLAST son mtodos de bsqueda de similitud local que se concentran en hallar emparejamientos cortos idnticos, que pueden contribuir a un emparejamiento total. Las implementaciones recientes de BLAST puede generar alineamientos con huecos.
Los alineamientos producidos por mtodos puramente automticos deben tratarse con cuidado, especialmente en los casos en que la similitud de las secuencias es baja; baja; a menudo dan lugar a un exceso de insercin de huecos que produce alineamientos incorrectos. incorrectos.
Protocolo de bsqueda de secuencias 1. Bsqueda de identidades en una base de datos compuesta. Es la primera y ms rpida prueba de si existe una secuencia exacta en las bases de datos pblicas.
3. Bsqueda en bases de datos de patrones. Indicar si la patrones. secuencia problema contiene algn motivo caracterstico que pueda sugerirnos aspectos particulares de su estructura o funcin(recursos).
Protocolo de bsqueda de secuencias Un enfoque prctico se bosqueja en el tutorial interactivo en lnea en:
http://umber.sbs.man.ac.uk/dbbrowser/bioactivity/
Ejercicios prcticos