Está en la página 1de 13

UNIVERSIDAD NACIONAL AUTNOMA DE MXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLN DEPARTAMENTOS DE CIENCIAS BIOLGICAS SECCIN BIOQUMICA Y FARMACOLOGA HUMANA

ALUMNO: Lpez Toledo Gustavo GRUPO: 2001 CARRERA: Bioqumica Diagnstica

PROFESORA: M. en C. Maritere Domnguez Rojas

Cuautitln Izcalli, Abril de 2013

En la bioinformtica , Basic Local Alignment Search Tool o BLAST , es un algoritmo para comparar informacin primaria de la secuencia biolgica, tales como los aminocidos secuencias de diferentes protenas o los nucletidos de las secuencias de ADN .Una bsqueda BLAST permite a un investigador comparar una secuencia de consulta con una biblioteca o base de datos de secuencias, e identificar secuencias de la biblioteca que se asemejan a la secuencia de consulta por encima de un cierto umbral. Los diferentes tipos de explosiones estn disponibles de acuerdo a las secuencias de la consulta. Por ejemplo, tras el descubrimiento de un gen previamente desconocido en el ratn , un cientfico suele realizar una bsqueda BLAST de la genoma humano para ver si los seres humanos tienen un gen similar; BLAST identifican secuencias en el genoma humano que se asemejan a los genes del ratn basado en la similitud de secuencia. BLAST se puede utilizar para varios fines. Esto incluye la identificacin de especies, dominios, posicionamiento filogenia establece, mapeo de ADN y la comparacin. La identificacin de especies:

Con el uso de BLAST, puede posiblemente identificar correctamente una especie y / o encontrar especies homlogas. Esto puede ser til, por ejemplo, cuando se est trabajando con una secuencia de ADN de una especie desconocida. Localizacin de dominios

Cuando se trabaja con una secuencia de la protena que puede ingresar en l BLAST, para localizar dominios conocidos dentro de la secuencia de inters. El establecimiento de la filogenia

Con los resultados recibidos a travs de BLAST puede crear un rbol filogentico utilizando el BLAST pgina web. Filogenias basadas en BLAST solo son menos fiables que otras construidas especficamente filogentica computacional mtodos, por lo que slo se debe confiar en los anlisis de "primer paso" filogenticos. Secuenciar el ADN

Cuando se trabaja con una especie conocida, y que mira a la secuencia de un gen en un lugar desconocido, BLAST puede comparar la posicin cromosmica de la secuencia de inters, a las secuencias correspondientes en la base de datos (s). Comparacin

Cuando se trabaja con genes, BLAST puede localizar genes comunes en dos especies relacionadas, y se puede utilizar para asignar anotaciones de un organismo a otro.

Programas de BLAST

Hay un nmero de variaciones del programa BLAST para comparar el cido nucleco o secuencias de protenas de consulta con cido nucleco o bases de datos de secuencias de protenas. Si es necesario, los programas de traducir secuencias de cidos nuclicos en los seis marcos de lectura posibles para compararlas con las secuencias de protenas. La seleccin apropiada de un programa BLAST para una bsqueda dada est influenciada por los siguientes tres factores 1) la naturaleza de la consulta, 2) el objeto de la bsqueda, y 3) la base de datos destinados como el objetivo de la bsqueda y su disponibilidad. Las siguientes tablas proporcionan recomendaciones sobre cmo hacer esta seleccin.

Programa de Seleccin para consultas de nucletidos


Base de datos

Longitud

Propsito

Programa

Explicacin

Identificar la secuencia de la consulta

megablast contigua , megablasto blastn

Ms informacin ...

Encontrar secuencias similares a la secuencia de consulta Nucletidos 20 pb o ms 28 pb o ms para megablast Encontrar secuencia similar desde el archivo de seguimiento Encuentra protenas similares a la consulta traducido en una base de datos traducida Encuentra protenas similares a la consulta traducido en una base de datos de protenas Encontrar sitios de unin o mapa contiguos motivos cortos

megablast contigua o blastn

Ms informacin ...

Traza megablast o megablast contigua Rastro

Ms informacin ...

BLAST Traducido (tblastx)

Ms informacin ...

Pptido

BLAST Traducido (blastx)

Ms informacin ...

7 a 20 pb

Nucletidos

Bsqueda de torneos cortos, casi exactas

Ms informacin ...

NOTA: El corte es slo una recomendacin. Para consultas cortas, es ms probable que obtenga los partidos si la opcin "Buscar torneos cortos, casi exactas" de la pgina se utiliza. Una discusin detallada se encuentra en la seccin 4 a continuacin. Con el ajuste predeterminado, el menor consulta inequvoca se puede utilizar es 11 para blastn y 28 para MEGABLAST.

Programa de Seleccin para consultas de protenas


Longitud Base de datos Propsito Identificar la secuencia de consulta o encontrar secuencias de protenas similares a la consulta Encuentra los miembros de una familia de protenas o construir una costumbre posicin especfica matriz de puntuacin Pptido Encuentra protenas similares a la consulta en 15 o ms residuos torno a un patrn dado Encuentre los dominios conservados de la consulta Buscar dominios conservados en la consulta e identificar otras protenas con arquitecturas de dominio similares Encuentra protenas Nucletidos similares en una base de datos de nucletidos traducida 5-15 residuos Pptido Buscar por motivos peptdicos Nota: El corte es slo una recomendacin. Para consultas cortas, es ms probable que obtenga los partidos si la opcin "Buscar torneos cortos, casi exactas" de la pgina se utiliza. Bsqueda de torneos cortos, casi exactas BLAST Traducido (tblastn) Conservada arquitectura de dominio de recuperacin Herramienta (CDART) CD-bsqueda (RPS-BLAST) PHI-BLAST PSI-BLAST BLAST Protena estndar (blastp) Programa

INICIO DE LA BUSQUEDA EN BLASTn Enter query sequence. Es el espacio designado para introducir la secuencia del usuario. Choose search sets. Permite elegir los parmetros a seguir en la bsqueda de secuencias para realizar el alineamiento Program Selection. Permite elegir el programa que llevar a cabo el alineamiento. logorithm parameter. Permite modificar los algoritmos que regirn la bsqueda.

En la ventana inicial se puede apreciar un men principal en donde se pueden encontrar las siguientes opciones:
Recent results. Permite acceder a los resultados obtenidos de forma reciente, cada bsqueda en BLAST proporciona un nmero ID de bsqueda, ste podr ser indicado con la finalidad de encontrar el resultado de inters, sin la necesidad de revisar los resultados uno por uno. Saves strategies. Permite seleccionar parmetros determinados previamente utilizados y guardados por el usuario. Help. Permite acceder a manuales y guas de uso para las diferentes herramientas que componen el sistema BLAST.

Secuencias de Genomas de BLAST


Home. Esta pestaa permitir visualizar la ventana de inicio de BLAST. En esta opcin se tendr acceso a una breve descripcin de BLAST; adems de proporcionar un acceso directo a todas las herramientas disponibles en BLAST.

Compara una secuencia problema de nucletidos contra una base de datos de secuencias de nucletidos. Compara una secuencia problema de aminocidos contra una base de datos de secuencias de protenas. Compara una secuencia problema de nucletidos traducida en sus seis posibles marcos de lectura contra una base de secuencias de protenas. Compara una secuencia problema de aminocidos contra toda la base de datos de nucletidos traducida en sus seis posibles marcos de lectura. Compara las seis traducciones en sus marcos de lectura de la secuencia problema de nucletidos, contra las seis traducciones en sus marcos de lectura de toda la base de datos de nucletidos.

Como informacin especializada secuencias genmicas y otras se pondrn a disposicin del pblico, NCBI BLAST crea pginas especializadas para esas secuencias. Elija un tipo de bsqueda especializada (o el nombre de

Programas de BLAST para comparar el cido nucleco o secuencias de protenas de consulta con cido nucleco o bases de datos de secuencias de protenas.
Formatos de entrada aceptados: Secuencia de consulta (s) que se utilizar para una bsqueda BLAST debe pegar en el "Buscar" rea de texto. Se acepta un nmero de diferentes tipos de entrada y determina automticamente el formato o la entrada. Para permitir esta funcin, no son necesarias ciertas convenciones con respecto a la entrada de los identificadores (por ejemplo, adhesiones o gi, FASTA, Secuencias Bare.).

Un segmento de las secuencias de consulta se puede utilizar en la bsqueda de BLAST. Por ejemplo, para limitar las coincidencias con la regin de 24 a 200 de la secuencia de consulta, deber introducir 24 en el campo "De" y 200 en el campo "a".
Seleccionar archivo: Esta funcin permite a los usuarios cargar un archivo de texto que contiene las consultas de formato en formato FASTA. El archivo tambin puede contener identificadores de secuencia en lugar de secuencias FASTA. Esta funcin slo est disponible para megablast pgina. Secuencia de largo debe ser cargado a travs de esta opcin para evitar posibles errores por el tamao de la secuencia. TITULO: Este ttulo aparece en todos los resultados de BLAST y bsquedas guardadas. Puede utilizar la sintaxis Entrez consulta para buscar un subconjunto de la base de datos BLAST seleccionado. Esto puede ser til para limitar las bsquedas a los tipos de molculas, las longitudes de secuencia o para excluir a los organismos. Megablast est destinado a comparar una consulta para secuencias estrechamente relacionadas y funciona mejor si el porcentaje de identidad de destino es 95% o ms, pero es muy rpido. Megablast contiguo utiliza una semilla inicial que ignora algunas bases (permitiendo desajustes) y est destinada a comparaciones entre especies. BlastN es lento, pero permite una palabra de tamao hasta siete bases.

Iniciar la secuenciacin con BLAST Nmero mximo de secuencias alineadas para mostrar (el nmero real de alineaciones puede ser mayor que esta).

Automticamente segn el tamao de la palabra y otros parmetros para mejorar los resultados de las consultas cortas. La longitud de la semilla que inicia una alineacin Esta configuracin especifica el umbral de significacin estadstica para informar partidos contra secuencias de bases de datos.

Limite el nmero de partidos a una amplia consulta. Esta opcin es til si muchos partidos fuertes con una parte de una consulta, puede prevenir que BLAST presente los partidos ms dbiles a otra parte de la consulta. Muchas bsquedas de nucletidos utiliza un sistema de puntuacin simple que consiste en una "recompensa" por un partido y una "pena" por una falta de coincidencia. El aumento de los costos Gap resultar en alineaciones que disminuyen el nmero de huecos introducidos.

Regiones de baja complejidad filtrar, Especficas para cada especie.

Inicio de comparacin de la secuencia en BLAST estableciendo los criterios en los algoritmos.

Descripcin grfica Una visin general de las secuencias de la base de datos alineados con la secuencia de consulta. La puntuacin de cada alineacin se indica mediante uno de los cinco colores diferentes, que divide el rango de puntuaciones en cinco grupos. Mltiples segmentos de alineamientos de la secuencia misma base de datos estn conectados por una lnea gris delgada. Pasar el ratn sobre una secuencia de coincidencias hace que la definicin y la puntuacin que se muestra en la ventana en la parte superior, al hacer clic en una secuencia de golpe llevan al usuario a las alineaciones correspondientes.
Este gen codifica un miembro de la p47 inmunidad relacionada GTPasa de la familia. La protena codificada puede desempear un papel en la respuesta inmune innata mediante la regulacin de la formacin en respuesta a la autofagia patgenos intracelulares. Polimorfismos que afectan a la normal la expresin de este gen estn asociadas con una susceptibilidad a Muestra un resumen grfico de las secuencias alineadas. El resumen cuenta con un cdigo de colores que vara segn el puntaje que reciba cada alineamiento; para el mejor alineamiento se encuentra el color rojo, de rosa se colocan los fragmentos de la secuencia alineada que cuenta con algunas no concordancias en la similitud, el verde muestra alineamientos poco confiables y los colores azul y negro son indicativos de alineamientos con una similitud muy pobre. Cada lnea representa una secuencia para una especie en especfica. Enfermedad de Crohn y la tuberculosis.

En la primera parte de los resultados podemos apreciar una descripcin general acerca de la secuencia de inters, el numero ID y gi, el nombre de la secuencia, el tipo de molcula, la longitud, y el programa empleado para llevar a cabo el alineamiento. Tambin aparece un apartado denominado Other reports en donde se aprecian 4 submens: una similitud muy pobre. Por otra Search summary permite apreciar un resumen de los parmetros empleados en la parte el componente grfico cuenta bsqueda. con una tabulacin que indica la longitud de la secuencia. Taxonomy reports. Para conocer la taxonoma de la secuencia. Distance tree of results. Presenta el rbol evolutivo de la secuencia de inters y de las Al posar el puntero sobre las barras secuencias que alinearon correctamente con esta. de los alineamientos, se obtendr Human genome informacinsobre la secuencia a la view. visualizar la localizacin de las secuencias alineadas en el mapa cual pertenece. genmico del humano.

DESCRIPCIN Este campo proporciona el nmero de acceso de la secuencia alineada, adems de una breve descripcin de dichas secuencias. As mismo, en este componente se puede apreciar el tipo y/o base de datos a la que pertenece la secuencia que se alineo a la secuencia del usuario.
Numero de acceso especfico para la secuencia descrita reportada en alguna pgina o liga de inters cientfico llmese NCBI o EBI.

Max score. Muestra la puntuacin mxima obtenida por un segmento alineado de la secuencia.

Query coverage. Indica el porcentaje total de la secuencia que alineo correctamente con respecto a la secuencia del usuario.

Max ident. Muestra el porcentaje de identidad de la secuencia alineada con respecto a la secuencia de inters.

La secuencia comparada en BLAST corresponde a la GTPasa de la familia IRGM en una molcula de RNA de la especie Homo sapiens, de las 1659 pb que conformar la secuencia se alineo en un 100% y presenta un 0.0% Evalue esto nos dice que si es su homologo ms que una secuencia al azar.

Total score. Muestra una sumatoria de la puntuacin obtenida por todos los fragmentos que alinearon de la secuencia.

E-value. Indica el valor o procedimiento matemtico para calcular la probabilidad de que un alineamiento particular sea producto nicamente del azar y no se base en homologa sabiendo que mientras menor sea este, mayor ser la similitud entre las secuencias.

ALINEACIONES Esta opcin restringe secuencias de la base de datos al nmero especificado para el que la alta puntuacin segmento de pares (HSPs) son reportados. Pginas diferentes tienen diferentes configuraciones por defecto. Si el nmero de secuencias de bases de datos satisface el umbral de significacin estadstica se presentan los informes, slo los partidos que posean la mayor importancia estadstica son reportados. Nos muestra en un formato FASTA de manera textual, los resultados del alineamiento, mostrando una descripcin general tanto de la secuencia alineada como la que tiene similitud con la misma, as como algunos porcentajes respecto a los gaps, el porcentaje de las bases identificadas. As como un apartado que nos permite elegir el orden en que se muestran los alineamientos. Se puede acceder a informacin de la secuencia en
Los resultados obtenidos pueden ser descargados directamente. GenBank y observar formato grfico en la misma pgina.

Nombre, nmero de acceso y descripcin de la secuencia perteneciente a la base de datos, longitud de la secuencia 1659 pb.
Valores estadsticos, resultados tras el alineamiento con 100% de similitud y al poseer 0.0% expect comprueba la homologa de la secuencia con BLAST.

Alineamiento textual entre secuencias.


LinkOuts de bases de datos. Al habilitar esta opcin proporciona enlaces de referencias cruzadas de los BLAST hits a las entradas que se encuentran en otras bases de datos especializadas de NCBI. Si una secuencia de bases de datos coincide con la consulta y tambin se incluye en Gene, UniGene, estructura o base de datos GEO, usted ser capaz de seguir el enlace al GIF icono marcado enlaces para obtener informacin adicional para que los hit.records en esos recursos.

= Enlace a Gene = Enlace a GEO

= Enlace a UniGene
= Enlace a la estructura

Aplicando la bsqueda de secuencias homologas en BLASTn para la protena ECSIT en homo sapiens con el menor e-value posible se obtienen los siguientes resultados.
gi|7407498|gb|AAF62100.1|AF243044_1 ECSIT [Homo sapiens] MSWVQATLLARGLCRAWGGTCGAALTGTSISQVPRRLPRGLHCSAAAHSSEQSLVPSPPEPRQRPTKALV PFEDLFGQAPGGERDKASFLQTVQKFAEHSVRKRGHIDFIYLALRKMREYGVERDLAVYNQLLNIFPKEV FRPRNIIQRIFVHYPRQQECGIAVLEQMENHGVMPNKETEFLLIQIFGRKSYPMLKLVRLKLWFPRFMNV NPFPVPRDLPQDPVELAMFGLRHMEPDLSARVTIYQVPLPKDSTGAADPPQPHIVGIQSPDQQAALACHN PARPVFVEGPFSLWLRNKCVYYHILRADLLPPEEREVEETPEEWNLYYPMQLDLEYVRSGWDNYEFDINE VEEGPVFAMCMAGAHDQATMAKWIQGLQETNPTLAQIPVVFRLAGSTRELQTSSAGLEEPPLPEDHQEED DNLQRQQQGQS

Se encontraron alrededor de 50 homologas que correspondan a la secuencia basados en un e-value del 0% pero estas presentaban diferente identidad en las secuencias pero afirmando que corresponden a la misma protena, aunque en diferentes especies. Como podemos apreciar los aprox 50 homlogos seleccionados tienen un e-value de 0 lo que nos indica, que las secuencias son muy similares entre s.

10

Se procedi a comparar ambas secuencias proteicas y analizar los resultados. Para ello debemos de seleccionar en la pgina principal de bsqueda la opcin Align two or more sequences en la opcin del programa BLASTp. En la parte de informacin general de las secuencias los resultados obtenidos son para ambas secuencias, el ID de ambas, a que organismo pertenecen, el tipo de molcula en ambos casos amino cidos, la longitud de ambas secuencias 431 para la primera ECSIT (Homo sapiens) y 435 para la segunda ECSIT (Mus musculus) as como la implementacin de BLASTP.

Por otra parte se nos presenta en el apartado Graphic Summary, un resumen grfico de las secuencias alineadas, en este caso el alineamiento se aprecia en color rojo los que nos indica el mejor alineamiento, de acuerdo al cdigo de colores, es decir ambas secuencias son homologas por parecerse entre s. En este apartado logramos apreciar la matriz
resultante, para el alineamiento de las secuencias. Vista de matriz de puntos, muestra las regiones de similitud en base a los resultados de BLAST. La secuencia de consulta se representa en el eje X y los nmeros representan las bases / residuos de la consulta. El sujeto se representa en el eje Y, y de nuevo los nmeros representan las bases / residuos de la materia. Las alineaciones se muestran en el diagrama como lneas. Relacin de partidos entre las lneas de protenas aquellas que estn inclinadas desde la parte inferior izquierda a la esquina superior derecha, menos partidos las lneas que estn inclinadas desde la parte superior izquierda a la inferior derecha. El nmero de lneas que se muestran en la trama es el mismo que el nmero de alineaciones que han encontrado los BLAST.

11

En la seccin de descriptions se muestra el numero de acceso de la secuencia alineada con la secuencia de inters, su descripcin y el valor Max Score de 627 que corresponde a la puntuacin mxima obtenida por el segmento alineado de la secuencia, el valor de Total score que se refiere a la puntuacin total de todos los fragmentos alineados que tambin es de 627, el porcentaje de alineamiento correcto fue de un 100% y el valor de e-value de 0 lo que nos indica una mayor similitud entre ambas secuencias al ser menor que 1 , pero la identidad de la secuencia alineada con respecto a la secuencia de inters fue de 73% es decir que no toda la secuencia de aa se parece entre la especie Homo sapiens y la Mus mulusculus.

En este apartado podemos apreciar el resultado del alineamiento de manera textual, se nos proporciona otra vez la descripcin general de la secuencia alineada, respecto a la secuencia de inters, as como la identidad entre aminocidos en este caso se identificaron 318 de 435 lo que equivale al 73% de identidad, adems de que hay zonas de delecin o insercin dentro de la secuencia, ya que se seala la existencia de 4 gaps correspondiente al 1% de toda la secuencia alineada, proporciona visualmente los tipos de aa que se modifican entre las secuencias de comparacin de las especies en humano y rata.

12

COMENTARIO BLAST, es una herramienta bioinformatica altamente funcional que permite encontrar regiones similares entre secuencias biolgicas. Normalmente BLAST es usado para encontrar probables genes homlogos. Por lo general, cuando una nueva secuencia es obtenida, se usa BLAST para compararla con otras secuencias que han sido previamente caracterizadas, para as poder inferir su funcin. BLAST es la herramienta ms usada para la anotacin y prediccin funcional de genes o secuencias proteicas. Muchas variantes han sido creadas para resolver algunos problemas especficos de bsqueda. Se ha convertido en la herramienta predilecta para llevar a cabo el alineamiento de grandes bases de datos de genomas. Debido que aborda un problema fundamental basado en la heurstica y su algoritmo que es mucho ms rpido que el clculo de una alineacin ptima. Se hace nfasis en la velocidad vital para el algoritmo prctico sobre las enormes bases de datos genmicos disponibles actualmente, aunque los algoritmos siguientes pueden ser an ms rpidos. Es as como se convierte en un medio de gran utilidad para las investigaciones de genticas, biologa molecular, medicina y con el paso de los aos BLAST se consolida como la herramienta ms poderosa y actualizada para llevar a cabo alineamientos entre una secuencia particular con respecto a otra, pudiendo incluso realizar un alineamiento con el total de las secuencias presentes en las bases de datos a nivel mundial.

13

También podría gustarte