Está en la página 1de 14

Laboratorio 1B BLAST bá sico

Materia:
Bioinformática básica

Profesor:
Denis Martínez Izquierdo

Tema/Actividad:
BLAST básico
Nombre de la alumna:
Alexandra Hernández Laureano

Fecha: Junio 06 de 2023


Contenido
Laboratorio 1b - BLAST básico (blastn)...................................................................................................1
1. Primero, necesitamos una secuencia de consulta para la búsqueda....................................................2
2. Ahora sí, ¡hay que hacer algo de BLAST!.........................................................................................6
3. La página de resultados se divide en secciones..................................................................................9
Tabla de ilustraciones
Figura 1 Figura 1 seleccionando el enlace RefSeq RNAs en el panel “Related information”a la
derecha. Esto nos lleva al ARNm que codifica la proteína que se está viendo......................4
Figura 2 volvemos a la página del Gen PUB12, sobre el panel del Visor de Secuencias, hacemos clic en el
enlace “Go to nucleotide: Genbank” esto nos llevará a la región genómica que codifica el ARNm que
estábamos viendo.....................................................................................................................................5
Figura 3. Seleccion de la opción megaBLAST.........................................................................................6
Figura 4. Seleccion de la opción................................................................................................................6
Figura 5 Selecion de megablast” ..................................................................................................7
Figura 6. Selecion de discotiguous megablast........................................................................8
Figura 7 Coincidencia hit.................................................................................................................10
INTRODUCCION
La presente practica tiene como objetivo que podamos aprender a utilizar la
herramienta de búsqueda BLAST que resulta ser el algoritmo a escoger en una
búsqueda preliminar de similitud entre una secuencia problema y las bases de datos
disponibles. Esto como Lic. En Genómica nos va a Proveer como primeros resultados
de una medida cuantitativa de la similaridad de la secuencia. Es una herramienta de
alineamiento local por pares. El manejo de BLAST en NCBI implica una serie de
pasos que permiten obtener resultados precisos y significativos.

Ir a Contenido Página 4 de 16
DESCRIPCION

BLAST la razón de su velocidad. es su uso de alineaciones locales que


sirven como semillas para alineaciones más extensas. Este es un Un
conjunto de herramientas BLAST para la búsqueda de secuencias de
nucleótidos y proteínas está disponible para su uso en el sitio NCBI.

Las búsquedas BLAST comienzan con una secuencia de consulta que se


comparará con las bases de datos de secuencias especificadas por el
usuario. A medida que los algoritmos trabajan a través de los datos,
computan la probabilidad de que cada coincidencia potencial haya surgido
solo por casualidad, lo que no sería consistente con una relación
evolutiva. Los algoritmos BLAST comienzan dividiendo la secuencia de
consulta en una serie de “palabras” cortas superpuestas y asignando
valores numéricos a las palabras. Las palabras por encima de un valor
umbral para significancia estadística se utilizan entonces para buscar
bases de datos.

Ir a Contenido Página 5 de 16
1.-

Figura 1 seleccionando el enlace RefSeq RNAs en el


panel “Related information”a la derecha. Esto nos lleva al
ARNm que codifica la proteína que se está viendo

a) Teniendo en cuenta tus conocimientos de biología,


¿por qué crees que son diferentes?
Por que cuando seleccionamos el botón de gene da el
registro de la base de esa secuencia y en cambio cuando
es en CDS da otra base, pero distinta a la que nos arroja
en gene

Ir a Contenido Página 6 de 16
FIGURA2 volvemos a la página del Gen PUB12, sobre el panel del Visor
de Secuencias, hacemos clic en el enlace “Go to nucleotide: Genbank”
esto nos llevará a la región genómica que codifica el ARNm que
estábamos viendo.
b) Nuevamente, ¿por qué son diferentes? Por en
Gene esta contiene la información de la proteína y
en CDS se codifica.

1. Ahora sí,

a. ¿
Cuándo te convendría usar megaBLAST? ¿Y qué pasa
con megaBLAST discontinuo? (Si tienes tiempo, prueba
cada uno para ver cómo difieren sus resultados) me
convendría cuando quiera una secuencia que compartan
un números significativos de residuos (nucleótidos o
aminoácidos) y por otro lado megaBLAST discontinuo
me permite que existan algunos errores en la secuencia
comparada, es decir que permite que la secuencia que
presenta cierta identidad tenga algunos desaciertos,
permitiendo así desarrollar una mayor cantidad de
Ir a Contenido Página 7 de 16
resultados.

Figura 3. Seleccion de la opción megaBLAST

Figura 4. Seleccion de la opción

 Abre los parámetros del algoritmo (Algorithm


parameters) cerca de la parte inferior y trata de
investigar un poco respecto a los siguientes
elementos.

b. ¿Qué Expect threshold? Es el número de coincidencias que
se espera encontrar por casualidad. Si la significancia
Ir a Contenido Página 8 de 16
estadística de una coincidencia es mayor que el umbral
esperado, la coincidencia no se informará. El umbral E
predeterminado está establecido en 10.

FIGURA 5 Selecion de megablast

c. ¿Qué pasaría si se disminuye? Aumenta la rigurosidad de la


búsqueda esto provoca que se informe ,menos la búsqueda
¿Qué pasaría si se aumenta? disminuirá la rigurosidad de la
búsqueda y dará como resultado que se informen más
coincidencias.

d. ¿Cuál sería el efecto de aumentar Word size? dará menos


coincidencias, ya que requiere regiones continuas más largas de
coincidencia exacta. Si se elige que el tamaño de palabra sea
casi del tamaño de la consulta, BLAST buscará coincidencias
casi exactas

Ir a Contenido Página 9 de 16
FIGURA . 6. Selecion de discotiguous megablast

e. ¿Por qué hay un filtro de regiones de baja complejidad


(¿Low complexity regions)? Facilitan el aumento de la
complejidad regulatoria y de red requerida con la
aparición de organismos con una distribución y desarrollo
de tejidos más complejos ¿Debemos mantenerlo activo?
Si Porque usualmente hay especies que tienen una
menor propensión a formar dominios estructurados y
tienden a estar mucho menos conservadas
evolutivamente que los dominios globulares

2. La página de resultados se divide en secciones.


En la parte superior está el resumen del trabajo, que simplemente
muestra detalles sobre su consulta y la base de datos buscada. Puedes
encontrar más detalles sobre tu búsqueda haciendo clic en Search
Summary.

a. ¿Cuántas secuencias hay en la base de datos nr?


La base de datos nr contiene alrededor de 148 millones de
secuencias de proteínas.

b. ¿Qué secuencias no están incluidas en la base de datos nr?


(Pregunta engañosa ;) secuencias que son redundantes esto
quiere decir que hay demasiada abundancia

c. ¿Qué significan las barras de colores? fila para cada una de


las secuencias similares obtenidas (hit). En cada fila se
representa la región cubierta por los distintos HSPs.

Ir a Contenido Página 10 de 16
d. ¿Cómo funciona el código de color? Esto es dependiendo del
E-value correspondiente.

e. ¿Qué información se muestra en el recuadro de la parte


superior de Graphic Summary? se nos informa sobre la
versión del programa utilizado, el nombre de la base de
datos y el número de secuencias buscadas.

f. ¿Qué notas respecto a los valores de significancia a medida


que avanza en el Graphic Summary? En ests se puede
encontrar información sobre los valores de significancia de los
resultados obtenidos. Estos valores son indicativos de la
probabilidad de que las similitudes observadas entre la
secuencia de consulta y los hit o coincidencias sean el
resultado de una coincidencia aleatoria o de ruido estadístico.

g. ¿Cuál es el género y la especie de la mejor coincidencia (hit)?

Figura 7. Coincidencia hit

h. ¿Qué
pasa si haces clic en una de las entradas?
Se pueden observar los distintos resultados hit.

a. ¿Cuántas coincidencias de secuencia se enumeran para esta


secuencia de consulta? ¿Cómo están ordenadas? Se
enumeran 100. Los distintos resultados (hits). Para cada uno
se puede observar la definición de la secuencia (description) y
el E-value. En la tabla los hits están ordenados por el E-value,
de menor a mayor.

b. ¿Qué pasa si haces clic en el enlace Accession? Esta te redirige a


una página específica que contiene información muy detallada sobre la
secuencia correspondiente a el número de acceso.

Ir a Contenido Página 11 de 16
c. ¿Qué sucede si haces clic en el enlace Alignments? Me manda
directamente a Salida Blastn Alignments

d. ¿Quérepresentan las barras verticales (|) entre la consulta (Query) y


el Sbjct?
indican la correspondencia exacta de los residuos o nucleótidos en esas
posiciones específicas.

e. ¿Qué significa Strand = Plus / Plus, Strand = Plus / Minus?


Strand = Plus: Indica que la secuencia se lee en la dirección 5' a 3', lo que
significa que se transcribe en la dirección opuesta a la hebra molde
(antisentido).
Strand = Minus: Indica que la secuencia se lee en la dirección 3' a 5', lo
que
coincide con la dirección de la hebra molde (sentido)
n. Describe la diferencia entre este formato y el formato anterior. Los dos
dan información tras información y de forma clara y muy útil

o. Puedes jugar con estas opciones. Si

p. ¿Cuál es su E-valor? Es 0.0

q. ¿Tiene un alto porcentaje de identidad? Si es así, ¿por qué


BLAST le daría un valor E tan pobre? Si es alto por las
inmensidades de coincidencias que hay asi que no tiene un valor
E pobre

r. ¿Crees que estas coincidencias son homólogos? ¿Por qué sí o por qué
no? Si porque son secuencias que están relacionadas.

Ir a Contenido Página 12 de 16
CONCLUSION

Bueno para finalizar con el presente documento puedo decir que la


herramienta BLAST es de mucha ayuda ya que nos sirve para la
anotación y predicción funcional de genes o secuencias proteicas
gracias a esta practica pude profundizar el como moverme y poder
buscar específicamente los elementos que me pedían. Es así que el
manejo de BLAST en el NCBI implica configurar los parámetros de
búsqueda, como el tipo de búsqueda, la base de datos a utilizar y los
criterios de coincidencia con todas el proceso que lleve a cabo aquí
ahora puedo decir que puedo realizar búsquedas con BLAST.

Ir a Contenido Página 13 de 16
BIBLIOGRAFIA
https://blast.ncbi.nlm.nih.gov/Blast.cgi?
CMD=Get&RID=80ZRTBJ001N&ADV_VIEW=no&CONFIG_DESCR=2,3,4,5,6,7,8

https://www.ncbi.nlm.nih.gov/nuccore/NC_003071.7?
report=genbank&from=12368220&to=12370420&strand=true

Ir a Contenido Página 14 de 16

También podría gustarte