Documentos de Académico
Documentos de Profesional
Documentos de Cultura
27 de agosto de 2015
BIOINFORMTICA BSICA
TALLER 4. Alineamientos de secuencias
El objetivo de esta gua es familiarizarse con las herramientas BLAST.
Para cada pregunta (si es necesario) haga una captura de pantalla para acompaar cada
respuesta.
Asiste a su consulta una pareja con un nio de 5 aos con retraso en la adquisicin del
lenguaje, ha sido valorado por diversos profesionales, incluyendo medicina, psicologa,
terapia del lenguaje, entre otras. Tras no encontrar una etiologa clara por el trastorno, la
pareja le comenta a Ud que han decidido ingresar a un estudio experimental en el que se
analiza el transcriptoma de los individuos, y quieren saber su opinin acerca de los
resultados obtenidos.
Para ello se realiz inicialmente una extraccin de RNA total de sangre perifrica en el
individuo afectado y sus padres, aparentemente sanos. A partir de las comparaciones de
los RT-PCR (PCR con transcriptasa reversa) se identifica la siguiente secuencia (5 3)
como la posible responsable de la alteracin en el desarrollo del lenguaje.
GACAATGGCATTAAACATGGAGGGCTAGACCTCACTACTAACAATTCCTCCTCGACTACCTCCTCC
AACA
CTTCCAAAGCATCACCACCAATAACTCATCATTCCATAGTGAATGGACAGTCTTCAGTTCTAAGTG
CAAG
ACGAGACAGCTCGTCACATGAGGAGACTGGGGCCTCTCACACTCTCTATGGCCATGGAGTTTGCAA
ATGG
CCAGGCTGTGAAAGCATTTGTGAAGATTTTGGACAGTTTTTAAAGCACCTTAACAATGAACACGCA
TTGG
ATGACCGAAGCACTGCTCAGTGTCGAGTGCAAATGCAGGTGGTGCAACAGTTAGAAATACAGCTTT
CTAA
AGAACGCGAACGTCTTCAAGCAATGATGACCCACTTGCACATGCGACCCTCAGAGCCCAAACCATC
TCCC
AAACCTCTAAATCTGGTGTCTAGTGTCACCATGTCGAAGAATATGTTGGAGACATCCCCACAGAGC
TTAC
CTCAAACCCCTACCACACCAACGGCCCCAGTCACCCCGATTACCCAGGGACCCTCAGTAATCACCC
CAGC
CAGTGTGCCCAATGTGGGAGCCATACGAAGGCGACATTCAGACAAATACAACATTCCCATGTCATC
AGAA
ATTGCCCCAAACTATGAATTTTATAAAAATGCAGATGTCAGACCTCCATTTACTTATGCAACTCTC
ATAA
GGCAGGCTATCATGGAGTCATCTGACAGGCAGTTAACACTTAATGAAATTTACAGCTGGTTTACAC
GGAC
ATTTGCTTACTTCAGGCGTAATGCAGCAACTTGGAAGAATGCAGTACGTCATAATCTTAGCCTGCA
CAAG
Antes de continuar con la investigacin se requiere verificar la naturaleza de esta
secuencia, es decir, qu tipo de producto (protena) genera este mRNA
1. En su hoja de respuestas defina con sus palabras en qu consiste la RT-PCR
Es una variante del PCR, este es un proceso usado en laboratorio cuando se requiere
replicar o amplificar ADN, entonces el RT-PCR entonces empleado cuando a partir del
ARN haciendo una transcripcin inversa se obtiene ADN.
Debido a que no tienen la secuencia completa no pueden hacer una traduccin terica
para saber la protena que se genera a partir de esta secuencia de DNA, pues no sabe
exactamente en qu nucletido se inicia el marco abierto de lectura (AUG) por lo que
deciden hacer una comparacin con los datos previamente reportados en las bases de
datos y deciden empezar con GENBANK.
2. Ingrese a http://www.ncbi.nlm.nih.gov/
3. Seleccione en la parte derecha de la pgina BLAST
4. Seleccione en el apartado BASIC BLAST la opcin nucleotide BLAST
5. Revise que la pestaa indique BLASTN y pegue la secuencia en el primer recuadro
6. Asegrese que estn seleccionadas las opciones Others y Nucleotide collection (en
Choose search set) y highly similar sequences (en Program selection)
7. Presione el botn BLAST y espere la aparicin de la nueva pgina
En esta nueva pgina observe los diferentes valores que se han generado:
Los valores de puntaje (Max score y total score) se refieren a los puntajes que
asign el algoritmo a la comparacin entre la secuencia problema (query) y las
dems secuencias de la base de datos.
Cuando las comparaciones por nucletidos son adecuadas (es decir ambos
nucletidos son iguales) el algoritmo asigna nmeros positivos; cuando los
nucletidos son distintos, el algoritmo asigna valores negativos, lo que reduce el
puntaje. De manera que entre mayor sea el puntaje, mayor ser la similitud entre
la secuencias.
El valor esperado (E-value) se refiere al nmero de veces que, por azar, puede
obtenerse un alineamiento mejor al encontrado por BLAST, teniendo en cuenta el
tamao de la base de datos de referencia.
14. Mire la pgina que se gener, compare las primeras 30 secuencias incluyendo Homo
sapiens y conteste las siguientes preguntas:
14.1.
Con cul de ellas tiene mayor similitud? Con cul la menor similitud?
Tiene mayor similitud con (Forkhead box protein P2 [Buceros rhinoceros silvestris])
en las 30 primeras y la menor (forkhead box protein P2 isoform 2 [Mus
musculus]).
14.2.
A qu gen corresponde esa informacin?
Es un gen que est relacionado con el lenguaje humano y su mutacin relaciona con
trastornos del lenguaje.
14.3.
A partir de estos datos, cree usted que con estos datos puede asegurarse
qu tipo de mRNA es el que se hall en las clulas?
Si, ya que a partir del gen y con el formato FASTA es posible traducir la informacin del
ADN a RNA.
15. Qu podra concluir a partir de los datos encontrados sobre esta protena para los
MAMFEROS?
En las dos versiones de este gen en los chimpancs y el ser humano que difieren en dos
aminocidos, sostienen la hiptesis de como los ser humano habra desarrollado el
lenguaje.
Si es necesario busque los nombres de las especies en Wikipedia para conocer su
nombre comn Ej Canis lupus: Lobo
16. Explore las otras opciones de BLAST que ofrece la pgina del NCBI (si ubica el mouse
sobre cada tipo de BLAST, sin hacer click, aparece una pequea descripcin de la
herramienta)
1 Richard Dawkins es un reconocido bilogo evolutivo y etlogo britnico, entre sus aportes a lo
comunidad cientfica se destacan la teora del gen egosta y de los memes o unidades de
informacin que al igual que los genes se replican, modifican o desaparecen en la mente de los
individuos.