Está en la página 1de 6

UNIVERSIDAD COLEGIO MAYOR DE

NUESTRA SEORA DEL ROSARIO


FACULTAD DE CIENCIAS NATURALES Y
MATEMTICAS
PROGRAMA DE REFUERZO ACADMICO

27 de agosto de 2015
BIOINFORMTICA BSICA
TALLER 4. Alineamientos de secuencias
El objetivo de esta gua es familiarizarse con las herramientas BLAST.
Para cada pregunta (si es necesario) haga una captura de pantalla para acompaar cada
respuesta.
Asiste a su consulta una pareja con un nio de 5 aos con retraso en la adquisicin del
lenguaje, ha sido valorado por diversos profesionales, incluyendo medicina, psicologa,
terapia del lenguaje, entre otras. Tras no encontrar una etiologa clara por el trastorno, la
pareja le comenta a Ud que han decidido ingresar a un estudio experimental en el que se
analiza el transcriptoma de los individuos, y quieren saber su opinin acerca de los
resultados obtenidos.
Para ello se realiz inicialmente una extraccin de RNA total de sangre perifrica en el
individuo afectado y sus padres, aparentemente sanos. A partir de las comparaciones de
los RT-PCR (PCR con transcriptasa reversa) se identifica la siguiente secuencia (5 3)
como la posible responsable de la alteracin en el desarrollo del lenguaje.
GACAATGGCATTAAACATGGAGGGCTAGACCTCACTACTAACAATTCCTCCTCGACTACCTCCTCC
AACA
CTTCCAAAGCATCACCACCAATAACTCATCATTCCATAGTGAATGGACAGTCTTCAGTTCTAAGTG
CAAG
ACGAGACAGCTCGTCACATGAGGAGACTGGGGCCTCTCACACTCTCTATGGCCATGGAGTTTGCAA
ATGG
CCAGGCTGTGAAAGCATTTGTGAAGATTTTGGACAGTTTTTAAAGCACCTTAACAATGAACACGCA
TTGG
ATGACCGAAGCACTGCTCAGTGTCGAGTGCAAATGCAGGTGGTGCAACAGTTAGAAATACAGCTTT
CTAA
AGAACGCGAACGTCTTCAAGCAATGATGACCCACTTGCACATGCGACCCTCAGAGCCCAAACCATC
TCCC

AAACCTCTAAATCTGGTGTCTAGTGTCACCATGTCGAAGAATATGTTGGAGACATCCCCACAGAGC
TTAC
CTCAAACCCCTACCACACCAACGGCCCCAGTCACCCCGATTACCCAGGGACCCTCAGTAATCACCC
CAGC
CAGTGTGCCCAATGTGGGAGCCATACGAAGGCGACATTCAGACAAATACAACATTCCCATGTCATC
AGAA
ATTGCCCCAAACTATGAATTTTATAAAAATGCAGATGTCAGACCTCCATTTACTTATGCAACTCTC
ATAA
GGCAGGCTATCATGGAGTCATCTGACAGGCAGTTAACACTTAATGAAATTTACAGCTGGTTTACAC
GGAC
ATTTGCTTACTTCAGGCGTAATGCAGCAACTTGGAAGAATGCAGTACGTCATAATCTTAGCCTGCA
CAAG
Antes de continuar con la investigacin se requiere verificar la naturaleza de esta
secuencia, es decir, qu tipo de producto (protena) genera este mRNA
1. En su hoja de respuestas defina con sus palabras en qu consiste la RT-PCR
Es una variante del PCR, este es un proceso usado en laboratorio cuando se requiere
replicar o amplificar ADN, entonces el RT-PCR entonces empleado cuando a partir del
ARN haciendo una transcripcin inversa se obtiene ADN.

Debido a que no tienen la secuencia completa no pueden hacer una traduccin terica
para saber la protena que se genera a partir de esta secuencia de DNA, pues no sabe
exactamente en qu nucletido se inicia el marco abierto de lectura (AUG) por lo que
deciden hacer una comparacin con los datos previamente reportados en las bases de
datos y deciden empezar con GENBANK.
2. Ingrese a http://www.ncbi.nlm.nih.gov/
3. Seleccione en la parte derecha de la pgina BLAST
4. Seleccione en el apartado BASIC BLAST la opcin nucleotide BLAST
5. Revise que la pestaa indique BLASTN y pegue la secuencia en el primer recuadro
6. Asegrese que estn seleccionadas las opciones Others y Nucleotide collection (en
Choose search set) y highly similar sequences (en Program selection)
7. Presione el botn BLAST y espere la aparicin de la nueva pgina
En esta nueva pgina observe los diferentes valores que se han generado:

Los valores de identidad mxima (Max ident) se refieren al porcentaje de


nucletidos idnticos que fueron comparados entre dos secuencias.

Query coverage, se refiere al porcentaje de nucletidos, de la secuencia


problema, que se pudieron comparar, ya que no todas las secuencias disponibles
tienen la misma longitud.

Los valores de puntaje (Max score y total score) se refieren a los puntajes que
asign el algoritmo a la comparacin entre la secuencia problema (query) y las
dems secuencias de la base de datos.

Cuando las comparaciones por nucletidos son adecuadas (es decir ambos
nucletidos son iguales) el algoritmo asigna nmeros positivos; cuando los
nucletidos son distintos, el algoritmo asigna valores negativos, lo que reduce el
puntaje. De manera que entre mayor sea el puntaje, mayor ser la similitud entre
la secuencias.

El valor esperado (E-value) se refiere al nmero de veces que, por azar, puede
obtenerse un alineamiento mejor al encontrado por BLAST, teniendo en cuenta el
tamao de la base de datos de referencia.

8. Compare la informacin de las primeras 30 secuencias y conteste las siguientes


preguntas
8.1. Con cul de ellas tiene mayor similitud? Con cul la menor similitud?
Tiene mayor similitud con ( PREDICTED: Homo sapiens forkhead box P2
(FOXP2), transcript variant X1, mRNA ) y tiene la menor similitud con
(PREDICTED: Rhinopithecus roxellana forkhead box P2 (FOXP2),
transcript variant X4, mRNA), tienen una similitud del 100% y 99%
respectivamente.
8.2. A qu gen o genes corresponden las comparaciones anteriores?
En el caso del primero les corresponde el gen (FOXP2) de la especie Homo

sapiens y el segundo le corresponde el (FOXP2) de la especie


Rhinopithecus roxellana
8.3. A partir de estos datos, cul cree usted que es la protena que se genera a partir
de este mRNA?

forkhead box P2 (FOXP2), en ambos casos


9. Regrese a la pgina de BLAST
10. Seleccione en BASIC BLAST la opcin BLASTX (esta herramienta busca protenas a
partir de una secuencia nucleotdica)
11. Pegue la secuencia en el primer recuadro
12. Asegrese que estn seleccionadas las opciones Standard (1) (para Genetic code) y
Nonredundant protein sequences (en Database dentro de Choose search set)
13. Presione el botn BLAST y espere la aparicin de la nueva pgina (Puede tardar un
poco)

14. Mire la pgina que se gener, compare las primeras 30 secuencias incluyendo Homo
sapiens y conteste las siguientes preguntas:
14.1.
Con cul de ellas tiene mayor similitud? Con cul la menor similitud?
Tiene mayor similitud con (Forkhead box protein P2 [Buceros rhinoceros silvestris])
en las 30 primeras y la menor (forkhead box protein P2 isoform 2 [Mus

musculus]).
14.2.
A qu gen corresponde esa informacin?
Es un gen que est relacionado con el lenguaje humano y su mutacin relaciona con
trastornos del lenguaje.
14.3.
A partir de estos datos, cree usted que con estos datos puede asegurarse
qu tipo de mRNA es el que se hall en las clulas?
Si, ya que a partir del gen y con el formato FASTA es posible traducir la informacin del
ADN a RNA.
15. Qu podra concluir a partir de los datos encontrados sobre esta protena para los
MAMFEROS?
En las dos versiones de este gen en los chimpancs y el ser humano que difieren en dos
aminocidos, sostienen la hiptesis de como los ser humano habra desarrollado el
lenguaje.
Si es necesario busque los nombres de las especies en Wikipedia para conocer su
nombre comn Ej Canis lupus: Lobo
16. Explore las otras opciones de BLAST que ofrece la pgina del NCBI (si ubica el mouse
sobre cada tipo de BLAST, sin hacer click, aparece una pequea descripcin de la
herramienta)

17. Realice un alineamiento tipo BLAST utilizando la siguiente secuencia. Qu tipo de


BLAST realizara para este tipo de secuencia (escoja la base de datos Ref-seq; si es
el caso)? Qu protena predice el programa, en que organismos se encuentra,
mencione al menos 3?
En esta secuencia corresponde a una protena por lo tanto no es posible usar la base de
datos Ref-seq. La protena que predice la base de datos (protein blast) predice
(microcephalin). Se encuentra presente en las especies; Homo sapiens, Pan troglodites y
Cercocebus atys.
MAAPILKDVVAYVEVWSSNGTENYSKTFTTQLVDMGAKVSKTFNKQVTHVIFKDGYQSTWDKAQKR
GVKL
VSVLWVEKCRTAGAHIDESLFPAANMNEHLSSLIKKKRKCMQPKDFNFKTPENDKRFQKKFEKMAK
ELQR
QKTNLDDDVPILLFESNGSLIYTPTIEINSRHHSAMEKRLQEMKEKRENLSPTSSQMIQQSHDNPS
NSLC
EAPLNISRDTLCSDEYFAGGLHSSFDDLCGNSGCGNQERKLEGSINDIKSDVCISSLVLKANNIHS
SPSF
THLDKSSPQKFLSNLSKEEINLQRNIAGKVVTPDQKQAAGMSQETFEEKYRLSPTLSSTKGHLLIH
SRPR
SSSVKRKRVSHGSHSPPKEKCKRKRSTRRSIMPRLQLCRSEDRLQHVAGPALEALSCGESSYDDYF
SPDN
LKERYSENLPPESQLPSSPAQLSCRSLSKKERTSIFEMSDFSCVGKKTRTVDITNFTAKTISSPRK
TGNG
EGRATSSCVTSAPEEALRCCRQAGKEDACPEGNGFSYTIEDPALPKGHDDDLTPLEGSLEEMKEAV
GLKS
TQNKGTTSKISNSSEGEAQSEHEPCFIVDCNMETSTEEKENLPGGYSGSVKNRPTRHDVLDDSCDG
FKDL
IKPHEELKKSGRGKKPTRTLVMTSMPSEKQNVVIQVVDKLKGFSIAPDVCETTTHVLSGKPLRTLN
VLLG
IARGCWVLSYDWVLWSLELGHWISEEPFELSHHFPAAPLCRSECHLSAGPYRGTLFADQPAMFVSP
ASSP
PVAKLCELVHLCGGRVSQVPRQASIVIGPYSGKKKATVKYLSEKWVLDSITQHKVCAPENYLLSQ
18. Escriba un documento reflexivo de al menos 250 palabras que contenga como se ha
sentido esta semana, cmo se sinti en clase y qu aprendi hoy.
Enve el documento a travs de la plataforma Moodle, las 8 primeras preguntas a la
actividad Taller 4 Bioinformtica: Alineamientos de secuencias con el ttulo Taller 4:
Nombre completo y la ltima pregunta a la actividad 4. Documento reflexivo, con el
titulo Documento reflexivo 4: Nombre completo.
Lo que hay en el corazn de toda cosa viviente no es un fuego, no un aliento clido, no una chispa
de vida. Es informacin, palabras, instrucciones. Si buscan una metfora, no piensen en fuegos ni
chispas ni alientos. Piensen en mil millones de caracteres digitales discretos tallados en tablillas de
cristal.

Richard Dawkins, 19861

1 Richard Dawkins es un reconocido bilogo evolutivo y etlogo britnico, entre sus aportes a lo
comunidad cientfica se destacan la teora del gen egosta y de los memes o unidades de
informacin que al igual que los genes se replican, modifican o desaparecen en la mente de los
individuos.

También podría gustarte