Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una secuencia de nucleótidos no nos aporta ninguna información, salvo que seamos capaces de descifrarla.
Para ello, debemos conocer el código de cifrado y tener las herramientas necesarias para descifrar la secuencia
de una cadena de ADN. Usando estas herramientas podemos predecir sin datos experimentales que
información contiene la secuencia. Podemos predecir la secuencia de la proteína que codifica, la localización
de exones e intrones, etc. Pero hay que tener en cuenta que el resultado que obtenemos es una predicción
teórica que deberá ser confirmada mediante experimentos. La predicción de las estructuras presentes en una
secuencia y el descifrado de la información son de vital importancia en los proyectos genoma; ya que nos
enfrentamos a una secuencia que contiene numerosos genes que no han sido estudiados experimentalmente
y de los cuales no se tiene ninguna información previa.
SMS es una suite de manipulación de secuencias, es decir, es una caja de herramientas, o página que contiene
programas para el análisis y modificación de las secuencias. A la izquierda se encuentra el índice de las
herramientas que nos ofrece. Con el número de acceso L12047 pruebe a convertir el formato GenBank a fasta.
Para traducir un fragmento sin tomar en cuenta el codón de inicio, es decir, leyendo desde el primer
nucleótido, podemos utilizar un programa muy simple que se encuentra en la misma página que el anterior:
O mediante ésta ruta: NCBI>All resources>Tools>Open reading frame finder (ORF Finder)
RESULTADOS
Según los resultados obtenidos son tres ORF encontrados y lo mejor de éste ORFfinder es
que podemos seleccionar uno de los tres marcos de lectura para hacer un BLASTp y
verificar la identidad de la secuencia de proteína traducida. ¿cuál es la identidad del
ORF más largo? La identidad del ORF más largo es de 312 nt, es decir el largo de la
cadena es de 312 nt, asi mismo cuenta con 103 aa
Recuerde que normalmente un ORF mayor de 300 pb ya es adecuado para una proteína.
1.- ¿Cuántos ORF encontró con el programa utilizado? son tres marcos abiertos de lectura
2.- ¿cuál de los posibles ORF que encontró podría generar en la realidad una proteína? Solo un ORF es capaz de
generar una proteína, siendo a su vez el ORF3 ya que cuenta con 312 nt, de este modo ya es adecuado.
3.- Ahora debemos traducir todas las ORF cada una de manera individual y comprobar por separado si
alguna de ellas presenta alta similitud con proteínas conocidas. Solamente aquélla que presente similitud
significativa podrá representar una proteína y así podemos decir cuál de todos esos ORF es el que tiene
verdadero potencial de ser un gen. El ORF con mayor similitud es el ORF3, ya que además de presentar 312
nt para proteína, tiene un valor de cobertura de 100% y un valor de identidad de 100%
Traducción inversa
También podemos deducir la secuencia de nucleótidos a partir de una secuencia de aminoácidos. El problema
es que hay varios codones que pueden codificar el mismo aminoácido, por lo que la secuencia calculada
tendrá ambigüedades. Utiliza primero “Reverse Translate” de la suite SMS y compara su resultado con el
Programa europeo Embossbacktranambing https://www.ebi.ac.uk/Tools/st/emboss_backtranambig/
Búsqueda de dianas de restricción (palíndromos), obtención del mapa
de restricción de una secuencia.
Estas herramientas localizan en la secuencia dianas de enzimas de restricción. Necesitamos una base de datos
de las secuencias reconocidas por las diferentes enzimas, por ejemplo: Rebase. El programa nos localizará las
dianas identificándolas en nuestra secuencia. Uno de los programas que podemos utilizar es NEBCUTTER que
se encuentra en la siguiente página https://www.neb.com/tools-and-resources/interactive-tools, en la que
podrá encontrar además otras herramientas.
1.- represente ésta triple digestión en el gel (“View gel). Colocando el cursor sobre el nombre de cada
enzima se puede entrar a un enlace en el que se describen las características de la enzima elegida, así como
las condiciones de incubación y el tiempo de digestión.
2.- Diga a qué temperatura se tiene que llevar a cabo la triple digestión.
3.- También comente qué tipo de extremos (cohesivos o romos) genera cada enzima en el ADN y pegue la
imagen representativa del corte. Escriba una conclusión para estos resultados.
El tipo de corte que genera la enzima de triple digestion es de tipo cohesivos, mientras quela otra enzima es
de corte cohesivo
EJERCÍCIO 1
Vamos a localizar pautas abiertas de lectura en dos secuencias. Utiliza los programas que revisamos para ORF.
GCAGTTCCGCCTCAAGTTTGGTCTGGTGCATCGTCAACGAGCTGACCTGCCGCTTGAGCACCTGCATCCGCGTGGTGGTCACCACTGAACGCACATCTGGTACAACGGCCT
CCGAGAATATCTCGTTAATCAGGCGATGGTTGTGCAGATAGCGGGCGTAGGCCAAGTGCTTGGTCGTATACCCTTCGTCCTGGTCATCCTCGTCCTCCGCCGGCTGAATGT
CGATGCGTCGCTCATGCTGCGACTTACTGCCGCCACCGCGTGACGGTGTCTCATGCATATCCACGTCGGTCTTCACCTTGCTTTTGGCCGACATGTAGGCCTGATAGGCGG
GCGTCTGGTGGTAGGCCTTTAGCGATTTCTCGTACTCCAGCTTCTCCGCCTCGTATTCGTCAATGAACTCCGTCTTCTCATCCTCGGGCAGCAACTTCCACATGGCACCGA
TCTTCTTACCCAGCTCCCACAGCTTCAGCTCTGGATGCTTCGCCTTGACGCTATCCCAGACGCGTTTCGAATACCGCATGTAGGGCAAAATGGGCTTCTCCGGCGGCTTTG
GTGGCTTGGGTAGCCTTGATTCGTTCTGGTTCTTGCTGCTCGACGACTTGGTTACCTTCTGTGGCGTGAATGCCGGATTCCCATAGTTGCTGTGCGTGAAGATGGGCGTCT
GATCCTTGTTGCGATCGCCACCACCTCCGCCGCCGGATGAACGCGCGCAGCTGCCGCCGCCGGAGCCACCGCCGCCGCCCTGGAGTGGTGTGGCCGATCCCTGGCCGCCAA
CGGCTATCTGCTTGTAGTTGCTTGGCAGGGCCATCTTTGTGCAATTCGCTGGTCAAATTTGTATGGATTTTCCAAGAGAAATAACAATTTTCAGACAGACGCCATTTTCTG
TCGGCGTTGGTGGAGGTGTGGCCGTACCTGATTCTAAGAAAAATCATATAAACCGGGAATTGGCATATATAGCGGAATATATATGATAAGGAAATAGTAACTGCTAGAGAA
TATACAAAATTTTAGTTACCTAAAACTAGCAGAACACTTTAGCTGAATTGCTGCTACTTATAAAAAAAATCTGTAACTTCTCATTTTTATTCAGCTTTATAGAAATCAAAA
ATTATACCACACTAGAATCTAGAAAATACCAACGGCAAATCATTTTCCATTAAGTTGGCAGCCCCGCAACTGGGATTTGTAAAATATAAACAAATCGTAAACAACTAAAAA
ATGTTTGCCGGTCGTTTGATGGTCCGTTCGATCGTTGGTCGGGCATGCTTGGCCACCATGGGCAGGTGGTCAAAGCCCCAAGCACACGCCAGCCAAGTGATCCTGCCCAGC
ACACCAGCGATAGCCGCAGTTGCTATTCAATGCGAGGAATTCACTGCCAACCGGCGATTGTTTAGCAGTCAAATTGAGACGGAATCCACATTGGACGGCGCCACCTACGAG
CGTGTGTGCTCCGACACCCTGGACGCACTGTGCGACTACTTCGAGGAGCTGACGGAGAACGCCTCCGAGCTGCAGGGCACGGATGTGGCTTACAGCGTAGGTGACATTCGG
CTATTACATCATTCCATTGACCTGCTAATCCTCGCGGGGTTTCCGCTTCCACAGGAATGGCGTGCTAACCGTGAACCTGGGAGGACAGCACGGCACCTATGTGATCAACCG
GCAGACGCCCAACAAGCAGATCTGGCTCAGTTCGCCCACCAGCGGTCCCAAGCGATACGATTTCGTCGGCACTGTGGCGGCGGGCAGATGGATCTACAAGCACAGTGGTCA
GTCGCTGCACGAACTGTTGCAGCAGGAGATACCCGGCATACTGAAGTCACAGTCCGTGGACTTCCTACGCCTGCCCTACTGTAGTTAATTCCGTGATTAGTTTAAATTCTC
CTCCATAAAAAGTCGGTTGAAACGTTCGATTTTGATATATTTATTGTTCTTCATCTGTTGGCACAGTGGTCACTCGATATACATGGAACTGCTGCTGCTGCGGATGACCAA
AGGTATATACTTATACTTCCCTGGAGCTGTGAAGCTTAGCTTCTGGCATAAATGCTTTGCATTCGCTTATTCATTTATGTACGATTAGTTTTGGTTTCGAAGTTTAAATTT
GTTGTTTTTGAGAGGAATAAACTTAAAAATCAGTTGTTTAATGTATAAATCAAATAATAATAATCAAATCACCATTGAAGAACATCATATGTAGCTATACATATTTTATTT
TATTTTATTATTTGTCACTTGTACGTTCCATTTCGTTTATTTTTATTTCAATACACAGAATTCAGAACTCAAAGCTCCCCCAGCTAATAATTCCAAACGAAAGTCGATTAA
AGTTGATTTCCGGAATTATTGTGTATGTTTATTCACGTGCTCTTCAGATTTATGTTTTCTGAATTCTATTGTTGTTCGGTGTTTTATAAACAAATGAAGGTAGTGATTATT
TTCTTTTCTTTTTTTTGGCAGCAGCACACATGTATGGTAAAAAAAAAAAATAACAAAAATCACTTGCCAGCTAGCAAATACACGGGCACTTCAAAGGGCGTTATTCTCGTT
TCTACATTACGTTTAAATTGCATAACGTTAATAGTATGGATATCTAAGTCTACGACACTCTAGTGACGTCCACCGAACATGTTGTTAAAGTGCGGCTGCTGCTGCTGCTGC
TGCTGCTGGGCACCCATAAA
ACAAATCGTAAACAACTAAAAAATGTTTGCCGGTCGTTTGATGGTCCGTTCGATCGTTGGTCGGGCATGC
TTGGCCACCATGGGCAGGTGGTCAAAGCCCCAAGCACACGCCAGCCAAGTGATCCTGCCCAGCACACCAG
CGATAGCCGCAGTTGCTATTCAATGCGAGGAATTCACTGCCAACCGGCGATTGTTTAGCAGTCAAATTGA
GACGGAATCCACATTGGACGGCGCCACCTACGAGCGTGTGTGCTCCGACACCCTGGACGCACTGTGCGAC
TACTTCGAGGAGCTGACGGAGAACGCCTCCGAGCTGCAGGGCACGGATGTGGCTTACAGCGATGGCGTGC
TAACCGTGAACCTGGGAGGACAGCACGGCACCTATGTGATCAACCGGCAGACGCCCAACAAGCAGATCTG
GCTCAGTTCGCCCACCAGCGGTCCCAAGCGATACGATTTCGTCGGCACTGTGGCGGCGGGCAGATGGATC
TACAAGCACAGTGGTCAGTCGCTGCACGAACTGTTGCAGCAGGAGATACCCGGCATACTGAAGTCACAGT
CCGTGGACTTCCTACGCCTGCCCTACTGTAGTTAATTCCGTGATTAGTTTAAATTCTCCTCCATAAAAAG
TCGGTTGAAACGTTCGATTTTGATATATTTATTGTTCTTCATCTGTTGGCACAGTGGTCACTCGATATAC
ATGGAACTGCTGCTGCGGATGACCAAAGGTATATACTTATACTTCCCTGGAGCTGTGAAGCTTAGCTTCT
GGCATAAATGCTTTGCATTCGCTTATTCATTTATGTACGATTAGTTTTGGTTTCGAAGTTTAAATTTGTT
GTTTTTGAGAGGAATAAACTTAAAAATCAGTTGTTTAATGTATAAAAAAAAAAAAAAAAAA
1.- Analizar ambas secuencias, localizar las ORFs y describir las diferencias.
La primera secuencia cuenta con 17 OFR, así mismo el primer ORF tiene 159 nt y cuenta con , mientras que
la segunda secuencia tiene solo 5 ORF así mismo el primer ORF cuenta con 132 nt y 43 aa.
2- ¿Cuántas y cuáles enzimas con sitio de corte de 8pb cortan ambas secuencias?
3.- Si queremos clonar el ORF en un vector cuáles son las enzimas con las que cortaría el vector y el inserto?
HincII y Aatll.
Recuerde que la condición es que sean enzimas de corte único y que no interrumpan el ORF, si no más bien lo
abarquen completo.
4. Diga qué tipo de corte realizan las enzimas que eligió y de cuántas pb se conforma? Las enzimas
elegidas fueron Hincll está tiene cortes romos, así mismo cuenta con un único corte la cual cuenta
con 6 pb y Aatll que cuenta con cortes cohesivos así mismo cuenta con un unoc corte y a su vez tiene
6 pb
5.- Identifique las secuencias y diga a qué organismo pertenecen y a qué gen o secuencia
Se tiene la siguiente secuencia en estudio dentro de un instituto de secuenciación. Su tarea como analista es
decir la mayor información que pueda acerca de la secuencia en relación a las preguntas y pasos
siguientes…
AGTTAGCAAAGAGCCGAGGCCGGGCGCGCGACCCTCGTCCTTCTGCCCCTGGCCGCACACTTTGCGCACA
TCTCTTTTTCTGCATGGTGGATATTATTTTTCATTATCCTTTTCTGGGTGCTATGGGTGATCATTCCAAG
AAGAAGCCCGGGACGGCCATGTGCGTGGGCTGCGGGAGTCAGATCCACGACCAGTTTATCCTGCGGGTGT
CGCCCGACCTCGAGTGGCACGCGGCCTGCCTCAAGTGTGCCGAGTGCAGCCAGTACCTGGACGAGACGTG
CACGTGCTTCGTGAGAGACGGGAAGACCTACTGCAAGCGGGACTACGTCAGGCTGTTCGGCATCAAGTGC
GCCAAGTGCCAGGTGGGCTTCAGCAGCAGCGACCTGGTGATGAGGGCGCGGGACAGCGTGTACCACATCG
AGTGCTTCCGCTGCTCCGTGTGCAGCCGCCAGCTGCTGCCTGGGGACGAGTTCTCGCTGCGGGAGCACGA
GCTGCTCTGCCGCGCCGACCACGGCCTCCTGCTCGAGCGCGCCGCGGCCGGCAGCCCGCGCAGCCCCGGC
CCGCTTCCCGGCGCCCGCGGCCTGCATCTGCCCGGTAAGCGCGCCGGGGCCTGTGCCGGGGTGAGCGGGG
TGTATGTGCGTGCGTGTGTGTAGGGGTACGCTTGTGTCCCTAACGAGAAGTTGTCAGTTGTGTGTGGTTC
CGTCTGCCGGGATAGTGTTTTTCTGTATCAGTGCGGAACTGTGTGCTGGGAACAAGGCTGTGTGTGTTCT
CGTGTGCTCGGGAGAAACTGCGTGTGTATGAGTGTGTGAGCACGGAGAATTGTGCAGAATCGTGTTCTCC
ATGACCAGGAACATGCAGGGCACAGTGCTAGGAGCAGAAGAGTGGATGACAACAGGGAATCTTAAGTGGT
GTCCGTCTTGGGGCTTGTATTAGGAATTTCTTGGAGGAATATGTGTTATTGTCAGAGGGTAAGGTTTGCC
CAGGGGTATGTGTGTAAGTAACACAGCTCCAAACTGGGAGCTGGGCAGGAGCTTGGTCAGCCAGGAGCCA
AGAACCCAACAAAGAGGGGTTTTTGCCATCTTGTTTTGAGGCCCAGTTTGATGAACAATTTAGCCAGGTT
CTTCTGGGGGAGGGGGAGTATCAATGCATAGTGGACTGTCACTGGAATATTCTGGGTCCTAATCAGCAGC
TGCCCAGAGATGGGGTCTGAGTGTATAATGGGCAGGTACGGCTGAACAGAAACAGAGGTGCCTCCACCCC
AGGCAAGGCAGTTTCCCCCAGGTAGCCATAGGCCTGCAGCACAGATCCGCAGACCAGGCTGGGCCTCTGG
GTGCTGTGTGGCCTTGCCCCGCTCCTCCCCTCTCTGGATCTTCACTTCCTCCCTATAGAAAGAGGAAACT
GGGCTGGATGGGCTATTTGTAAATATTTGTCCAGACCTAGAAATTCGTAGAGGGGAACATAAACCGAAAT
GGTGCAGTACAGATCCACGGTATATATGGGTCGGGATCAAATGGAGATGTGAAATGGGAGCAAGCGGGTA
TTCAGTGCACCCCCATCTGGGATCTCGGAGAGGCTCCCCTTTGTTTGTTTCGGGCTTCAGGGTGCAGGCT
CTGGAATCAGTCACTGTTTCCCCGGGATGGAGAGAACCTGGGGCCAAGCGAGGAGAGTGCCAGCGGCTGC
TCAGCACCTTGGTCGGTGGGAGGCCACTGGGCTGGGGAACCTGGAGCCTTGAGGAAGGAGACAGGGGCCG
AAGCCCAAGGGCGGGCAGGAAGGAACTGTTGCAAGCCCTGGAGGCCCGTCCATAACCGTGGATGAGTCTT
CTACACATGTGGCCTGGCCCTGTCCAAATGGGCTCTGAAGGAGGGGAAGGGCCCTCGTAGGCCCCCGGCA
TATTCGCACCTCCCACCCAGTCCCCTGGGCAGCGCCTCGCCCTGGGTCCACGTCGGTCCCTTTCCCTCTC
CAGAGTCCTGGGCAAGCCTCTTTCCTCTTCCTCTGAAACTCCGACTTCTTCCGGAGGGCTTCGCTCGTTC
CGAGGGTCCTGCGACTGGAGGAGGCACATCCCTGAGCAGCCACTCCCTCCCCGCAGCGGCCTGTCGCCGA
GCTCCCGCGCCCTGCTTGAGCTCGGGAGAGATCGCTGCGGGGCAGTCCGGCCCGGGAGCGAGAGAAAGAA
CGAAAATGCACAGCTCTCTCCGAACGCTGGGTCGGGCCGGCAGCCCGCGTTGCGCCCGCACGTGCACAAG
CAGACGGAGAAGACGACCCGCGTGCGGACTGTGCTGAACGAGAAGCAGCTGCACACTCTGCGGACCTGCT
ACGCCGCCAACCCGCGGCCCGACGCTCTCATGAAGGAGCAGCTGGTGGAGATGACCGGCCTGAGCCCGCG
GGTCATCCGCGTCTGGTTCCAGAACAAGCGCTGCAAGGACAAGAAGAAATCCATTCTCATGAAGCAGCTG
CAGCAGCAGCAGCACAGCGACAAGACGAGCCTTCAGGGACTGACTGGGACGCCCCTGGTGGCGGGCAGTC
CCATCCGCCATGAGAACGCCGTGCAGGGCAGCGCAGTGGAGGTGCAGACGTACCAGCCGCCGTGGAAGGC
GCTCAGCGAGTTTGCCCTCCAGAGCGACCTGGACCAACCCGCCTTCCAACAGCTGGTCTCCTTCTCCGAG
TCCGGCTCCCTAGGCAACTCCTCCGGCAGCGACGTGACCTCCCTGTCCTCGCAGCTCCCGGACACCCCCA
ACAGTATGGTGCCGAGTCCCGTGGAGACGTGAGGGGGACCCCTCCCTGCCAGCCCGCGGACCTCGCATGC
TCCCTGCATGAGACTCACCCATGCTCAGGCCATTCCAGTTCCGAAAGCTCTCTCGCCTTCGTAATTATTC
TATTGTTATTTATGAGAGAGTACCGAGAGACACGGTCTGGACAGCCCAAGGCGCCAGGATGCAACCTGCT
TTCACCAGACTGCAGACCCCTGCTCCGAGGACTCTTAGTTTTTCAAAACCAGAATCTGGGACTTACCAGG
GTTAGCTCTGCCCTCTCCTCTCCTCTCTACGTGGCCGCCGCTCTGTCTCTCCACGCCCCACCTGTGTCCC
CATCTCGGCCGGCCCGGAGCTCGCCCACGCGGACCCCCGCCCTGCCCCAGCTCAGCGCTCCCTGGCGGCT
TCGCCCGGGCTCCTAGCGGGGAAAAGGAAGGGGATAACTCAGAGGAACAGACACTCAAACTCCCAAAGCG
CATGATTGCTGGGAAACAGTAGAAACCAGACTTGCCTTGAAAGTGTTTAAGTTATTCGACGGAGGACAGA
GTATGTGAGCCTTTGCCGAACAAACAAACGTAAGTTATTGTTATTTATTGTGAGAACAGCCAGTTCATAG
TGGGACTTGTATTTTGATCTTAATAAAAAATAATAACCCGG
2.- Elegir el ORF con mayor potencial para ser proteína y someterlo a traducción
3.- Con la secuencia traducida deberá decir con qué tipo de organismo y gen tiene mayor identidad.
La secuencia traducida es del organismo homo sapiens, ya que este a su vez es una homeobox, así mismo,
pertenece al gen del cromosoma 15, GRCh38 de homo sapiens.
4- Si queremos clonar el ORF en un vector cuáles son las enzimas con las que cortaría el vector y el inserto?
Las enzimas con las que se cortaria el vector y el inserto, serian en este caso PshAl ya que es una enzima de
corte unico y a su vez es una enzima con cortes romos, está cuenta con 10 pb y Srfl, ya que es una enzima
de corte unico y a su vez cuenta con cortes romos, está enzima es de 8 pb
Recuerde que la condición es que sean enzimas de corte único y que no interrumpan el ORF, si no más bien
lo abarquen completo.
4. Diga qué tipo de corte realizan las enzimas que eligió y de cuántas pb se conforma?
Las enzimas con las que se cortaría el vector y el inserto, serian en este caso PshAl ya que es una enzima de
corte unico y a su vez es una enzima con cortes romos, está cuenta con 10 pb y Srfl, ya que es una enzima
de corte unico y a su vez cuenta con cortes romos, está enzima es de 8 pb
5.- Identifique las secuencias y diga a qué organismo pertenecen y a qué gen o secuencia
corresponden
La secuencia traducida es del organismo homo sapiens, ya que este a su vez es una homeobox, así mismo,
pertenece al gen del cromosoma 15, GRCh38 de homo sapiens.