Está en la página 1de 22

Herramientas de análisis bioinformático

Una secuencia de nucleótidos no nos aporta ninguna información, salvo que seamos capaces de descifrarla.
Para ello, debemos conocer el código de cifrado y tener las herramientas necesarias para descifrar la secuencia
de una cadena de ADN. Usando estas herramientas podemos predecir sin datos experimentales que
información contiene la secuencia. Podemos predecir la secuencia de la proteína que codifica, la localización
de exones e intrones, etc. Pero hay que tener en cuenta que el resultado que obtenemos es una predicción
teórica que deberá ser confirmada mediante experimentos. La predicción de las estructuras presentes en una
secuencia y el descifrado de la información son de vital importancia en los proyectos genoma; ya que nos
enfrentamos a una secuencia que contiene numerosos genes que no han sido estudiados experimentalmente
y de los cuales no se tiene ninguna información previa.

Conversión del formato GenBank a Fasta.


Ahora pruebe ésta página; www.bioinformatics.org/sms2/

SMS es una suite de manipulación de secuencias, es decir, es una caja de herramientas, o página que contiene
programas para el análisis y modificación de las secuencias. A la izquierda se encuentra el índice de las
herramientas que nos ofrece. Con el número de acceso L12047 pruebe a convertir el formato GenBank a fasta.

Traducción de una secuencia de nucleótidos


Traducir una secuencia es una de las predicciones más fáciles. Conocemos el código de la información y no
presenta ninguna complicación el análisis. El código es el código genético: cada aminoácido es codificado por
unos varios tripletes y las señales de inicio y parada también están codificadas por tripletes. Lo único que
tenemos que hacer es transcribir a ARN y leer la secuencia en formato triplete.
ADN AGG TTT ACA TGT AGA GGA.....TGA

ARN AGG UUU ACA UGU AGA GGA UGA

PROT Arg Phe Thr Cys Arg Ala Fin

Para traducir un fragmento sin tomar en cuenta el codón de inicio, es decir, leyendo desde el primer
nucleótido, podemos utilizar un programa muy simple que se encuentra en la misma página que el anterior:

Además también se puede traducir en el sentido inverso, es decir la cadena complementaria.


Pero en ocasiones, cuando necesitamos obtener el marco abierto de lectura (ORF), es decir, que el programa
ubique desde el codón de inicio hasta el codón de paro, el primer problema que nos planteamos es donde
empezamos a traducir, ya que la traducción será diferente si comenzamos en el primer nucleótido, en el
segundo o en el tercero.
ADN AGG TTT ACA TGT AGA GGA .....TGA

RNA1 AGG UUU ACA UGU AGA GGA......UGA

PROT1 Arg Phe Thr Cys Arg Ala ………..Fin

RNA2 GGU UUA CAU GUA GAG GAU.....

PROT2 Gly Fin Leu Val Glu Asp.....

RNA3 GUU UAC AUG UAG AGG AUG....


PROT3 Val Tyr Met Fin Arg Met ...

Así que para éstas funciones se recomienda un programa llamado ORFfinder

Búsqueda de ORF (marco abierto de lectura) ORFinder.


Un fragmento de ADN tiene seis pautas de lecturas posible, por lo que analizarlas manualmente o con un
programa de corto alcance sería muy costoso en tiempo. Utilizaremos la herramienta de traducción de NCBI
que puede encontrar en su página o en éste vínculo Open Reading Frame Finder (ORF Finder)

O mediante ésta ruta: NCBI>All resources>Tools>Open reading frame finder (ORF Finder)

y analice la siguiente secuencia, cópiela y péguela en el recuadro:


CAGAGAAAATCAAAAAGCAGGCCACGCAGGGTGATGAATTAACAATAAAAATGGTTAAAAACCCCGATAT
CGTCGCAGGCGTTGCCGCACTAAAAGACCATCGACCCTACGTCGTTGGATTTGCCGCCGAAACAAATAAT
GTGGAAGAATACGCCCGGCAAAAACGTATCCGTAAAAACCTTGATCTGATCTGCGCGAACGATGTTTCCC
AGCCAACTCAAGGATTTAACAGCGACAACAACGCATTACACCTTTTCTGGCAGGACGGAGATAAAGTCTT
ACCGCTTGAGCGCAAAGAGCTCCTTGGCCAATTATTACTCGACGAGATCGTGACCCGTTATGATGAAAAA
AATCGACGTTAAGATTCTGGACCCGCGCGTTGGGAAGGAATTTCCGCTCCCGACTTATGCCACCTCTGGC
TCTGCCGGACTTGACCTGCGTGCCTGTCTCAACGACGCCGTAGAACTGGCTCCGGGTGACACTACGCTGG
El programa ORFfinder realizará la traducción de las seis pautas de un fragmento de ADN y para decidir cuál
sería la que con mayor probabilidad es el ORF verdadero, puede decirse que generalmente, la región mejor
traducida y probablemente la que en la realidad se traduce dentro de la célula, es el fragmento más largo, o
mayor a 300 pb. En este caso se corresponde con la secuencia de 5’-3’ Frame 3, es decir el marco abierto de
lectura 3. Note que todas la secuencias respetan las leyes del código genético, comienzan con Metionina y
terminan con un codón de paro.

RESULTADOS

Según los resultados obtenidos son tres ORF encontrados y lo mejor de éste ORFfinder es
que podemos seleccionar uno de los tres marcos de lectura para hacer un BLASTp y
verificar la identidad de la secuencia de proteína traducida. ¿cuál es la identidad del
ORF más largo? La identidad del ORF más largo es de 312 nt, es decir el largo de la
cadena es de 312 nt, asi mismo cuenta con 103 aa

Recuerde que normalmente un ORF mayor de 300 pb ya es adecuado para una proteína.

1.- ¿Cuántos ORF encontró con el programa utilizado? son tres marcos abiertos de lectura

2.- ¿cuál de los posibles ORF que encontró podría generar en la realidad una proteína? Solo un ORF es capaz de
generar una proteína, siendo a su vez el ORF3 ya que cuenta con 312 nt, de este modo ya es adecuado.
3.- Ahora debemos traducir todas las ORF cada una de manera individual y comprobar por separado si
alguna de ellas presenta alta similitud con proteínas conocidas. Solamente aquélla que presente similitud
significativa podrá representar una proteína y así podemos decir cuál de todos esos ORF es el que tiene
verdadero potencial de ser un gen. El ORF con mayor similitud es el ORF3, ya que además de presentar 312
nt para proteína, tiene un valor de cobertura de 100% y un valor de identidad de 100%

Traducción inversa
También podemos deducir la secuencia de nucleótidos a partir de una secuencia de aminoácidos. El problema
es que hay varios codones que pueden codificar el mismo aminoácido, por lo que la secuencia calculada
tendrá ambigüedades. Utiliza primero “Reverse Translate” de la suite SMS y compara su resultado con el
Programa europeo Embossbacktranambing https://www.ebi.ac.uk/Tools/st/emboss_backtranambig/
Búsqueda de dianas de restricción (palíndromos), obtención del mapa
de restricción de una secuencia.
Estas herramientas localizan en la secuencia dianas de enzimas de restricción. Necesitamos una base de datos
de las secuencias reconocidas por las diferentes enzimas, por ejemplo: Rebase. El programa nos localizará las
dianas identificándolas en nuestra secuencia. Uno de los programas que podemos utilizar es NEBCUTTER que
se encuentra en la siguiente página https://www.neb.com/tools-and-resources/interactive-tools, en la que
podrá encontrar además otras herramientas.

Copie la siguiente secuencia y dé un click a SUBMIT.

>CY040888.1 Influenza A virus (A/Mexico/47N/2009(H1N1)) segment 4 sequence


ATGAAGGCAATACTAGTAGTTCTGCTATATACATTTGCAACCGCAAATGCAGACACATTATGTATAGGTT
ATCATGCGAACAATTCAACAGACACTGTAGACACAGTACTAGAAAAGAATGTAACAGTAACACACTCTGT
TAACATTCTAGAAGACAAGCATAACGGGAAACTATGCAAACTAAGAGGGGTAGCCCCATTGCATTTGGGT
AAATGCAACATTGCTGGCTGGATCCTGGGAAATCCAGAGTGTGAATCACTCTCCACAGCAAGCTCATGGT
CCTACATTGTGGAAACATCTAGTTCAGACAATGGAACGTGTTACCCAGGAGATTTCATCGATTATGAGGA
GCTAAGAGAGCAATTGAGCTCAGTGTCATCATTTGAAAGGTTTGAGATATTCCCCAAGACAAGTTCATGG
CCCAATCATGACTCGAACAAAGGTGTAACGGCAGCATGTCCTCATGCTGGAGCAAAAAGCTTCTACAAAA
ATTTAATATGGCTAGTTAAAAAAGGAAATTCATACCCAAAGCTCAGCAAATCCTACATTAATGATAAAGG
GAAAGAAGTCCTCGTGCTATGGGGCATTCACCATCCATCTACTAGTGCTGACCAACAAAGTCTCTATCAG
AATGCAGATGCATATGTTTTTGTGGGGTCATCAAGATACAGCAAGAAGTTCAAGCCGGAAATAGCAATAA
GACCCAAAGTGAGGGATCAAGAAGGGAGAATGAACTATTACTGGACACTAGTAGAGCCGGGAGACAAAAT
AACATTCGAAGCAACTGGAAATCTAGTGGTACCGAGATATGCATTCGCAATGGAAAGAAATGCTGGATCT
GGTATTATCATTTCAGATACACCAGTCCACGATTGCAATACAACTTGTCAGACACCCAAGGGTGCTATAA
ACACCAGCCTCCCATTTCAGAATATACATCCGATCACAATTGGAAAATGTCCAAAATATGTAAAAAGCAC
AAAATTGAGACTGGCCACAGGATTGAGGAATGTCCCGTCTATTCAATCTAGAGGCCTATTTGGGGCCATT
GCCGGTTTCATTGAAGGGGGGTGGACAGGGATGGTAGATGGATGGTACGGTTATCACCATCAAAATGAGC
AGGGGTCAGGATATGCAGCCGACCTGAAGAGCACACAGAATGCCATTGACGAGATTACTAACAAAGTAAA
TTCTGTTATTGAAAAGATGAATACACAGTTCACAGCAGTAGGTAAAGAGTTCAACCACCTGGAAAAAAGA
ATAGAGAATTTAAATAAAAAAGTTGATGATGGTTTCCTGGACATTTGGACTTACAATGCCGAACTGTTGG
TTCTATTGGAAAATGAAAGAACTTTGGACTACCACGATTCAAATGTGAAGAACTTATATGAAAAGGTAAG
AAGCCAGCTAAAAAACAATGCCAAGGAAATTGGAAACGGCTGCTTTGAATTTTACCACAAATGCGATAAC
ACGTGCATGGAAAGTGTCAAAAATGGGACTTATGACTACCCAAAATACTCAGAGGAAGCAAAATTAAACA
GAGAAGAAATAGATGGGGTAAAGCTGGAATCAACAAGGATTTACCAGATTTTGGCGATCTATTCAACTGT
CGCCAGTTCATTGGTACTGGTAGTCTCCCTGGGGGCAATCAGTTTCTGGATGTGCTCTAATGGGTCTCTA
CAGTGTAGAATATGTATTTAA

Se desplegará un mapa de restricción de la secuencia. Además también le muestra un marco abierto de


lectura (ORF) de 566 aminoácidos representado por una barra gris sobre el mapa de restricción.
¿Cuántas veces corta la enzima KpnI? Hace un corte en 802, es decir en GGTACC
En el cuadro de abajo a la izquierda acceda al enlace “custom digest”, aparecerá una lista de las enzimas que
cortan el fragmento. Seleccione únicamente KpnI y vuelva a digerir, para esto, presione el botón verde de
abajo a la derecha “digest”.
Ahora solo aparece el mapa de restricción con la enzima elegida: KpnI. Presione “View gel”, que se encuentra
abajo a la derecha. Aparecerá la representación del gel. Seleccione un marcador de 100 pares de bases. Y
ahora vuelva a realizar una nueva digestión “new custom digest” y seleccione una enzima que corte dos veces
el fragmento, también añada una tercera enzima que corte el fragmento 3 veces.

1.- represente ésta triple digestión en el gel (“View gel). Colocando el cursor sobre el nombre de cada
enzima se puede entrar a un enlace en el que se describen las características de la enzima elegida, así como
las condiciones de incubación y el tiempo de digestión.
2.- Diga a qué temperatura se tiene que llevar a cabo la triple digestión.

La temperatura a la que se lleva a cabo es de 65ª C

3.- También comente qué tipo de extremos (cohesivos o romos) genera cada enzima en el ADN y pegue la
imagen representativa del corte. Escriba una conclusión para estos resultados.
El tipo de corte que genera la enzima de triple digestion es de tipo cohesivos, mientras quela otra enzima es
de corte cohesivo

EJERCÍCIO 1
Vamos a localizar pautas abiertas de lectura en dos secuencias. Utiliza los programas que revisamos para ORF.

GCAGTTCCGCCTCAAGTTTGGTCTGGTGCATCGTCAACGAGCTGACCTGCCGCTTGAGCACCTGCATCCGCGTGGTGGTCACCACTGAACGCACATCTGGTACAACGGCCT
CCGAGAATATCTCGTTAATCAGGCGATGGTTGTGCAGATAGCGGGCGTAGGCCAAGTGCTTGGTCGTATACCCTTCGTCCTGGTCATCCTCGTCCTCCGCCGGCTGAATGT
CGATGCGTCGCTCATGCTGCGACTTACTGCCGCCACCGCGTGACGGTGTCTCATGCATATCCACGTCGGTCTTCACCTTGCTTTTGGCCGACATGTAGGCCTGATAGGCGG
GCGTCTGGTGGTAGGCCTTTAGCGATTTCTCGTACTCCAGCTTCTCCGCCTCGTATTCGTCAATGAACTCCGTCTTCTCATCCTCGGGCAGCAACTTCCACATGGCACCGA
TCTTCTTACCCAGCTCCCACAGCTTCAGCTCTGGATGCTTCGCCTTGACGCTATCCCAGACGCGTTTCGAATACCGCATGTAGGGCAAAATGGGCTTCTCCGGCGGCTTTG
GTGGCTTGGGTAGCCTTGATTCGTTCTGGTTCTTGCTGCTCGACGACTTGGTTACCTTCTGTGGCGTGAATGCCGGATTCCCATAGTTGCTGTGCGTGAAGATGGGCGTCT
GATCCTTGTTGCGATCGCCACCACCTCCGCCGCCGGATGAACGCGCGCAGCTGCCGCCGCCGGAGCCACCGCCGCCGCCCTGGAGTGGTGTGGCCGATCCCTGGCCGCCAA
CGGCTATCTGCTTGTAGTTGCTTGGCAGGGCCATCTTTGTGCAATTCGCTGGTCAAATTTGTATGGATTTTCCAAGAGAAATAACAATTTTCAGACAGACGCCATTTTCTG
TCGGCGTTGGTGGAGGTGTGGCCGTACCTGATTCTAAGAAAAATCATATAAACCGGGAATTGGCATATATAGCGGAATATATATGATAAGGAAATAGTAACTGCTAGAGAA
TATACAAAATTTTAGTTACCTAAAACTAGCAGAACACTTTAGCTGAATTGCTGCTACTTATAAAAAAAATCTGTAACTTCTCATTTTTATTCAGCTTTATAGAAATCAAAA
ATTATACCACACTAGAATCTAGAAAATACCAACGGCAAATCATTTTCCATTAAGTTGGCAGCCCCGCAACTGGGATTTGTAAAATATAAACAAATCGTAAACAACTAAAAA
ATGTTTGCCGGTCGTTTGATGGTCCGTTCGATCGTTGGTCGGGCATGCTTGGCCACCATGGGCAGGTGGTCAAAGCCCCAAGCACACGCCAGCCAAGTGATCCTGCCCAGC
ACACCAGCGATAGCCGCAGTTGCTATTCAATGCGAGGAATTCACTGCCAACCGGCGATTGTTTAGCAGTCAAATTGAGACGGAATCCACATTGGACGGCGCCACCTACGAG
CGTGTGTGCTCCGACACCCTGGACGCACTGTGCGACTACTTCGAGGAGCTGACGGAGAACGCCTCCGAGCTGCAGGGCACGGATGTGGCTTACAGCGTAGGTGACATTCGG
CTATTACATCATTCCATTGACCTGCTAATCCTCGCGGGGTTTCCGCTTCCACAGGAATGGCGTGCTAACCGTGAACCTGGGAGGACAGCACGGCACCTATGTGATCAACCG
GCAGACGCCCAACAAGCAGATCTGGCTCAGTTCGCCCACCAGCGGTCCCAAGCGATACGATTTCGTCGGCACTGTGGCGGCGGGCAGATGGATCTACAAGCACAGTGGTCA
GTCGCTGCACGAACTGTTGCAGCAGGAGATACCCGGCATACTGAAGTCACAGTCCGTGGACTTCCTACGCCTGCCCTACTGTAGTTAATTCCGTGATTAGTTTAAATTCTC
CTCCATAAAAAGTCGGTTGAAACGTTCGATTTTGATATATTTATTGTTCTTCATCTGTTGGCACAGTGGTCACTCGATATACATGGAACTGCTGCTGCTGCGGATGACCAA
AGGTATATACTTATACTTCCCTGGAGCTGTGAAGCTTAGCTTCTGGCATAAATGCTTTGCATTCGCTTATTCATTTATGTACGATTAGTTTTGGTTTCGAAGTTTAAATTT
GTTGTTTTTGAGAGGAATAAACTTAAAAATCAGTTGTTTAATGTATAAATCAAATAATAATAATCAAATCACCATTGAAGAACATCATATGTAGCTATACATATTTTATTT
TATTTTATTATTTGTCACTTGTACGTTCCATTTCGTTTATTTTTATTTCAATACACAGAATTCAGAACTCAAAGCTCCCCCAGCTAATAATTCCAAACGAAAGTCGATTAA
AGTTGATTTCCGGAATTATTGTGTATGTTTATTCACGTGCTCTTCAGATTTATGTTTTCTGAATTCTATTGTTGTTCGGTGTTTTATAAACAAATGAAGGTAGTGATTATT
TTCTTTTCTTTTTTTTGGCAGCAGCACACATGTATGGTAAAAAAAAAAAATAACAAAAATCACTTGCCAGCTAGCAAATACACGGGCACTTCAAAGGGCGTTATTCTCGTT
TCTACATTACGTTTAAATTGCATAACGTTAATAGTATGGATATCTAAGTCTACGACACTCTAGTGACGTCCACCGAACATGTTGTTAAAGTGCGGCTGCTGCTGCTGCTGC
TGCTGCTGGGCACCCATAAA
ACAAATCGTAAACAACTAAAAAATGTTTGCCGGTCGTTTGATGGTCCGTTCGATCGTTGGTCGGGCATGC
TTGGCCACCATGGGCAGGTGGTCAAAGCCCCAAGCACACGCCAGCCAAGTGATCCTGCCCAGCACACCAG
CGATAGCCGCAGTTGCTATTCAATGCGAGGAATTCACTGCCAACCGGCGATTGTTTAGCAGTCAAATTGA
GACGGAATCCACATTGGACGGCGCCACCTACGAGCGTGTGTGCTCCGACACCCTGGACGCACTGTGCGAC
TACTTCGAGGAGCTGACGGAGAACGCCTCCGAGCTGCAGGGCACGGATGTGGCTTACAGCGATGGCGTGC
TAACCGTGAACCTGGGAGGACAGCACGGCACCTATGTGATCAACCGGCAGACGCCCAACAAGCAGATCTG
GCTCAGTTCGCCCACCAGCGGTCCCAAGCGATACGATTTCGTCGGCACTGTGGCGGCGGGCAGATGGATC
TACAAGCACAGTGGTCAGTCGCTGCACGAACTGTTGCAGCAGGAGATACCCGGCATACTGAAGTCACAGT
CCGTGGACTTCCTACGCCTGCCCTACTGTAGTTAATTCCGTGATTAGTTTAAATTCTCCTCCATAAAAAG
TCGGTTGAAACGTTCGATTTTGATATATTTATTGTTCTTCATCTGTTGGCACAGTGGTCACTCGATATAC
ATGGAACTGCTGCTGCGGATGACCAAAGGTATATACTTATACTTCCCTGGAGCTGTGAAGCTTAGCTTCT
GGCATAAATGCTTTGCATTCGCTTATTCATTTATGTACGATTAGTTTTGGTTTCGAAGTTTAAATTTGTT
GTTTTTGAGAGGAATAAACTTAAAAATCAGTTGTTTAATGTATAAAAAAAAAAAAAAAAAA
1.- Analizar ambas secuencias, localizar las ORFs y describir las diferencias.

La primera secuencia cuenta con 17 OFR, así mismo el primer ORF tiene 159 nt y cuenta con , mientras que
la segunda secuencia tiene solo 5 ORF así mismo el primer ORF cuenta con 132 nt y 43 aa.

2- ¿Cuántas y cuáles enzimas con sitio de corte de 8pb cortan ambas secuencias?

Son 2 la primera es AsiSi y la segunda es Nt.BspQI

3.- Si queremos clonar el ORF en un vector cuáles son las enzimas con las que cortaría el vector y el inserto?
HincII y Aatll.
Recuerde que la condición es que sean enzimas de corte único y que no interrumpan el ORF, si no más bien lo
abarquen completo.

4. Diga qué tipo de corte realizan las enzimas que eligió y de cuántas pb se conforma? Las enzimas

elegidas fueron Hincll está tiene cortes romos, así mismo cuenta con un único corte la cual cuenta

con 6 pb y Aatll que cuenta con cortes cohesivos así mismo cuenta con un unoc corte y a su vez tiene

6 pb
5.- Identifique las secuencias y diga a qué organismo pertenecen y a qué gen o secuencia

corresponden Las secuencias pertenecen a frataxin perteneciente a drosophila melanogaster.


Ejercício 2

Se tiene la siguiente secuencia en estudio dentro de un instituto de secuenciación. Su tarea como analista es
decir la mayor información que pueda acerca de la secuencia en relación a las preguntas y pasos
siguientes…
AGTTAGCAAAGAGCCGAGGCCGGGCGCGCGACCCTCGTCCTTCTGCCCCTGGCCGCACACTTTGCGCACA
TCTCTTTTTCTGCATGGTGGATATTATTTTTCATTATCCTTTTCTGGGTGCTATGGGTGATCATTCCAAG
AAGAAGCCCGGGACGGCCATGTGCGTGGGCTGCGGGAGTCAGATCCACGACCAGTTTATCCTGCGGGTGT
CGCCCGACCTCGAGTGGCACGCGGCCTGCCTCAAGTGTGCCGAGTGCAGCCAGTACCTGGACGAGACGTG
CACGTGCTTCGTGAGAGACGGGAAGACCTACTGCAAGCGGGACTACGTCAGGCTGTTCGGCATCAAGTGC
GCCAAGTGCCAGGTGGGCTTCAGCAGCAGCGACCTGGTGATGAGGGCGCGGGACAGCGTGTACCACATCG
AGTGCTTCCGCTGCTCCGTGTGCAGCCGCCAGCTGCTGCCTGGGGACGAGTTCTCGCTGCGGGAGCACGA
GCTGCTCTGCCGCGCCGACCACGGCCTCCTGCTCGAGCGCGCCGCGGCCGGCAGCCCGCGCAGCCCCGGC
CCGCTTCCCGGCGCCCGCGGCCTGCATCTGCCCGGTAAGCGCGCCGGGGCCTGTGCCGGGGTGAGCGGGG
TGTATGTGCGTGCGTGTGTGTAGGGGTACGCTTGTGTCCCTAACGAGAAGTTGTCAGTTGTGTGTGGTTC
CGTCTGCCGGGATAGTGTTTTTCTGTATCAGTGCGGAACTGTGTGCTGGGAACAAGGCTGTGTGTGTTCT
CGTGTGCTCGGGAGAAACTGCGTGTGTATGAGTGTGTGAGCACGGAGAATTGTGCAGAATCGTGTTCTCC
ATGACCAGGAACATGCAGGGCACAGTGCTAGGAGCAGAAGAGTGGATGACAACAGGGAATCTTAAGTGGT
GTCCGTCTTGGGGCTTGTATTAGGAATTTCTTGGAGGAATATGTGTTATTGTCAGAGGGTAAGGTTTGCC
CAGGGGTATGTGTGTAAGTAACACAGCTCCAAACTGGGAGCTGGGCAGGAGCTTGGTCAGCCAGGAGCCA
AGAACCCAACAAAGAGGGGTTTTTGCCATCTTGTTTTGAGGCCCAGTTTGATGAACAATTTAGCCAGGTT
CTTCTGGGGGAGGGGGAGTATCAATGCATAGTGGACTGTCACTGGAATATTCTGGGTCCTAATCAGCAGC
TGCCCAGAGATGGGGTCTGAGTGTATAATGGGCAGGTACGGCTGAACAGAAACAGAGGTGCCTCCACCCC
AGGCAAGGCAGTTTCCCCCAGGTAGCCATAGGCCTGCAGCACAGATCCGCAGACCAGGCTGGGCCTCTGG
GTGCTGTGTGGCCTTGCCCCGCTCCTCCCCTCTCTGGATCTTCACTTCCTCCCTATAGAAAGAGGAAACT
GGGCTGGATGGGCTATTTGTAAATATTTGTCCAGACCTAGAAATTCGTAGAGGGGAACATAAACCGAAAT
GGTGCAGTACAGATCCACGGTATATATGGGTCGGGATCAAATGGAGATGTGAAATGGGAGCAAGCGGGTA
TTCAGTGCACCCCCATCTGGGATCTCGGAGAGGCTCCCCTTTGTTTGTTTCGGGCTTCAGGGTGCAGGCT
CTGGAATCAGTCACTGTTTCCCCGGGATGGAGAGAACCTGGGGCCAAGCGAGGAGAGTGCCAGCGGCTGC
TCAGCACCTTGGTCGGTGGGAGGCCACTGGGCTGGGGAACCTGGAGCCTTGAGGAAGGAGACAGGGGCCG
AAGCCCAAGGGCGGGCAGGAAGGAACTGTTGCAAGCCCTGGAGGCCCGTCCATAACCGTGGATGAGTCTT
CTACACATGTGGCCTGGCCCTGTCCAAATGGGCTCTGAAGGAGGGGAAGGGCCCTCGTAGGCCCCCGGCA
TATTCGCACCTCCCACCCAGTCCCCTGGGCAGCGCCTCGCCCTGGGTCCACGTCGGTCCCTTTCCCTCTC
CAGAGTCCTGGGCAAGCCTCTTTCCTCTTCCTCTGAAACTCCGACTTCTTCCGGAGGGCTTCGCTCGTTC
CGAGGGTCCTGCGACTGGAGGAGGCACATCCCTGAGCAGCCACTCCCTCCCCGCAGCGGCCTGTCGCCGA
GCTCCCGCGCCCTGCTTGAGCTCGGGAGAGATCGCTGCGGGGCAGTCCGGCCCGGGAGCGAGAGAAAGAA
CGAAAATGCACAGCTCTCTCCGAACGCTGGGTCGGGCCGGCAGCCCGCGTTGCGCCCGCACGTGCACAAG
CAGACGGAGAAGACGACCCGCGTGCGGACTGTGCTGAACGAGAAGCAGCTGCACACTCTGCGGACCTGCT
ACGCCGCCAACCCGCGGCCCGACGCTCTCATGAAGGAGCAGCTGGTGGAGATGACCGGCCTGAGCCCGCG
GGTCATCCGCGTCTGGTTCCAGAACAAGCGCTGCAAGGACAAGAAGAAATCCATTCTCATGAAGCAGCTG
CAGCAGCAGCAGCACAGCGACAAGACGAGCCTTCAGGGACTGACTGGGACGCCCCTGGTGGCGGGCAGTC
CCATCCGCCATGAGAACGCCGTGCAGGGCAGCGCAGTGGAGGTGCAGACGTACCAGCCGCCGTGGAAGGC
GCTCAGCGAGTTTGCCCTCCAGAGCGACCTGGACCAACCCGCCTTCCAACAGCTGGTCTCCTTCTCCGAG
TCCGGCTCCCTAGGCAACTCCTCCGGCAGCGACGTGACCTCCCTGTCCTCGCAGCTCCCGGACACCCCCA
ACAGTATGGTGCCGAGTCCCGTGGAGACGTGAGGGGGACCCCTCCCTGCCAGCCCGCGGACCTCGCATGC
TCCCTGCATGAGACTCACCCATGCTCAGGCCATTCCAGTTCCGAAAGCTCTCTCGCCTTCGTAATTATTC
TATTGTTATTTATGAGAGAGTACCGAGAGACACGGTCTGGACAGCCCAAGGCGCCAGGATGCAACCTGCT
TTCACCAGACTGCAGACCCCTGCTCCGAGGACTCTTAGTTTTTCAAAACCAGAATCTGGGACTTACCAGG
GTTAGCTCTGCCCTCTCCTCTCCTCTCTACGTGGCCGCCGCTCTGTCTCTCCACGCCCCACCTGTGTCCC
CATCTCGGCCGGCCCGGAGCTCGCCCACGCGGACCCCCGCCCTGCCCCAGCTCAGCGCTCCCTGGCGGCT
TCGCCCGGGCTCCTAGCGGGGAAAAGGAAGGGGATAACTCAGAGGAACAGACACTCAAACTCCCAAAGCG
CATGATTGCTGGGAAACAGTAGAAACCAGACTTGCCTTGAAAGTGTTTAAGTTATTCGACGGAGGACAGA
GTATGTGAGCCTTTGCCGAACAAACAAACGTAAGTTATTGTTATTTATTGTGAGAACAGCCAGTTCATAG
TGGGACTTGTATTTTGATCTTAATAAAAAATAATAACCCGG

1.- Analizar la secuencia, decir cuántos ORFs tiene según el ORFfinder.


Los ORF’s encontrados son 24

2.- Elegir el ORF con mayor potencial para ser proteína y someterlo a traducción

La proteína elegida es aquel ORF21, ya que tiene una longitud mayor de nt y de aa

3.- Con la secuencia traducida deberá decir con qué tipo de organismo y gen tiene mayor identidad.
La secuencia traducida es del organismo homo sapiens, ya que este a su vez es una homeobox, así mismo,
pertenece al gen del cromosoma 15, GRCh38 de homo sapiens.

4- Si queremos clonar el ORF en un vector cuáles son las enzimas con las que cortaría el vector y el inserto?

Las enzimas con las que se cortaria el vector y el inserto, serian en este caso PshAl ya que es una enzima de
corte unico y a su vez es una enzima con cortes romos, está cuenta con 10 pb y Srfl, ya que es una enzima
de corte unico y a su vez cuenta con cortes romos, está enzima es de 8 pb
Recuerde que la condición es que sean enzimas de corte único y que no interrumpan el ORF, si no más bien
lo abarquen completo.
4. Diga qué tipo de corte realizan las enzimas que eligió y de cuántas pb se conforma?

Las enzimas con las que se cortaría el vector y el inserto, serian en este caso PshAl ya que es una enzima de
corte unico y a su vez es una enzima con cortes romos, está cuenta con 10 pb y Srfl, ya que es una enzima
de corte unico y a su vez cuenta con cortes romos, está enzima es de 8 pb
5.- Identifique las secuencias y diga a qué organismo pertenecen y a qué gen o secuencia

corresponden

La secuencia traducida es del organismo homo sapiens, ya que este a su vez es una homeobox, así mismo,
pertenece al gen del cromosoma 15, GRCh38 de homo sapiens.

También podría gustarte