Está en la página 1de 10

BIOINFORMÁTICA (BII) virtual

TAREA INDIVIDUAL: 07
Nombre del alumno: Edgar Fernando Maldonado Alvarez
Fecha: 04/11/2020
Grupo: 7”C”
Cuatrimestre: Septiembre - Diciembre 2020 03
Docente: Dr. Emiliano Villordo Pineda.

I. A partir de la Tarea 1.2, elige tres secuencias de nucleótidos y realiza un


análisis de PROTEIN BLAST (blastx), utilizando la database: NON-
REDUNDANT PROTEIN SEQUENCE. Para cada secuencia se debe incluir:

a. Porcentaje de identidad
b. E value (expect)
c. Imagen de alineamiento
d. Numero de Gaps
e. Accession
i. Definicion
ii. Numero de Accession
iii. Source Organism
iv. Autores
v. Journal

Página 1 de 10
Departamento de Ingeniería en Biotecnología. Universidad Politécnica de Guanajuato, Av.
Universidad Sur 1001, Comunidad Juan Alonso, Cortázar Guanajuato, México 38483, Teléfono
(461) 44 14 300, Fax: (461) 4414 328.

BIOINFORMATICA

TAREA 07:
BLAST
7°C

Integrantes:
Edgar Fernando Maldonado Alvarez

Profesor: Dr. Emiliano Villordo Pineda Fecha de entrega: 04/11/2020

Página 2 de 10
Introducción

La comunidad científica que realiza investigación dentro del área biológica, en el


afán de encontrar respuestas a estudios de la estructura molecular y las
secuencias de ADN, día a día se enfrenta a mayores retos que implican el manejo
de enormes volúmenes de datos que crecen de manera exponencial en tamaño y
complejidad, debido a los avances tecnológicos que permiten hacer cálculos más
precisos (Kumar, S., & Filipski, A., 2007).
Afortunadamente, el desarrollo tecnológico en el ámbito del desarrollo de software
y computacional ha permitido un avance significativo en las técnicas de
procesamiento y análisis inteligente de datos, beneficiando los estudios científicos
que permiten conocer mejor las estructuras de los organismos vivos (Martinez
Ortiz, 2018).
Las tareas más importantes de las que se ocupa la Bioinformatica consisten en
entender las correlaciones, las estructuras y los patrones en los datos biológicos.
El análisis de la secuencia de ADN, es el descubrimiento de similitudes
funcionales y estructurales, y las diferencias entre múltiples secuencias biológicas.
Esto puede hacerse comparando las nuevas (desconocidas) con las bien
estudiadas y anotadas (conocidas) secuencias. Este análisis incluye la alineación
de secuencias, la búsqueda en la base de datos de secuencias, el descubrimiento
de patrones, la reconstrucción de las relaciones evolutivas, y la formación y la
comparación del genoma (Escobar, 2011).
Los científicos han encontrado que dos secuencias similares poseen el mismo
papel funcional. La comparación se puede hacer desde aspectos de
comportamiento bioquímico o de acuerdo a la estructura de la proteina. Si dos
secuencias de diferentes organismos son similares, se dice que son secuencias
homologas. En el proceso de alineamiento de secuencias se comparan las
secuencias mediante la búsqueda de patrones de caracteres comunes y el
establecimiento de los residuos de correspondencia entre las secuencias
relacionadas (Escobar, 2011).
Un concepto importante en el análisis de la secuencia es una homología de
secuencia. Cuando dos secuencias son descendientes de un origen evolutivo
común, se dice que tienen una relación homologa u homología(Escobar, 2011).

Página 3 de 10
I. A partir de la Tarea 1.2, elige tres secuencias de nucleótidos y realiza un
análisis de PROTEIN BLAST (blastx), utilizando la database: NON-
REDUNDANT PROTEIN SEQUENCE.

Secuencia de Nucleótidos (1):

>MK450794.1 Aspergillus niger strain CMV005G9 RNA polymerase II second


largest subunit gene, partial cds
TCTTTTCCGAGTTCTGTTCACTCGTGTCACCCGTGACCTCCAGCGGTACGTGCAGAGATGCGTGGAGACG
AACAGGGAGATCTACTTAAACATTGGTATCAAGGCCAGCACCTTGACAGGAGGTCTGAAGTACGCTCTTG
CCACGGGTAACTGGGGAGAGCAGAAGAAGGCAGCCAGCGCCAAGGCTGGTGTATCTCAAGTGCTCAGTCG
TTACACCTACGCCTCTACGTTGTCCCACCTTCGTCGTACCAATACACCAATTGGCCGTGACGGTAAGATC
GCCAAACCTCGTCAGCTCCACAACACCCATTGGGGTCTGGTCTGTCCAGCTGAAACCCCTGAGGGTCAAG
CTTGTGGTCTGGTCAAGAACTTGGCGCTCATGTGCTACATCACTGTTGGTACGCCTAGTGAGCCCATTAT
TGATTTCATGATTCAACGCAACATGGAAGTGCTTGAAGAATTCGAGCCGCAGGTGACGCCAAATGCGACC
AAGGTGTTTGTCAACGGTGTCTGGGTGGGTATTCATAGAGATCCCGCGCATCTGGTGAACACCATGCTCT
CTCTCCGTCGCCGGAACATGATCTCGCACGAGGTCAGTTTGATTCGCGATATTCGTGAGCGAGAGTTCAA
GATCTTTACCGATGCTGGACGTGTGTGTCGACCACTGTTCGTCGTCGACAATGATCCCAAGAGCGAGAAC
TGCGGCTCGCTGGTACTCAATAAGGAACACATCCGCAAACTGGAGCAAGACAAGGATTTGCCCCCCGATC
TGGATCCAGAAGATCGCAGGGAGCGCTACTTCGGTTGGGATGGTTTGGTGAAGTCTGGTGTCGTCGAGTA
CGTCGACGCCGAGGAGGAGGAGACGATCATGATTGTGATGACACCGGAGGATCTGGAGATCTCGAAGCAA
CTTCAGGCCGGTTATGCCCTTCCCGAAGAAGAGCTGCACGATCCCAACAAGCGTGTCCGTTCCATTCTGA
GTCAAAAGGCTCACACCTGGACACACTGCGAGATTCACCCCAGTATGATCCTGGGTGTCTGCGCCAGTAT
CATTCCTTTCCCCGACCACAACCA

Proteina:
MCYITVGTPSEPIIDFMIQRNMEVLEEFEPQVTPNATKVFVNGVWVGIHRDPAHL
VNTMLSLRRRNMISHEVSLIRDIREREFKIFTDAGRVCRPLFVVDNDPKSENCGS
LVLNKEHIRKLEQDKDLPPDLDPEDRRERYFGWDGLVKSGVVEYVDAEEEETIM
IVMTPEDLEISKQLQAGYALPEEELHDPNKRVRSILSQKAHTWTHCEIHPSMILG
VCASIIPFPDHN
a. Porcentaje de identidad
100%
b. E value (expect)
2e-170
c. Imagen de alineamiento

d. Numero de Gaps: 0

Página 4 de 10
e. Accession:

i. Definicion:
RNA polymerase II second largest subunit, partial
ii. Numero de Accession:
QEM39372
iii. Source Organism:
Aspergillus niger
iv. Autores:
Visagie,C.M. and Yilmaz,N.
v. Journal:
Unpublished

Secuencia de Nucleótidos (2):

>XM_001392191.2 Aspergillus niger CBS 513.88 beta-1,3-exoglucosidase,


mRNA
GCATCCTTCAACTCTGAGCTAGCTAAAGAAATGCCTGTCGGGATATCCAGATGTCTCGGTCCGGGACCAA
GGCCATATGCCGGCAACCCAAGAATGGACGAGATATAAGAAGTGCTGGAACTAGTCCGATAGAATGAAGT
TATAGCAGTGGTCCACGCCCATCTCATCTGCTCTCCGAACTCGCTCCCAATGTACAGTCTCCTAGGGCTC
CTCGCTGCGCTGGGCTGCGCGCAGTCCGCCCTCGCAGCCCCCCTAGCCAGCCCCCCAAACTCTTCCTACA
TCGACTGGCGCACCTTCAAAGGCAACGGCGTCAACCTCGGCGGCTGGCTCGAGCAAGAATCGACAATAGA
CAGTCTATTCTGGGATAAATATTCTGGCGGCGCCTCAGACGAATGGGGCCTCTGCGAACATCTAGGCTCA
CAATGCGGCCCCGTCCTCGAGCACCGCTACGCAACCTGGATCACCAAGGCCGACATTGACAAGCTCGCCT
CCGGCGGTATCACAGTCCTGCGCATCCCCACCACCTATGCCGCATGGATCGATCTCCCCAGCTCGCAGCT
CTACTCGGGAAACCAAACGGCCTACCTCAAAGAAATCGCCGACTACGCCATCAAGACTTACAACATGCAC
ATCATCATCGACACGCACTCCCTCCCCGGCGGCGTCAACGGCCTGACCATCGGCGAAGCCACCGGCCACT
GGTACTGGTTCTACAACGAGACCAACTTCAACTACTCCATGCAAGTGATCGATCAAGTCATCAACTTCAT
CCAAACCTCGGGATCCCCGCAATCCTACACCCTCGAGCCCATCAACGAACCCGCCGACAACAACACCAAC
ATGGTCGTCTTCGGCACGCCCCTCGCCCTGACGGACCACGGCGCCGCCTGGGTCCTCAAGTACATCCGGG
CTGTGGTTCAACGGGTCGAATCGGTGAACCCCAACATCCCCGTCATGTTCCAGGGTAGTTTCAAGTACCC
GCAGTACTGGGAAGGTGACTTCCCCGCGAGTACGAACCTCGTCTTCGACACGCATCATTATTACTACGAG
CATATGGATTCCTCGTCGGAGAATCTGCCCGAGTATATTCTTGCGGATGCGCGGGAGAAGTCGGGCACGG
GCAAGTTCCCCGTGTTTGTGGGCGAATGGGCAATCCAGGCGACGTATAATAATACGTTGGCGTTGAGGAA
GAGGAATGTGTTGGCGGGGTTGAAGACTTGGAGCAGTTTTTCGCAGGGGAGTTCGTATTGGACGGCGAAG
TTTACGGGGAATACGAGTGTCGCTGGACAGGGGGAGCAGAAGGATTATTGGTGTTATGAGACGTTTATTG
ACGAGGGGTATTTCAATTGA

Proteina:
MYSLLGLLAALGCAQSALAAPLASPPNSSYIDWRTFKGNGVNLGGWLEQESTID
SLFWDKYSGGASDEWGLCEHLGSQCGPVLEHRYATWITKADIDKLASGGITVLR
IPTTYAAWIDLPSSQLYSGNQTAYLKEIADYAIKTYNMHIIIDTHSLPGGVNGL
TIGEATGHWYWFYNETNFNYSMQVIDQVINFIQTSGSPQSYTLEPINEPADNNT
NMVVFGTPLALTDHGAAWVLKYIRAVVQRVESVNPNIPVMFQGSFKYPQYWEGDF
PASTNLVFDTHHYYYEHMDSSSENLPEYILADAREKSGTGKFPVFVGEWAIQAT
YNNTLALRKRNVLAGLKTWSSFSQGSSYWTAKFTGNTSVAGQGEQKDYWCYETF
IDEGYFN

Página 5 de 10
a. Porcentaje de identidad
100%

b. E value (expect)
0
c. Imagen de alineamiento

d. Numero de Gaps: 0

e. Accession:
i. Definicion:
beta-1,3-exoglucosidase

ii. Numero de Accession:


XP_001392228

iii. Source Organism:


Aspergillus niger

iv. Autores:
Sin autor

v. Journal:
Sin publicar

Página 6 de 10
Secuencia de Nucleótidos (3):

>GU056837.1 Vitis vinifera WRKY gene, complete cds


CTAATTTTATTTTTTTATAATAATTATTGGAGGAACTAAAACATTAATGAAATAATAATTATCATAATTATTAATTACATATTTATT
AGGTATAATATTTAAGGAAAAATATATTTTATGTTAATTGTAATAATTAGAACAAACATGCCATGACCATTTTTTTTTTTTTATGG
AAATTTTTTTAGTTTAAAATATTAATTGAAATTAATGTAATGTCATGGCTAAGTATGAAGATTTCAACATAAATTAAATTTAAATA
AAATATTATTAATTAAAAATAAATAAAAAGAAAATTTCCAAAACACAGTAGAGCGCTAAGAATTTTCTTCAGAGTGGGGCCCAC
CACCTACTCTTTCACCACTAAAACGTCGTCGTTTTACTTTTAAAACAAAGAATACAGCTTTGACTTTGCAACTTCCTCTGCTTTTCC
TCTTTTCTTCTCTTTATATTGCCTTCCTCRGCCTCACTTCTTCTTCTCATTCTTTGTTGTGGAGTTCATCGATTGAGTTTTGTTACCG
GCGTTTATGGCCGTCGATTTTCTAGGATTCTCCAAGATGGACGAGCAGATGGCTATCCAGGAAGCCGCATCGGCCGGTTTGAA
GAGCATGGAGCACCTGATCCTCCTCTTGAATCATCACCATCCTCAATCTCAGCAAATCAACCACTTCGATTGCAGAGAAATCACC
GATTTCACAGTTTCCAAGTTCAAGCAAGTCATTTCCATCCTGAACCGGACCGGCCACGCCCGGTTCCGTCGCGGTCCGGTTACTT
CTTCTCCTTCTCAGTCTCCTTATGACTTGTCTAATAAATCGGAATTGCCCAAACCGGTTGAGTCAAGCCCATTTCATTCGAACCTG
ATTCTATCTGCGAAGCCTGATCCGCTCAAATCGGAAGGCAACGCTAGCGTGTCGTCGACGACTTCGTCTTTCTTGTCGTCGATCA
CCGGAGACGGCAGCGTGTCGAACGGAAAATTAGGGACTTCTCTGTTTGCACCTCCTCCGGCTCCGGCGGTTTCCGCCGGTAAAC
CGCCTCTTTCGTCGTCTCAACGGAGGAAATGTCATGAGCATGGATCCTCCGACAACATCTCCGGAAAACTCTCTGTTTCCGGCCG
CTGCCATTGCTCGAAAAGAAGGTATTGAATTTTCCTTCGGCGATTGGGTACTCTTGAATGCCTCTTAAAATAATAGATATTAAAT
ATGGATTTTTCGATGTTTTKCAGGAAAAATCGTGTGAAGAGGACGATCAGAGTTCCTGCGATAAGCTCGAAGATCGCCGATATT
CCCGCCGACGAGTACTCTTGGAGAAAGTACGGTCAGAAGCCGATCAAGGGCTCACCATACCCACGGTAATTTTCTACTCCTCTA
AATCTCCACCGCAGATCCAGAAGACTTNNNNNNNNNNNNNNCTTTTCAAAGTCAAACTTTTCTCATCCCAATATTCAAACAATT
TCCTCTTCCTCTTCCTATTTTCAGAGGCTACTACAAATGTAGCAGCGTGAGAGGCTGCCCAGCGAGAAAACACGTGGAGCGCGC
ACCAGACGATCCGGCGATGCTCATCGTCACCTACGAGGGAGAGCACCGCCACTCTCAAACTCCGGCACCGGCCGGTGGCCTCA
TGTTCCCATCAACCTGACGATCCTCCCCTGCCCCCAATCCAGGATCGGCTGTCAGGGAGCAAGTTGTCACAGCCAGGTGGCCAT
AGATTCCCCGGGGCACAAAAGTCAAAGAAGAGTCAAACTTACTGTTCCGGAGAATAGTGTACAAAAGAAAAGAAAATTCAAAA
ATCAATGTCTAGAAATGAATTATTATTTTTCCCTCTTTCGGTATTAAATTAATTGGCTTGAATTGGGATTCTGTGTTTTCTTGCGCA
CCAAGTCAAAAAAGGTGGGAATACTTTTCATAAGAAGAGGGGCCCACTGCATTGTAGGAGGCAATGTATTGTTGTGGAGGTGT
GAGTAGGTGGTCAATGGAGCTTTGTTGAGATGGGCCCCATTACAGCTAATAATTCCAACTCGGGGGTAGTCCACTCCAGGTTGT
TGACGAATACGGGGCGAGTCCGCCCATGAATTATTACGCTGAAGCTTTGGAGGGTTGACCTTCTTCCATGTGATTGTCTGCCAC
ATGAACCCAGGTCACATCATTCATAAATAAATAAATAAATAAATAATCAAAAAGAAGAAGCTAGAAGCAATGGCTGACTTTTGT
TATTTTATTTAGGTATGGCAAATGGTAAGCTGATGGTTTCAAGAACCTCAACCAACTACCAAGTTTTCATCATCTTTTCCACATTT
TCTCTATAACCAAACAAAACACCTACTCACTCTCACACCGGCTCCTTCCCCATCTTTGGTCATCAATACGAAGGAAATTAGGAGTC
GGTTTGCTAGATTTGAAATTTGTTTCCCAATAAGTTTGTCGACTTCTCACCAAGCAGATGGATTTGAAGTAAAATATGATTTCAA
GTTAATTTCAAAGAATTGCTTTTAGCTTAATAAATGTTTTTATAAAAAGATTATATATTGGAAATTTATAAACACTTTCAAAATTTT
TAAAATTAACTTAAAATAATTTAATAACGATTTAGTAAACGTTTAATTATTTAATTATTAAATTTAATTTTATTAT
ATATAAATAAATAANAATATATATATATA

Proteina:

MAVDFLGFSKMDEQMAIQEAASAGLKSMEHLILLLNHHHPQSQQINHFDCRE
ITDFTVSKFKQVISILNRTGHARFRRGPVTSSPSQSPYDLSNKSELPKPVES
SPFHSNLILSAKPDPLKSEGNASVSSTTSSFLSSITGDGSVSNGKLGTSLFA
PPPAPAVSAGKPPLSSSQRRKCHEHGSSDNISGKLSVSGRCHCSKRRY

Página 7 de 10
a. Porcentaje de identidad
100%

b. E value (expect)
2e-143

c. Imagen de alineamiento

d. Numero de Gaps: 0

e. Accession:

i. Definicion:
WRKY [Vitis vinifera]
ii. Numero de Accession:
ACY25182
iii. Source Organism:
Vitis vinifera
iv. Autores:
Liu,H., Han,Y. and Li,S.
v. Journal:
Submitted (28-SEP-2009) Fruit Tree Molecular Breeding,
WuhanBotanical Garden, Chinese Academy of Science,
Moshan, Wuhan, Hubei430074, P.R.China

Conclusión:
Las bases de datos y los software de alineamiento nos pueden brindar información
importante para saber si nuestra proteina efectivamente corresponde al ser vivo
del cual secuenciamos el gen. También nos ayuda a saber si nuestra proteina ya
fue caracterizada con anterioridad.

Página 8 de 10
Referencias

 Kumar, S., & Filipski, A. (2007). Multiple sequence alignment: in pursuit of


homologous DNA positions. Genome research, 17(2), 127-135.
 Martínez Ortiz, C. M. (2018). MIDAS: Aplicación informática para la
identificación de microsatélites exactos e inexactos en secuencias
genómicas. Revista Cubana de Informática Médica, 10(2).
 Escobar, C. A. M., Murillo, L. V. R., & Soto, J. F. (2011). Tecnologías
bioinformáticas para el análisis de secuencias de ADN. Scientia et
technica, 3(49), 116-121.
 Martínez, J. M. R. (2004). Secuenciación de genomas. Arbor, 177(698),
285-310.
 Quiceno, V. H. A. (2006). Bio-informática un Campo por conocer. REDVET.
Revista Electrónica de Veterinaria, 7(11), 1-9.
 Angel Herraez (2018). Biología molecular e Ingeniería Genética. 2ªedicion.
Conceptos, técnicas y aplicaciones en ciencias de la salud. ELSEVIER. Pp:
211-213.
 EXPASY: https://web.expasy.org/translate/
 NCBI: www.ncbi.nlm.nih.gov

Página 9 de 10
LISTA DE COTEJO PARA TAREAS

DATOS GENERALES DEL PROCESO DE EVALUACIÓN


Nombre(s) del alumno(s) y/o Equipo: Firma del alumno(s):
Edgar Fernando Maldonado Alvarez

Producto: Nombre o tema de la Tarea: Fecha: 04/11/2020


Tarea 07 BLAST
Asignatura: Grupo: Periodo cuatrimestral:
BIOINFORMATICA 7”C” septiembre-diciembre

Nombre del Docente: Firma del Docente:


Dr. Emiliano Villordo Pineda

INSTRUCCIONES

Revisar las características que se solicitan y califique en la columna “Valor Obtenido” el valor
asignado con respecto al “Valor del Reactivo”. En la columna “OBSERVACIONES” haga las
indicaciones que puedan ayudar al alumno a saber cuáles son las condiciones no cumplidas.
Valor
del Valor OBSERVACIONE
Característica a cumplir (Reactivo)
reactiv Obtenido S
o
Es entregado puntualmente. Hora y fecha solicitada
5%
(indispensable)

5% Presentación (Portada, etc.), Limpieza del trabajo y Ortografía

Desarrollo

5% Claridad de objetivo y Planteamiento del problema

60% Procedimiento y lógica de la solución.

20% Solución correcta

5% Entrega en tiempo y forma

100% CALIFICACIÓN:

Página 10 de 10

También podría gustarte