Está en la página 1de 14

INSTITUTO POLITÉCNICO NACIONAL

ESCUELA NACIONAL
DE CIENCIAS BIOLÓGICAS
“INGENIERÍA BIOQUÍMICA”

BIOINFORMÁTICA
PRACTICA No.4
“ALINEAMIENTOS MÚLTIPLES”
PROFESORES:
 LARIOS SERRATO VIOLETA
 JAIMES DIAZ HUEMAN
ALUMNO:
 RIVERA HERNÁNDEZ JORGE OSCAR

GRUPO: 7IX1
4. Procedimiento y resultados
4.1 Datos de entrada
1. Descargar del NCBI las secuencias fastas de la tabla 1 y llenar la siguiente tabla y
reportarla:

Secuencia Organismo
>ACB38137.1 xilanasa, parcial [Trichoderma reesei]
Locus: ACB38137, Longitud: 190aa , Cadena: Lineal, PLN 26-JUL-2016
ACB38137.1 QTIQPGTGYNNGYFYSYWNDGHGGVTYTNGPGGQFSVNWSNSGNFVGGKGWQPGTKNKVINFSGSYNPNG
NSYLSVYGWSRNPLIEYYIVENFGTYNPSTGATKLGEVTSDGSVYDIYRTQRVNQPSIIGTATFYQYWSV
RRNHRSSGSVNTANHFNAWAQQGLTLGTMDYQIVAVEGYFSSGSASITVS
>ACS96449.1 familia-10 endo-beta-1,4-xilanasa [Bispora sp. MEY-1]
Locus: ACS96449, Longitud: 424 aa , Cadena: Lineal, PLN 24-OCT-2009
MSFHSLLISGLLASVAVAVPKEAWGITVTETKTVSTTIIATVTELGTCSSTITSPTSDATTTTTSSATNT
NPTTTLLATPQPSNWGLNNAARADGKLWFGTAADIPGLEQDDRYYMKEYNNTHDFGGTTPANIMKFMFTE
ACS96449.1 PEQNVFNFTGAQEFLDIAFASHKLVRCHNLIWQSELPTWVTNPTTNWTNETLSKVLQNHVYTLVSHFGDQ
CYSWDVVNEALSDDPAGSYQNNIWFDTIGPEYVAMAFEYAEKAVKDHKLNVKLYYNDYNIEYPGPKSTAA
QNIVKELKARNIQIDGVGLESHFIAGETPSQATQITNMADFTSLDIDVAVTELDVRLYLPPNATSEAQQV
ADYYATAAACAATERCIGITVWDFDDTYSWVPSTFAGQGYADLFFQPDGPNTPLVKKAAYDGCLQALQHK
AESP
>ACY70400.1 endo-beta-1,4-xilanasa [Penicillium sp. CGMCC 1669]
Locus: ACY70400, Longitud: 217 aa , Cadena: Lineal, PLN 11-NOV-2009
MVSFSNLFMAACAAVTAFALPNELDKRALTTSKQGTSDGYFYSFWTNGGGSVSYENGAAGQYSVTWKNCD
ACY70400.1
SFTSGKGWATGSARNIKFSGSFKPSGNAYLAVYGWTTSPLVEYYIMESYGEYNPGSSMTFKGTVTSDGSV
YDIYTHKQVNQPSIVADSSTFDQYWSIRRNKRSSGTVTTANHFNAWSKLGMGMGSHGYQIVSTEGYKSSG
SSITVS
>sp|Q4WG11.1|XYNA_ASPFU RecName: Completo=Endo-1,4-beta-xilanasa
xynf11a; Corto = Xilanasa xynf11a; AltName: Completo = 1,4-beta-D-xilano
xilanohidrolasa xynf11a; Banderas: Precursor
Locus: XYNA_ASPFU, Longitud: 228 aa , Cadena: Lineal, PLN 25-MAY-2022
Q4WG11.1
MVSFSYLLLACSAIGALAAPVEPETTSFNETALHEFAERAGTPSSTGWNNGYYYSFWTDGGGDVTYTNGA
GGSYSVNWRNVGNFVGGKGWNPGSARTINYGGSFNPSGNGYLAVYGWTTNPLIEYYVVESYGTYNPGSGG
TFRGTVNTDGGTYNIYTAVRYNAPSIEGTKTFTQYWSVRTSKRTGGTVTMANHFNAWSRLGMNLGTHNYQ
IVATEGYQSSGSASITVY
>WP_011030540.1 MULTIESPECIES: endo-1,4-beta-xilanasa [Streptomyces]
Locus: WP_011030540, Longitud: 477 aa , Cadena: Lineal, BCT 16-MAY-2022
MGSYALPRSGVRRSIRVLLLALVVGVLGTATALIAPPGAHAAESTLGAAAAQSGRYFGTAIASGRLSDST
YTSIAGREFNMVTAENEMKIDATEPQRGQFNFSSADRVYNWAVQNGKQVRGHTLAWHSQQPGWMQSLSGS
WP_011030540 ALRQAMIDHINGVMAHYKGKIVQWDVVNEAFADGSSGARRDSNLQRSGNDWIEVAFRTARAADPSAKLCY
NDYNVENWTWAKTQAMYNMVRDFKQRGVPIDCVGFQSHFNSGSPYNSNFRTTLQNFAALGVDVAITELDI
QGAPASTYANVTNDCLAVSRCLGITVWGVRDSDSWRSEQTPLLFNNDGSKKAAYTAVLDALNGGDSSEPP
ADGGQIKGVGSGRCLDVPDASTSDGTQLQLWDCHSGTNQQWAATDAGELRVYGDKCLDAAGTGNGSKVQI
YSCWGGDNQKWRLNSDGSVVGVQSGLCLDAVGNGTANGTLIQLYTCSNGSNQRWTRT
>XP_001388522.1 endo-1,4-beta-xilanasa A [Aspergillus niger CBS 513.88]
Locus: XP_001388522, Longitud: 225 aa , Cadena: Lineal, PLN 03-MAR-2011
MLTKNLLLCFAAAKAALAVPHDSVAQRSDALHMLSERSTPSSTGENNGFYYSFWTDGGGDVTYTNGDAGA
XP_001388522.1 YTVEWSNVGNFVGGKGWNPGSAQDITYSGTFTPSGNGYLSVYGWTTDPLIEYYIVESYGDYNPGSGGTYK
GTVTSDGSVYDIYTATRTNAASIQGTATFTQYWSVRQNKRVGGTVTTSNHFNAWAKLGMNLGTHNYQIVA
TEGYQSSGSSSITVQ
2. Describa la función biológica para esta familia de proteínas
ACB38137.1 xilanasa: Son enzimas clave para el aprovechamiento de la biomasa porque
rompen los enlaces β1-4 de la molécula de xilano, permitiendo la liberación de xilooligosacáridos
(XOS) y Xilosa. Los XOS tienen potencial prebiótico y la Xilosa puede ser fermentada a xilitol, un
edulcorante no-calórico, altamente buscado, por lo que es uno de los componentes principales de
las paredes celulares las cuales son producidas por hongos, bacterias, levaduras, algas marinas,
protozoos, caracoles, crustáceos, insectos, semillas, etc., mientras que los mamíferos no producen
xilanasas. La principal fuente comercial de xilanasas son los hongos filamentosos.
3. Describa una aplicación industrial de esta familia de proteínas
La Hemicelulosa, es un hecho de xilanos, ya que es un componente principal para la mayoría de
las paredes celulares de las plantas. Por lo que las xilanasa hidrolizan este componente por lo que
es útil para una variedad de aplicaciones, incluyendo la reducción de la viscosidad de trigo, cebada,
mazorcas de maíz y alimentos difíciles de digerir. Actualmente la Xilanasa está disponible en un
polvo granular o una preparación de enzimas liquidas diseñado para una variedad aplicaciones
para la solubilización de fibras. Este producto tiene un gran rango de pH actividad y no requiere
cambio del pH a un pH acídico para una actividad óptima. La xilanasa en polvo es no-OMG, no
peligroso, enzima de grado industrial y grado para alimento animal, la cual se emplea como aditivo
de alimento animal, en aplicaciones industriales, aplicaciones sanitarias como degradación de
papeles de desechos, y una variedad de aplicaciones en el procesamiento de textiles. Otras
aplicaciones incluyen detergentes y compuestas para limpieza industrial entre otras como;
 Papel: La xilanasa se emplea en la industria de la pulpa y el papel como un método
ambientalmente seguro para el blanqueo sin cloro de la pulpa de madera antes del proceso de
fabricación del papel.
 Nutrición: También se utilizan como aditivos alimentarios para aves de corral; en harina de
trigo para mejorar el manejo de la masa y la calidad de los productos horneados; para la
extracción de café, aceites vegetales y almidón; en la mejora de las propiedades nutricionales
del ensilaje agrícola (compostaje fermentativo); en acondicionadores de masa, gracias a su
capacidad para mejorar la capacidad de trabajo y la absorción de agua de la masa; y la
alimentación de cereales. Además, en combinación con pectinasa y celulasa se utiliza para la
clarificación de los jugos de frutas y el desgomado de las fuentes de fibra vegetal como el lino,
el cáñamo, el yute y el ramio. Existe una buena cantidad de bibliografía científica sobre las
características clave de las enzimas xilanasa en la biotecnología, desde su selección en
fuentes microbianas hasta métodos de producción, caracterización, purificación y aplicaciones
en el sector comercial.
 Energía: Se han llevado a cabo ensayos para la producción de biocombustible a partir de
material vegetal.
Ahora este producto esta usado para pasar por lejía biológica en aplicaciones de pulpa de madera
en molino de papel para reducir emisiones de dióxido de azufre.
4. Concatene todas las secuencias fasta con los siguientes comandos mediante la
terminal, puede apoyarse con el comando cd, para cambiar al directorio de trabajo
Window Mac
copy *fasta xylanases.fasta cat *fasta > xylanases.fasta
4.2 Alineamiento multiple con CLUSTAL Omega de EMBOSS
5. Utilice Launch de Clustal Omega de EMBOSS, https://www.ebi.ac.uk/Tools/msa
6. Cargue o seleccione al archivo concatenado, explore los parámetros disponible
7. Alinee con los valore estándar
8. Reporte los formatos clustalW, Pearson/Fasta, MSF (indique que significan la
iniciales), nexux y stockholm
clustalW
Pearson/Fasta
MSF
9. ¿Qué formato le permitió hacer una comparación más clara de la similitud o identidad
de la secuencias? y ¿Por qué?
Clustal W ya que permite hacer comparaciones más claras porque tiene signos como (.), (:) y (*”)
que nos ayudan a identificar las regiones o posiciones donde, hay menor y mayor similitud e
identidad entre todas las secuencias que alineamos.

4.3 Alineamiento multiple con MUSCLE de EMBOSS


10. Utilice Launch de MUSCLE de EMBOSS, https://www.ebi.ac.uk/Tools/msa
11. Cargue o selecione al archivo concatenado, explore los parámetros disponible
12. Alinee con los valore estándar
13. Reporte el formato ClustalW
14. ¿Qué formatos de salida tiene disponibles y diferentes a Clustal?
 Pearson/Fasta
 Clustal W (strict)
 HTML
 GCG/MSF
 Phylip interleaved
 Phylip sequential

15. ¿Observa alguna diferencia en los resultados con respecto a Clustal Omega, he utilice
el formato clustal W para responder.
El alineamiento de las secuencias es diferente, esto puede ser por los parámetros que usa
cada uno para alinear, aun así el formato clustal W sigue siendo el mismo, guiones para
alinear y caracteres o signos (“.”, “:” y “*”) para mostrar el grado de similitud e identidad.

4.4 EMBOSScons
16. Utilice Launch de EMBOSScons, https://www.ebi.ac.uk/Tools/msa
17. Cargue o selecione el alineamiento de clustalW
18. De click en sumit
19. Reporte la secuencia consenso y comente

20. Reportesummision details, ¿para que servirá esta información?


Esta información nos permite ver los detalles como lo es el programa, la versión, fechas, los
archivos de secuencia de entrada y resultado de salida, el comando y además los parámetros de
entrada como “Plurality” que es un calificador de pluralidad que permite al usuario establecer un
límite para el número de coincidencias positivas por debajo del cual no hay consenso, “Setcase”
que es un calificador que establece el umbral para las coincidencias positivas por encima del cual
el consenso está en mayúsculas y por debajo del cual el consenso está en minúsculas, “Identity”
que es un calificador de identidad que brinda la posibilidad de establecer el número requerido de
identidades en un sitio para que dé un consenso en esa posición, así como el nombre de la
secuencia consenso que es EMBOSS0001, la matriz que para este caso es EBLOSUM62 (para
proteínas) y el tipo de secuencia que en este caso es una proteína.

4.5 MUSCLE en MEGA


21. Edite manualmente xylanases.fasta, retirando las secuencias que observe con mayor
divergencia y renómbrelo como xylanases_v2.fasta
22. Con el menu File y la opción Open A File/Session, seleccione el archivo editado.

23. Presionar Align

24. Alinie mediante Clustal W

25. ¿Qué significan los colores estándar en el alineamiento?


En los alineamientos de proteínas nos indican las propiedades de los aminoácidos para
ayudar a la caracterización de la conservación o en una sustitución de aminoácidos dada.
26. Alinee mediante MUSCLE
27. Reporte una región con alta conservación con MUSCLE y guarde en formato fasta el
alineamiento.

28. ¿Qué formatos de salida están disponibles con MEGA?


 Mega
 Fasta
 Nexus

4.6 Visualizadores de alineamientos con jalview


29. Importe el alineamiento fasta construido con MEGA

30. Explore el menu de color y formato

31. ¿Que intrepetación tienen las gráficas debajo del alineamiento?


La primera “Conservation” es el nivel de conservación de las propiedades fisicoquímicas en cada
posición y nos marca con “*” amarillo los residuos conservados totalmente, con “+” las posiciones
donde se conservan las propiedades y además las posiciones menos conservadas tienen colores
más obscuros y valores menores, la segunda “Quality” nos muestra la probabilidad de observar
una mutación en cualquier posición, la tercera “Consensus” nos muestra el porcentaje del residuo
modal en cada posición, además del logotipo de la secuencia de consenso que se muestra para
las regiones conservadas con un “+” para las regiones no conservadas y un “-“ para los residuos
vacíos y por ultimo “Occupancy” que nos muestra el nivel de ocupación en cada posición de las
secuencias alineadas.
4.6 Preguntas Extra
1. ¿Qué parametros o aspectos deben considerarse para elegir un software para alinear?
Los parámetros son tipos de variables usadas para personalizar el análisis de secuencias, estas
variables influyen en el análisis y de esta manera intervienen indirectamente en el resultado. En los
alineamientos, la selección de parámetros ajusta los posibles resultados de la búsqueda, a lo que
el investigador le interesa.
 Descripción: Restringe el número de descripciones cortas reportadas que coinciden.
 Expectativa: El umbral de significancia estadística coincide con la secuencia de la base de
datos.
 Secuencias blanco máximas: Mantiene un número máximo de descripciones y alineaciones.
 Alineación: Restringe las secuencias de la base de datos con el número especificado para
obtener pares de segmentos con la mayor puntuación.
 Nombre del organismo: Se introduce el nombre de la especie, por ejemplo: Homo sapiens.
 Filtro de baja complejidad: La filtración puede eliminar la significancia estadística, sin embargo
no elimina informes biológicos, lo que permite tener regiones biológicas más interesantes en
la secuencia de consulta para que esta coincida específicamente contra la base de datos
2. ¿Qué diferencias hay entre los fundamentos o algoritmos de MUSCLE y CLUSTAL
omega?
CLUSTAL implementa el algoritmo de Feng y Doolittle, que consta de 3 fases. La primera es el
alineamiento global de 2 en 2 mediante el algoritmo de NW, donde las puntuaciones de similitud se
traducen a una matriz de distancias para que puedan usarse y después generar el árbol. En la
segunda fase se crea un árbol guía a partir de la matriz de distancias, la longitud de las ramas
depende de la distancia que haya y también se unen las ramas de las secuencias con distancias
más cortas y por último se crea el alineamiento múltiple paso a paso. CLUSTAL omega utiliza redes
ocultas de marco para hacer el alineamiento. MUSCLE es un programa que cuenta con gran
precisión y rapidez, puede alinear 1000 proteínas en 21 segundos, los elementos del algoritmo
incluyen la estimación de distancia rápida usando el conteo de kmer, la alineación progresiva
usando la función llamada puntuaje de expectativa de registro y el refinamiento usando la partición
restringida dependiente del árbol.

Referencias Bibliográficas
 Aguirre A. Diferencias entre MUSCLE Y CLUSTAL. Scribd. Recuperado de:
https://es.scribd.com/document/460292532/Diferencias-entre-MUSCLE
 Montoya A. (2012). Caracterización de una endo-xilanasa producida por Bacillus flexus
NJY2. Facultad de ciencias químicas. Recuperado de:
http://eprints.uanl.mx/3080/1/1080224609.pdf
 Emboss contras. Recuperado de: https://galaxy-iuc.github.io/emboss-5.0-docs/cons.html
 Sola D. (2019). Xilanasas. 3tres3. Recuperado de:
https://www.3tres3.com/esmx/articulos/xilanasas_3084/#:~:text=La%20xilanasa%20es%20
com%C3%BAn%20en,en%20la%20fabricaci%C3%B3n%20de%20piensos.
 Tratamiento con xilanasas en la secuencia industrial de blanqueo de eucalipto OXAZDP.
Pág. 12.2 y 12.3. Recuperado
de:https://www.tdx.cat/bitstream/handle/10803/6498/14Ufl14de19.pdf;jsessionid=E74E45C
517AF2096240688BBE9729B4D?sequence=14

También podría gustarte