Está en la página 1de 16

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS”

FACULTAD DE CIENCIAS BIOLÓGICAS

LABORATORIO DE BIOLOGÍA MOLECULAR

INFORME DE LA PRÁCTICA N°
ANÁLISIS BIOINFORMÁTICO DE SECUENCIAS PROTÉICAS

INTEGRANTES: CÓDIGOS

● Cordova Velazco, Antuane Xiomara 17100089


● Ovalle Rojas, Jimena Lizeth 18100087
● Salinas Angeles, Renato Aarom 17100009
● Salazar Lopez, Yomara Maite 17100094
● Valverde Huasco, Darlene Mercedes 18100097

PROFESOR:
Gustavo A. Sandoval

HORARIO:
Viernes de 08:00 am a 4:00 pm

FECHA DE ENTREGA:
03/10/2019

2019-II
ÍNDICE
Introducción ------------------------------------------------------------------------------------------------(2)

Resultados -------------------------------------------------------------------------------------------------(3)

Discusión ---------------------------------------------------------------------------------------------------(10)

Conclusiones ----------------------------------------------------------------------------------------------(11)

1. INTRODUCCIÓN:

1
La bioinformática, es una combinación entre los avances tecnológicos
con los nuevos descubrimientos científicos a nivel de la biología. Usados
sobre todo para resumir y tener a disposición registros de mucha
información almacenados en bases de datos globales .
La necesidad en este tipo de bases de datos tiene como raíz la falta de
orden causado por la gran cantidad de información descubierta en los
últimos años a partir del planteamiento de la estructura de doble hélice
del DNA, esta gran cantidad de información se produjo en 1953, con los
descubrimientos de Watson y Crick, una de las épocas donde la
información era producida de forma exponencial. A la par tanto la
biología como la tecnología iba avanzando y dando herramientas que
ayudaron en el análisis comparativo y resolución de problemas respecto
al DNA o proteínas, creando bases de datos donde se pueden
almacenar trabajos y descubrimientos a nivel mundial, teniendo toda
esta información al alcance de la mano.
La informática comenzó a aplicarse mucho antes de la época del
internet, ya que para los años 1960 el gran aumento de la producción
de información por parte de los científicos los llevó a crear estrategias
para manejar teniendo como base la biología molecular, la informática
y el nuevo invento, la computadora apareciendo en este punto la
bioinformática y la biología computacional que buscan utilizar patrones
y estructuras inherentes en datos biológicos como secuencias génicas
así como el desarrollo de nuevas metodologías para el acceso y
búsqueda en bases de datos.
Así pues, la bioinformática es una rama multidisciplinaria cuya historia
se llegó a dividir durante los años 1945 y 1955 donde Sanger y su equipo
secuenció en forma completa y por primera vez una proteína
determinando además el orden de aminoácidos, algo que hasta el
momento no se había podido lograr. El logro alcanzado por Singer
marcó el rumbo de la bioinformática en años posteriores pues se vio tras
esto una gran necesidad de interpretar la información contenida dentro
del ADN y ARN que posteriormente se convertirían en proteínas. Esta
marcaría dos eras seguidas de la bioinformática las cuales serían la Pre-
secuenciación y la Post-secuenciación, que no habrían sido posible sin
el progreso a la par de la tecnología de las computadoras.
En 1980, la doctora Dayhoff creó la primera base de datos
computadorizada con secuencias de ácidos nucleicos y proteínas, es un
usuario al cual uno puede conectarse con cualquier tipo de servidor en
el mundo para obtener la información.
En 1983 la Protein Sequence DataBase(PSD) era la base de datos más
grande del mundo contando con más de 2 millones de nucleótidos
secuenciados con sus respectivas referencias y anotaciones. Años
después de la muerte de la doctora se puso en marcha el sistema de
secuenciación online, que consiste en programas y bases de datos

2
accesibles a toda la comunidad mundial científica mediante el programa
Protein Identification Resource(PIR), con este software cualquiera
puede identificar proteínas a partir de los datos de composición de
aminoácidos o secuencias.
Los avances de esta rama de la biología no han parado, sino que poco
a poco se descubren nuevas formas de cómo mejorar o nuevas formas
de aplicar la bioinformática dentro de sus campos(7). El presente
informe tiene como objetivo dar a conocer como funciona la
bioinformática, a través del análisis de secuencias proteicas, en dos
programas no relacionados : ProtParam y UniProt.

2. RESULTADOS:

MRVNNGLTPQELEAYGISDVHDIVYNPSYDLLYQ
EELDPSLTGYERGVLTNLGAVAVDTGIFTGRSPK
DKYIVRDDTTRDTFWWADKGKGKNDNKPLSPET
WQHLKGLVTRQLSGKRLFVVDAFCGANPDTRLS
VRFITEVAWQAHFVKNMFIRPSDEELAGFKPDFIV
MNGAKCTNPQWKEQGLNSENFVAFNLTERMQLI
SECUENCIA CONSENSO PROBLEMA GGTWYGGEMKKGMFSMMNYLLPLKGIASMHCS
ANVGEKGDVAVFFGLSGTGKTTLSTDPKRRLIGD
DEHGWDDDGVFNFEGGCYAKTIKLSKEAEPEIYN
AIRRDALLENVTVREDGTIDFDDGSKTENTRVSY
PIYHIDNIVKPVSKAGHATKVIFLTADAFGVLPPVS
RLTADQTQYHFLSGFTAKLAGTERGITEPTPTFSA
CFGAAFLSLHPTQYAEVLVKRMQAAGAQAYLVN
TGWNGTGKRISIKDTRAIIDAILNGSLDNAETFTLP
MFNLAIPTELPGVDTKILDPRNTYASPEQWQEKA
ETLAKLFIDNFDKYTDTPAGAALVAAGPKL

2.1. Análisis de la secuencia consenso en ProtParam:

2.1.1 Resultados generales:

Número de Peso molecular Punto isoeléctrico


aminoácidos teórico

540 59643.48 5.46

2.1.2 Porcentaje de aminoácidos

3
Tipo de
aminoácido Aminoácido Cantidad de Porcentaje de
aminoácido aminoácido

Ácidos Aspartato (D) 38 7.0%

Glutamato (E) 30 5.5%

Básicos Arginina (R) 23 4.2%

Histidina (H) 9 1.6%

Lisina (K) 34 6.2%

Apolares Alanina (A) 45 8.3%


alifáticos

Glicina (G) 47 8.7%

Isoleucina (I) 27 5.0%

Leucina (L) 46 8.5%

Metionina (M) 11 2.0%

Valina (V) 32 5.9%

Fenilananina (F) 28 5.1%

4
Apolares Tirosina (Y) 17 3.1%
aromáticos

Triptófano (W) 9 1.6%

Polares Asparragina (N) 27 5.0%

Cisteína (C) 5 0.9%

Glutamina (Q) 15 2.7%

Prolina (P) 27 5.0%

Serina (S) 25 4.6%

Treonina (T) 45 8.3%

Tabla 1. Porcentaje de aminoácidos obtenido en el análisis de la secuencia


consenso en ProtParam

5
Fig 1.Porcentaje de aminoácidos obtenido en el análisis de la secuencia consenso
en ProtParam

2.2. Análisis de la secuencia consenso en UniProt:


Se muestra los resultados de coincidencia de la secuencia consenso
problema, con e-value=0.0 y un score=2.854.

CÓDIGO NOMBRE DE PROTEÍNA - ESPECIE IDENTIDAD

Q3YWM2 Phosphoenolpyruvate carboxykinase (ATP) (Shigella 100%


sonnei (strain Ss046))

Q31VN1 Phosphoenolpyruvate carboxykinase (ATP) (Shigella 100%


boydii serotype 4)

B2U3L1 Phosphoenolpyruvate carboxykinase (ATP) (Shigella 100%


boydii serotype 18)

B1IP62 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli (strain ATC)

A8A5L1 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli O9:H4 (stra)

B1X750 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli (strain K12)

C4ZUQ8 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli (strain K12)

B7M1V7 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli O8 (strain )

B7L4T1 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli (strain 559)

B7UKA7 Phosphoenolpyruvate carboxykinase (ATP) 100%


(Escherichia coli O127:H6 (st)

P22259 Phosphoenolpyruvate carboxykinase (ATP) 100%


Escherichia coli (strain K12)

Tabla 3 .Resultado del análisis de la secuencia consenso,mostrando de las 11


primeras coincidencias.

6
2.2.1 Análisis de las principales características de Q3YWM2 :

FUNCIÓN ● Participa en la gluconeogénesis. Cataliza la


conversión de oxaloacetato (OAA) a
fosfoenolpiruvato (PEP) a través de la transferencia
directa de fosforilo entre el nucleósido trifosfato y
OAA.

NOMBRE Y ● Nombre: fosfoenolpiruvato carboxiquinasa


TAXONOMÍA ● Organismo: Shigella sonnei (cepa Ss046)
● Gen: pckA
● Identificador taxonómico: 300269 [ NCBI ]
● Linaje taxonómico :Bacterias ›Proteobacterias
› Gammaproteobacterias › Enterobacterales ›
Enterobacteriaceae › Shigella

UBICACIÓN ● Citoplasma
SUBCELULAR

ESTRUCTURA https://swissmodel.expasy.org/repository/unipr
TRIDIMENSIONAL ot/Q31VN1?csm=A744D90899F6A8A5

PTM / Procesamiento Procesamiento de moléculas:


Función: cadena
Puestos: 1-540
Descripción:Fosfoenolpiruvato
carboxiquinasa (ATP)

Modificaciones de aminoácidos:
Residuo modificado: 87
Descripción: N6-acetyllysine
Longitud:1

Residuo modificado: 523


Descripción: N6-acetyllysine
Longitud:1

7
INTERACCIÓN No se encontraron datos
Tabla 4. Características de Q3YWM2

2.2.2 Análisis de las principales características de P22259 :


FUNCIÓN ● Participa en la gluconeogénesis. Cataliza la
conversión de oxaloacetato (OAA) a fosfoenolpiruvato
(PEP) a través de la transferencia directa de fosforilo
entre el nucleósido trifosfato y OAA.

NOMBRE Y ● Nombre: fosfoenolpiruvato carboxiquinasa


TAXONOMÍA ● Organismo: Escherichia coli (cepa K12)
● Gen: pckA
● Identificador taxonómico: 83333 [ NCBI ]
● Linaje taxonómico :Bacterias › Proteobacterias
› Gammaproteobacterias › Enterobacterales ›
Enterobacteriaceae › Escherichia

UBICACIÓN ● Citoplasma
SUBCELULAR

ESTRUCTURA
TRIDIMENSIONAL https://swissmodel.expasy.org/repository/unipro
t/P22259?csm=A744D90899F6A8A5

PTM / Procesamiento Procesamiento de moléculas:


Función: cadena
Puestos: 1-540
Descripción:Fosfoenolpiruvato
carboxiquinasa (ATP)

Modificaciones de aminoácidos:

8
Residuo modificado: 87
Descripción: N6-acetyllysine
Longitud:1

Residuo modificado: 523


Descripción: N6-acetyllysine
Longitud:1

INTERACCIÓN https://string-db.org/network/511145.b3403

Tabla 5. Características de P22259

INTERACCIONES:

Malato sintasa A; proteína


Fosfoenolpiruvato implicada en el ciclo de
carboxiquinasa (ATP); participa glioxilato. cataliza la
en la gluconeogénesis. Cataliza la condensación aldólica de
conversión de oxaloacetato (OAA) glioxilato con acetil-CoA para
a fosfoenolpiruvato (PEP) a través formar L- malato, lo cual
de la transferencia directa de corresponde al segundo paso
fosforilo entre el nucleósido del ciclo del glioxilato, una ruta
trifosfato y OAA; pertenece a la alternativa al ciclo del ácido
familia de fosfoenolpiruvato tricarboxílico presente en
carboxiquinasa (ATP) bacterias, hongos y plantas.

9
Acetil-coenzima A sintetasa; cataliza
la conversión de acetato en acetil-CoA
(AcCoA), es un intermedio esencial en
la unión de las vías anabólicas y
Fosfoenolpiruvato catabólicas. Acs sufre una reacción de
carboxiquinasa (ATP) dos pasos, en la primera mitad de la
reacción se combina acetato con ATP
para formar el intermedio acetil-
adenilato (AcAMP), en la segunda mitad
de la reacción, puede transferir el grupo
acetilo de AcAMP al grupo sulfhidrilo de
CoA formando el producto AcCoA

Acetil coenzima A sintetasa: Enzima de bacterias y plantas que cataliza la síntesis de acetil-
CoA a partir de acetato y coenzima A, mediante una reacción dirigida por la hidrólisis de
adenosin trifosfato. La utilización de etanol vía acetato por la levadura S. cerevisiae requiere
la presencia de la enzima acetil-coenzima a sintetasa (acetil-coa sintetasa) que cataliza la
activación del acetato a acetil-coenzima a (acetil-coa).

Fosfoenolpiruvato
carboxilasa; forma
Fosfoenolpiruvato oxaloacetato, una fuente
carboxiquinasa (ATP) de ácido dicarboxílico de
cuatro carbonos para el
ciclo del ácido
tricarboxílico

La PPC también cataliza la interconversión de PEP a oxaloacetato, pero esta reacción es


irreversible y requiere HCO 3, en lugar de CO2. (8)

Piruvato quinasa II,


Fosfoenolpiruvato estimulada por glucosa;
carboxiquinasa (ATP) proteína implicada en la
glucólisis, fermentación y
respiración anaeróbica.

10
Piruvato quinasa I, estimulada
Fosfoenolpiruvato por fructosa; es una proteína
carboxiquinasa (ATP) implicada en la glucólisis,
fermentación y respiración
anaeróbica.

La proteína piruvato quinasa es una enzima que participa en la glucólisis en la que cataliza la
transferencia de un grupo fosfato del fosfoenolpiruvato al adenosín difosfato (ADP),
produciendo una molécula de piruvato y otra de adenosín trifosfato (ATP) es estimulada por
fructosa. Proteína implicada en la fermentación y respiración anaeróbica. La relación que
guarda con la proteína evaluada fosfoenolpiruvato carboxiquinasa, es que la piruvato quinasa
realiza la reacción inversa convirtiendo el fosfoenolpiruvato en piruvato a nivel de glucólisis,
mientras que la PEPCK interviene en la segunda reacción de la conversión de piruvato a
fosfoenolpiruvato a nivel de gluconeogénesis.

Malato deshidrogenasa; cataliza


Fosfoenolpiruvato la oxidación reversible del malato
carboxiquinasa (ATP) a oxaloacetato

Fructosa-1,6-
bisfosfatasa clase 1;
Fosfoenolpiruvato
proteína implicada en
carboxiquinasa (ATP)
la gluconeogénesis.

11
Citrato sintasa; proteína implicada
en el ciclo del ácido tricarboxílico y
Fosfoenolpiruvato la respiración anaeróbica;
carboxiquinasa (ATP) Pertenece a la familia de la citrato
sintasa.

Fosfoenolpiruvato
Fosfoenolpiruvato sintasa; cataliza la
carboxiquinasa (ATP) fosforilación de piruvato a
fosfoenolpiruvato

Enolasa; Cataliza la conversión


Fosfoenolpiruvato reversible de 2-fosfoglicerato en
fosfoenolpiruvato. Es esencial para la
carboxiquinasa (ATP)
degradación de los carbohidratos a
través de la glucólisis. También es un
componente del degradosoma de
ARN, un complejo multienzimático
involucrado en el procesamiento del
ARN y la degradación del ARN
mensajero. Su interacción con la
ARNasa E es importante para la
renovación del ARNm, en particular
en las transcripciones que codifican
enzimas de rutas metabólicas
generadoras de energía. Se requiere
su presencia en el degradosoma para
la respuesta al exceso de fosfoazúcar.
Puede desempeñar un papel
regulador en la degradación de ARN
específicos.

12
3. DISCUSIÓN

El análisis realizado de la secuencia consenso (SC) en ProtParam nos brinda


datos importantes de la proteína que estamos indagando, cómo lo es el punto
isoeléctrico(pI), que nos da a entender cual es el pH para el cual la carga
eléctrica media de las moléculas es cero (1) ,dado que es fundamental conocer
este pH en el cual la proteína presenta su mínima solubilidad y por lo tanto
precipita(2).El pI de nuestra SC es de 5.46 y con los datos de la Tabla 1, se
entiende que esta molécula necesita de un pH ácido para poder tener su carga
eléctrica en cero, dado al mayor porcentaje de aminoácidos que le confieren
de una carga positiva Fig 1.
ProtParam también nos brinda un recuento del número de aminoácidos, y el
peso molecular de nuestra secuencia. Estos datos obtenidos nos brindan las
características de la naturaleza química y las propiedades que tiene nuestra
proteína problema y poder así tener la posibilidad de poder develar esta
secuencia.
Un segundo programa para poder realizar un análisis, con referencia a
estudios de otros investigadores y poder así comparar nuestra secuencia es
UniProt, dado que la base de conocimiento de UniProt proporciona una base
de datos central de secuencias de proteínas con una secuencia precisa,
consistente, rica y anotación funcional (6) en la búsqueda de encontrar una
coincidencia con la SC , observando el porcentaje de coincidencia(PCo) y el
score.
Los resultados obtenidos se muestran en la Tabla 3, en el cual observamos los
10 primeros resultados de coincidencia, teniendo en cuenta que el PCo es del
100% y el score es 2.854, en todos los ítems de la tabla mencionada.
Dado que se tiene como objetivo la familiarización del programa, se escogieron
los resultados de codigo Q3YWM2 y P22259, de posicion 1 y 10
respectivamente en la Tabla 3. Esta selección se realizó por criterios como
: resultado de coincidencia en dos diferentes géneros de bacteria (Shigella y
Escherichia), y que al mismo tiempo en Escherichia de la posición 10 se
encuentra datos mucho más completos como lo es la interacción con otras
moléculas,no siendo así en los 9 primeros resultados.
La proteína que se relaciona con nuestra SC secuencia es
Phosphoenolpyruvate carboxykinase, cuyos datos se describen en las Tablas
4 y 5, viendo que las características mencionadas en dichas tablas concuerdan
en su totalidad.
Para poder explicar porque apareció nuestra secuencia proteica en dos
géneros diferentes se entiende que los cromosomas de Shigella comparten la
mayoría de sus genes con los de la de Escherichia (4), dado que estos dos
géneros pertenecen a la familia Enterobacteriaceae que son bacilos
anaerobios o aerobios facultativos, los cuales fermentan una amplia gama de
hidratos de carbono, poseen una estructura antigénica compleja y otros
factores de virulencia (3).

13
Una de las funciones de alta importancia que nos brinda UniProt es la de
interacción de nuestra proteína con otras, dado que las interacciones proteína-
proteína son eventos críticos para muchos procesos celulares que se
extienden desde la formación de estructuras macromoleculares y complejos
enzimáticos, hasta la regulación y la transducción de señales. Comprender
estas interacciones en detalle, proporciona información útil sobre el mecanismo
molecular de funcionamiento de la célula (5) ,y tener toda esta información en
una base de datos confiable nos hace comprender la importancia de la
bioinformática en una carrera como la de biología .

4. CONCLUSIONES

El uso de las herramientas bioinformáticas nos ayuda al análisis de secuencia de ADN


como proteicas en este caso, existen diversas bases de datos que almacenan todo
tipo de información de las proteínas, esto ayuda a la comunidad científica ya que al
obtener distintas bases de datos, en las cuales se puede comparar, buscar y
contrastar una sola proteína; que son proporcionados por investigadores y revisada
por especialistas.

5. BIBLIOGRAFÍA

1. AMINOÁCIDOS Y PROTEÍNAS [Internet]. [citado 2 de octubre de 2019].


Disponible en: http://www.ehu.eus/biomoleculas/buffers/buffer3.htm

2. Álvarez López C. Determinación del punto isoeléctrico de las proteínas


presentes en cuatro fuentes foliares: yuca (Manihot esculenta Crantz)
variedades verónica y tai, jatropha (Jatropha curcas L.) y gmelina (Gmelina
arbórea). prospect. 6 de agosto de 2014;12(1):30.

3. Bacilos gramnegativos entéricos (Enterobacteriaceae) | Microbiología


médica, 27e | AccessMedicina | McGraw-Hill Medical [Internet]. [citado 3 de
octubre de 2019]. Disponible en:
https://accessmedicina.mhmedical.com/content.aspx?bookid=1837&sectionid
=128957405

4. Yang F. Genome dynamics and diversity of Shigella species, the etiologic


agents of bacillary dysentery. Nucleic Acids Research. 24 de octubre de
2005;33(19):6445-58.

5. Interacciones proteína-proteína: bases de datos y métodos teóricos de


predicción. :8.

6. UniProt Knowledgebase User Manual [Internet]. 2019 [citado 3 de octubre de


2019]. Disponible en: https://www.uniprot.org/docs/userman.htm

14
7. Deakin WJ, Parker VE, Wright EL, Ashcroft KJ, Loake GJ, Shaw CH.
Agrobacterium tumefaciens possesses a fourth flagellin gene located in a large
gene cluster concerned with flagellar structure, assembly and motility.
Microbiology. 1999;145(6):1397-407.

8. Chiba, Y., Kamikawa, R., Nakada-Tsukui, K., Saito-Nakano, Y., y Nozaki, T. .


Descubrimiento de los genes de fosfoenolpiruvato carboxiquinasa de tipo PPi
en eucariotas y bacterias. El diario de química biológica. 2015; 290 (39):
23960–23970. doi: 10.1074 / jbc.M115.672907

9.Fernández,M .El gen acr1 de saccharomyces cerevisiae: un gen implicado en


la utilización de diferentes fuentes de carbono.RUO.[2019] Disponible en:
http://hdl.handle.net/10651/15309

15

También podría gustarte