Está en la página 1de 13

SOLUCIÓN TALLER DE BASES DE DATOS Y PROTEÍNAS

Asignatura: Bioquímica.
Fecha: marzo de 2021.
Docente: David Leonardo Sotelo.
Valor en el segundo corte: 10 %

Nombre: Maria Juliana Trimio Álvarez Código: 6182479 Grupo: 1


Nombre: Valentina Tafur Arias Código: 6191516 Grupo: 1

Rta/

1. Protein Data Bank (PDB)


a. Mantener un archivo de datos de estructuras macromoleculares disponible gratuita y públicamente
para la comunidad global.
b. Es una base de datos de la estructura tridimensional de las proteínas y ácidos nucleicos.
c. Reino Unido y Estados Unidos.

2. Uniprot
a. proporcionar secuencias de proteínas confiables asociadas con un alto nivel de anotación (como la
descripción de la función de una proteína, su estructura de dominio , modificaciones
postraduccionales , variantes, etc. ), un nivel mínimo de redundancia y alto nivel de integración con
otras bases de datos.
b. Repositorio central de datos gratuito sobre proteínas.
c. Reino Unido.

3. National Center of Biotechnology Information (NCBI)


a. Ser una importante fuente de información de biología molecular.
b. Almacena y constantemente actualiza la información referente a secuencias genómicas en GenBank,
un índice de artículos científicos referente a biomedicina, biotecnología, bioquímica, genética y
genómica en PubMed, una recopilación de enfermedades genéticas humanas en OMIM, además de
otros datos biotecnológicos de relevancia en diversas bases de datos.
c. Estados Unidos.
Rta/

Organismo de origen: Schizosaccharomyces pombe (cepa 972 / ATCC 24843) (levadura de fisión)

a. Función: Tiene un papel dual en el ciclo celular. En la mitosis, participa en el mantenimiento de la actividad quinasa
cdc2. Posteriormente se requiere para la regulación de la formación del tabique. Podría estar involucrado en el
mantenimiento de la actividad de la quinasa cdc2 al prevenir, directa o indirectamente, la degradación de la ciclina o la
desfosforilación de 'Thr-167' de cdc2.
b.
Nombres de proteínas Nombre recomendado:
Proteína de control de la división celular 16

Nombres de genes  Nombre: cdc16


Sinónimos: bub2
Nombres ORF: SPAC6F6.08c

Organismo Schizosaccharomyces pombe (cepa 972 / ATCC 24843)


(levadura de fisión)

Identificador taxonómico 284812 [ NCBI ]

Linaje taxonómico Eukaryota › Hongos › Dikarya › Ascomycota ›


Taphrinomycotina ›
Schizosaccharomycetes ›
Schizosaccharomycetales ›
Schizosaccharomycetaceae ›
Schizosaccharomyces ›

Proteomas UP000002485 Componente: Cromosoma I

Bases de datos de organismos específicos

PomBase i SPAC6F6.08c , cdc16

VEuPathDB i FungiDB: SPAC6F6.08c

c. Citoesqueleto
citoplasma y citosol

d. Secuencia
10 20 30 40 50
MPSIDCKRLQ KLAPKSPENQ SKCISRLRYM VMLDQVESDE GGNSSTRPYV
60 70 80 90 100
WAVLLNAPPR NADEYIRYVR QGPSPMAQKI QNDVSRTLVV ESQFHSRVSQ
110 120 130 140 150
SSLSRLLNAY VWKRGALYVQ GMNVLASPFL YACKSENQAF QFFDRLLQNE
160 170 180 190 200
CPLYVLPNID GVHRGAKLLD KCLEVLDHRL YTYLLSKGLT AKIYALPSIL
210 220 230 240 250
TLSACTAPLS EALTIWDFLF AYGIHLNILC VIAQMFIFRE QLIDHPSPMT
260 270 280 290
LLRTFPPLNA KNIMKITILL ISKLPPELYN LLARHAWDSE AGVLIDRLT

Rta/

a. Saccharomyces cerevisiae

Estructura de S. cerevisiae Zip2: complejo Spo16, forma C2

● Clasificación: PROTEÍNA DE UNIÓN AL ADN


● Organismo (s): Saccharomyces cerevisiae
● Sistema de expresión: Escherichia coli
● Mutación (es): No

Contenido de macromoléculas

● Peso total de la estructura: 199,96 kDa


● Recuento de átomos: 13181
● Recuento de residuos modelados: 1559
● Recuento de residuos depositados: 1688
● Cadenas de proteínas únicas: 5

b.
Rta/

ORGANISMO : Trichoderma reesei QM6a


Eucariota; Hongos Dikarya; Ascomycota; Pezizomycotina;
Sordariomicetos; Hypocreomycetidae; Hypocreales; Hypocreacea; Trichoderma.
a. En la literatura se encuentran sólo artículos en pubmed y en pubmed central

La primera de las respuestas en PubMed y con más relación a lo buscado es un artículo que habla de Un sitio
NF-κB adicional permite que el subtipo C del VIH-1 evite la restricción de las proteínas PYHIN nucleares

b. Genes

En Gen nos muestran la siguiente descripción


Que nos describe:

Símbolo gen dieciséis


Descripción del gen proteína de cinta métrica
Etiqueta de lugar KNV76_gp016
Tipo de gene codificación de proteínas
Estado de RefSeq PROVISIONAL
Organismo Fago de Mycobacterium OhShagHennessy
Linaje Virus; Duplodnaviria; Heunggongvirae; Uroviricota;
Caudoviricetes; Caudovirales; Siphoviridae
Etiqueta de locus antiguo SEA_OHSHAGHENNESSY_16

c. Proteínas

en la parte de proteína, nos muestra datos importantes

LOCUS NP_001372612 603 aa PRI lineal 19-SEP-2021

DEFINICIÓN transportador dependiente de sodio y cloruro XTRP3 isoforma 3 [Homo

sapiens].

ADHESIÓN NP_001372612

VERSIÓN NP_001372612.1

DBSOURCE REFSEQ: adhesión NM_001385683.1

PALABRAS CLAVE RefSeq.

FUENTE Homo sapiens (human)

ORGANISMO Homo sapiens

Eucariota; Metazoos; Chordata; Craniata; Vertebrata; Euteleostomi;

Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;

Catarrhini; Hominidae; Homo.

REFERENCIA 1 (residuos 1 a 603)

OBSERVACIÓN GeneRIF: El enfoque integrador identifica SLC6A20 y CXCR6 como genes causales putativos para la señal
COVID-19 GWAS en el 3p21.31 lugar.
REFERENCIA 2 (residuos 1 a 603)

OBSERVACIÓN GeneRIF: La edición del genoma y del epigenoma identifican CCR9 y SLC6A20 como genes diana en el locus
3p21.31 asociados con COVID-19 grave.

REFERENCIA 3 (residuos 1 a 603)

Rta/ BLAST es un programa informático de alineamiento de secuencias de tipo local, ya sea de ADN, ARN o de proteínas. El
programa es capaz de comparar una secuencia problema contra una gran cantidad de secuencias que se encuentren en una
base de datos.

Usos: El BLAST es la herramienta más usada para la anotación y predicción funcional de genes o secuencias proteicas. Muchas
variantes han sido creadas para resolver algunos problemas específicos de búsqueda.

Rta/ Tipos de Blast

Podemos usar todos los tipos de blast con blast local, es decir, blastx, blastp, blastn y tblastn al instalarnos blast+ de NCBI
en local. Recordad que:

a. para uso con nucleótidos , blastn: nucleotide > nucleotide (nucleotide blast)
b. b. blastp : protein > protein (protein blast)

Rta/ Es un valor que se calcula sobre la eficiencia del alineamiento, mide que tan bien se realizó el alineamiento, y entre más
pequeño es el valor , mejor será el alineamiento.

Rta/ Es un programa de computadora utilizado para realizar alineamientos múltiples de secuencias.

Usos: Hacer alineamientos de múltiples secuencias de datos de proteínas, ADN o ARN, encuentra si algún cambio o mutación
en las moléculas, crea un árbol filogenético y ayuda a saber cual es el comportamiento de las macromoléculas de los seres
vivos.
Rta/ Homo sapiens (Human)

Cataliza la fosforilación de varias hexosas, como D-glucosa, D-glucosamina, D-fructosa, D-manosa y


2-desoxi-D-glucosa, a hexosa 6-fosfato (D-glucosa 6-fosfato, D-glucosamina 6 -fosfato, D-fructosa 6-fosfato, D-manosa
6-fosfato y 2-desoxi-D-glucosa 6-fosfato, respectivamente. No fosforila la N-acetil-D-glucosamina, actúa como un
receptor de reconocimiento de patrones para el peptidoglicano bacteriano y por último, Cuando se libera en el citosol,
el componente N-acetil-D-glucosamina del peptidoglicano bacteriano inhibe la actividad hexoquinasa de HK1 y
provoca su disociación de la membrana externa mitocondrial, activando así el inflamasoma NLRP3.

Rta/ Alfa hélice

Rta/ cuenta con 917 aminoácidos


sus funciones:

Rta/ Se evidencian 4 subunidades,de las cuales existen 2 pares; siendo dos iguales y las otras dos subunidades diferentes a las
anteriores pero iguales entre ellas. .
Rta/ 4FPB

Rta/

Se usará el blast de proteínas (Blastp)

Rta/

Esta opción nos permite elegir el conjunto de búsqueda, más específicamente la base de datos donde queremos que se busque
la info , se encuentra en la base de datos no redundante (nr) la cual tiene los registros no redundantes entre las dos bases de
datos principales a nivel mundial: GenBank en USA y EMBL (European Molecular Biology Laboratories) en Europa.

Rta/

En la parte de descripciones se muestran cuáles son los 100 mejores alineamientos obtenidos:
En el resumen gráfico se encuentra que es la descripción visual de organización de las secuencias organizando los 100
primeros, según su puntaje de alineamiento (que tan bien se alineó), donde los colores significan

negro-> mal puntaje

azul-> 40-50

verde-> 50-80

rojo-> buen puntaje alineamiento

en alineamientos mostrará los alineamientos de cada respuesta de forma detallada, se podrá ver con claridad aminoácidos que
no se alinearon y diferentes valores.

Rta/ Los señalados y resaltados a continuación

Rta/ Como vemos se tuvo un alineamiento del 100% lo que indica que los aminoácidos coincidieron en su totalidad, por lo que
ya sabemos que es la proteína > pdb | 4ZI1 | Cadena A, receptor de estrógeno beta

ID de secuencia: 4ZI1_A Longitud: 249


Rta/

● Tiene 142 aminoácidos


● FUENTE Homo sapiens (human)
● ORGANISMO Homo sapiens

Eucariota; Metazoos; Chordata; Craniata; Vertebrata; Euteleostomi;

Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;

Catarrhini; Hominidae; Homo.

● Función: Hemoglobina Dunn: ácido aspártico alfa 6 (A4) reemplazado por asparagina dos cadenas alfa más dos
cadenas beta constituyen HbA, que en la vida adulta normal comprende alrededor del 97% del total hemoglobina; las
cadenas alfa se combinan con las cadenas delta para constituir HbA-2, que con HbF (hemoglobina fetal) constituye el
3% restante de hemoglobina adulta. Las alfa talasemias son el resultado de deleciones de cada uno de los genes alfa,
así como las deleciones tanto de HBA2 como de HBA1; También se han informado algunas alfa talasemias sin
supresión.

Rta/

>NP_032244.2 hemoglobin subunit alpha [Mus musculus]

MVLSGEDKSNIKAAWGKIGGHGAEYGAEALERMFASFPTTKTYFPHFDVSHGSAQVKGHGKKVADALANA

AGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLASHHPADFTPAVHASLDKFLASVSTVLTSK

YR

Rta/

● Tiene 147 aminoácidos


● FUENTE Mus musculus (ratón doméstico)
● ORGANISMO Mus musculus

Eucariota; Metazoos; Chordata; Craniata; Vertebrata; Euteleostomi;


Mammalia; Eutheria; Euarchontoglires; Glires; Rodentia; Myomorpha;

Muroidea; Muridae; Murinae; Mus; Mus.

● Función: Este gen es uno de genes de beta-hemoglobina que están regulados distalmente por un locus de un grupo de
región de control, y que se organizan a lo largo del cromosoma en el orden de su expresión de desarrollo. En el ratón,
dos principales los haplotipos específicos de la cepa del grupo de genes de la beta-globina son encontrado - un
haplotipo 'único' encontrado en cepas de tipo C57BL /, que incluye dos genes de beta-globina adultos muy similares,
beta sy beta t, y un haplotipo 'difuso' que se encuentra en cepas como BALB / c y 129Sv, que incluye dos beta-globina
adulta algo diversa genes, beta-mayor y beta-menor. Este gen representa la beta s gen adulto encontrado en el
haplotipo "único". Cromosoma primario 7 de el ensamblaje del genoma de referencia del ratón, que se deriva de C57BL
/ 6 cepa de ratones, representa el haplotipo 'único', mientras que el 'difuso' El haplotipo está representado en la
colección del genoma de referencia por el alterno de cepa BALB / c, NT_095534.1.

Rta/

> NP_001188320.1 hemoglobina, cadena s beta del adulto [Mus musculus]


MVHLTDAEKAAVSGLWGKVNADEVGGEALGRLLVVYPWTQRYFDSFGDLSSASAIMGNAKVKAHGKKVIT
AFNDGLNHLDSLKGTFASLSELHCDKLHVDPENFRLLGNMIVIVLGHHLGKDFTPAAQAAFQKVVAGVAA
ALAHKYH

Rta/ En esta parte nos muestra la comparación o alineación de los dos FASTA insertados, donde a un lado nos indica el nombre
de la proteína y donde nos muestra de cada bloque la alineación con cada letra que representa un aminoácido con una
indicación al lado derecho del número de aminoácidos en cada línea.

Rta/ En esta parte cada tipo aminoácido tendrá un color para así ser más fácil la comparación de forma visual, los asteriscos
nos demuestran alineación perfecta, Los dos puntos (:) se refiere a un cambio dentro de los dos aminoácidos, pero el algoritmo
indica que esos aminoácidos diferentes tienen cierto parecido (cambio conservativo).
Un punto (.) es un cambio no conserva la parte evolutiva, dos aminoácidos que tienen diferencias notables
Donde no hay nada, quiere decir que los aminoácidos son TOTALMENTE diferentes no tiene relación.
La secuencia cuenta con una serie de líneas consecutivas que corresponden a los espacios que no coinciden, por lo que se
separan con los guiones hasta tener una parte de la otra secuencia que logre coincidir, es algo denominado gaps donde se
abren espacios para lograr coincidencia en las secciones de los FASTA comparados.

También podría gustarte