Está en la página 1de 4

Primer Parcial: Bioinformática 2018

Responda cada problema en hoja separada y no ocupe más de una carilla. Ponga el
nombre en cada carilla.

Problema 1 (30p):

Para realizar el alineamiento global de las secuencias nucleotídicas ATATCA y TATCATC decide
usar programación dinámica con el siguiente sistema de puntaje: Match=1, Mismatch= 0 y Gap
penalty= -1.

a) Complete la matriz de score y la matriz de traza que se muestran más abajo. Justifique
poniendo en cada casillero los valores de los 3 movimientos posibles en el llenado de las
celdas en blanco y resaltando el movimiento óptimo elegido entre celdas y la traza
correspondiente.

b) ¿Existe más de un alineamiento óptimo? En caso afirmativo indique cuales son los
alineamientos y a que caminos corresponden en la matriz de traza

c) ¿Cuál es el score de los alineamientos? Justifique


Problema 2:(20p)

Las proteínas kinasas regulan procesos celulares mediante la interacción con otras proteínas y
su posterior fosforilación en residuos clave. La proteína kinasa CDK2 (Cyclin Dependant Kinase
2) fosforila a diversas proteínas luego de interactuar con una región lineal de 6 aminoácidos. En
un experimento se identifican las secuencias de 3 proteínas blanco (Tabla 1) y usted decide
realizar un alineamiento múltiple para comenzar a comprender el motivo.

a) Escriba el árbol basado en similitud entre las tres secuencias


GAP-GAP=0. Costo de apertura de GAP = -10 y extensión de GAP = -1. Matriz Blosum62.

b) Calcule el score total del alineamiento.

c) Escriba una solución regular que contenga a las tres figuras.

Secuencias
Motivo1 F E R T K Y W A
Motivo2 F D - S E S W A
Motivo3 F D - `S D H W A

BLOSUM-62
Problema 3 (30p):

En un articulo publicado el 23 de abril (Zeraati et. al. “I-motif DNA structures are formed in the
nuclei of human cells “ Nature Chemistry 2018) en una prestigiosa revista, un grupo de científicos
australianos demuestra, utilizando anticuerpos monoclonales (mAb) la presencia de una
estructura especial del ADN, denominada motivo-i (Figura 1a), en diferentes condiciones de
cultivo celular. Esta estructura, se cree podría tener importantes funciones regulatorias, que
podrían ser utilizadas para el desarrollo de tratamientos contra diferentes enfermedades como el
cáncer o el Alzheimer. Usted tiene la suerte (o mala suerte, según su punto de vista) de ser el
bioinformático de este grupo y su tarea es utilizar métodos avanzados de análisis de secuencias
para buscar y estudiar los motivos-i. Su primer objetivo es construir un HMM que caracterice la
secuencia que define el motivo-i. Luego de trabajar con las secuencias obtenidas a partir de la
secuenciación de unas 100 regiones inmunoprecipitadas con el mAb, usted obtiene el HMM
descrito por el logo de la Figura 1b.

Figura 1.

1A 1B

Responda:

a) Sabiendo que utilizó un HMM que NO considera inserciones. Describa la estructura del HMM
obtenido indicando i) Número y tipos de estados, ii) Número y tipo parámetros del HMM. iii) ¿Que
problema resolvió usted cuando construyo el HMM?

b) Indique “brevemente” cómo procedería para buscar en el Genoma Humano potenciales


regiones capaces de formar motivos-i.

c) Al realizar la búsqueda del punto anterior encontró 73 regiones. Estas regiones fueron luego
evaluadas experimentalmente de acuerdo a su capacidad de formar motivos-i, sin embargo 5 de
estas regiones demostraron ser incapaces de formarlos. ¿cómo se denomina a este tipo de
resultado? ¿por qué ocurre?
Problema 4 (20p):
Verdadero o Falso. Justifique.
1. Si al realizar una búsqueda de homólogos con Blast se obtienen pocos resultados, para
tratar de aumentar el número de hits una posibilidad es aumentar el Word Size.
2. En una matriz PSSM generada por PSI-Blast los valores de las sustituciones
aminoacídicas son los de la matriz de entrada seleccionada.
3. Si se usa la matriz BLOSUM90 para una búsqueda en bases de datos con Blastp los
resultados que se obtienen son secuencias con una identidad de ≥90% con la secuencia
query.
4. Ref_seq es una base de datos no curada al presentar información de secuencias que
pueden haber sido generada en diferentes momentos, y presentar versiones alternativas
de secuencias y metadatos.

También podría gustarte