Documentos de Académico
Documentos de Profesional
Documentos de Cultura
sistemas y Lab
Profesor: Antonio Jesús Tamayo Herrera
Instrucciones
Marque la hoja del examen con su nombre y número de TIP. Lea atentamente cada uno de los
ejercicios y comience a solucionarlos. La interpretación de todos los ejercicios hace parte del
examen. No se responden preguntas durante el mismo y no se permite sacar ningún
tipo de notas de clase. Solo debe usar lapiz/lapicero, borrador, sacapuntas y calculadora
si lo considera necesario. El uso de cualquier otro dispositivo como smartphones, tablets o
computadores no está permitido durante el examen.
Sea cuidadoso en sus argumentaciones, solo responda de manera precisa lo que se le pregunta,
evitando poner información adicional que pueda opacar la claridad de sus respuestas. Preste
atención a las preguntas que piden una respuesta argumentada o que piden mostrar
el procedimiento usado para hallar la respuesta, no olvide argumentar o mostrar
dicho procedimiento, de lo contrario su respuesta quedará incompleta
Nombre: TIP:
1
Parte 1
Ejercicio 1
Suponga que usted se enfrenta a un problema de clasificación de dos clases y cuenta con una
base de datos de 1000 muestras (observaciones), en la cual tiene 700 muestras de una clase y
300 muestras de otra clase. Usted eligió implementar un modelo clasificador SVM y durante el
proceso de entrenamiento decidió hacer una única vez, una partición aleatoria de los datos en
70-30 (70% para entrenamiento y 30% para validación) y entrenar el modelo con esta partición
de los datos. En este contexto, ¿cuál(es) de las siguientes afirmaciones es(son) correcta(s)?
Este punto puede tener múltiples respuestas.
2
Ejercicio 2
2.1 En sus palabras explique qué es la regularización.
3
Ejercicio 3
¿Cuáles son las funciones de activación que se usan en una red neuronal (MLP)?
¿Cuáles son para un problema de clasificación biclase y multiclase y en que capa? Explique.
Con un modelo de red nueronal artificial (MLP), para un problema de clasificación biclase, es
necesario usar la técnica One Hot Encoding?
a. Verdadero
b. Falso
Argumente su respuesta.
4
Ejercicio 4
Basado en la arquitectura de red neuronal artificial (MLP) mostrada en la Figura 3, resuelva
los literales del ejercicio 4.
Figure 1:
Nota: tenga cuidado con los subı́ndices de los pesos. Observe los que se dan de ejemplo. No
olvide los pesos que acompañan el término (neurona) independiente en cada capa.
b. Usando una sigmoidal como función de activación en todas las capas de la red, escriba la
expresión para:
∂E(w)
(1) =
∂w11
Ayuda:
1. Recuerde que dfdz(z) = f (z)(1 − f (z)), para la función sigmoidal
1
PN (4) t 2
2. Recuerde que: E(w) = 2N i=1 (a1i − yi )
5
Ejercicio 5
¿En qué consiste el uso del truco Kernel en el modelo SVM?
¿Con qué fin se introducen las variables de relajación en un modelo de máquinas de soporte
vectorial (SVM)?
6
Ejercicio 6
6.1 ¿De las siguientes afirmaciones, cuál es verdadera?
6.2 En sus palabras explique las diferencias entre las funciones tipo filtro y tipo wrapper.
6.3 Cuando se aplica el método de análisis de componentes principales, ¿qué se puede afirmar
de las nuevas variables generadas? Este punto puede tener múltiples respuestas.
7
Ejercicio 7
¿Qué busca el método LDA al proyectar las muestras para hacer reducción de dimensión?
Ejercicio 8
¿Qué busca el método PCA al proyectar las muestras para hacer reducción de dimensión?
8
Parte 21
Ejercicio 1
Consider that we want to find an SVM classification model for the following two problems.
Problem I involves building a diagnostic classifier of a viral disease from a dataset with 90,000
patients, each of which is described by 50 biomarkers. Problem II involves building a prognostic
classifier of breast cancer metastasis from a dataset with 200 patients, each of which is described
by 100,000 values of mass over charge from a mass-spectrometry proteomics assay. All other
things being equal, what is the most computationally efficient way to solve these problems?
(a) Solve problem I in the primal SVM formulation, and problem II in the primal SVM
formulation
(b) Solve problem I in the primal SVM formulation, and problem II in the dual SVM for-
mulation
(c) Solve problem I in the dual SVM formulation, and problem II in the primal SVM for-
mulation
(d) Solve problem I in the dual SVM formulation, and problem II in the dual SVM formu-
lation
Explain why.
1
Exercises taken from: A gentle introduction to support vector machines in biomedicine. Statnikov A. et al.
(2011) World Scientific Publishing.
9
Ejercicio 2
Consider two hyperplanes shown in next Figure Assume for the sake of this problem that both
of them have the same gap between border-line objects. Which one of these hyperplanes will
be found by the soft-margin SVM algorithm? Explain why.
Figure 2:
10
Ejercicio 3
Consider data shown in next Figure. Which of the two hyperplanes is more likely to result
from application of the soft-margin SVM with a smaller value of C ? Explain why.
Figure 3:
Ejercicio 4
Which function Φ(~x) should be used to obtain linear primal SVM formulation from the non-
linear one?
(a) Φ(~x) = 1
(b) Φ(~x) = 12
(c) Φ(~x) = x
Ejercicio 5
Which kernel function K(~
xi , x~j ) should be used to obtain linear dual SVM formulation from
the non-linear one?
a). K(~
xi , x~j ) = 1
b). K(~
xi , x~j ) = x~i
c). K(~
xi , x~j ) = x~j
11
Ejercicio 6
What is the mapping function Φ(~x) for the kernel K(~ xi · x~j )2
xi , x~j ) = 1 + (~
x2
√ (1)
a). Φ(~x) = 2x(1) x(2)
x2
2 (2)
x(1)
b). Φ(~x) =
x2
(2)
1
√2x
√ (1)
2x(2)
c). Φ(~x) = √
2x(1) x(2)
x2(1)
x2(2)
x(1)
d). Φ(~x) =
x(2)
Nota:
Estudiar también los ejercicios y ejemplos desarrollados durante las clases.
12