Está en la página 1de 6

102784 [20380] Visió per Computador Prueba 2 (2019) A

Teorı́a (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)
1. Para llegar a la expresión del detector de Harris necesitamos aproximar el valor de la imagen en los
pı́xeles de una vecindad (intensidades trasladas). Qué se usa para este fin.

a) Calculamos la SVD de esa vecindad


b) Filtramos la imagen con una gaussiana
c) Traslaciones horizontales y verticales de la imagen
d) Un desarrollo de Taylor del valor de la imagen en ese punto

2. El valor final del detector de Harris, R, tiene que ser

a) grande y positivo
b) cercano a cero
c) valor absoluto grande
d) negativo

3. La localización final de las esquinas en el detector de Harris

a) R es una imagen de puntos binaria, sale por tanto directamente de R


b) calculamos mı́nimos locales sobre algunos valores de R
c) calculamos máximos locales sobre algunos valores de R
d) son los n valores máximos de la imagen R

4. imshow(atan2(conv2(im,[1,-1]’,’same’),conv2(im,[1,-1],’same’)),[]).

a) representa el gradiente de la imagen im


b) representa el módulo del gradiente de la imagen im
c) representa la orientación del gradiente de la imagen im
d) representa la arcotangente al cuadrado de las derivadas de la imagen im

5. la máscara [-1 0 1; -2 0 2; -1 0 1] es el kernel de convolución que

a) calcula la derivada x del detector de Roberts


b) calcula la derivada y del detector de Roberts
c) calcula la derivada x del detector de Sobel
d) calcula la derivada y del detector de Sobel
78 83 80
6. Si calculamos el código LBP para esta subimagen 71 70 72 obtenemos
65 51 47

a) 1 0 0 0 1 1 1 1
b) 5/3
c) 241
d) 2 -23 -19 -5 1 8 13 10

7. En una Haar-like feature consiste en

a) la diferencia de energı́a (intensidad) de una región rectangular y la de otra región rectangular.


b) la diferencia de energı́a de los contornos en x y los contornos en y de una región rectangular.
c) la ratio entre la energı́a de los contornos en x y los contornos en y de una región rectangular.
d) el histograma de orientaciones del gradiente ponderado por la magnitud del gradiente en una región
rectangular.

8. Cuál de estas técnicas no se considera un algoritmo de segmentación.

a) Otsu
b) Snake
c) Watershed
d) Tenengrad

9. El resultado de un algoritmo de superpı́xeles lo podemos considerar una

a) oversegmentation (demasiado segmentado)


b) undersegmentation (poco segmentado)
c) segmentación final (segmentación justa)
d) segmentación conductual (segmentación según el comportamiento)

10. El open residue o top-hat de una imagen im cómo se calcula.

a) im - erode(dilate(im))
b) im - dilate(erode(im))
c) erode(dilate(im)) - im
d) dilate(erode(im)) - im

11. En un problema de segmentación sabemos que tenemos 3 clases bien diferenciadas, cuál de estos algo-
ritmos elegiremos

a) Niblack
b) Otsu
c) Tenengrad
d) k-means

12. Cuáles son las distancias L2 , L1 y L∞ entre a = [3, 2, −1] y b = [0, −2, −1].

a) 13, 5, 3
b) 5, 7, 4
c) 25, 5, 3
d) 7, 5, 0

13. Cuál de las siguientes afirmaciones es falsa sobre la matriz de confusión

a) Los false positives están fuera de la diagonal y los false negative en la diagonal.
b) Los false positives y los false negative están fuera de la diagonal.
c) La suma de true positives, true negative, false positives, false negative es el número total de mues-
tras.
d) Los true positives y los true negative están sobre la diagonal.
14. La distancia de Mahalanobis

a) adapta la escala de la medida a la geometrı́a de los datos obtenida a partir de la correlación de estos.
b) es isotrópica y por tanto no varı́a con la dirección.
c) es una extensión de la distancia euclı́dea para el caso de más de tres dimensiones.
d) permite valores negativos para puntos muy alejados

15. Cuál de estas operaciones no es una cross-validation

a) 1-fold cross-validation
b) 2-fold cross-validation
c) 10-fold cross-validation
d) N-fold cross-validation

16. SVM como algoritmo de clasificación lo podemos considerar como un algoritmo de aprendizaje

a) reforzado.
b) profundo.
c) supervisado.
d) no supervisado.

17. La clasificación y la regresión están relacionadas por

a) nada, no tienen nada que ver.


b) predecir valores, clasificación obtiene valores continuos y la regresión discretos.
c) predecir valores, clasificación obtiene valores discretos y la regresión continuos.
d) ambas predicen valores discretos.

18. En un par estéreo, los posibles puntos de la segunda imagen que geométricamente pueden tener corres-
pondencia con un punto determinado de la primera imagen

a) están sobre la lı́nea de rectificación


b) están sobre la lı́nea epipolar
c) son todos los de la segunda imagen
d) recaen sobre una curva clotoide

19. En cuál de estas técnicas de reconstrucción 3D no cambiamos el punto de vista de la cámara respecto
del objeto.

a) photometric stereo
b) multiview stereo
c) volum intersection (carving)
d) shape from movement

20. Cuál de estas funciones de activación es una ReLU

a) σ(x) = ωx + b
1
b) σ(x) = 1+e−x
c) σ(x) = tanh(x)
d) σ(x) = máx(0, x)
21. En una red feedforward tı́pica (AlexNet, VGG-16, ...) las capas convolucionales

a) están al final y se encargan de generar las caracterı́sticas que permitirán clasificar


b) están al principio y se encargan de generar las caracterı́sticas que permitirán clasificar
c) están al final y se encargan básicamente de clasificar
d) están al principio y se encargan básicamente de clasificar

22. Cuál de estas Loss functions utilizaremos para clasificar en una red neuronal

a) L2
b) Logistic
c) L1
d) Huber

23. Cuál de estas afirmaciones referente a las Reccurrent (RNN) no es cierta.

a) Las LSTM son un tipo de RNN.


b) Se han usado con éxito en traducción automática.
c) Los entrenamientos se reducen significativamente respecto a esquemas más tradicionales.
d) Las salidas se usan como entradas, y permite a la red exhibir un comportamiento temporal.

24. Cuál de estas capas/proceso permite tener una salida que emula una probabilidad.

a) Dropout
b) Training loss minimization
c) Softmax
d) Max pooling

25. Qué hace la técnica del weight decay.

a) establece un learning rate que decrece con el tiempo.


b) evita que lo pesos se hagan grandes.
c) establece que los pesos decaigan con el tiempo.
d) favorece que la importancia del resultado recaiga en unas pocas neuronas.

Apellidos: , Nombre:
NIU: , DNI: Prueba 2 (2019) A
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
a a a a a a a a a a a a a a a a a a a a a a a a a
b b b b b b b b b b b b b b b b b b b b b b b b b B:
c c c c c c c c c c c c c c c c c c c c c c c c c M:
d d d d d d d d d d d d d d d d d d d d d d d d d ∅:

 
102784 [20380] Visió per Computador Prueba 2 (2019) A
Apellidos: , Nombre:
NIU: , DNI:
Problemas (10p)
1. (3p) Implementa un detector de cı́rculos para un radio fijo basado en la transformada de Hough para
cı́rculos.

2. (2p) Implementa un algoritmo de segmentación global (similar a Otsu) pero basado en un k-means (2-
means) uno de los centroides para los pı́xeles claros y otro para los oscuros.
3. (2p) En un OCR de dı́gitos manuscritos tenemos representado cada uno de estos dı́gitos con un vector
de caracterı́sticas de 16384 valores. Queremos hacernos una idea de si el vector que hemos elegido será
capaz de discernir y separar las diferentes clases y para ello queremos representar toda la base de datos
de dı́gitos en un espacio de 3 dimensiones para poder visualizarlo. Qué montaremos y cómo lo podemos
implementar.

4. (3p) Queremos montar una app que sea capaz de distinguir pokemons capturados con la cámara del
móvil. Hemos decidido usar un Bag of Words. Cómo lo implementaremos. Qué ventajas tendremos
respecto a otras propuestas.

También podría gustarte