Visio19 2A PDF

102784 [20380] Visió per Computador Prueba 2 (2019) A
Teorı́a (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)
1. Para llegar a la expresión del detector de Harris necesitamos aproximar el valor de la imagen en los
pı́xeles de una vecindad (intensidades trasladas). Qué se usa para este fin.
a) Calculamos la SVD de esa vecindad

b) Filtramos la imagen con una gaussiana
c) Traslaciones horizontales y verticales de la imagen
d) Un desarrollo de Taylor del valor de la imagen en ese punto
2. El valor final del detector de Harris, R, tiene que ser
a) grande y positivo
b) cercano a cero
c) valor absoluto grande
d) negativo
3. La localización final de las esquinas en el detector de Harris
a) R es una imagen de puntos binaria, sale por tanto directamente de R

b) calculamos mı́nimos locales sobre algunos valores de R
c) calculamos máximos locales sobre algunos valores de R
d) son los n valores máximos de la imagen R
4. imshow(atan2(conv2(im,[1,-1]’,’same’),conv2(im,[1,-1],’same’)),[]).
a) representa el gradiente de la imagen im

b) representa el módulo del gradiente de la imagen im
c) representa la orientación del gradiente de la imagen im
d) representa la arcotangente al cuadrado de las derivadas de la imagen im
5. la máscara [-1 0 1; -2 0 2; -1 0 1] es el kernel de convolución que
a) calcula la derivada x del detector de Roberts

b) calcula la derivada y del detector de Roberts
c) calcula la derivada x del detector de Sobel
d) calcula la derivada y del detector de Sobel
78 83 80
6. Si calculamos el código LBP para esta subimagen 71 70 72 obtenemos
65 51 47
a) 1 0 0 0 1 1 1 1
b) 5/3
c) 241
d) 2 -23 -19 -5 1 8 13 10
7. En una Haar-like feature consiste en
a) la diferencia de energı́a (intensidad) de una región rectangular y la de otra región rectangular.

b) la diferencia de energı́a de los contornos en x y los contornos en y de una región rectangular.
c) la ratio entre la energı́a de los contornos en x y los contornos en y de una región rectangular.
d) el histograma de orientaciones del gradiente ponderado por la magnitud del gradiente en una región
rectangular.
8. Cuál de estas técnicas no se considera un algoritmo de segmentación.
a) Otsu
b) Snake
c) Watershed
d) Tenengrad
9. El resultado de un algoritmo de superpı́xeles lo podemos considerar una
a) oversegmentation (demasiado segmentado)

b) undersegmentation (poco segmentado)
c) segmentación final (segmentación justa)
d) segmentación conductual (segmentación según el comportamiento)
10. El open residue o top-hat de una imagen im cómo se calcula.
a) im - erode(dilate(im))
b) im - dilate(erode(im))
c) erode(dilate(im)) - im
d) dilate(erode(im)) - im
11. En un problema de segmentación sabemos que tenemos 3 clases bien diferenciadas, cuál de estos algo-
ritmos elegiremos
a) Niblack
b) Otsu
c) Tenengrad
d) k-means
12. Cuáles son las distancias L2 , L1 y L∞ entre a = [3, 2, −1] y b = [0, −2, −1].
√
a) 13, 5, 3
b) 5, 7, 4
c) 25, 5, 3
d) 7, 5, 0
13. Cuál de las siguientes afirmaciones es falsa sobre la matriz de confusión
a) Los false positives están fuera de la diagonal y los false negative en la diagonal.
b) Los false positives y los false negative están fuera de la diagonal.
c) La suma de true positives, true negative, false positives, false negative es el número total de mues-
tras.
d) Los true positives y los true negative están sobre la diagonal.
14. La distancia de Mahalanobis
a) adapta la escala de la medida a la geometrı́a de los datos obtenida a partir de la correlación de estos.
b) es isotrópica y por tanto no varı́a con la dirección.
c) es una extensión de la distancia euclı́dea para el caso de más de tres dimensiones.
d) permite valores negativos para puntos muy alejados
15. Cuál de estas operaciones no es una cross-validation
a) 1-fold cross-validation
b) 2-fold cross-validation
c) 10-fold cross-validation
d) N-fold cross-validation
16. SVM como algoritmo de clasificación lo podemos considerar como un algoritmo de aprendizaje
a) reforzado.
b) profundo.
c) supervisado.
d) no supervisado.
17. La clasificación y la regresión están relacionadas por
a) nada, no tienen nada que ver.

b) predecir valores, clasificación obtiene valores continuos y la regresión discretos.
c) predecir valores, clasificación obtiene valores discretos y la regresión continuos.
d) ambas predicen valores discretos.
18. En un par estéreo, los posibles puntos de la segunda imagen que geométricamente pueden tener corres-
pondencia con un punto determinado de la primera imagen
a) están sobre la lı́nea de rectificación

b) están sobre la lı́nea epipolar
c) son todos los de la segunda imagen
d) recaen sobre una curva clotoide
19. En cuál de estas técnicas de reconstrucción 3D no cambiamos el punto de vista de la cámara respecto
del objeto.
a) photometric stereo
b) multiview stereo
c) volum intersection (carving)
d) shape from movement
20. Cuál de estas funciones de activación es una ReLU
a) σ(x) = ωx + b
1
b) σ(x) = 1+e−x
c) σ(x) = tanh(x)
d) σ(x) = máx(0, x)
21. En una red feedforward tı́pica (AlexNet, VGG-16, ...) las capas convolucionales
a) están al final y se encargan de generar las caracterı́sticas que permitirán clasificar

b) están al principio y se encargan de generar las caracterı́sticas que permitirán clasificar
c) están al final y se encargan básicamente de clasificar
d) están al principio y se encargan básicamente de clasificar
22. Cuál de estas Loss functions utilizaremos para clasificar en una red neuronal
a) L2
b) Logistic
c) L1
d) Huber
23. Cuál de estas afirmaciones referente a las Reccurrent (RNN) no es cierta.
a) Las LSTM son un tipo de RNN.

b) Se han usado con éxito en traducción automática.
c) Los entrenamientos se reducen significativamente respecto a esquemas más tradicionales.
d) Las salidas se usan como entradas, y permite a la red exhibir un comportamiento temporal.
24. Cuál de estas capas/proceso permite tener una salida que emula una probabilidad.
a) Dropout
b) Training loss minimization
c) Softmax
d) Max pooling
25. Qué hace la técnica del weight decay.
a) establece un learning rate que decrece con el tiempo.

b) evita que lo pesos se hagan grandes.
c) establece que los pesos decaigan con el tiempo.
d) favorece que la importancia del resultado recaiga en unas pocas neuronas.
Apellidos: , Nombre:
NIU: , DNI: Prueba 2 (2019) A

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
a a a a a a a a a a a a a a a a a a a a a a a a a
b b b b b b b b b b b b b b b b b b b b b b b b b B:
c c c c c c c c c c c c c c c c c c c c c c c c c M:
d d d d d d d d d d d d d d d d d d d d d d d d d ∅:

102784 [20380] Visió per Computador Prueba 2 (2019) A
Apellidos: , Nombre:
NIU: , DNI:
Problemas (10p)
1. (3p) Implementa un detector de cı́rculos para un radio fijo basado en la transformada de Hough para
cı́rculos.
2. (2p) Implementa un algoritmo de segmentación global (similar a Otsu) pero basado en un k-means (2-
means) uno de los centroides para los pı́xeles claros y otro para los oscuros.
3. (2p) En un OCR de dı́gitos manuscritos tenemos representado cada uno de estos dı́gitos con un vector
de caracterı́sticas de 16384 valores. Queremos hacernos una idea de si el vector que hemos elegido será
capaz de discernir y separar las diferentes clases y para ello queremos representar toda la base de datos
de dı́gitos en un espacio de 3 dimensiones para poder visualizarlo. Qué montaremos y cómo lo podemos
implementar.
4. (3p) Queremos montar una app que sea capaz de distinguir pokemons capturados con la cámara del
móvil. Hemos decidido usar un Bag of Words. Cómo lo implementaremos. Qué ventajas tendremos
respecto a otras propuestas.

Visio19 2A PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Visio19 2A PDF

Cargado por

Copyright:

Formatos disponibles

102784 [20380] Visió per Computador Prueba 2 (2019) A

a) Calculamos la SVD de esa vecindad

2. El valor final del detector de Harris, R, tiene que ser

3. La localización final de las esquinas en el detector de Harris

a) R es una imagen de puntos binaria, sale por tanto directamente de R

a) representa el gradiente de la imagen im

5. la máscara [-1 0 1; -2 0 2; -1 0 1] es el kernel de convolución que

a) calcula la derivada x del detector de Roberts

7. En una Haar-like feature consiste en

a) la diferencia de energı́a (intensidad) de una región rectangular y la de otra región rectangular.

8. Cuál de estas técnicas no se considera un algoritmo de segmentación.

9. El resultado de un algoritmo de superpı́xeles lo podemos considerar una

a) oversegmentation (demasiado segmentado)

10. El open residue o top-hat de una imagen im cómo se calcula.

13. Cuál de las siguientes afirmaciones es falsa sobre la matriz de confusión

15. Cuál de estas operaciones no es una cross-validation

17. La clasificación y la regresión están relacionadas por

a) nada, no tienen nada que ver.

a) están sobre la lı́nea de rectificación

20. Cuál de estas funciones de activación es una ReLU

a) están al final y se encargan de generar las caracterı́sticas que permitirán clasificar

23. Cuál de estas afirmaciones referente a las Reccurrent (RNN) no es cierta.

a) Las LSTM son un tipo de RNN.

25. Qué hace la técnica del weight decay.

a) establece un learning rate que decrece con el tiempo.

También podría gustarte