Está en la página 1de 7

CARRERA DE INGENIERÍA DE SOFTWARE

APLICACIÓNES BASADAS EN EL CONOCIMIENTO


PRUEBA UNIDAD III

Nombre: Danny Yanchapanta Puntaje: 4 ptos.


Fecha: 8 de marzo de 2024 Tiempo: 30 min.

En cada ítem realice, explique e inserte los cálculos respectivos

1. En el contexto de la generación de candidatos y dada la imagen de abajo, indique la


afirmación incorrecta.
1 punto

a) La generación de candidatos en sí misma también requiere aprendizaje.

b) Para este tipo de ventanas candidatas será más conveniente el uso de modelos holísticos que
de DPMs.

c) Corresponde a la estrategia de generación de candidatos conocida como “selective search”.

d) Idealmente, con una sola ejecución del algoritmo tendremos simultáneamente los candidatos
para detectar distintos tipos de objetos, y a diferentes escalas.

2. El algoritmo de etiquetaje de componentes conexas se basa en dos recorridos de la imagen.


En el primer recorrido etiqueta y anota equivalencias, en el segundo resuelve las
equivalencias y re-etiqueta.

Siguiendo los pasos de los algoritmos, y suponiendo que está en el primer recorrido y que se utiliza
conectividad a 8, explica cómo etiqueta los siguientes pasos, indicando qué afirmación es correcta.
NOTA: puede haber más de una.
A. En el caso (b), X tomará una etiqueta nueva
B. En el caso (d), X tomará una etiqueta nueva
C. En el caso (a), X tomará una etiqueta nueva
D. En el caso (b), las etiquetas E1 y E2 pasarán a ser equivalentes
E. En el caso (c), X tomará una etiqueta nueva
F. En el caso (a), X tomará la etiqueta E
G. En el caso (c), las etiquetas E1 y E2 pasarán a ser equivalentes

3. Si se aplica el algoritmo de template matching con este template:

Y la medida de semejanza que se aplica es la correlación normalizada, calcula el valor que dará
el TM aplicado al caso (1), si para el caso (2) ha dado 255 después de ser re-escalado.

6 ∗ (255 ∗ 255)
𝑇𝑀(𝑥, 𝑦) =
√8 ∗ 2552 ∗ 6 ∗ 2552

𝑇𝑀(𝑥, 𝑦) = 0.866 ∗ 255

𝑻𝑴(𝒙, 𝒚) = 𝟐𝟐𝟎. 𝟖𝟑

4. Se ha aplicado el método del Template Matching a la imagen de la derecha, con el template


dado. El mapa de semejanza que ha calculado corresponde a la imagen de la izquierda. Y
sobre la imagen de la derecha aparecen dos ventanas que son el resultado de la localización
a partir del mapa de semejanza.
Indique cuál de los siguientes procedimientos se ha aplicado para obtener este resultado:
A. Se ha aplicado TM con Cálculo de correlación normalizada y se ha localizado los mínimos
locales más pequeños.
B. Se ha aplicado TM con Cálculo de correlación normalizada, se han localizado los máximos
locales más grandes.
C. Se ha aplicado TM con Cálculo de diferencia y se han localizado el mínimo global y el
mínimo local más pequeño.
D. Se ha aplicado TM con cálculo de diferencia y se han localizado los mínimos más grandes.

5. Indica cuál será el resultado de la convolución de la imagen, I, con los filtros, k1 y k2,
respectivamente.

A. 765 y -765
B. 765 y -255
C. 255 y -255
D. 3 y -1

Solución:
K1

𝐫(𝐱, 𝐲) = (−1 ∗ 0) + (1 ∗ 255) + (−1 ∗ 0) + (−1 ∗ 0) + (1 ∗ 255) + (−1 ∗ 0) + (−1


∗ 0) + (1 ∗ 255) + (−1 ∗ 0)

𝐫(𝐱, 𝐲) = 0 + 255 + 0 + 0 + 255 + 0 + 0 + 255 + 0 = 𝟕𝟔𝟓

K2

𝐫(𝐱, 𝐲) = (−1 ∗ 0) + (−1 ∗ 255) + (−1 ∗ 0) + (1 ∗ 0) + (1 ∗ 255) + (1 ∗ 0) + (−1


∗ 0) + (−1 ∗ 255) + (−1 ∗ 0)

𝐫(𝐱, 𝐲) = 0 − 255 + 0 + 0 + 255 + 0 + 0 − 255 + 0 = −𝟐𝟓𝟓

6. Indica las afirmaciones correctas.


1 punto.

a) El algoritmo de refinación de pre-candidatos trabaja con ventanas de tamaño canónico.

b) Supongamos que dadas dos pre-detecciones “A” y “B”, la


función
SeSolapanLoSuficiente(A, B) SeSolapanLoSuficiente(A, B) es cierta si la intersección de
“A” y “B” supera el 50% del área de “A” (todo en número de píxeles). Entonces, dadas otras
dos pre-detecciones “X” e “Y” cualquiera, SeSolapanLoSuficiente(X, Y)
SeSolapanLoSuficiente(X, Y) devuelve el mismo resultado que
SeSolapanLoSuficiente(Y, X)SeSolapanLoSuficiente(Y, X).

c) El algoritmo de refinación de pre-candidatos tiene en cuenta la confidencia/probabilidad que


el clasificador de candidatos asignó a las ventanas correspondientes a esos precandidatos.

d) El algoritmo de refinación que hemos visto, devuelve una detección “promedio” para cada
grupo de pre-detecciones. Es decir, las detecciones no corresponden a un subconjunto de las
pre-detecciones.

7. Dadas las dos ventanas que se ven en la figura, indica qué afirmación es correcta:
A. Si usamos un histograma de códigos LBP para describir cada ventana, los histogramas de
estas dos ventanas son exactamente iguales.

B. La afirmación anterior solo es cierta si los códigos son de tipo LBP uniforme.

C. Si usamos un histograma de códigos LBP para describir cada ventana, los histogramas de
estas dos ventanas nos son exactamente iguales pero la diferencia es totalmente negligible.

D. La afirmación anterior solo es cierta si los códigos son de tipo LBP uniforme.

8. Dados los resultados de los tres clasificadores representados en colores, indica cuál será la
exactitud (accuracy) en cada uno de los casos. Cuál y porque de los clasificadores escogería:
1 punto

NOTA IMPORTANTE. El resultado debe indicarse según el siguiente orden: " Exactitud
Clasificador 1", " Exactitud Clasificador 2", " Exactitud Clasificador 3".

12 + 24
𝐸𝑥𝑎𝑐𝑡𝑖𝑡𝑢𝑑 𝐶𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑟 1 = = 0.69
(12 + 24 + 6 + 10)
14 + 23
𝐸𝑥𝑎𝑐𝑡𝑖𝑡𝑢𝑑 𝐶𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑟 2 = = 0.72
(12 + 23 + 6 + 10)

19 + 25
𝐸𝑥𝑎𝑐𝑡𝑖𝑡𝑢𝑑 𝐶𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑟 3 = = 0.84
19 + 25 + 5 + 3

9. Supongamos que el descriptor de esta ventana, de 64x128 píxeles, se basa en calcular códigos
LBP y tiene dimensión 1888, es decir, se utilizan 1888 características para describirla.
Indica qué afirmación es correcta:

A. Usamos LBP uniforme y hemos creado bloques no solapados de 16x16 píxeles, entonces
hemos calculado el histograma de códigos de cada bloque y los hemos concatenado todos.

B. Usamos LBP no uniforme y hemos creado bloques no solapados de 32x32 píxeles, entonces
hemos calculado el histograma de códigos de cada bloque y los hemos concatenado todos

C. El descriptor consiste en el histograma de los códigos LBP de toda la ventana.

D. El descriptor consiste en concatenar los códigos LBP de todos los píxeles de la ventana.

10. Dada la figura de abajo, indique las afirmaciones correctas.


1 punto.
a) El peatón “B” se detectará en un nivel de la pirámide más bajo que el peatón “A”.

b) El peatón “A” se detectará en un nivel de la pirámide más bajo que el peatón “B”.

c) El tamaño (altura y anchura) de la ventana que detecta al peatón “A”, está más cercano al
tamaño canónico que el tamaño de la ventana que detecta al peatón “B”.

d) El tamaño (altura y anchura) de la ventana que detecta al peatón “B”, está más cercano al
tamaño canónico que el tamaño de la ventana que detecta al peatón “A”.

También podría gustarte