PP#3 III-U ABC Danny Yanchapanta VI Software 202351 3.6 4

CARRERA DE INGENIERÍA DE SOFTWARE
APLICACIÓNES BASADAS EN EL CONOCIMIENTO

PRUEBA UNIDAD III
Nombre: Danny Yanchapanta Puntaje: 4 ptos.

Fecha: 8 de marzo de 2024 Tiempo: 30 min.
En cada ítem realice, explique e inserte los cálculos respectivos
1. En el contexto de la generación de candidatos y dada la imagen de abajo, indique la

afirmación incorrecta.
1 punto
a) La generación de candidatos en sí misma también requiere aprendizaje.
b) Para este tipo de ventanas candidatas será más conveniente el uso de modelos holísticos que
de DPMs.
c) Corresponde a la estrategia de generación de candidatos conocida como “selective search”.
d) Idealmente, con una sola ejecución del algoritmo tendremos simultáneamente los candidatos
para detectar distintos tipos de objetos, y a diferentes escalas.
2. El algoritmo de etiquetaje de componentes conexas se basa en dos recorridos de la imagen.

En el primer recorrido etiqueta y anota equivalencias, en el segundo resuelve las
equivalencias y re-etiqueta.
Siguiendo los pasos de los algoritmos, y suponiendo que está en el primer recorrido y que se utiliza
conectividad a 8, explica cómo etiqueta los siguientes pasos, indicando qué afirmación es correcta.
NOTA: puede haber más de una.
A. En el caso (b), X tomará una etiqueta nueva
B. En el caso (d), X tomará una etiqueta nueva
C. En el caso (a), X tomará una etiqueta nueva
D. En el caso (b), las etiquetas E1 y E2 pasarán a ser equivalentes
E. En el caso (c), X tomará una etiqueta nueva
F. En el caso (a), X tomará la etiqueta E
G. En el caso (c), las etiquetas E1 y E2 pasarán a ser equivalentes
3. Si se aplica el algoritmo de template matching con este template:
Y la medida de semejanza que se aplica es la correlación normalizada, calcula el valor que dará
el TM aplicado al caso (1), si para el caso (2) ha dado 255 después de ser re-escalado.
6 ∗ (255 ∗ 255)
𝑇𝑀(𝑥, 𝑦) =
√8 ∗ 2552 ∗ 6 ∗ 2552
𝑇𝑀(𝑥, 𝑦) = 0.866 ∗ 255
𝑻𝑴(𝒙, 𝒚) = 𝟐𝟐𝟎. 𝟖𝟑
4. Se ha aplicado el método del Template Matching a la imagen de la derecha, con el template

dado. El mapa de semejanza que ha calculado corresponde a la imagen de la izquierda. Y
sobre la imagen de la derecha aparecen dos ventanas que son el resultado de la localización
a partir del mapa de semejanza.
Indique cuál de los siguientes procedimientos se ha aplicado para obtener este resultado:
A. Se ha aplicado TM con Cálculo de correlación normalizada y se ha localizado los mínimos
locales más pequeños.
B. Se ha aplicado TM con Cálculo de correlación normalizada, se han localizado los máximos
locales más grandes.
C. Se ha aplicado TM con Cálculo de diferencia y se han localizado el mínimo global y el
mínimo local más pequeño.
D. Se ha aplicado TM con cálculo de diferencia y se han localizado los mínimos más grandes.
5. Indica cuál será el resultado de la convolución de la imagen, I, con los filtros, k1 y k2,
respectivamente.
A. 765 y -765
B. 765 y -255
C. 255 y -255
D. 3 y -1
Solución:
K1
𝐫(𝐱, 𝐲) = (−1 ∗ 0) + (1 ∗ 255) + (−1 ∗ 0) + (−1 ∗ 0) + (1 ∗ 255) + (−1 ∗ 0) + (−1

∗ 0) + (1 ∗ 255) + (−1 ∗ 0)
𝐫(𝐱, 𝐲) = 0 + 255 + 0 + 0 + 255 + 0 + 0 + 255 + 0 = 𝟕𝟔𝟓
K2
𝐫(𝐱, 𝐲) = (−1 ∗ 0) + (−1 ∗ 255) + (−1 ∗ 0) + (1 ∗ 0) + (1 ∗ 255) + (1 ∗ 0) + (−1

∗ 0) + (−1 ∗ 255) + (−1 ∗ 0)
𝐫(𝐱, 𝐲) = 0 − 255 + 0 + 0 + 255 + 0 + 0 − 255 + 0 = −𝟐𝟓𝟓
6. Indica las afirmaciones correctas.

1 punto.
a) El algoritmo de refinación de pre-candidatos trabaja con ventanas de tamaño canónico.
b) Supongamos que dadas dos pre-detecciones “A” y “B”, la

función
SeSolapanLoSuficiente(A, B) SeSolapanLoSuficiente(A, B) es cierta si la intersección de
“A” y “B” supera el 50% del área de “A” (todo en número de píxeles). Entonces, dadas otras
dos pre-detecciones “X” e “Y” cualquiera, SeSolapanLoSuficiente(X, Y)
SeSolapanLoSuficiente(X, Y) devuelve el mismo resultado que
SeSolapanLoSuficiente(Y, X)SeSolapanLoSuficiente(Y, X).
c) El algoritmo de refinación de pre-candidatos tiene en cuenta la confidencia/probabilidad que

el clasificador de candidatos asignó a las ventanas correspondientes a esos precandidatos.
d) El algoritmo de refinación que hemos visto, devuelve una detección “promedio” para cada
grupo de pre-detecciones. Es decir, las detecciones no corresponden a un subconjunto de las
pre-detecciones.
7. Dadas las dos ventanas que se ven en la figura, indica qué afirmación es correcta:
A. Si usamos un histograma de códigos LBP para describir cada ventana, los histogramas de
estas dos ventanas son exactamente iguales.
B. La afirmación anterior solo es cierta si los códigos son de tipo LBP uniforme.
C. Si usamos un histograma de códigos LBP para describir cada ventana, los histogramas de
estas dos ventanas nos son exactamente iguales pero la diferencia es totalmente negligible.
D. La afirmación anterior solo es cierta si los códigos son de tipo LBP uniforme.
8. Dados los resultados de los tres clasificadores representados en colores, indica cuál será la
exactitud (accuracy) en cada uno de los casos. Cuál y porque de los clasificadores escogería:
1 punto
NOTA IMPORTANTE. El resultado debe indicarse según el siguiente orden: " Exactitud
Clasificador 1", " Exactitud Clasificador 2", " Exactitud Clasificador 3".
12 + 24
𝐸𝑥𝑎𝑐𝑡𝑖𝑡𝑢𝑑 𝐶𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑟 1 = = 0.69
(12 + 24 + 6 + 10)
14 + 23
(12 + 23 + 6 + 10)
19 + 25
19 + 25 + 5 + 3
9. Supongamos que el descriptor de esta ventana, de 64x128 píxeles, se basa en calcular códigos
LBP y tiene dimensión 1888, es decir, se utilizan 1888 características para describirla.
Indica qué afirmación es correcta:
A. Usamos LBP uniforme y hemos creado bloques no solapados de 16x16 píxeles, entonces
hemos calculado el histograma de códigos de cada bloque y los hemos concatenado todos.
B. Usamos LBP no uniforme y hemos creado bloques no solapados de 32x32 píxeles, entonces
hemos calculado el histograma de códigos de cada bloque y los hemos concatenado todos
C. El descriptor consiste en el histograma de los códigos LBP de toda la ventana.
D. El descriptor consiste en concatenar los códigos LBP de todos los píxeles de la ventana.
10. Dada la figura de abajo, indique las afirmaciones correctas.

1 punto.
a) El peatón “B” se detectará en un nivel de la pirámide más bajo que el peatón “A”.
b) El peatón “A” se detectará en un nivel de la pirámide más bajo que el peatón “B”.
c) El tamaño (altura y anchura) de la ventana que detecta al peatón “A”, está más cercano al
tamaño canónico que el tamaño de la ventana que detecta al peatón “B”.
d) El tamaño (altura y anchura) de la ventana que detecta al peatón “B”, está más cercano al
tamaño canónico que el tamaño de la ventana que detecta al peatón “A”.

PP#3 III-U ABC Danny Yanchapanta VI Software 202351 3.6 4

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

PP#3 III-U ABC Danny Yanchapanta VI Software 202351 3.6 4

Cargado por

Copyright:

Formatos disponibles

CARRERA DE INGENIERÍA DE SOFTWARE

APLICACIÓNES BASADAS EN EL CONOCIMIENTO

Nombre: Danny Yanchapanta Puntaje: 4 ptos.

En cada ítem realice, explique e inserte los cálculos respectivos

1. En el contexto de la generación de candidatos y dada la imagen de abajo, indique la

a) La generación de candidatos en sí misma también requiere aprendizaje.

c) Corresponde a la estrategia de generación de candidatos conocida como “selective search”.

2. El algoritmo de etiquetaje de componentes conexas se basa en dos recorridos de la imagen.

3. Si se aplica el algoritmo de template matching con este template:

𝑇𝑀(𝑥, 𝑦) = 0.866 ∗ 255

4. Se ha aplicado el método del Template Matching a la imagen de la derecha, con el template

𝐫(𝐱, 𝐲) = (−1 ∗ 0) + (1 ∗ 255) + (−1 ∗ 0) + (−1 ∗ 0) + (1 ∗ 255) + (−1 ∗ 0) + (−1

𝐫(𝐱, 𝐲) = 0 + 255 + 0 + 0 + 255 + 0 + 0 + 255 + 0 = 𝟕𝟔𝟓

𝐫(𝐱, 𝐲) = (−1 ∗ 0) + (−1 ∗ 255) + (−1 ∗ 0) + (1 ∗ 0) + (1 ∗ 255) + (1 ∗ 0) + (−1

𝐫(𝐱, 𝐲) = 0 − 255 + 0 + 0 + 255 + 0 + 0 − 255 + 0 = −𝟐𝟓𝟓

6. Indica las afirmaciones correctas.

a) El algoritmo de refinación de pre-candidatos trabaja con ventanas de tamaño canónico.

b) Supongamos que dadas dos pre-detecciones “A” y “B”, la

c) El algoritmo de refinación de pre-candidatos tiene en cuenta la confidencia/probabilidad que

C. El descriptor consiste en el histograma de los códigos LBP de toda la ventana.

10. Dada la figura de abajo, indique las afirmaciones correctas.

También podría gustarte