Está en la página 1de 11

VISIÓN ARTIFICIAL - Control 1

------------------------------------------------------------------------------------------------------------
Profesor: Juan Manuel Barrios
Alumno: Fredy Silva Opazo

----
Pregunta 1
Considere la siguiente imagen de 7 x 7 en escala de gris 8 bits

Pregunta (1a) (1 punto)


Escriba la imagen resultante de hacer convolución entre la imagen A y el siguiente kernel
K1 de 3 x 3.
Para realizar la convolución sólo considere los pixeles donde el kernel está
completamente contenido dentro de la imagen (por tanto, la imagen resultante es de
menor tamaño que la imagen original).

Respuesta (1a):

Matriz de 5x5
0 1 2 3 4 5
1 40 30 40 30 40
2 30 60 30 40 30
3 40 30 40 30 40
4 30 40 30 60 30
5 40 30 40 30 40

El cálculo es el siguiente (movimiento a la derecha):

Pixel A1,1:
• x1,1 = 100x0,1 + 0x0,1 + 0x0,1 + 0x0,1 + 100x0,2 + 0x0,1 + 0x0,1 + 0x0,1 +100x0,1
• x1,1 = 40

Pixel A1,2:
• x1,2 = 0x0,1 + 0x0,1 + 0x0,1 + 100x0,1 + 0x0,1 + 100x0,1 + 0x0,1 + 100x0,1 + 0x0,1
• x1,2 = 30

... Pixel A1,5:


• x1,5 = 100x0,1 + 0x0,1 + 0x0,1 + 0x0,1 + 100x0,2 + 0x0,1 + 0x0,1 + 0x0,1 + 100x0,1
• x1,5 = 40

Pixel A2,1:
• x2,1 = 0x0,1 + 100x0,1 + 0x0,1 + 0x0,1 + 0x0,1 + 100x0,1 + 0x0,1 + 100x0,1 + 0x0,1
• x2,1 = 30

Pixel A2,2:
• x2,2 = 100x0,1 + 0x0,1 + 100x0,1 + 0x0,1 + 100x0,2 + 0x0,1 + 100x0,1 + 0x0,1 +
100x0,1
• x2,2 = 60

Pixel A2,3...

K1 siempre debe estar contenido dentro de la matriz A, por lo que el llegar a la columna
5, se debe descender a la siguiente fila, siempre de izquierda a derecha. Esto mismo
ocurre al llegar a la fila 5 y querer avanzar a la fila 6, las filas de K1 quedarán fuera el
universo de A, por lo que ya no se puede descender. Es por ello que la matriz se reduce
a 5x5.
Pregunta (1b) (1 punto)
Escriba la imagen resultante de hacer convolución entre la imagen A y el siguiente kernel
K2 de 3 x 3 y después aplicar un umbral Ut con t=500:

Para realizar la convolución asuma que la imagen está rodeada de pixeles con valor 0
(por tanto, la imagen resultante es de igual tamaño que la imagen original)

Respuesta (1b):

Matriz convolución
0 1 2 3 4 5 6 7
1 200 -200 200 -200 300 -200 100
2 -200 300 -300 300 -300 300 -200
3 200 -300 500 -300 400 -300 300
4 -200 300 -300 300 -300 300 -200
5 300 -300 400 -300 500 -300 200
6 -200 300 -300 300 -300 300 -200
7 100 -200 300 -200 200 -200 200

Umbral 500
0 1 2 3 4 5 6 7
1 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0
3 0 0 1 0 0 0 0
4 0 0 0 0 0 0 0
5 0 0 0 0 1 0 0
6 0 0 0 0 0 0 0
7 0 0 0 0 0 0 0
Realicé la convolución entre la nueva imagen A y el nuevo kernel K1 y que la imagen está
rodeada de píxeles con valor 00, lo que permite que la imagen resultante tenga el mismo
tamaño que la imagen original. En donde se ve que los pixeles con un valor de 500 o más
se mantienen en la matriz de resultante.

Pixel A1,1:
• x,11 = 0×1 + 0×−1 + 0×1 + 0×−1 + 100×1 + 0×−1 + 0×1 + 0×−1 + 100×1

Pregunta (1c) (1 punto):

Escriba la imagen resultante de aplicar un filtro de mediana de 3x3 sobre la imagen A.


Para realizar la convolución asuma que la imagen está rodeada de pixeles con valor 0
(por tanto, la imagen resultante es de igual tamaño que la imagen original).

Respuesta (1c):

0 1 2 3 4 5 6 7
1 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0
3 0 0 100 0 0 0 0
4 0 0 0 0 0 0 0
5 0 0 0 0 100 0 0
6 0 0 0 0 0 0 0
7 0 0 0 0 0 0 0

Como se puede ver la mayoría de los píxeles se han convertido en cero, excepto aquellos
que están rodeados de ceros y tienen un valor de 100 en la imagen original. Estos píxeles
conservan su valor original porque la mediana del universo es 100.

Etapas para el Calculo


• Asumir que la imagen está rodeada por píxeles con valor 0, para los píxeles en
los bordes de la imagen, los vecinos que están fuera de la imagen se consideran
como 0.
• Se recorre cada píxel de la imagen original. Para cada píxel, consideramos una
ventana de 3×3 centrada en ese píxel.
• En cada ventana de 3×3, se debe ordenar los 9 valores (incluyendo los ceros para
los píxeles en los bordes) y debemos tomar el valor del medio como la mediana.
Reemplazamos el valor del píxel central en la imagen original con la mediana
calculada.
----
Pregunta 2
Pregunta (2a) (1 punto):

Considere la siguiente imagen de 16 x 16 pixeles en escala de gris 8 bits:


Respuesta (2a) (1 punto):

Dibuje el histograma global de grises de la imagen normalizado (es decir, los bins suman
1). Sea preciso en las alturas de los bins y el valor que representa cada bin del
histograma.

Total recuadros matriz:


• Negros: 96/256
• Blancos: 96/256
• Gris: 64/256

Pregunta (2b) (1 punto):

Dibuje el histograma de grises normalizado para una división de 2x2 zonas. Sea preciso
en las alturas de los bins y el valor que representa cada bin.
Tablero Ajedrez

Tablero Gris
Tablero Columnas

Tablero Filas
Pregunta (2c) (1 punto):
Dibuje el histograma de orientaciones de gradiente (HOG) normalizado usando una
división de 2x2 zonas. Calcule el gradiente en cada píxel mediante las fórmulas:

Sea preciso en las alturas de los bins y el valor que representa cada bin del histograma.
Sólo considere los pixeles donde el cálculo de la derivada está completamente contenido
dentro de la zona.

respuesta (2c) (1 punto):

Tablero Ajedrez

• En el caso del tablero de Ajedrez el arco tangente es de 45. Eje x=255-0, eje
y=255-0, arctan(255/255), el resultado es 45.
Tablero Gris

• En el caso del tablero Gris no hay arco tangente, ya que no existe la gradiente.

Tablero Columnas
• En el caso del tablero de Columnas sería el eje x = 255-0 eje y = 0, arctan(0/255)
lo que da 0 como resultado.

Tablero Filas

• En el caso del tablero de Líneas el arco tangente es 90. Eje x=0, eje y=255-0.
Arctan(255/0) = infinito. El ángulo es 90.

También podría gustarte