Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad Iztapalapa
Proyecto de Investigación
Por
México 2023
Índice
1. Introducción 2
4. Estadística Bayesiana 19
4.1. Inferencia Bayesiana . . . . . . . . . . . . . . . . . . . . . . . 20
4.2. Modelado de P (x|θ) . . . . . . . . . . . . . . . . . . . . . . . 21
4.3. Implementación . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5. Conclusión 30
.
1
1. Introducción
En la era de la transformación audiovisual,las imágenes digitales se posi-
cionan como una de las formas de comunicación más recurrentes, desde las
fotografías a pie de calle de Google Street hasta obras de arte como los lla-
mados NFTs. 1 Matemáticamente la representación de las imágenes digitales
se ven como funciones, matrices, conjuntos y grafos.
1
Token No Fungible, por sus siglas en inglés; son obras digitales que pueden ser com-
pradas y vendidas como cualquier otro tipo de propiedad, pero no tienen forma tangible.
Una fotografía digital o un vídeo, por ejemplo, son piezas de arte que no existen en el
mundo físico.
2
2. Procesamiento de Imágenes digitales
Al conjunto de técnicas y procesos para descubrir o hacer resaltar in-
formación contenida en una imagen usando como herramienta principal una
computadora se le conoce como procesamiento digital de imágenes.
3
Figura 1: El acantilado cósmico de la nebulosa Carina, parte superior, tomada con el telescopio Hubble,
inferior, tomada con el telescopio James Webb
4
2.1. Caracterización matemática de las imágenes
Una imagen digital en escala de grises es una función bidimensional de
la intensidad de la luz denotada por f (x, y), donde el valor o amplitud de
f en las coordenadas espaciales (x, y) da la intensidad, iluminación o nivel
de gris, de la imagen en aquellas coordenadas. Una imagen monocromática
se puede considerar como una matriz de tamaño mn cuyos índices de fila y
columna identifican a un punto de la imagen, y el valor correspondiente es
proporcional a la intensidad.
f (0, 0) f (0, 1) ··· f (0, n − 1)
f (1, 0) f (1, 1) ··· f (1, n − 1)
F = .. .. .. ..
. . . .
f (m − 1, 0) f (m − 1, 1) · · · f (m − 1, n − 1)
5
A cada elemento f (x, y) de la imagen F se le denomina píxel(picture ele-
ment), estos valores serán un número finito de elementos donde cada uno
tiene una localidad y valor particular (Klette Zamperoni, 1996).
6
Figura 4: Etapas involucradas en el procesamiento de imágenes
7
2.3. Preprocesamiento
Actualmente una imagen digital en la web, consta de 4 millones de píxeles
aproximadamente. ¿Cómo seria agrupar tantos píxeles? Comúnmente en el
procesamiento de imágenes uno se enfrenta al problema de asignar a cada
pixel una etiqueta que lo identifique como miembro de una clase específica,
de acuerdo a las propiedades del pixel.
8
2.4. Algoritmo SLIC
El algoritmo SLIC (Simple Linear Iterative Clustering) toma como base
la teoría de agrupamiento de datos difusos por lo que es necesario iniciar el
entrenamiento calculando los centros de cúmulos iniciales.
9
La segmentación en forma de arreglo
Una vez generados los superpixeles por el algoritmo SLIC, se toma cada
uno de los superpixeles como una imagen (véase figura 8).
10
Figura 8: Superpixeles como imágenes
11
Figura 10: Histogramas de cada superpixel
Estos valores pueden oscilar entre cero y 255, siendo cero ninguno y 255
el valor máximo, también muestra cuántos pixeles dentro de los colores están
presentes por intensidad. En un histograma, los datos a menudo se agrupan
en clases o columnas, cada una de las cuales se representa en un histograma
mediante una barra vertical. La altura de esta barra indica la frecuencia del
histograma.
12
Figura 11: Ejemplo de los histogramas de una imagen a color
Figura 12: Miguel Bacilio pinta un mural con el Rostro de su hijo Braulio Bacilio, desaparecido en el 2016
por autoridades que ocultaron su cuerpo durante seis años en el Instituto de Ciencias Forenses. El 11 de
abril del 2022 la familia de Brulio conoció el paradero del pequeño.
13
Las figuras 13 y 14 son imágenes de gran tamaño de pixeles procesadas
por el algoritmo SLIC.
14
3. Proceso del Restaurante Chino
Los modelos de mezcla del Proceso de Dirichlet proporcionan un conjunto
valioso de algoritmos de agrupamiento flexibles para análisis de datos de alta
dimensión.
Las mezclas del proceso dirchelet se pueden describir a través del proceso
de restaurante chino (PRC), una distribución sobre particiones que encar-
na la distribución previa asumida sobre las estructuras de clúster (Pitman,
2002).
15
El PRC proporciona una distribución posterior sobre las agrupaciones,
pero este es un modelo intercambiable; es decir la distribución posterior so-
bre las agrupaciones no depende del orden de los datos observados.
16
Para esto nos interesa medir la cercanía del centroide c y una ubicación
u lo cual se hará a través de una función de penalización:
17
En la figura 16, se muestra como una imagen procesada por el algoritmo
SLIC, tiene superpixeles parecidos pero a una distancia mayor, estos super-
pixeles no pueden pertenecer al mismo grupo en la segmentación posterior,
aquí la importancia del PRC dependiente de la distancia.
18
4. Estadística Bayesiana
La Estadística es el proceso de aprender acerca de las características ge-
nerales de una población a partir de un subconjunto de miembros de esa
población y hace inferencias. (Manuel Molina 2021).
19
4.1. Inferencia Bayesiana
El Teorema de Bayes es una forma de aprender de H a partir de lo que
observamos E y se expresa a través de las probabilidades condicionales como
sigue:
P (E|H)P (H)
P (H|E) =
P (E)
En donde H: Hipótesis y E: Evidencia. Dado que el denominador no
dependan de E, es común escribir
En donde
20
4.2. Modelado de P (x|θ)
Los superpixeles se describen mediante histogramas de color de píxeles.
xi |x ∼ M ultinomial(x)
donde x es el color promedio del segmento, ya que existe cierta variación
en los tonos, propios de una imagen, estos condicionados a la segmentación.
21
4.3. Implementación
La inferencia Bayesiana consiste en estimar parámetros de la fdp a pos-
teriori. El principal inconveniente es que para hallar estos estimadores es
complejo, y típicamente en varias dimensiones. En la mayoría de ocasiones
esto no es posible de forma analítica.
Una alternativa de aproximación estocástica para superar este inconvenien-
te son los métodos Monte Carlo vias cadenas de Markov (MCMC) que son
algoritmos de simulación de una distribución que producen una cadena de
Markov con distribución invariante .
22
En esta sección a manera ilustrativa de lo esperado en la implementación,
tenemos el paso a paso de la segmentación de una imagen. En la figura 17,
tenemos la imagen preprocesada, es decir obtuvimos los superpixeles.
23
Listos los superpixeles, centroides e histogramas, las muestras Gibbs Sam-
plers obtiene esta segmentación posterior. (figura 19)
π = {{1, 2, 3, 4}, {5, 7}, {9}, {10, 11, 15}, {8, 13}, {12, 16}, {14, 17, 18, 19, 20}}
24
Obtenemos el valor de muestra que ocurre con más frecuencia es decir
la moda posterior de la partición , esta es nuestro estimador puntual. En-
tonces en la figura 21, se representa lo esperado en la implementación de la
investigación.
25
Una forma simplificada (primitiva) para la implementación de nuestro
algoritmo es en escala de grises.Dado que en una imagen a color (figura 22),
los histogramas se representan como
Xi = (hist(G))
26
Las siguientes imágenes son las obtenidas de la implementación, la figura
24 muestra los superpixeles mediante el algoritmo SLIC.
En la figura 25 notamos que por alguna razón nos arrojo dos segmentos,
dicha segmentación se obtuvo en la mayoría de los casos, el caso que se uso,
es cuando se fija el parámetro τ que es el parámetro de la penalización y c
que es el parámetro Direchlt.
27
Variando el rol de los parámetros τ y c, vemos una segmentación más
oportuna, pero no ideal.
Observamos que en efecto, una gran parte del rostro formo un segmento,
es importante destacar, que en los superpixeles generados, uno de ellos toma
parte del rostro con el piso, entonces en la posterior segmentación es valido
que también lo tome como segmento (figura 26).
28
(a) Imagen con pocos detalles. (b) Superpixeles de la imagen.
29
5. Conclusión
Comenzamos el proyecto estudiando el enfoque bayesiano como herra-
mienta para la inferencia de la segmentación, a la par inició la investigación
de Procesamiento de imágenes digitales, expresiones y composición de las
mismas.
Esto dio paso a tener que crear un modelo nuevo, el cual inicialmente
se tomó la idea del articulo Proceso del restaurante chino dependiente de la
distancia espacial para segmentación de imágenes, y para este nuevo modelo,
se trabajo con articulo Agrupación restringida en redes lineales.
30
Referencias
[1] Soumya Ghosh, Andrei B. Ungureanu, Erik B. Sudderth, and David M.
Blei. (s/f). Spatial distance dependent Chinese restaurant processes for
image segmentation.[PDF]
[3] Gonzalez, R. C., Woods, R. E. (2017). Digital Image Processing (4a ed.).
Pearson.
31