Proyecto de Investigación Nataly Maraver

UNIVERSIDAD AUTÓNOMA METROPOLITANA
Unidad Iztapalapa
Proyecto de Investigación
Un enfoque estadístico para la segmentación de imágenes
Por
Nataly Noemi Maraver Badillo

Asesor: Asael Fabian Martínez Martínez
México 2023
Índice
1. Introducción 2
2. Procesamiento de Imágenes digitales 3

2.1. Caracterización matemática de las imágenes . . . . . . . . . . 5
2.2. Segmentación de imágenes . . . . . . . . . . . . . . . . . . . . 6
2.3. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.4. Algoritmo SLIC . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.5. Histograma de cada Superpixel . . . . . . . . . . . . . . . . . 12
3. Proceso del Restaurante Chino 15

3.1. Proceso del Restaurante Chino dependiente de la distancia . . 16
4. Estadística Bayesiana 19
4.1. Inferencia Bayesiana . . . . . . . . . . . . . . . . . . . . . . . 20
4.2. Modelado de P (x|θ) . . . . . . . . . . . . . . . . . . . . . . . 21
4.3. Implementación . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5. Conclusión 30
.
1
1. Introducción
En la era de la transformación audiovisual,las imágenes digitales se posi-
cionan como una de las formas de comunicación más recurrentes, desde las
fotografías a pie de calle de Google Street hasta obras de arte como los lla-
mados NFTs. 1 Matemáticamente la representación de las imágenes digitales
se ven como funciones, matrices, conjuntos y grafos.
Todas estas representaciones permiten definir operaciones y relaciones bá-

sicas entre píxeles. pueden ser interpretadas de diversas formas, dependiendo
del sistema al que sirvan, convirtiéndose en la práctica, en un componente
crítico en la Ciencia, Tecnología y diversas áreas, sus secuencias, técnicas y
procesos para descubrir, resaltar la información contenida en ellas, se le co-
noce como Procesamiento de Imágenes.
En el presente trabajo abordamos,la segmentación de imágenes, que cons-

ta en dividir una imagen natural en grupos similares de píxeles adyacen-
tes.Por lo tanto, la segmentación de imágenes es un tipo especial de problema
de agrupamiento, y existen varios métodos que cuentan con un particiona-
miento inicial de la imagen en pequeñas regiones, y un criterio de similitud
para tomar la decisión de unir dos regiones.
Cada método que existe busca mejorar la calidad de las segmentaciones

obtenidas, en este presente trabajo abordaremos la segmentación haciendo
uso de la Estadística Bayesiana y el Proceso del restaurante chino.
1
Token No Fungible, por sus siglas en inglés; son obras digitales que pueden ser com-
pradas y vendidas como cualquier otro tipo de propiedad, pero no tienen forma tangible.
Una fotografía digital o un vídeo, por ejemplo, son piezas de arte que no existen en el
mundo físico.
2
2. Procesamiento de Imágenes digitales
Al conjunto de técnicas y procesos para descubrir o hacer resaltar in-
formación contenida en una imagen usando como herramienta principal una
computadora se le conoce como procesamiento digital de imágenes.
Los seres humanos confíamos fundamentalmente en el sentido de la vista

dado que recogemos 99 % de nuestra información a través de nuestros ojos. El
sistema visual humano es uno de los mecanismos de procesamiento de imá-
genes más poderosos que existe, es capaz de detectar, analizar y almacenar
eficientemente una imagen.
En esta era de la multimedia, el procesamiento de imágenes digitales es,

la tecnología más importante que nos puede asistir en cuanto a la producción
de imágenes, y con el fin de enganchar al lector, demos un paseo veloz en la
historia del procesamiento de imágenes.
Uno de los primeros ejemplos de procesamiento de imágenes fue en 1920,

cuando se desarrolló un sistema de transmisión de fotografías de un periódi-
co que fueron transmitidas por un cable submarino entre Londres y Nueva
York usando códigos telegráficos. Este sistema permitía una codificación de
la imagen en 5 niveles de gris, y luego en 1929 fue mejoró a 15 niveles de gris.
El procesamiento de imágenes vía computadoras tuvo su inicio en el Jet

Propultion Laboratory en Pasadena California, en 1964, cuando las imáge-
nes de la Luna fueron transmitidas por el Ranger 7 y procesadas por una
computadora para corregir diferentes tipos de distorsiones inherentes en los
sistemas de captura de la cámara de televisión.
El procesamiento digital de imágenes ha cobrado gran importancia en

las imágenes astronómicas, de objetos cósmicos espectaculares, la primera
mitad de la década de 1990 cuando el telescopio Hubble comenzó a entregar
evidencias de la existencia de agujeros negros masivos, y hasta el 12 de julio
de 2022 con la foto más alejada jamás capturada por el telescopio James
Webb, El cúmulo de galaxias SMACS 0723, tal como era hace 4.600 millones
de años (Ver Figura 1).
3
Figura 1: El acantilado cósmico de la nebulosa Carina, parte superior, tomada con el telescopio Hubble,
inferior, tomada con el telescopio James Webb
Dentro del procesamiento de imágenes, se pueden distinguir tres tipos de

procesamiento; procesamiento óptico, procesamiento analógico y el procesa-
miento digital, todos estos con el fin de poder mejorar las características o
para evaluar algunos aspectos estadísticos.
El procesamiento óptico como los procesos empleados en fotografía; el

trabajo en el cuarto oscuro es un ejemplo claro del empleo de varias técnicas
para mejorar las características de las imágenes, Otro ejemplo del procesa-
miento óptico es el mejoramiento de la calidad de las imágenes telescópicas, el
procesamiento analógico consiste en el uso de sistemas eléctricos para alterar
las imágenes. Ejemplos de esto son las imágenes por televisión y finalmente,
el procesamiento digital que es tema que abordaremos.
4
2.1. Caracterización matemática de las imágenes
Una imagen digital en escala de grises es una función bidimensional de
la intensidad de la luz denotada por f (x, y), donde el valor o amplitud de
f en las coordenadas espaciales (x, y) da la intensidad, iluminación o nivel
de gris, de la imagen en aquellas coordenadas. Una imagen monocromática
se puede considerar como una matriz de tamaño mn cuyos índices de fila y
columna identifican a un punto de la imagen, y el valor correspondiente es
proporcional a la intensidad.
 
f (0, 0) f (0, 1) ··· f (0, n − 1)
 f (1, 0) f (1, 1) ··· f (1, n − 1) 
 
F = .. .. .. .. 
 . . . . 
f (m − 1, 0) f (m − 1, 1) · · · f (m − 1, n − 1)
Cuando una imagen se encuentra a color, se interpreta mediante tres

matrices (conocidas como máscaras),esto es un arreglo de tres imágenes mo-
nocromáticas independientes de tamaño mn, las cuales, representan la inten-
sidad de tres colores específicos. En particular, para imágenes digitales en la
web, se suele utilizar RGB correspondientes a la escala de rojos (R –red-),
verdes (G –green-) y azules (B –blue-) (Ver Figura 2).
Figura 2: Guacamaya azul y amarilla, junto a su representación RGB
5
A cada elemento f (x, y) de la imagen F se le denomina píxel(picture ele-
ment), estos valores serán un número finito de elementos donde cada uno
tiene una localidad y valor particular (Klette Zamperoni, 1996).
El pixel se define, usualmente, como la menor unidad homogénea de color,

El tamaño de la imagen es dado por el número de pixeles de alto y de ancho
de la imagen, como se muestra en la figura 3
Figura 3: Zoom de un pixel de una imagen tamaño 2750x1820
2.2. Segmentación de imágenes

El procesamiento de imágenes está subdividido en cinco áreas (figura 4)
• Adquisición: proceso a través del cual se obtiene una imagen.
• Preprocesado: diferentes técnicas de mejoramiento en detalles para el aná-
lisis posterior.
• Segmentación: proceso que divide una imagen en objetos de interés.
• Representación y descripción:trabaja con la obtención de las características
deseadas.
• Reconocimieno e Interpretación: significado de los datos obtenidos.
6
Figura 4: Etapas involucradas en el procesamiento de imágenes
El trabajo aquí presente abordara solamente el área de la segmentación,

según González y Wood (2001), puede definirse como: la agrupación de pi-
xeles con intensidades de colores similares en un espacio paramétrico, con el
fin de separar las partes de interés del resto de la imagen.
El objetivo de la segmentación de imágenes es dividir una imagen digital

en varias regiones mediante un proceso de clasificación. Particularmente, hay
qué asociar los píxeles de interés, y es un de problema de agrupamiento. Los
métodos basados en el agrupamiento particional o clustering, descomponen
el conjunto de objetos de tal modo que los objetos de un mismo grupo son
más similares unos a otros que con objetos de otros grupos (Campos, 2009).
Nosotros esperamos encontrar regiones contiguas de la imagen asignadas

al mismo grupo, pero no queremos un grupo que este disperso en pixeles de
imágenes individuales.
En las siguientes secciones se verá un modelo bayesiano para la segmen-

tación de imágenes basado en el proceso del restaurante chino dependiente
de la distancia (PRCdd). Este método encuentra segmentos espacialmente
contiguos de la imagen y determina un número de segmentos específicos de
la imagen a partir de los datos observados.
7
2.3. Preprocesamiento
Actualmente una imagen digital en la web, consta de 4 millones de píxeles
aproximadamente. ¿Cómo seria agrupar tantos píxeles? Comúnmente en el
procesamiento de imágenes uno se enfrenta al problema de asignar a cada
pixel una etiqueta que lo identifique como miembro de una clase específica,
de acuerdo a las propiedades del pixel.
Una manera de solventar esta desventaja consiste en asignar una etique-

ta no por cada pixel, sino por regiones relativamente pequeñas formadas por
pixeles que se presume pertenecen a la misma clase. Esto se hará mediante
los llamados superpixeles los cuales son agrupaciones de píxeles que per-
ceptualmente comparten propiedades similares (similares en color, similitud,
proximidad en el plano y otras propiedades de bajo nivel).
Los superpíxeles mejoran sustancialmente el proceso posterior al reducir

una imagen a un pequeño conjunto de segmentos, en contraste con los millo-
nes de píxeles originales de la imagen.
En este caso el preprocesamiento de la imagen se realiza con el fin de

hacer un agrupamiento previo que facilite la posterior segmentación.
De manera particular, usamos el algoritmo Simple Linear Iterative Clus-

tering (SLIC) que resulta ser muy eficiente y fácil de implementar.
8
2.4. Algoritmo SLIC
El algoritmo SLIC (Simple Linear Iterative Clustering) toma como base
la teoría de agrupamiento de datos difusos por lo que es necesario iniciar el
entrenamiento calculando los centros de cúmulos iniciales.
Realizando un muestreo de K centros de cúmulos igualmente espaciados

dentro de la imagen y colocando dichos centros a las posiciones, que corres-
ponden a la posición menor dentro de una vecindad de pixeles vecinos. Una
vez que todos los pixeles son asociados a un cúmulo, se calcula un nuevo
centro de acuerdo a un vector promedio formado por todos los pixeles que
pertenecen a ese cúmulo. Este proceso se repite de forma iterativa hasta cum-
plirse una condición de paro.
Esta es un ejemplo del preprocesamiento de una imagen de tamaño 10x10

(véase figura 5), que es pequeña con el fin mostrar claramente los pasos del
algoritmo, esta simulación la obtuvimos mediante el algoritmo SLIC para el
lenguaje de programación Python.
Figura 5: Imagen tamaño 10x10
9
La segmentación en forma de arreglo
Figura 6: Arreglo de superpixeles
Figura 7: Superpixeles de la imagen 10x10
Una vez generados los superpixeles por el algoritmo SLIC, se toma cada
uno de los superpixeles como una imagen (véase figura 8).
10
Figura 8: Superpixeles como imágenes
y a cada uno se le encuentra su centroide y se genera su histograma.
Figura 9: Centroides de cada Superpixel
11
Figura 10: Histogramas de cada superpixel
2.5. Histograma de cada Superpixel

Un histograma de color en imágenes digitales es un recuento de la fre-
cuencia de píxeles dentro de una imagen. Cada pixel de una imagen digital
consta de tres valores relevantes que determinan su color: rojo, azul y verde.
Estos valores pueden oscilar entre cero y 255, siendo cero ninguno y 255
el valor máximo, también muestra cuántos pixeles dentro de los colores están
presentes por intensidad. En un histograma, los datos a menudo se agrupan
en clases o columnas, cada una de las cuales se representa en un histograma
mediante una barra vertical. La altura de esta barra indica la frecuencia del
histograma.
12
Figura 11: Ejemplo de los histogramas de una imagen a color
El histograma H(M ) un vector (h1 , h2 , . . . , hn ) una dimensión n espacio

vectorial, donde cada elemento hj representa el número de pixeles de color j
en la imagen M .
Dada la imagen (figura 12), la preprocesamos con diferentes numero de
superpixeles, teniendo en cuenta que el el algoritmo se le pide un numero
pero los superpixeles que arroja son variables.
Figura 12: Miguel Bacilio pinta un mural con el Rostro de su hijo Braulio Bacilio, desaparecido en el 2016
por autoridades que ocultaron su cuerpo durante seis años en el Instituto de Ciencias Forenses. El 11 de
abril del 2022 la familia de Brulio conoció el paradero del pequeño.
13
Las figuras 13 y 14 son imágenes de gran tamaño de pixeles procesadas
por el algoritmo SLIC.
Figura 13: Imagen con 278 superpixeles
Figura 14: Imagen con 455 superpixeles
14
3. Proceso del Restaurante Chino
Los modelos de mezcla del Proceso de Dirichlet proporcionan un conjunto
valioso de algoritmos de agrupamiento flexibles para análisis de datos de alta
dimensión.
Las mezclas del proceso dirchelet se pueden describir a través del proceso
de restaurante chino (PRC), una distribución sobre particiones que encar-
na la distribución previa asumida sobre las estructuras de clúster (Pitman,
2002).
Él PRC se describe mediante la metáfora de una secuencia de clientes

sentados en las mesas de un restaurante chino. Cada cliente se sienta en una
mesa previamente ocupada con probabilidad proporcional a la número de
clientes que ya están sentados allí, y en una nueva mesa con probabilidad
proporcional a un parámetro de concentración.
Una vez que los clientes han ingresado al restaurante, el acomodo de

clientes nos proporciona una agrupación. (ver figura 15).
Figura 15: PRC; ejemplo con 4 mesas y 10 clientes y su agrupamiento
15
El PRC proporciona una distribución posterior sobre las agrupaciones,
pero este es un modelo intercambiable; es decir la distribución posterior so-
bre las agrupaciones no depende del orden de los datos observados.
La intercambiabilidad es una suposición razonable en algunas aplicacio-

nes de agrupamiento, pero en muchas no lo es. Considere los datos espa-
ciales,como píxeles en una imagen. Aquí nuevamente, cada dato tienden a
agruparse con otros datos que están cerca en el espacio. Mientras que la mez-
cla tradicional del PRC proporciona una previa flexible sobre las particiones
de los datos, no puede acomodar tal no intercambiabilidad.
Entonces se uso una generalización que es el Proceso del restaurante chino

dependiente de la distancia (PRCdd), en el cual la asignación aleatoria de
asientos de los clientes depende de las distancias entre ellos.
3.1. Proceso del Restaurante Chino dependiente de la

distancia
El proceso de restaurante chino dependiente de la distancia (PRCdd) es
una generalización del Proceso del Restaurante chino (PRC) que permite una
distribución no intercambiable en particiones; es decir modela clientes que se
vinculan con otros clientes.
La clave del PRC dependiente de la distancia es que representa la parti-

ción con asignaciones de clientes, en lugar de asignaciones de tablas. Mientras
que el PRC tradicional conecta a los clientes con las mesas, el PRC depen-
diente de la distancia conecta a los clientes con otros clientes. La partición de
los datos, es decir, la representación de asignación de mesas, surge de estas
conexiones de clientes.
La distribución de asignación de clientes tendrá una penalización por la

distancia, la cual se hará evidente con una función, la cual determina cómo
la distancia entre dos puntos de datos afecta su probabilidad de conectarse
entre si, es decir, su probabilidad de pertenecer al mismo grupo.
16
Para esto nos interesa medir la cercanía del centroide c y una ubicación
u lo cual se hará a través de una función de penalización:
w(e, u, |τ ) = exp{−τ (e − u)′(e − u)}
para algún τ > 0
El PRCdd induce una distribución sobre las posibles agrupaciones

 c
 n−1+c w(ei , u∗ , |τ ) si δ = δk
P (xn = δ|xn−1 , ..., x1 ) =
 nj
n−1+c
w(ei , ul , |τ ) si δ = x∗j
Donde
α
w(ei , u∗ , |τ )
n−1+α
es la probabilidad de sentarse en una mesa sin ocupar es decir, La proba-
bilidad de que un superpixel forme un nuevo segmento. Y
nj
w(ei , ul , |τ )
n−1+α
es la probabilidad de sentarse en la j-ésima mesa ocupada es decir, la
probabilidad de que un superpixel vaya a un segmento que ya contiene otros
superpixeles.
17
En la figura 16, se muestra como una imagen procesada por el algoritmo
SLIC, tiene superpixeles parecidos pero a una distancia mayor, estos super-
pixeles no pueden pertenecer al mismo grupo en la segmentación posterior,
aquí la importancia del PRC dependiente de la distancia.
Figura 16: Imagen con superpixeles similares a una distancia considerable.
Entonces el PRCdd es apropiado para la segmentación de imágenes por-

que naturalmente, puede dar cuenta de la estructura espacial de los superpi-
xeles a través de su función de distancia, usando esa distancia espacial entre
píxeles para imponer un sesgo hacia los agrupamientos contiguos.
18
4. Estadística Bayesiana
La Estadística es el proceso de aprender acerca de las características ge-
nerales de una población a partir de un subconjunto de miembros de esa
población y hace inferencias. (Manuel Molina 2021).
De manera muy general, puede decirse que la estadíıstica es el estudio

de fenómenos inciertos (aleatorios): fenómenos que no pueden predecirse con
certeza. El estudio se lleva a cabo a partir de posible conocimiento previo y
de observaciones que se realizan sobre el fenómeno.
La Estadística Bayesiana se basa en el concepto probabilístico del teore-

ma de Bayes. Su característica diferenciadora es que incorpora información
externa al estudio que se está realizando, de forma que la probabilidad de
un determinado suceso puede verse modificada por la información previa de
que dispongamos sobre el suceso en cuestión. Así, la información obtenida a
priori se utiliza para establecer una probabilidad a posteriori que nos permita
realizar la inferencia y llegar a una conclusión sobre el problema que estemos
estudiando.
Los modelos bayesianos primordialmente incorporan observaciones que

provienen de variables aleatorias condicionalmente independientes con dis-
tribución común. Esta distribución depende de parámetros desconocidos que
son conocimiento previo para poder estimar modelos útiles dentro de un es-
pacio muestral y de este modo poder estimar parámetros que provengan de
la experiencia o de una teoría probabilística.
19
4.1. Inferencia Bayesiana
El Teorema de Bayes es una forma de aprender de H a partir de lo que
observamos E y se expresa a través de las probabilidades condicionales como
sigue:
P (E|H)P (H)
P (H|E) =
P (E)
En donde H: Hipótesis y E: Evidencia. Dado que el denominador no
dependan de E, es común escribir
P (H|E) ∝ P (E|H)P (H),
En donde
•P (H): Se le llama probabilidad a priori de H lo que conocemos inicial-

mente acerca de H.
•P (E|H): Se le llama probabilidad condicional de que se cumpla la evi-

dencia E si la hipótesis H es verdadera, como se comporta H con la evidencia
que tenemos para corregir o actualizar
•P (H|E): Se le llama probabilidad posteriori de H dado E, representa

H después de incorporar la evidencia
Para mayor familiaridad, ocuparemos la siguiente notación
P (θ|y) ∝ P (y|θ)P (θ)
Que nos dice que la probabilidad a posteriori es proporcional a la Verosi-

militud por la Probabilidad a priori.
El enfoque bayesiano proporciona inferencias más completas en el sentido

de que toda la información disponible sobre el valor de queda representada
a través de la distribución final, y se puedan obtener estimaciones puntuales.
20
4.2. Modelado de P (x|θ)
Los superpixeles se describen mediante histogramas de color de píxeles.
xi = (xi1 , xi2 , ..., xib )
donde xij es la frecuencia del tono j en el superpixel. Por lo que modelamos

un superpixel através de la distribución Multinomial.
xi |x ∼ M ultinomial(x)
donde x es el color promedio del segmento, ya que existe cierta variación
en los tonos, propios de una imagen, estos condicionados a la segmentación.
Nuestro modelo Bayesiano para la segmentación se puede escribir a través

de manera jerárquica como
xi]|π , θ, e, u ∼ M ult(θj )1(i ∈ πj ) i = 1, ...n ind

θj] |e, u ∼ Dirichlet(α) j = 1, ...k iid.
π|e, u, τ ∼ P RCdd(e, u, c, τ ) j = 1, ...k iid.
uj ∼ U nif (R) donde R = Imagen como regin en R2
Donde
• xi : representa a lo i histogramas de los superpixeles.
• π: es la partición.
• θ: es el color promedio del histograma.
• e :centroides de los superpixeles.
• u: ubicaciones de posibles agrupaciones.
• τ : penalización.
21
4.3. Implementación
La inferencia Bayesiana consiste en estimar parámetros de la fdp a pos-
teriori. El principal inconveniente es que para hallar estos estimadores es
complejo, y típicamente en varias dimensiones. En la mayoría de ocasiones
esto no es posible de forma analítica.
Una alternativa de aproximación estocástica para superar este inconvenien-
te son los métodos Monte Carlo vias cadenas de Markov (MCMC) que son
algoritmos de simulación de una distribución que producen una cadena de
Markov con distribución invariante .
La idea básica es muestrear secuencialmente de una cadena de Markov

cuya distribución estacionaria es exactamente la distribución conjunta a pos-
teriori de los parámetros de interés.
El metodo Gibbs Sampling consiste en que dado un vector de parámetros,

este genera muestras de las distribuciones condicionales,las muestras de estas
distribuciones condicionales se pueden generar ya que tiene formas conocidas.
Bajo ciertas condiciones, la especificación de las distribuciones condicionales
lleva a la distribución conjunta de forma única y a las distribuciones margi-
nales.
22
En esta sección a manera ilustrativa de lo esperado en la implementación,
tenemos el paso a paso de la segmentación de una imagen. En la figura 17,
tenemos la imagen preprocesada, es decir obtuvimos los superpixeles.
Figura 17: Representación de los superpixeles de la imagen.
Dados los superpixeles, se les calcula su centroide e histograma a cada

uno de ellos, en este caso la imagen resulto con 20 superpixeles (figura 18).
Figura 18: Superpixeles y la ubicación de sus centroides.
23
Listos los superpixeles, centroides e histogramas, las muestras Gibbs Sam-
plers obtiene esta segmentación posterior. (figura 19)
π = {{1, 2, 3, 4}, {5, 7}, {9}, {10, 11, 15}, {8, 13}, {12, 16}, {14, 17, 18, 19, 20}}
Es decir la segmentación nos arrojo 7 particiones, cada segmento agrupo

ciertos superpixeles, por ejemplo,el primer segmento, contiene al superpixel
1,2,3 y 4, el segundo segmento agrupo al superpixel 5 y 7 y así con los demás.Y
tenemos que
d = {1, 1, 2, 3, 4, 3, 3}
es el vector de membresías es decir, numero de observaciones que arroja el
PRCdd.
Figura 19: Representación de segmentación de los superpixeles.
24
Obtenemos el valor de muestra que ocurre con más frecuencia es decir
la moda posterior de la partición , esta es nuestro estimador puntual. En-
tonces en la figura 21, se representa lo esperado en la implementación de la
investigación.
Figura 20: Representación de lineas de segmentos.
Figura 21: Representación de segmentación adecuada.
25
Una forma simplificada (primitiva) para la implementación de nuestro
algoritmo es en escala de grises.Dado que en una imagen a color (figura 22),
los histogramas se representan como
Xi = (hist(R), hist(G), hist(B))
Donde Xi es el histograma de color del i-esimo superpixel, y en una imagen

en escala de grises (figura 22) su histograma es
Xi = (hist(G))
por esta razón dicho algoritmo funciona para escalas de grises.
Figura 22: Histogramas RGB.
Figura 23: Histograma escala de grises.
26
Las siguientes imágenes son las obtenidas de la implementación, la figura
24 muestra los superpixeles mediante el algoritmo SLIC.
Figura 24: simulación algoritmo SLIC.
En la figura 25 notamos que por alguna razón nos arrojo dos segmentos,
dicha segmentación se obtuvo en la mayoría de los casos, el caso que se uso,
es cuando se fija el parámetro τ que es el parámetro de la penalización y c
que es el parámetro Direchlt.
Figura 25: Segmentación 1.
27
Variando el rol de los parámetros τ y c, vemos una segmentación más
oportuna, pero no ideal.
Observamos que en efecto, una gran parte del rostro formo un segmento,
es importante destacar, que en los superpixeles generados, uno de ellos toma
parte del rostro con el piso, entonces en la posterior segmentación es valido
que también lo tome como segmento (figura 26).
Figura 26: Segmentación 2.
De forma practica, en la siguiente prueba para el algoritmo se optó por

tomar una imagen con menos elementos y un alto cortaste de grises, se calcu-
laron sus superpixeles con el algoritmo SLIC, en esta ocasión le pedimos un
mayor numero de segmentos (figura 27). Se obtuvo esta segmentación, que
es buena pero no es la esperada seguido se aplica color para diferenciar los
segmentos(figura 28).
28
(a) Imagen con pocos detalles. (b) Superpixeles de la imagen.
Figura 27: Preprocesamiento
(a) Segmentación. (b) Color de segmentos.
Figura 28: Procesamiento
29
5. Conclusión
Comenzamos el proyecto estudiando el enfoque bayesiano como herra-
mienta para la inferencia de la segmentación, a la par inició la investigación
de Procesamiento de imágenes digitales, expresiones y composición de las
mismas.
Se hizo un preprocesamiento de imágenes con el fin de hacer un agrupa-

miento previo que facilite la partición posterior, esto se realizó con el algo-
ritmo SLIC, el cual calcula los llamados superpixeles, y dados estos se les
calculo sus centroides e histogramas a cada uno.
Para este punto se observó la complejidad de la representación matricial

RGB de una imagen a color, y el hecho de que también se incluiría una matriz
de adyacencia la cual tendría el fin de guardar la información sobre cómo se
relacionaban los superpixeles, entonces se optó por segmentar una imagen en
escala de grises y modificar la relación de los superpixeles mediante el uso de
ubicaciones convenientes.
Esto dio paso a tener que crear un modelo nuevo, el cual inicialmente
se tomó la idea del articulo Proceso del restaurante chino dependiente de la
distancia espacial para segmentación de imágenes, y para este nuevo modelo,
se trabajo con articulo Agrupación restringida en redes lineales.
En conjunto se estudió el Procesamiento del Restaurante Chino depen-

diente de la distancia que resultó adecuado para la naturaleza de las imágenes
ya que solo relaciona superpixeles dependiendo de su cercanía.
Listos los componentes, se implementó el algoritmo con las muestras gibbs

samplers, que obtuvo la segmentación posterior, siendo esta: la moda que es
el estimador puntual.
Se sigue explorando el rol de los parámetros para obtener la segmentación

adecuada, una vez solucionado el problema. El alcance del proyecto es el
procesamiento de imágenes a color.
30
Referencias
[1] Soumya Ghosh, Andrei B. Ungureanu, Erik B. Sudderth, and David M.
Blei. (s/f). Spatial distance dependent Chinese restaurant processes for
image segmentation.[PDF]
[2] Klette, R., Zamperoni, P. (1996). Handbook of image processing opera-

tors. John Wiley Sons.
[3] Gonzalez, R. C., Woods, R. E. (2017). Digital Image Processing (4a ed.).
Pearson.
[4] Campos, M. G. (2009). Aplicación de técnicas de clustering para la

mejora del aprendizaje. Madrid: Universidad Carlos III de Madrid
[5] Pitman, J. Combinatorial Stochastic Processes. Lecture Notes for St.

Flour Summer School. Springer-Verlag, New York, NY, 2002
[6] Molina, M. (2020). ¿Rioja o Ribera? Estadística frecuentis-

ta vs bayesiana. Revista electrónica de AnestesiaR, 12(10).
https://doi.org/10.30445/rear.v12i10.892
[7] Martínez, A. (2010). Métodos computacionales para modelos de mezclas

no paramétricos. [PDF]
[8] Rueda, R. Estad ıstica Bayesiana.[PDF]
[9] Martínez, A. (2022). Un modelo de clustering para la detección de focos

rojos en ciudades.
[10] Domínguez, A. (1996). Procesamiento Digital de Imágenes.

https://www.redalyc.org/pdf/132/13207206.pdf
[11] Capitulo1. http://dea.unsj.edu.ar/imagenes/recursos/Capitulo1.pdf
[12] Escalante, B. (2006). Procesamiento Digital de Imágenes.[PDF]
[13] Gonzales S. (2013). Metodos MCMC para la inferencia bayesiana.[PDF]
[14] David M. Peter I. (2011). Distance Dependent Chinese Restaurant Pro-

cesses.[PDF]
31

Proyecto de Investigación Nataly Maraver

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Proyecto de Investigación Nataly Maraver

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD AUTÓNOMA METROPOLITANA

Un enfoque estadístico para la segmentación de imágenes

Nataly Noemi Maraver Badillo

2. Procesamiento de Imágenes digitales 3

3. Proceso del Restaurante Chino 15

Todas estas representaciones permiten definir operaciones y relaciones bá-

En el presente trabajo abordamos,la segmentación de imágenes, que cons-

Cada método que existe busca mejorar la calidad de las segmentaciones

Los seres humanos confíamos fundamentalmente en el sentido de la vista

En esta era de la multimedia, el procesamiento de imágenes digitales es,

Uno de los primeros ejemplos de procesamiento de imágenes fue en 1920,

El procesamiento de imágenes vía computadoras tuvo su inicio en el Jet

El procesamiento digital de imágenes ha cobrado gran importancia en

Dentro del procesamiento de imágenes, se pueden distinguir tres tipos de

El procesamiento óptico como los procesos empleados en fotografía; el

Cuando una imagen se encuentra a color, se interpreta mediante tres

Figura 2: Guacamaya azul y amarilla, junto a su representación RGB

El pixel se define, usualmente, como la menor unidad homogénea de color,

Figura 3: Zoom de un pixel de una imagen tamaño 2750x1820

2.2. Segmentación de imágenes

El trabajo aquí presente abordara solamente el área de la segmentación,

El objetivo de la segmentación de imágenes es dividir una imagen digital

Nosotros esperamos encontrar regiones contiguas de la imagen asignadas

En las siguientes secciones se verá un modelo bayesiano para la segmen-

Una manera de solventar esta desventaja consiste en asignar una etique-

Los superpíxeles mejoran sustancialmente el proceso posterior al reducir

En este caso el preprocesamiento de la imagen se realiza con el fin de

De manera particular, usamos el algoritmo Simple Linear Iterative Clus-

Realizando un muestreo de K centros de cúmulos igualmente espaciados

Esta es un ejemplo del preprocesamiento de una imagen de tamaño 10x10

Figura 5: Imagen tamaño 10x10

Figura 6: Arreglo de superpixeles

Figura 7: Superpixeles de la imagen 10x10

y a cada uno se le encuentra su centroide y se genera su histograma.

Figura 9: Centroides de cada Superpixel

2.5. Histograma de cada Superpixel

El histograma H(M ) un vector (h1 , h2 , . . . , hn ) una dimensión n espacio

Figura 13: Imagen con 278 superpixeles

Figura 14: Imagen con 455 superpixeles

Él PRC se describe mediante la metáfora de una secuencia de clientes

Una vez que los clientes han ingresado al restaurante, el acomodo de

Figura 15: PRC; ejemplo con 4 mesas y 10 clientes y su agrupamiento

La intercambiabilidad es una suposición razonable en algunas aplicacio-

Entonces se uso una generalización que es el Proceso del restaurante chino

3.1. Proceso del Restaurante Chino dependiente de la

La clave del PRC dependiente de la distancia es que representa la parti-

La distribución de asignación de clientes tendrá una penalización por la

w(e, u, |τ ) = exp{−τ (e − u)′(e − u)}

para algún τ > 0

El PRCdd induce una distribución sobre las posibles agrupaciones

Figura 16: Imagen con superpixeles similares a una distancia considerable.

Entonces el PRCdd es apropiado para la segmentación de imágenes por-

De manera muy general, puede decirse que la estadíıstica es el estudio

La Estadística Bayesiana se basa en el concepto probabilístico del teore-

Los modelos bayesianos primordialmente incorporan observaciones que

P (H|E) ∝ P (E|H)P (H),

•P (H): Se le llama probabilidad a priori de H lo que conocemos inicial-

•P (E|H): Se le llama probabilidad condicional de que se cumpla la evi-

•P (H|E): Se le llama probabilidad posteriori de H dado E, representa

Para mayor familiaridad, ocuparemos la siguiente notación

P (θ|y) ∝ P (y|θ)P (θ)

Que nos dice que la probabilidad a posteriori es proporcional a la Verosi-

El enfoque bayesiano proporciona inferencias más completas en el sentido

xi = (xi1 , xi2 , ..., xib )