Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los histogramas nos ofrecen mucha más información de la que podemos apreciar con el ojo. Estos
gráficos contienen datos sobre la cantidad de tonos negros, medios y blancos que hay en una
fotografía, lo que puede ayudarnos a determinar si la foto está bien expuesta o no, o si es
necesario ajustar su contraste
consiste en otorgar una etiqueta o categoría a cada píxel de una imagen. A diferencia de los
sistemas de detección y reconocimiento de objetos, que dan como resultado la ventana
rectangular donde se ha detectado un objeto y son evaluados por la precisión de estas ventanas,
los sistemas de segmentación semántica tienen como objetivo delimitar precisamente los objeto
de las distintas categorías a nivel de píxel, dando como resultado cualquier forma arbitraria.
El clustering :
consiste en agrupar ítems en grupos con características similares y se utiliza para determinar
patrones climáticos, agrupar artículos por temas o para segmentar clientes.
Umbralización manual
La umbralización es una técnica de segmentación que parte del supuesto que los objetos se
constituyen de pixeles de intensidad homogénea. De esta manera, cada pixel es comparado con
un umbral pre-fijado, si el valor de la intensidad del pixel es mayor, el pixel es considerado de una
determinada categoría, pero si es menor corresponderá a otra categoría
El método Otsu
es el método más popular para el cálculo del umbral óptimo. El método permite la identificación
de dos clases usando el histograma de intensidades de la imagen. El histograma presenta 2
distribuciones traslapadas, la primera correspondiente a un objeto, y la segunda correspondiente
al segundo objeto. Generalmente, en condiciones óptimas uno de los objetos será el de interés y
el otro el fondo.
K-means
se usan, principalmente, para eliminar altas o bajas frecuencias de la imagen, lo que se traduce en
suavizar la imagen, o bien, realzar o detectar bordes
Filtro espacial
permite crear un dataset de resultados con una copia de las entidades de su mapa que cumpla una
serie de criterios basados en una consulta espacial.
La función de convolución:
realiza el filtrado de los valores de píxel de una imagen, lo que se puede utilizar para aumentar su
nitidez, difuminarla, detectar sus ejes u otros realces basados en el kernel.
Kernel:
Un kernel o máscara de convolución puede entenderse como una matriz de coeficientes que al ser
aplicada en un pixel objetivo (considérese el pixel como un punto (x,y) del plano) obteniendo una
transformación en el pixel objetivo como en sus vecinos (entendiendo la transformación como la
imagen G(x,y) en todos ellos)
Si bien la forma y tamaño del kernel es variable, usualmente se trabaja con máscaras de
convolución cuadradas.
CONECTIVIDAD DE PIXELES
La conectividad entre pixeles es un concepto utilizado para establecer los límites en objetos y
regiones de componentes en una imagen. Para establecer la conectividad entre dos pixeles, es
necesario determinar si son adyacentes en sentido específico (si tiene 4 vecindades) y si su nivel
de gris satisface un criterio especificado de similitud (si son iguales). Por ejemplo, en una imagen
binaria con valores 0 y 1, dos pixeles pueden tener vecindad de 4, pero sólo se consideran
conectados si tienen el mismo valor.
Pixel
El píxel -o px, para abreviar- es el elemento más pequeño de una imagen reproducida
digitalmente.
TIPOS DE IMÁGENES
BMP
BMP es un formato estándar que Windows usa para almacenar imágenes independientes del
dispositivo y de la aplicación. El número de bits por píxel (1, 4, 8, 15, 24, 32 o 64) para un archivo
BMP determinado se especifica en un encabezado de archivo.
JPEG es un esquema de compresión que funciona bien para escenas naturales, como fotografías
escaneadas. Cierta información se pierde en el proceso de compresión, pero la pérdida suele ser
imperceptible para el ojo humano.
https://www.aprendemachinelearning.com/como-funcionan-las-convolutional-neural-networks-
vision-por-ordenador/