Está en la página 1de 9

SEGMENTACION

Los histogramas nos ofrecen mucha más información de la que podemos apreciar con el ojo. Estos
gráficos contienen datos sobre la cantidad de tonos negros, medios y blancos que hay en una
fotografía, lo que puede ayudarnos a determinar si la foto está bien expuesta o no, o si es
necesario ajustar su contraste
consiste en otorgar una etiqueta o categoría a cada píxel de una imagen. A diferencia de los
sistemas de detección y reconocimiento de objetos, que dan como resultado la ventana
rectangular donde se ha detectado un objeto y son evaluados por la precisión de estas ventanas,
los sistemas de segmentación semántica tienen como objetivo delimitar precisamente los objeto
de las distintas categorías a nivel de píxel, dando como resultado cualquier forma arbitraria.

El clustering :

consiste en agrupar ítems en grupos con características similares y se utiliza para determinar
patrones climáticos, agrupar artículos por temas o para segmentar clientes.
Umbralización manual

La umbralización es una técnica de segmentación que parte del supuesto que los objetos se
constituyen de pixeles de intensidad homogénea. De esta manera, cada pixel es comparado con
un umbral pre-fijado, si el valor de la intensidad del pixel es mayor, el pixel es considerado de una
determinada categoría, pero si es menor corresponderá a otra categoría

El método Otsu

es el método más popular para el cálculo del umbral óptimo. El método permite la identificación
de dos clases usando el histograma de intensidades de la imagen. El histograma presenta 2
distribuciones traslapadas, la primera correspondiente a un objeto, y la segunda correspondiente
al segundo objeto. Generalmente, en condiciones óptimas uno de los objetos será el de interés y
el otro el fondo.

K-means 

es un algoritmo de clasificación no supervisada (cauterización) que agrupa objetos


en k grupos basándose en sus características. El agrupamiento se realiza
minimizando la suma de distancias entre cada objeto y el centroide de su grupo o
cluster. Se suele usar la distancia cuadrática.
FILTROs

Los filtros en el dominio de la frecuencia

se usan, principalmente, para eliminar altas o bajas frecuencias de la imagen, lo que se traduce en
suavizar la imagen, o bien, realzar o detectar bordes

Filtro espacial

permite crear un dataset de resultados con una copia de las entidades de su mapa que cumpla una
serie de criterios basados en una consulta espacial.

La función de convolución:

realiza el filtrado de los valores de píxel de una imagen, lo que se puede utilizar para aumentar su
nitidez, difuminarla, detectar sus ejes u otros realces basados en el kernel.

Kernel:

Un kernel o máscara de convolución puede entenderse como una matriz de coeficientes que al ser
aplicada en un pixel objetivo (considérese el pixel como un punto (x,y) del plano) obteniendo una
transformación en el pixel objetivo como en sus vecinos (entendiendo la transformación como la
imagen G(x,y) en todos ellos)

Si bien la forma y tamaño del kernel es variable, usualmente se trabaja con máscaras de
convolución cuadradas.
CONECTIVIDAD DE PIXELES
La conectividad entre pixeles es un concepto utilizado para establecer los límites en objetos y
regiones de componentes en una imagen. Para establecer la conectividad entre dos pixeles, es
necesario determinar si son adyacentes en sentido específico (si tiene 4 vecindades) y si su nivel
de gris satisface un criterio especificado de similitud (si son iguales). Por ejemplo, en una imagen
binaria con valores 0 y 1, dos pixeles pueden tener vecindad de 4, pero sólo se consideran
conectados si tienen el mismo valor.

Pixel
El píxel -o px, para abreviar- es el elemento más pequeño de una imagen reproducida
digitalmente.

TIPOS DE IMÁGENES
BMP
BMP es un formato estándar que Windows usa para almacenar imágenes independientes del
dispositivo y de la aplicación. El número de bits por píxel (1, 4, 8, 15, 24, 32 o 64) para un archivo
BMP determinado se especifica en un encabezado de archivo.

Formato JPEG (Joint Photographic Experts Group)

JPEG es un esquema de compresión que funciona bien para escenas naturales, como fotografías
escaneadas. Cierta información se pierde en el proceso de compresión, pero la pérdida suele ser
imperceptible para el ojo humano.

Archivo de imagen intercambiable (EXIF)


EXIF es un formato de archivo que se usa para fotografías capturadas por cámaras digitales. Un
archivo EXIF contiene una imagen comprimida según la especificación JPEG.

Formato PNG (Portable Network Graphics)


El formato PNG conserva muchas de las ventajas del formato GIF, pero también proporciona
funcionalidades que van más allá. Al igual que los archivos GIF, los archivos PNG se comprimen sin
pérdida de información. Los archivos PNG pueden almacenar colores con 8, 24 o 48 bits por píxel y
escalas de grises con 1, 2, 4, 8 o 16 bits por píxel.

Formato TIFF (Tagged Image File Format)


TIFF es un formato flexible y extensible, compatible con una amplia variedad de plataformas y
aplicaciones de procesamiento de imágenes. Los archivos TIFF pueden almacenar imágenes con un
número arbitrario de bits por píxel y pueden emplear diversos algoritmos de compresión.
METRICAS DE DESENPEÑO
Matriz de confucion
es una herramienta que permite la visualización del desempeño de un algoritmo que se emplea en
aprendizaje supervisado

En la teoría de detección de señales, una curva ROC (acrónimo de Receiver Operating


Characteristic, o Característica Operativa del Receptor) es una representación gráfica de la
sensibilidad frente a la especificidad para un sistema clasificador binario según se varía el umbral
de discriminación. Otra interpretación de este gráfico es la representación de la razón o
proporción de verdaderos positivos (VPR = Razón de Verdaderos Positivos) frente a la razón o
proporción de falsos positivos (FPR = Razón de Falsos Positivos) también según se varía el umbral
de discriminación (valor a partir del cual decidimos que un caso es un positivo). ROC también
puede significar Relative Operating Characteristic (Característica Operativa Relativa) porque es una
comparación de dos características operativas (VPR y FPR) según cambiamos el umbral para la
decisión.
deep learning
Los algoritmos de deep learning realizan una tarea repetitiva que ayuda a mejorar de manera
gradual el resultado a través de ‘’deep layers’’ lo que permite el aprendizaje progresivo. Este
proceso forma parte de una familia más amplia de métodos de machine learning basados en redes
neuronales.

https://www.aprendemachinelearning.com/como-funcionan-las-convolutional-neural-networks-
vision-por-ordenador/

También podría gustarte