Está en la página 1de 9

UNIVERSIDAD DEL VALLE DE PUEBLA

ALGEBRA LINEAL

PROYECTO 2

“Digitalización de imágenes”

Jose Luis Carrasco Linares IM 40129

GRUPO 3j2
Índice:
 Introducción.
 La imagen digital.
 Sistema de visión y Procesamiento de imágenes.
 Procesamiento digital de imágenes.
 Relaciones básicas entre pixeles.
 Conectividad entre pixeles.
 Medidas de distancia.
 Los escáneres
 Proceso de digitalización ProHD.
 Imágenes en movimiento.
 Elementos de la imagen en movimiento.
 Conclusión.
 Bibliografía.
Introducción:
La visión puede ser considerada como un proceso que permite a una persona
obtener una gran cantidad de información del ambiente, la cual a la vez ayuda a
ésta a desenvolverse ya sea en la navegación o bien en la realización de tareas.
El que este proceso con todos sus problemas se intente resolver de forma
automática mediante computadoras, formula una de las áreas de investigación y
desarrollo de mayor inversión en los últimos años. Visión por computadora se
define como todo intento enfocado al desarrollo de algoritmos que traten de lograr
que una máquina simule hasta cierto grado el proceso de visión biológico.
Sistema de visión y Procesamiento de imágenes:

Un sistema de visión y procesamiento de imagen se compone de una serie de


subsistemas que operan sobre una escena con el objetivo de interpretar alguna
característica notable.
En el bajo nivel, se encuentran procesos que se realizan sobre imágenes
correspondientes de suavizado, umbralización, eliminación de ruido, definición de
bordes, etc. Los procesos que se desarrollan en esta etapa de procesamiento
suelen conocerse en la comunidad de visión como pre-procesamiento. En el nivel
medio, se definen procesos tales como definición de límites y extracción de
características. En el alto nivel se establecen relaciones semánticas entre los
objetos de la descripción de la escena. En este libro la mayoría de los algoritmos
tratados a lo largo de los capítulos caen en el bajo nivel y medio nivel.

La imagen digital

Antes de nada, hay que preguntarse: ¿qué es exactamente una digitalización y en


qué se diferencia de otras imágenes digitales como las vectoriales? Desde un
punto de vista técnico, la imagen digital obtenida con un escáner se conoce como
imagen “de barrido” o “ráster”. Este tipo de imagen digital está formada por un
mapa de bits organizado en forma de retícula o rejilla y compuesto por píxeles.
Las propiedades de la imagen digital de barrido más relevantes para el proceso de
digitalización son las siguientes:

 Resolución: la resolución de una imagen ráster indica el nivel de detalle; se mide


contando el número de píxeles, es decir, un punto o cuadrado diminuto que ocupa
una posición en una retícula ordenada.
 Profundidad de color: la profundidad de color (o resolución de la señal) es la
cantidad de información en bits representada en un solo píxel; cuantos más bits
tenga un píxel, mayor es la información que puede representarse.
 Compresión: la compresión es la reducción del tamaño de un fichero con el
objetivo de procesarlo, almacenarlo o transmitirlo de manera óptima; los ficheros
comprimidos son menores que su contrapartida sin comprimir, pero la técnica de
compresión y el nivel de compresión pueden disminuir la calidad del fichero.
 Tamaño de los ficheros: se calcula multiplicando el número total de píxeles por
la profundidad de color en bytes; el resultado de esta multiplicación debe dividirse
por 8. Es decir, el tamaño de un fichero = (ancho en píxeles x alto en píxeles x
profundidad de color) / 8.

PROCESAMIENTO DIGITAL DE IMÁGENES

El procesamiento digital de imágenes puede definirse como la operación de


imágenes mediante computadora, el tipo de operaciones que se realizan coinciden
a nivel de procesos en los tratados en la sección anterior. Una diferencia
importante entre el procesamiento de imágenes y la visión corresponde a que las
imágenes con las que se trabaja en el primer caso no provienen únicamente de la
captación del espectro visible a la que corresponde el sistema de visión biológico,
ya que las imágenes pueden originarse de la captación de cualquier área del
espectro electromagnético. Existen hoy día sistemas de procesamiento de imagen
que operan sobre imágenes generadas a partir del censado de rayos X, rayos
gamma, resonancia magnética, microondas entre otras.

La materia prima del procesamiento de imágenes y la visión son las imágenes, las
cuales se considerarán como una representación del mundo físico que tiene
información importante, la cual es captada mediante un proceso de muestreo,
generalmente por medios electrónicos. Para poder obtener imágenes digitales, se
requiere de un proceso que involucra captura, muestreo, cuantificación y
codificación. Una imagen puede definirse como una función bidimensional que
cuantifica la intensidad de luz (el espectro visible es el más común). Una imagen
normalmente es representada como (x, y), donde el valor de la intensidad se
obtiene por el indexado de las coordenadas x e y.

𝐼 = (1,1) 𝐼 = (2,1) … 𝐼 = (𝑁, 1)


𝐼 = (1,2) ⋯ 𝐼 = (2,2) ⋱ ⋯ 𝐼 = (𝑁, 2) ]
𝐼(𝑥, 𝑦) = [
⋮ ⋮ ⋮
𝐼 = (1, 𝑀) 𝐼 = (2, 𝑀) ⋯ 𝐼 = (𝑁, 𝑀)

RELACIONES BÁSICAS ENTRE PIXELES


En este apartado se establecerán algunas relaciones importantes que existen
entre los píxeles de una imagen, la idea es describirlas tanto en su concepto como
su nomenclatura ya que serán tratadas de manera extensiva en los capítulos del
libro.

Vecinos de un píxel

La vecindad se define como la relación que tiene un pixel de manera posicional


con los píxeles más cercanos a él. Existen dos tipos de vecindad que posee un
pixel en la imagen, la vecindad 4-vecinos y la 8-vecinos.

La vecindad 4-vecinos se constituye de los píxeles (V1, V2, V3 y V4) que se


encuentran arriba, abajo, a la derecha e izquierda del pixel en cuestión P.

La vecindad 8-vecinos se constituye de los píxeles (VI, V2, V3, V4, VS, V6, V7 y
V8) correspondientes a los 4-vecinos más, los 4 pixeles que se encuentran en
forma diagonal al pixel en cuestión P.

Conectividad entre pixeles

La conectividad entre pixeles es un concepto utilizado ampliamente en la


detección de regiones u objetos presentes en una determinada imagen. Por esta
razón la conectividad se define como una situación de adyacencia y vecindad.
Bajo esta observación existen dos tipos de conectividad, la conectividad 4 y la
conectividad 8. El concepto de conectividad puede ser mejor entendido si se
considera una Imagen binaria, es decir una imagen cuyos pixeles representan una
característica en lugar de luminosidad, por lo que sus valores solo pueden ser cero
o uno.

Considerando lo anterior se dice que dos pixeles (x, y) y (x,y), cuyos valores en la
imagen son uno, están conectados con conectividad-4 si ambos se encuentran en
relación de 4-vecinos. De igual manera los mismos pixeles estarían conectados
con conectividad-8 si ambos se encuentran en relación de 8-vecinos.

Con el objetivo de mostrar la importancia de estos conceptos se ilustra en la


Figura una imagen binaria en la cual se encuentran uno o dos objetos, según el
tipo de conectividad utilizada. En caso de considerar la conectividad-4, la imagen
tendrá dos objetos, ya que el punto en donde ambas estructuras se encuentran
más cercanas los pixeles de contacto no está en relación de vecindad 4-vecinos.
Si en la misma imagen se considera como criterio de vecindad el de 8-vecinos los
dos pixeles de contacto estarían conectados por lo que ambas estructuras serian
consideradas como un solo objeto.

MEDIDAS DE DISTANCIA

La distancia existente entre dos píxeles es una de las medidas más usadas en el
procesamiento de imágenes, con aplicaciones que van desde la similitud hasta la
medición de objetos encontrados en la escena. Existen varios tipos de medidas
para encontrar relaciones posicionales entre píxeles, sin embargo, las más
comunes son la distancia euclidiana, la distancia city-block y la chessboard.

Para la definición y caracterización de las distancias entre dos puntos se considera


la imagen mostrada en la Figura que contiene dos píxeles etiquetados como (x1,
y1)) = p, e 𝐼2 (𝑥2 , 𝑦2 ) = 𝑃2 .

La distancia euclidiana se define como la distancia existente entre dos píxeles


definida de acuerdo a:

𝐷𝐸 (𝑃1 , 𝑃2 ) = √(𝑥1 − 𝑥2 )2 + (𝑦1 − 𝑦2 )2

Los escáneres

Existen muchos tipos de escáneres: planos, de rodillo, para transparencias y


microfilms, de trayectoria y gran formato, etc. Actualmente, muchos proyectos de
digitalización utilizan cámaras digitales, que se pueden instalar en un trípode, e
incluso dispositivos móviles, como ScanTent. En cualquier caso, la elección del
tipo de escáneres depende de los materiales que se pretenden digitalizar y del uso
de las imágenes digitales. Como en ProHD nuestro objetivo es digitalizar
documentos manuscritos e impresos, contamos con dos escáneres planetarios de
Zeutschel. Ambos escáneres, OS15000 Advanced Plus y zeta comfort, son
óptimos para escanear libros y documentos encuadernados, manuscritos, mapas y
hojas sueltas, es decir, todo tipo de materiales delicados que no se pueden
introducir en un escáner plano o de rodillo.
Además de estos dos escáneres adquiridos para el proyecto, el Archivo de la
Oficina del Historiador de la Ciudad de La Habana cuenta con un tercer escáner
de gran formato.

El proceso de digitalización puede verse como una cadena de producción en la


que cada actividad añade algo de “valor” al documento: desde la selección,
pasando por la limpieza, la conversión mediante escáneres, la creación de
ficheros maestros y de acceso, la optimización con filtros o la obtención de OCR,
hasta la creación de metadatos y de copias de respaldo, todas estas actividades
enriquecen el documento aumentando o modificando sus características, su
formato, sus componentes o su relación con otros ficheros. Por este motivo, es
importante respetar el orden del flujo de trabajo descrito y concebir todas las
actividades de manera interdependiente.

 Digitalización o captura: es el proceso de conversión digital según las


especificaciones (resolución, profundidad de color, formatos, etc.) acordadas
previamente para cada tipo de documento con el objetivo de generar un fichero
maestro de calidad alta.
Imágenes en movimiento

El movimiento de una imagen se produce cuando una sucesión de imágenes


estáticas, llamadas fotogramas, son proyectadas a gran velocidad. Para que una
imagen fija se perciba en movimiento se tienen que proyectar un mínimo de 16
imágenes por segundo, aunque para percibirlo como real, se graba y se proyecta
a 24 fotogramas por segundo en el cine, y a 25 en la televisión y el vídeo.

ELEMENTOS DE LA IMAGEN EN MOVIMIENTO


La imagen en movimiento está compuesta por imágenes fijas que, al pasar a una
determinada velocidad ante nuestros ojos (24 fotogramas/frames por segundo en
el caso del cine y 25 fotogramas/frames seg. en el de la televisión) crean la ilusión
del movimiento. La lectura de la imagen en movimiento se nutre de aquellos
conceptos que hemos trabajado en la imagen fija (encuadre, plano, ángulo, etc.).
A estos elementos debemos añadir aquellos aspectos diferenciales de las
imágenes en movimiento:

 Componentes narrativos: Se trata de aquellas unidades de significado que


componen las imágenes en movimiento. Estos elementos resultan
esenciales a la hora de construir los relatos.
 Transiciones: Estos recursos se emplean para unir los diferentes planos.
Existen diferentes métodos que permiten crear en la audiencia sensaciones
de diversa naturaleza.
 Movimientos de cámara: Con el desplazamiento físico u óptico de las
cámaras se consigue imitar la forma de captar la realidad por parte de las
personas. Estos movimientos han adquirido una gran importancia en el
lenguaje cinematográfico y permiten dotar a las imágenes de una gran
fuerza expresiva.
 Estructura narrativa: La utilización de estos recursos permiten estructurar el
relato y dar una coherencia interna al mismo, situando a la audiencia en los
diferentes momentos y espacios en los que se desenvuelve.
 Efectos: Los efectos son aquellos trucos técnicos que permiten modificar
los límites que ofrecen las imágenes convencionales. A medida que avanza
la técnica se han incrementado el número de efectos, aunque en este curso
sólo vamos a recoger los más clásicos. Estos recursos tienen mucha
importancia en el discurso cinematográfico.
 Profundidad de campo y campo.

Conclusión:

En conclusión el proceso de digitalizar imágenes aunque a simple vista puede


parecer algo relativamente sencillo la realidad es que el proceso que permite la
digitalización de las imágenes en realidad es más complejo, ya que el mismo
depende de muchos factores para poder no solo presentar una imagen si no que
durante el proceso de digitalización se puede generar un efecto en el cual los
pixeles dan la impresión de generar movimiento.
Referencias:

“La digitalización es un proceso más complejo de lo que normalmente se piensa” – Una

introducción a los pasos de trabajo más importantes del proceso de digitalización.

(2020, 3 noviembre). Proyecto Humboldt Digital (ProHD). Recuperado 20 de

octubre de 2022, de https://habanaberlin.hypotheses.org/1844

2. La imagen en movimiento - 4o EPV. La Imagen. (s. f.). Recuperado 20 de octubre de

2022, de https://sites.google.com/site/4oepvlaimagen/contenido/2-la-imagen-en-

movimiento

ELEMENTOS DE LA IMAGEN EN MOVIMIENTO. (s. f.). PDF.

https://personales.unican.es/rodriguezhc/Bloque%203%20Imagen%20en%20movi
miento.pdf

Libro:

Procesamiento digital de imágenes usando MatLAB & Simulink /

Cuevas, Erik; Zaldívar, Daniel; Pérez-Cisneros, Marco

D.L. 2010

También podría gustarte