Está en la página 1de 7

¿Qué es visión? ¿Qué es procesamiento de imágenes?

¿Cuál es la diferencia
entre ambos?
 La visión es la ventana al mundo de muchos organismos. Su función principal es
reconocer y localizar objetos en el ambiente mediante el procesamiento de las
imágenes. La visión computacional es el estudio de estos procesos, para
entenderlos y construir maquinas con capacidades similares.

 El procesamiento de imágenes esa ligado a la visión computacional cuyo


objetivo es mejorar la calidad de las imágenes para su posterior utilización o
interpretación como remover defectos, remover problemas por movimiento o
desenfoque, mejorar ciertas propiedades como color, contraste, estructura, etc.
O agregar “colores falsos” a imágenes monocromáticas.

1. Da dos ejemplos de problemas que se pueden resolver utilizando


procesamiento de imágenes y dos que correspondan a visión.
 En el procesador de imágenes, el libro trae como ejemplo el enfoque de una
ilustración, el cual obtiene una imagen “mejor” para su posterior interpretación
por una persona, presenta la misma imagen, resaltando e ignorando ciertas
características, en este caso tratara de construir una representación
tridimensional de un objeto, analizar un objeto para determinar su calidad y/o
descomponer una imagen u objeto en diferentes partes.
 Un ejemplo del uso de procesamiento de imágenes es el mejorar la fotografía de
una persona en el cual por ejemplo en la entrada la fotografía sale obscura, así
que mediante el procesamiento la imagen de salida es esencialmente la misma
pero de mejor calidad o “más útil”.
 Otro ejemplo del procesamiento de imágenes, pero que también aplica para la
visión, es en el área de Interpretación de imágenes aéreas y de satélite, el cual
se usa estos dos tipos para mejorar las imágenes obtenidas, identificar
diferentes tipos de cultivo, ayudar en la predicción del clima, etc.
 Para la visión computacional extrae las características de una imagen para su
descripción e interpretación por la computadora y puede determinar la
localización y tipo de objetos en la imagen, visión busca obtener descripciones
útiles para cada tarea a realizar, demandara modificar ciertos atributos, haciendo
que la imagen de entrada sea procesada para extraer los atributos, obteniendo
como salida una descripción de la imagen analizada.
 Otro ejemplo donde se usa la visión es en el área de manufactura para la
localización e identificación de piezas, para control de calidad entre otras tareas.
2. Demuestra usando análisis de Fourier el teorema del muestreo.
La respuesta nos la da el teorema del muestreo de Whitaker-Kotelnikov-Shannon. Este
dice que para lograr una recuperación completa, es necesario que la frecuencia de
muestreo sea al menos dos veces mayor a la frecuencia mayor contenida en el
espectro de la señal ˜ original. Esto se puede demostrar a partir de un análisis de
Fourier del fenómeno de muestreo. Si no se cumple esto se presenta un fenómeno
llamado “aliasing” en el cual las bajas frecuencias interfieren en las altas frecuencias,
resultando en la perdida de detalle de la imagen que se ve borrosa.

Sea una señal x (t) de energía finita y de banda limitada a B, entonces:

Es decir, para recuperar una señal banda limitada a B basta conocer sus muestras
tomadas con una frecuencia igual a 2B. Dicha frecuencia se denomina frecuencia de
Nyquist
Demostración Primero vamos a considerar la función f (u) = e2πiut en el intervalo (−B, B).
Vamos a extenderla periódicamente y a calcular su serie exponencial de Fourier en la
base {e2πi(n/2B) u} n≥0, que es una base ortogonal de L2 (−B, B).
Nuestra función es continua y derivable luego su serie de Fourier será uniformemente
convergente como hemos visto en el apartado de convergencia.
Vemos que:

Ya que es una integral en la cual el integrando es una función impar en un dominio de


integración simétrico.

En adelante usaremos la notación , que denota a la función seno


cardinal. Recordamos que definimos la trasformada de Fourier y su inversa como:
3. Al digitalizar una imagen ¿qué tan “cerca” deben estar las muestras y
porque? ¿Qué pasa si no hay la suficiente resolución?
La respuesta nos la da el teorema del muestreo de Shannon. Este dice que para lograr
una recuperación completa, es necesario que la frecuencia de muestreo sea al menos
dos veces mayor a la frecuencia mayor contenida en el espectro de la señal ˜ original.
Si consideramos que los elementos de la imagen en realidad no son puntos sino celdas
con un nivel de intensidad uniforme, entonces dichas celdas tienen cierta forma
bidimensional.
4. Considerando que cada pixel en una imagen se represente con 8 bits, y
además se transmite un bit de inicio y uno de fin por “paquete” (pixel),
cuantos segundos se requieren para transmitir una imagen de 1024 x 1024
pixeles para una velocidad de transmisión de (a) 300 baud (bits por
segundo), (b) 9600 baud, (c) 1 Mega baud.
1 Mbaud -> 1048576 bps
La imagen como esta en una resolución de 1024 x 1024, este está compuesto de
8,388,608 bits por lo cual para una velocidad de 300 Baud se requerirán 27,962.02
segundos para transmitir por completo la imagen, para la velocidad de 9600 Baud se
requerirá 873.81 segundos para una transferencia completa, y para 1 Mega Baud que
equivale a 1,048,576 bits por segundo requerirá solo 8 segundos para una
transferencia completa.
5. Repite el problema anterior para imágenes a color, con 8 bits por banda,
considerando que cada pixel es un paquete.
Las imágenes a color de 8 bits contienen alrededor de 256 colores presentes posibles
para formar la imagen, la transferencia depende de la profundidad de la imagen y los
canales utilizados para este comparado con una imagen blanco y negro, comúnmente
constando de 3 canales representando RGB, para este caso nuestra imagen de 1024 x
1024 constara ahora de 25,165,824 bits, para una transferencia de 300 Baud requerirás
una espera de 83,886 segundos para transferir la imagen, para 9600 Baud requerirás
un total de 2,621.44 segundos para transferir la imagen y para 1 Mega Baud requerirás
24 segundos para transferir una imagen a color de 8 bits bajo 3 canales asumiendo que
es RGB y no CYMK.

6. Define una métrica para distancia en arreglos de celdas rectangulares y


hexagonales.
Para esto es conveniente que la distancia sea una métrica, que satisfaga lo siguiente:

Este aspecto es fácil de definir en un patrón rectangular, pero es más complejo en los
patrones triangulares y hexagonales.

7. Analiza un proceso computacional de acuerdo a los niveles de análisis de


Marr y describe cada uno de estos.
Marr quiere que tomemos 3 niveles para hacer el análisis general de todo un sistema,
el asume la metáfora computacional (mente-ordenador) hasta el extremo de diseñar un
modelo informático de visión artificial que opere según los procedimientos utilizados por
el sistema visual humano. Acepta el nivel explicativo representacional, en cuanto
recurre a descripciones simbólicas de los objetos que componen las escenas. Concibe
un abordaje, de los problemas relativos a la percepción, desde una perspectiva
interdisciplinaria, que considera tanto las aportaciones de la neurofisiología y psicología
como los algoritmos computacionales, integrando sus hallazgos en un modelo de la
percepción visual.
8. Describe los tres principales niveles de visión. Especifıca las entradas y
salidas a cada nivel, así como la información adicional que se requiera en
cada uno.
Marr propone 3 niveles:
 Para el primer nivel explica la teoría computacional, el cual el objetivo es del
proceso computacional, sus metas y las estrategias adecuadas para realizarlo,
asume el análisis hasta el extremo de diseñar un modelo informático de visión
artificial que opere según los procedimientos utilizados por el sistema visual
humano. Para este nivel debe de clarificar que es lo que cumple, que es lo que
hace, que es lo que computa y por qué razón lo hace, Marr propone que debe
transformarse las entradas en forma de imágenes en salidas en forma
descriptiva.


 El segundo nivel es la representación y el algoritmo, el cual la descripción del
proceso computacional, es el representar las entradas y las salidas, proponer el
algoritmo para lograr dicha transformación. Para este nivel debe de establecer
cuáles son las operaciones fundamentales encargadas de realizar las funciones,
como realizara las operaciones, en que formato las representara y utilizara cada
una de las entidades significativas.
 El tercer nivel es la implementación, el cual pregunta cómo se realiza
físicamente dicho proceso. Para este nivel está más enfocado en el elemento del
hardware, el cual hay que especificar en qué dispositivo tendría lugar el proceso,
si tendrá lugar sobre los mecanismos neuronales del sistema visual o los
mecanismos electrónicos de una computadora, este nivel señala las
restricciones que soporta el sistema físico.
9. Un proceso computacional lo podemos considerar desde tres puntos de
vista: teoría computacional, algoritmo e implementación. Describe el
proceso general de visión desde los tres aspectos.
 En el primer nivel tenemos que clarificar las funciones computacionales de
extracción de imágenes y patrones, analizando en el concepto de que es lo que
tiene que hacer, que es lo que cumplirá, como lo cumplirá, que es lo que
computa, por qué razón lo hace y como será sus entradas que tendrán que ser
transformadas a salidas en forma descriptiva.
 Para el segundo nivel que se basa más en los algoritmos debemos establecer
las operaciones principales que deberá de hacer nuestro sistema, ver como
transformara las imágenes, con que función se basara en el algoritmo y como
realizara las operaciones dependiendo del formato representacional que se
utilizara para cada entidad o imagen.
 Para el ultimo nivel el cual es la implementación es que después de haber tenido
la base computacional y el algoritmo, que es lo que correrá nuestro sistema, el
cual hay que especificar el lugar donde se hará el proceso, ya sea una maquina
o un cerebro el cual tendrá que replicar mecanismos neuronales en el sistema y
que con esto podemos ver cuáles son sus puntos fuertes pero a la vez que
podemos ver como son las restricciones o limitaciones que ofrece el sistema.

También podría gustarte