Está en la página 1de 11

Reconocimiento de Patrones

(Pattern Recognition)
en minería de datos
Profesor
Héctor Allende. hallende@inf.utfsm.cl
Página: www.inf.utfsm.cl/~hallende

Certamen Global 40%


Fecha Martes 22 de Junio de 2006

Tareas personales 30%

Trabajo de investigación 30%

Estado del arte

Aplicaciones: Clasificación,
Clustering,
Asociación,
Regresión
Pronóstico

"# $

[1] R. Duda, P. Hart and D. Stork, “Pattern Classification”, Ed. J. Wiley ,2001.
[2] B. D. Ripley, “Pattern recognition and Neural Network”, .Ed. Cambrige University
Press, 1996.
[3] Bishop, “Neural Networks for Pattern Recognition”, Ed. Clarendon Press Oxford,
1995.
[4] J. Han, M. Kamber, “Data Mining Concepts and Techniques”, Ed. Academic
Press, 2001.
[5] Revistas: Pattern Recognition, Pattern Recognition Letters IEEEE Trans. on
Neuronal Networks, LNCS : Pattern Recognition and Image Analysis
[6] L. I. Kuncheva Combining Pattern Classifiers Ed. J. Wiley 2004

Pattern Recognition, Pattern Recognition Letters IEEEE Trans. on Neuronal


Networks, LNCS : Pattern Recognition and Image Analysis.

Links: http://www.ph.tn.tudelft.nl/PRInfo/index.html
http://www.inf.utfsm.cl/~hallende/
%"& '% ( )%
Describir los conceptos básicos del reconocimiento de formas
(Pattern Recognition) ¿Qué es RP? Qué es un espacios de
Representación ?. Distancia v/s Medidas de Similaridad.

Maquinas de Aprendizaje en el reconocimiento de formas: Selección


de variables, Clasificación supervisada, Clasificación no supervisada

Presentar las algunas aplicaciones del reconocimiento de formas, en


Data Mining y Teledetección (Procesamiento de Imágenes; Médicas ,
Espaciales etc).

Comentar los principales avances para los problemas de


clasificación y reconocimiento de patrones.

Mucha de la información que se maneja en la vida real se


presenta en la forma de patrones complejos: caras, textos
escritos, enfermedades, música, flores, piezas
industriales, etc.
La psicología aún no ha encontrado un modelo
concluyente que describa los mecanismos por los que las
señales externas estimulan los nuestros órganos
sensoriales y se convierten en experiencias perceptuales
significativas.
Las TI han dado un gran impulso este campo: Estudiando
de las teorías y técnicas de reconocimiento implantadas
en distintos sistemas de información.

Problemas esenciales:
Elaboración de algoritmos eficientes
Elaboración de medidas de similaridad
Clasificación no supervisada
Criterios de agrupamiento
Algoritmos conceptuales

Minería de Texto
Problemas esenciales: Representación de
documentos Similaridad entre documentos
Sumarización y desambiguación
Reglas de asociación
Selección y extracción de de variables

Con Minería con datos mezclados e incompletos


Testores
Algoritmos
Sensitividad
Extensiones

)
Aplicaciones del Reconocimiento de Patrones
Existen variados campos de aplicaciones de PR
Naturaleza de los patrones: caracteres escritos,
símbolos, dibujos, imágenes biomédicas, objetos
tridimensionales, firmas, huellas dactilares,
espectrograma, imágenes de Teledetección,
cromosomas, etc.
Requerimientos de los sistema de PR
• Tiempo de respuesta
• Autonomía ( Inteligencia computacional)
• Factores económicos (costo del equipamiento)
• Factores Tecnológicos

* )

Aproximación estadística
Cada patrón se representa por un vector de números,
resultantes del muestreo y cuantificación (o binarización) de las
señales externas.

= =

= =

×
* )

Cada clase se representa por uno o varios patrones


prototipos.
Variabilidad de las medidas registradas: cada
componente del vector es una variable aleatoria y cada
uno de sus valores es una realización de esa variable
aleatoria.
Un patrón es un punto en el espacio de representación
de los patrones, espacio de dimensionalidad
determinada por el número de variables consideradas.
Es razonable que los patrones de una misma clase
estén cercanos, mientras que los de clases diferentes
deberían estar en diferentes regiones.

* )

Aproximación sintáctica
La aproximación estadística no considera el contexto:
en ocasiones, Los patrones complejos se pueden
descomponerse en patrones más simples hasta llegar
a componentes básicos.
Un patrón se describe en términos de sus elementos
básicos (elementos terminales) y de reglas sintácticas
(gramática) que especifican cómo se pueden generar
patrones válidos de una determinada clase.
Problema: responder si un determinado patrón
pertenece al lenguaje generado por una gramática.

+, -)

El Reconocimiento de Patrones puede considerarse, de


forma genérica, como una disciplina de la Estadística
Computacional y de la Inteligencia Computacional ( soft-
computing.

Adquisición y representación del conocimiento.

Transferencia y transformación de conocimientos de una


o más fuentes (libros, manuales, expertos, etc.) a un
sistema informático y presentarlo (expresarlo) de forma
útil para su tratamiento posterior.
+, -)

Aprendizaje
Implica cambios en el sistema que se adapta para
permitir llevar a cabo la misma tarea a partir de las
mismas condiciones de un modo más eficiente y eficaz
cada vez.
Usualmente se utiliza aprendizaje inductivo:
Una vez establecida la manera de representar el
conocimiento y extraído éste, se calcula a partir de un
conjunto de entrenamiento el patrón (o conjunto de
patrones) prototipos utilizando un algoritmo de
aprendizaje. Es necesario un esquema de evaluación
que proporciona una medida de bondad del sistema.

+, -)

Naturaleza estadística de aprendizaje


A partir de una muestra representativa se infieren
reglas o patrones a toda la población objetivo.
Máquinas de Inferencia: Estimación ; Regresión
general y Pronóstico

Clasificación.
Consiste en proporcionar nuevos prototipos al
sistema, independientes de los utilizados en el
aprendizaje para que éste los etiquete utilizando el
conjunto de clases disponibles.
+, -)

Evaluación.
Toda clasificación lleva aparejada una medida de error,
bondad y confianza. Deben proporcionarse mecanismos
para evaluar esta bondad. Normalmente se utiliza un
conjunto de patrones etiquetados por expertos y no usados
en el aprendizaje.

PR: Consiste en el análisis de Características; variabilidad


y similaridad entre Patrones

El PR: Se centra en el estudio de mecanismos de


reconocimiento presente en seres vivos.

Dato puede ser :

un número (Dato Cuantitativo)


un nombre (Dato Categórico)
una cualidad( Dato Ordinal)
Pero también puede ser :

una imagen
un símbolo
un jeroglífico
una señal de radio
un electrocardiograma
un documento
un libro
una función
una matriz
un tensor, etc.
Tipos de datos

•Cuantitativos
Estructurados •Cualitativos

•Simbólicos
•Ordenados jerárquicamente

• Imágenes
Bloques de datos binarios
• Sonido

No Estructurados •Textos

Problemas que están intrínsecamente relacionados con datos:

Identificar un rostro en un cuadro o


Convertir un texto hablado en uno escrito o
Establecer un diagnóstico médico a partir de un ECG o EEG
En cada uno de ellos se tienen propósitos específicos.

Cada uno de estos propósitos determinan la forma en que los datos


deben ser procesados.
Esto implica que todo proceso de relacionado con datos está precedido,
por un proceso de modelación del problema que necesitamos resolver.

pronóstico de magnitudes máxima de terremotos


pronóstico de perspectividad de yacimientos minerales
pronóstico de tormentas ionosféricas
regionalización sísmica
diagnóstico diferencial de enfermedades
evaluación de pacientes con labio paladar hendido
lectura diagnóstica de electro señales (EEG, ECG, EMG, etc.)
clasificación automática de hongos
identificación de huellas digitales (rodadas, incompletas)
identificación de caligrafías
identificación de rostros (estáticos, en movimiento, enmascarados,
etc.)
identificación de interlocutores
identificación de objetos mediante sonidos (aviones, vehículos)
identificación de objetos mediante rastros (balística)
dispositivos de acceso por identificación iriológica o palmaria
reconocimiento de patentes de vehículos

caracterización socio política de colectivos sociales

pronóstico de surgimiento de fenómenos socialesç

caracterización del modus operandi de un objeto

análisis de las causas de la delincuencia juvenil (u otro fenómeno


social)

clasificación jerárquica de delitos

evaluación de la gravedad delictiva

! " # $%

! " #
$
%
& " '
. la práctica, casi siempre tenemos que vernos con
En
datos ruidosos o difusos con el propósito de extraer de
ellos información que nos sea útil.

En el caso particular del RP, aunque no haya una


división exacta en el procesamiento desde los datos
ruidosos por un lado hasta las conclusiones por el otro,
un paradigma útil puede ser el considerar todo ese
proceso dividido en cuatro etapas.

& %$

Etapas del procesamiento de datos en RP:

Adquisición

Preprocesamiento

Representación-descripción, y

Análisis

Adquisición:

Este proceso está caracterizado por el hecho


que la entrada es los datos originales
tomados de las fuentes originales y la salida
son los datos ruidosos de los que tenemos
que extraer la información que nos puede ser
útil.

(
La adquisición de datos puede ser tan simple como tomar
los datos sin ruidos, limpios, listos para ser procesados.

Observe que en la entrada de esta etapa del proceso


tenemos una fuente, por ejemplo un electrocardiógrafo, a
partir del cual tomamos una señal, el ECG del paciente.

Esa señal ECG casi siempre tiene ruidos, no está lo


suficientemente limpia por lo que no es siempre posible la
lectura de lo queremos extraer sin errores.

La etapa del Pre-procesamiento está caracterizada


por el hecho que ambas, la entrada y la salida son
datos de la misma naturaleza, es decir, significa casi
la misma cosa.
Por ejemplo, ambas son señales, imágenes,
jeroglíficos, matrices, tuplos de valores de un cierto
rasgo, etc.

Pre-procesamiento o Filtrado de señales o imágenes,


incrementar la resolución o el contraste de una imagen,
restaurar una imagen, eliminarle el ruido, ajustar los datos de
una variable, validar los datos, escalarlos, son ejemplos de pre-
procesamiento de datos.

Observe que en la entrada de esta estapa tenemos por ejemplo


una señal, el ECG de un paciente, y en la salida casi que el
mismo ECG sólo que quizás sin ruidos, más limpio, más claro,
en el cual es mas sencillo leer la información que estamos
buscando.

)
Tarea No.1

1.-¿Qué es un patrón?
2.-Describa un sistema de Reconocimiento
de Patrones de un ejemplo.

También podría gustarte