Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tipos de Datos
Tipos de Datos
(Pattern Recognition)
en minería de datos
Profesor
Héctor Allende. hallende@inf.utfsm.cl
Página: www.inf.utfsm.cl/~hallende
Aplicaciones: Clasificación,
Clustering,
Asociación,
Regresión
Pronóstico
"# $
[1] R. Duda, P. Hart and D. Stork, “Pattern Classification”, Ed. J. Wiley ,2001.
[2] B. D. Ripley, “Pattern recognition and Neural Network”, .Ed. Cambrige University
Press, 1996.
[3] Bishop, “Neural Networks for Pattern Recognition”, Ed. Clarendon Press Oxford,
1995.
[4] J. Han, M. Kamber, “Data Mining Concepts and Techniques”, Ed. Academic
Press, 2001.
[5] Revistas: Pattern Recognition, Pattern Recognition Letters IEEEE Trans. on
Neuronal Networks, LNCS : Pattern Recognition and Image Analysis
[6] L. I. Kuncheva Combining Pattern Classifiers Ed. J. Wiley 2004
Links: http://www.ph.tn.tudelft.nl/PRInfo/index.html
http://www.inf.utfsm.cl/~hallende/
%"& '% ( )%
Describir los conceptos básicos del reconocimiento de formas
(Pattern Recognition) ¿Qué es RP? Qué es un espacios de
Representación ?. Distancia v/s Medidas de Similaridad.
Problemas esenciales:
Elaboración de algoritmos eficientes
Elaboración de medidas de similaridad
Clasificación no supervisada
Criterios de agrupamiento
Algoritmos conceptuales
Minería de Texto
Problemas esenciales: Representación de
documentos Similaridad entre documentos
Sumarización y desambiguación
Reglas de asociación
Selección y extracción de de variables
)
Aplicaciones del Reconocimiento de Patrones
Existen variados campos de aplicaciones de PR
Naturaleza de los patrones: caracteres escritos,
símbolos, dibujos, imágenes biomédicas, objetos
tridimensionales, firmas, huellas dactilares,
espectrograma, imágenes de Teledetección,
cromosomas, etc.
Requerimientos de los sistema de PR
• Tiempo de respuesta
• Autonomía ( Inteligencia computacional)
• Factores económicos (costo del equipamiento)
• Factores Tecnológicos
* )
Aproximación estadística
Cada patrón se representa por un vector de números,
resultantes del muestreo y cuantificación (o binarización) de las
señales externas.
= =
= =
×
* )
* )
Aproximación sintáctica
La aproximación estadística no considera el contexto:
en ocasiones, Los patrones complejos se pueden
descomponerse en patrones más simples hasta llegar
a componentes básicos.
Un patrón se describe en términos de sus elementos
básicos (elementos terminales) y de reglas sintácticas
(gramática) que especifican cómo se pueden generar
patrones válidos de una determinada clase.
Problema: responder si un determinado patrón
pertenece al lenguaje generado por una gramática.
+, -)
Aprendizaje
Implica cambios en el sistema que se adapta para
permitir llevar a cabo la misma tarea a partir de las
mismas condiciones de un modo más eficiente y eficaz
cada vez.
Usualmente se utiliza aprendizaje inductivo:
Una vez establecida la manera de representar el
conocimiento y extraído éste, se calcula a partir de un
conjunto de entrenamiento el patrón (o conjunto de
patrones) prototipos utilizando un algoritmo de
aprendizaje. Es necesario un esquema de evaluación
que proporciona una medida de bondad del sistema.
+, -)
Clasificación.
Consiste en proporcionar nuevos prototipos al
sistema, independientes de los utilizados en el
aprendizaje para que éste los etiquete utilizando el
conjunto de clases disponibles.
+, -)
Evaluación.
Toda clasificación lleva aparejada una medida de error,
bondad y confianza. Deben proporcionarse mecanismos
para evaluar esta bondad. Normalmente se utiliza un
conjunto de patrones etiquetados por expertos y no usados
en el aprendizaje.
una imagen
un símbolo
un jeroglífico
una señal de radio
un electrocardiograma
un documento
un libro
una función
una matriz
un tensor, etc.
Tipos de datos
•Cuantitativos
Estructurados •Cualitativos
•Simbólicos
•Ordenados jerárquicamente
• Imágenes
Bloques de datos binarios
• Sonido
No Estructurados •Textos
! " # $%
! " #
$
%
& " '
. la práctica, casi siempre tenemos que vernos con
En
datos ruidosos o difusos con el propósito de extraer de
ellos información que nos sea útil.
& %$
Adquisición
Preprocesamiento
Representación-descripción, y
Análisis
Adquisición:
(
La adquisición de datos puede ser tan simple como tomar
los datos sin ruidos, limpios, listos para ser procesados.
)
Tarea No.1
1.-¿Qué es un patrón?
2.-Describa un sistema de Reconocimiento
de Patrones de un ejemplo.