Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clasificación Divisiva No Supervisada
Clasificación Divisiva No Supervisada
Divisiva no
supervisada
Mtodos I de Anlisis de Datos
Introduccin
Una
La estructura de clasificacin resultante es una
conjunto de objetos:
Ejemplo: Consideremos la
siguiente tabla:
El mtodo de agrupacin de
rboles
Se propone un algoritmo recursivo para la
organizacin de una poblacin dada de objetos
simblicos en clases. De acuerdo con el mtodo
de agrupacin de rbol, los nodos se dividen de
forma recursiva por la eleccin de la mejor
variable de intervalo.
y no homogneo
Un proceso de Poisson es un proceso natural
puntual
que se puede utilizar en los datos
distribuidos al azar y de forma independiente.
Este proceso se caracteriza por dos elementos:
las variables que cuentan el nmero de
puntos
en
intervalos
disjuntos
son
independientes. el nmero promedio de
puntos en cada rea
del espacio es
proporcional a la medida de Lebesgue de
esta rea.
, and ,
Donde es la medida de Lebesgue de
Si la tasa es constante, el proceso de Poisson
es un proceso de Poisson homogneo. Si la
tasa es dependiente de los puntos, el
proceso de Poisson es no-homogneo.
La
funcin
de
verosimilitud,
observaciones con , es:
para
las
es el
En consecuencia, si se conoce la intensidad del
Donde es la anchura de la ventana, tambin llamado
el parmetro de suavizado, que determina la
anchura de los golpes, y K es el ncleo con las
siguientes propiedades:
1. Es simtrico.
2. Es continuo.
3.
4. Se determina la forma de esos golpes.
Golpes y multimodalidades
Esto
ha sido mostrar al menos para el ncleo
normal. En consecuencia, para estimar la intensidad
del proceso de Poisson no homogneo, vamos a
utilizar el mtodo de ncleo con este ncleo
normales, definido por:
Criterio de Divisin
La particin ,) de
Mtodo de poda
Al final del proceso de divisin, obtenemos un
enorme rbol. a continuacin, se selecciona el
mejor sub-rbol.
De hecho, hemos desarrollado, bajo la hiptesis
de un proceso de Poisson no homogneo, un
mtodo de poda de rboles que toma la forma
de una prueba de hiptesis clsica, la prueba
de brecha (Kubushishi, 1996;Rasson and
Kubushishi, 1994).
Aplicacin a datos de
intervalo
Como
usamos un mtodo de divisin, las
Datos de Salida y
Resultados
Despus
de ejecutar el algoritmo y el procedimiento
Ejemplo
La agrupacin mtodo descrito ha sido probado
con el conocido conjunto de datos aceites de
Ichino. El conjunto de datos se compone de
ocho aceites que se describen en trminos de
cuatro variables de intervalo. Nuestro algoritmo
de divisin produce la particin del rbol en
clusters que se muestran en la figura 9.1.
Tabla de aceites y
grasas
Tabla 9.2
Gravedad Especfica: Indica la densidad del lquido comparada
con la densidad de un volumen de igual agua a una temperatura de
15C.
Punto de Congelamiento: Temperatura a la que los aceites se
solidifican
Clasificacin en
clsteres
Figura 9.1
Cada nodo terminal corresponde a un clster
,
,