Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis Conglomerados Mixturas
Análisis Conglomerados Mixturas
La selección del modelo adecuado se puede realizar según algún criterio que conjugue
verosimilitud y complejidad, como AIC o BIC. Cuanto mayor sea el BIC, mejor es la calidad del
conglomerado. BIC es el coeficiente que determina el mejor modelo. Usamos la librería
library(mclust)
La matriz “Sigma”, en modelos con varianzas iguales (EII,EEI, EEE) es la estimación de la matriz
de dispersión común.
Ej.9. Ajustar un modelo de mixturas de normales bivariantes sobre los datos faithful de la
librería mclust, correspondiente a datos de tiempo de espera entre las erupciones y la
duración de la erupción del géiser Old Faithful en el Parque Nacional Yellowstone, Wyoming,
EE.UU.
library(mclust)
data(faithful)
Primero dibujamos el plot de los datos para saber si tiene sentido plantearse la
mixtura.
Parámetros estimados
plot(Mclusfaith)
-en el primer plot vemos el número de conglomerados, distribuciones
-en el segundo, eruptions, vemos además elipses, que son RC para los
vectores de media de cada una de las normales.
Ej. 10. Ajustar un modelo de mixturas sobre los datos wreath de la librería mclust. Los
datos contienen 1000 observaciones realizadas de una mixtura normal bidimensional
de 14 componentes en las que las covarianzas de las componentes tienen el mismo
volumen o tamaño y forma, pero diferente orientación.
data(wreath)
En este ejercicio usamos, la instrucción mclustBIC que guarda sólo los valores del
criterio BIC, y no las medias.
wreathBIC<- mclustBIC(wreath)
plot(wreathBIC,legendArgs=list(x="topleft"))
wreathBIC<- mclustBIC(wreath,G=1:20,x=wreathBIC)
plot(wreathBIC,G=10:20,legendArgs=list(x="bottomright"))
wreathBIC
plot(wreath, col=summary(wreathBIC,data=wreath)$classification )