Está en la página 1de 12

TALLER No.

2 – Análisis con la aplicación SPAD

1. Análisis Clúster
1.1 Usando la base de datos del ejercicio 2.3 (Fig. 1) del taller 1 sobre cremas dentales, realice
un análisis clúster para encontrar grupos de marcas de dentífricos caracterizados por una
serie de atributos:

a. Realice una clasificación jerárquica, determine el número de grupos que son


adecuados y muestre el dendograma. Concluya.
b. Usando el número de grupos encontrado en el literal a. construya una
caracterización y muestre:
a. La descomposición de la inercia de cada grupo.
b. Número de marcas en cada grupo.
c. Explique los porcentajes Cla/Mod, Mod/Cla, Global de la modalidad con el
mayor valor test de cada grupo.
d. Documente lo que caracteriza a las marcas de cada grupo.
e. Haga el plano factorial que muestre las variables activas (muestre los tamaños
de cada punto de acuerdo a la contribución de las modalidades al análisis).
MA RC A NIÑOS MUJE RE S HOMB RE S MA NC HA S ME DIC INA L C A RA B A RA TA S E X Y S A B OR S E NS IB ILIDA D S A RRO FRE S C URA C A RIE S A LIE NTO B LA NC OS
COLGATE 10 10 11 9 3 34 20 7 58 6 19 55 47 49 44
KOLYNOS 2 4 3 3 8 7 2 0 6 6 5 10 5 9 10
COLGATEWHITE 15 30 29 25 23 64 4 14 113 5 47 106 100 89 105
BLENDDY 6 0 0 0 0 1 3 0 3 0 0 4 3 5 1
BLENDAMED 2 4 4 2 4 4 1 1 4 2 3 6 4 5 5
CLOSEUP 4 7 7 10 2 28 23 10 53 2 11 55 36 5 39
COLGATECREMA 14 18 20 12 3 30 34 10 67 4 24 59 55 53 53
FLUORDENT 0 8 11 30 14 22 8 3 23 6 17 23 17 25 32
DENTAGARD 0 1 1 1 1 2 0 0 1 0 1 2 1 1 1
COLGATEPROALIVIO 1 5 5 4 16 10 0 2 8 13 5 10 11 10 8
COLGATEHERBAL 7 15 15 10 30 27 10 3 30 10 14 36 35 31 31
KEMPHOR 1 3 3 5 5 6 1 1 6 2 4 8 8 8 6
AQUAFRESH 11 19 19 7 14 24 35 13 70 10 16 77 37 67 45
PROFIDEN 8 13 12 8 4 15 38 7 46 6 23 41 36 40 42
SENSODINE 0 6 6 4 15 18 3 2 10 27 3 13 4 8 7
SIGNALFLUOR 9 12 12 8 5 26 31 6 56 3 22 55 49 45 44
SIGNAL2 7 12 12 6 3 22 23 7 48 2 17 45 41 36 33
SIGNALPASTA 7 9 9 9 4 19 22 7 50 4 19 44 42 39 37
SNOOPY 31 0 0 0 0 3 2 0 6 1 1 6 2 3 2
TEELAK 0 1 1 2 8 9 0 1 6 4 4 8 7 8 7
ULTRABRITE 3 4 4 8 4 5 14 1 15 2 6 13 5 11 25

Fig. 1.1

Respuesta:

DATOS:

El archivo “CremaDental.xls” corresponde a una tabla de valores absolutos de las frecuencias para
las diferentes marcas de cremas dentales en el mercado con respecto a unos atributos que fueron
evaluados por los consumidores. Se considera a estos valores como variables numéricas, por lo
tanto, se configura SPAD, del siguiente modo.
TALLER No. 2 – Análisis con la aplicación SPAD

Fig. 1-2A

Los datos de la Fig. 1-2B nos indican que existen un total de 15 variables y 21 casos, en donde los
nombres de las marcas de crema dental están bajo el campo Libl. Cada caso queda enumerado
bajo el campo Iden. Los campos Label e Ident de la Fig. 1-2A nos muestra un diccionario de datos
en donde se identifican los nombres completos de los campos y su abreviatura respectivamente. A
la derecha de éstos se muestran los tipos de datos, que son numéricos con su rango mínimo y
máximo observado para cada variable.

Fig. 1-2B
TALLER No. 2 – Análisis con la aplicación SPAD

Fig. 1-2C

ESTUDIO PRELIMINAR DE LOS DATOS

La Fig. 1-3 muestra la matriz de distancias que corresponden a las correlaciones de Pearson en
valor absoluto entre las variables y se obtuvieron usando SPSS. Si todas las distancias hubieran
sido similares o iguales, no se hubiera podido formar grupos, y el análisis por conglomerados no se
aplicaría.
Matriz de distancias
Archivo matricial de entrada
Caso NIÑOS MUJERES HOMBRES MANCHAS MEDICINAL CARA BARATA SEXY SABOR SENSIBILIDAD SARRO FRESCURA CARIES ALIENTO BLANCOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 NIÑOS 1,000 ,321 ,313 ,030 ,103 ,282 ,262 ,333 ,404 ,220 ,329 ,383 ,380 ,393 ,341
2 MUJERES ,321 1,000 ,993 ,635 ,527 ,896 ,521 ,871 ,920 ,161 ,922 ,926 ,919 ,941 ,930
3 HOMBRES ,313 ,993 1,000 ,689 ,518 ,900 ,532 ,869 ,915 ,158 ,921 ,919 ,911 ,940 ,928
4 MANCHAS ,030 ,635 ,689 1,000 ,457 ,717 ,201 ,523 ,596 ,045 ,734 ,582 ,613 ,584 ,725
5 MEDICINAL ,103 ,527 ,518 ,457 1,000 ,493 ,176 ,206 ,249 ,572 ,352 ,308 ,315 ,367 ,348
6 CARA ,282 ,896 ,900 ,717 ,493 1,000 ,364 ,834 ,912 ,168 ,907 ,914 ,936 ,844 ,933
7 BARATA ,262 ,521 ,532 ,201 ,176 ,364 1,000 ,694 ,637 ,062 ,511 ,627 ,532 ,582 ,532
8 SEXY ,333 ,871 ,869 ,523 ,206 ,834 ,694 1,000 ,960 ,041 ,831 ,966 ,885 ,860 ,888
9 SABOR ,404 ,920 ,915 ,596 ,249 ,912 ,637 ,960 1,000 ,017 ,932 ,993 ,970 ,928 ,967
10 SENSIBILIDAD ,220 ,161 ,158 ,045 ,572 ,168 ,062 ,041 ,017 1,000 ,020 ,024 ,043 ,062 ,025
11 SARRO ,329 ,922 ,921 ,734 ,352 ,907 ,511 ,831 ,932 ,020 1,000 ,905 ,963 ,921 ,974
12 FRESCURA ,383 ,926 ,919 ,582 ,308 ,914 ,627 ,966 ,993 ,024 ,905 1,000 ,952 ,923 ,952
13 CARIES ,380 ,919 ,911 ,613 ,315 ,936 ,532 ,885 ,970 ,043 ,963 ,952 1,000 ,911 ,964
14 ALIENTO ,393 ,941 ,940 ,584 ,367 ,844 ,582 ,860 ,928 ,062 ,921 ,923 ,911 1,000 ,912
15 BLANCOS ,341 ,930 ,928 ,725 ,348 ,933 ,532 ,888 ,967 ,025 ,974 ,952 ,964 ,912 1,000

Fig. 1-3

La Fig. 1-3 muestra que las distancias tienen un rango desde la correlación más baja de
0,017(marcado en amarillo), que corresponden al par SABOR-SENSIBILIDAD, hasta la correlación
más alta de 0,993 (marcado en verde), que corresponden al par HOMBRE-MUJERES. Los cuadros
de color azul, corresponden a la diagonal y su valor es siempre 1 ya que se compara cada atributo
consigo mismo.
TALLER No. 2 – Análisis con la aplicación SPAD
La Fig. 1-4 muestra las distancias en término de la distancia euclidiana. Obsérvese que los las
correlaciones más altas tienen una distancia euclidiana más baja, es decir, se encuentran más
cercanos y aquellas con correlaciones más bajas tiene la distancia euclidiana más alta, es decir, se
encuentran más lejos del uno al otro.
Matriz de distancias
Archivo matricial de entrada
Caso NIÑOS MUJERES HOMBRES MANCHAS MEDICINAL CARA BARATA SEXY SABOR SENSIBILIDAD SARRO FRESCURA CARIES ALIENTO BLANCOS
NIÑOS 0,000 39,611 40,075 46,271 50,971 83,223 66,918 33,362 172,769 46,723 57,105 166,889 137,459 134,933 142,517
MUJERES 39,611 0,000 4,123 28,844 33,779 57,836 54,873 26,608 151,631 41,905 29,394 145,207 115,013 112,187 119,021
HOMBRES 40,075 4,123 0,000 26,851 34,234 57,096 54,203 27,221 151,205 42,297 29,000 144,838 114,704 111,647 118,537
MANCHAS 46,271 28,844 26,851 0,000 35,986 66,985 66,776 32,218 163,725 43,151 40,669 157,750 127,201 125,881 128,078
MEDICINAL 50,971 33,779 34,234 35,986 0,000 73,675 78,256 40,112 172,653 31,859 54,690 164,463 135,333 131,533 138,185
CARA 83,223 57,836 57,096 66,985 73,675 0,000 74,579 79,630 103,860 88,017 38,639 97,273 66,985 74,344 70,901
BARATA 66,918 54,873 54,203 66,776 78,256 74,579 0,000 61,895 139,567 75,319 55,145 133,866 112,414 107,149 115,676
SEXY 33,362 26,608 27,221 32,218 40,112 79,630 61,895 0,000 172,818 32,985 50,951 166,604 137,106 135,470 141,612
SABOR 172,769 151,631 151,205 163,725 172,653 103,860 139,567 172,818 0,000 185,499 128,406 18,138 47,979 60,399 45,387
SENSIBILIDAD 46,723 41,905 42,297 43,151 31,859 88,017 75,319 32,985 185,499 0,000 65,955 178,110 150,073 145,664 153,590
SARRO 57,105 29,394 29,000 40,669 54,690 38,639 55,145 50,951 128,406 65,955 0,000 123,624 90,211 90,719 93,936
FRESCURA 166,889 145,207 144,838 157,750 164,463 97,273 133,866 166,604 18,138 178,110 123,624 0,000 48,877 56,912 45,552
CARIES 137,459 115,013 114,704 127,201 135,333 66,985 112,414 137,106 47,979 150,073 90,211 48,877 0,000 47,032 30,887
ALIENTO 134,933 112,187 111,647 125,881 131,533 74,344 107,149 135,470 60,399 145,664 90,719 56,912 47,032 0,000 47,032
BLANCOS 142,517 119,021 118,537 128,078 138,185 70,901 115,676 141,612 45,387 153,590 93,936 45,552 30,887 47,032 0,000

Fig. 1-4

LA Fig. 1-5 muestra el histograma de los primeros 14 valores propios y se puede observar que ya a
partir del 6 valor, ya se retiene más del 95% acumulado de la inercia, confirmándonos que los
indicadores mantienen una estructura de alta correlación como para realizar un análisis por
conglomerados.

Fig. 1-5
TALLER No. 2 – Análisis con la aplicación SPAD
a. Realice una clasificación jerárquica, determine el número de grupos que son adecuados
y muestre el dendograma. Concluya.

Fig. 1-6A
La Fig. 1-6A muestra un historial sobre cómo se forman los nodos para este ejercicio, según los
parámetros que se indicaron al sistema. Por ejemplo, en la iteración 15 se unen los dos
elementos 11 y 12 para formar un grupo. Éste tiene un peso de 146.00. En la iteración 16 se unen
los elementos 5 y 10 para formar otro grupo de dos elementos. En la 17a. Iteración, se unen los
grupos de las iteraciones 15 y 16 para formar un grupo con los dos nodos anteriores, es decir 4
elementos. Así sucesivamente se van formando los grupos hasta llegar a la iteración 27 en donde
se unen los grupos de la iteración 13 y la 26 para formar un único grupo de 14 elementos (n-1=15-
1=14).
La Fig. 1-6B muestra el dendograma de los datos suministrados a SPAD, usando el método que
fue aprendido en clase para el análisis clúster. Es importante mencionar que en la etapa 14
muestra que existe un único punto no agrupado, el 13. Por lo que dividir los grupos en dos, no
sería muy descriptivo de la realidad de la muestra. Por lo tanto, descartamos la agrupación en dos
grupos por esta razón.

Fig. 1-6B
TALLER No. 2 – Análisis con la aplicación SPAD
Aunque con un análisis discriminante se podría definir con mayor exactitud el número de
conglomerados, es nuestra opinión que la partición debería realizarse un poco debajo de la
distancia media, ya que existen muchos grupos aglomerados debajo de esta línea divisoria. Por lo
tanto, se podrían escoger entre 3 o 4 grupos, como se indica en la Fig. 1-7. Para este ejercicio se
escogerán 4 grupos porque debajo de éstos se aglomeran muchos grupos en cascada con
distancias euclidianas bastante cortas (de alrededor de 0,01 o menor), aunque la escogencia de 3
grupos podría ser también válida.

Fig. 1-7
TALLER No. 2 – Análisis con la aplicación SPAD
b. Usando el número de grupos encontrado en el literal a. construya una caracterización y
muestre:
a. La descomposición de la inercia de cada grupo.
Ésta se muestra en la Fig. 1-7, en donde se indican los pesos de cada uno de los cuatro
conglomerados antes y después de su agrupación. El primer conglomerado es el más
pesado de los cuatro grupos, con una inercia dentro de su grupo de 0,0449, peso de
3866,00 y distancia de 0,0206 para un total de 11 elementos, teniendo a su vez las
menores distancias antes y después de su agrupación. Los demás grupos se describen del
mismo modo. La inercia entre grupos es de 0,2249 y la inercia total es de 0,2899.

Fig. 1-7
TALLER No. 2 – Análisis con la aplicación SPAD
b. Número de marcas en cada grupo.
Como se puede apreciar en la Fig. 1-8, existen cuatro conglomerados en los cuales el primero
abarca 11 marcas, las cuales se enumeran en la Fig. 1-8. El segundo conglomerado agrupa a
7 marcas. El tercero a 2 marcas y el cuarto tiene una única marca, SNOOPY, que es
principalmente preferida por los niños, como lo veremos más adelante.

Fig. 1-8
TALLER No. 2 – Análisis con la aplicación SPAD
c. Explique los porcentajes Cla/Mod, Mod/Cla, Global de la modalidad con el mayor
valor test de cada grupo.
La Fig. 1-9A muestra la caracterización de cada conglomerado por frecuencia con el valor
de prueba de cada grupo, según SPAD. Igualmente se muestran las variables que más
caracterizan a cada grupo en la Fig. 1-9B. Debido a que el software está en inglés, se
indican las siguientes equivalencias:
Según los apuntes de clase: Cla/Fre <-> Cla/Mod y Frec/Cla <-> Mod/Cla
Según la versión de SPAD en Inglés: GRP <-> GRUPO <-> CLASE <-> Cla, por lo
tanto:
Cla/Mod <-> GRP/FRE y Mod/Cla <-> FRE/GRP, los segundos de estas dos
equivalencias son los que muestra la versión en inglés de SPAD y se describen a
continuación.

Fig. 1-9A
TALLER No. 2 – Análisis con la aplicación SPAD

Fig. 1-9B
La Fig. 1-9B muestra los datos con mayor valor test de cada grupo y fueron extraídos de la Fig.
1-9A. En la cabecera de cada registro se muestra el grupo a que pertenecen. Estos registros
se interpretan de la siguiente manera:
 Todos los registros seleccionados presentan un valor test > 4 por lo tanto todos se
aceptan con las características de cada grupo que se indica. Si éstos hubieran sido
negativos, no hay nada más que hacer.
 Para el grupo o clase 1, se concluye:
o GRP/FRE: De todas las cremas dentales usadas en la muestra el 90,15% en
donde los encuestados que prefieren una crema dental barata pertenecen al
grupo o clase 1.
o FRE/GRP: De todas las cremas dentales asociadas al grupo 1 el 6,39%
presentan el atributo de ser barata.
o GLOBAL: El 77.68% de todas las marcas de crema dental de la muestra
pertenecen al grupo o clase 1. De este grupo, el 5.51% se asocian al atributo
barata.
 Para el grupo o clase 2, se concluye:
o GRP/FRE: De todas las cremas dentales usadas en la muestra el 42,17% en
donde los encuestados que prefieren una crema dental medicinal pertenecen
al grupo o clase 2.
o FRE/GRP: De todas las cremas dentales asociadas al grupo 2 el 8,54%
presentan el atributo de ser medicinal.
o GLOBAL: El 16,48% de todas las marcas de crema dental de la muestra
pertenecen al grupo o clase 2. De este grupo, el 3,34% se asocian al atributo
medicinal.

 Para el grupo o clase 3, se concluye:


o GRP/FRE: De todas las cremas dentales usadas en la muestra el 34,78% en
donde los encuestados que prefieren una crema dental con el atributo
sensibilidad pertenecen al grupo o clase 3.
TALLER No. 2 – Análisis con la aplicación SPAD
o FRE/GRP: De todas las cremas dentales asociadas al grupo 3 el 17,09%
presentan el atributo de sensibilidad.
o GLOBAL: El 4,70% de todas las marcas de crema dental de la muestra
pertenecen al grupo o clase 3. De este grupo, el 2,31% se asocian al atributo
sensibilidad.

 Para el grupo o clase 4, se concluye:


o GRP/FRE: De todas las cremas dentales usadas en la muestra el 22,46% en
donde los encuestados que prefieren una crema dental con el atributo niños
pertenecen al grupo o clase 4.
o FRE/GRP: De todas las cremas dentales asociadas al grupo 4 el 54,39%
presentan el atributo de niños.
o GLOBAL: El 1,15% de todas las marcas de crema dental de la muestra
pertenecen al grupo o clase 4. De este grupo, el 2,77% se asocian al atributo
niños.

d. Documente lo que caracteriza a las marcas de cada grupo.


Para responder a esta pregunta, se usarán los datos de la Fig. 1-9A.

GRUPO o CLASE 1: Las características de las cremas dentales que los encuestados
prefieren para este grupo son:
 Barata
 Sabor
 Caries
 Frescura

Por lo tanto, los encuestados recuerdan a las marcas que pertenecen a este grupo
las prefieren por su bajo costo, buen sabor, protección anti-caries y sabor fresco.
Posiblemente, estas personas pertenecen a un nivel socio-económico medio-bajo.

GRUPO o CLASE 2: Las características de las cremas dentales que los encuestados
prefieren para este grupo son:
 Medicinal
 Manchas
 Sensibilidad

Por lo tanto, los encuestados recuerdan a las marcas que pertenecen a este grupo
las prefieren por su valor medicinal, limpieza de las machas dentales, y protección
a las encías. Posiblemente estas personas son fumadoras.

GRUPO o CLASE 3: Las características de las cremas dentales que los encuestados
prefieren para este grupo son:
 Sensibilidad
 Medicinal
 Cara
TALLER No. 2 – Análisis con la aplicación SPAD
Por lo tanto, los encuestados recuerdan a las marcas que pertenecen a este grupo
las prefieren por su protección a las encías, por ser medicinal y su alto precio que
les infunde la idea de calidad. Posiblemente, estas personas utilizan backets.

GRUPO o CLASE 4: Las características de las cremas dentales que los encuestados
prefieren para este grupo son:
 Niños

Por lo tanto, los encuestados recuerdan a la marca SNOOPY por ser infantil y sus
compradores son padres de familia.

e. Haga el plano factorial que muestre las variables activas (muestre los tamaños de
cada punto de acuerdo a la contribución de las modalidades al análisis).
La Fig. 1-10A muestra el plano factorial de las variables activas con los tamaños de
acuerdo a la contribución de las modalidades al análisis. Se puede observar que la crema
dental SNOOPY tiene una gran contribución; sin embargo, ella sola no comparte su grupo
con ninguna más y pertenece al grupo 4. Aunque los grupos se han indicado con una línea
de contorno trazada a mano, la leyenda especifica los colores de los conglomerados a los
que pertenecen. Tambien se puede notar que la crema Blenddy se encuentra alejada de
las otras cremas que conforman el grupo 1. La segunda crema dental que más contribuye
al análisis es Sensodine, que pertenece al grupo 3. La tercera crema dental que más
contribuye al análisis es ColgateAlivio. Las demás cremas dentales presentan un tamaño
pequeño con respecto a las tres primeras ya mencionadas.

Fig. 1-10A

También podría gustarte