Está en la página 1de 6

REPASO EE2, 2da parte

CASO: Frecuencia de compra

Se desea hacer un estudio sobre la frecuencia de compra semanal en los diferentes


supermercados de la ciudad. Para ello se recopila datos de una muestra de clientes que se
presentan en la tabla de contingencia que está en la Hoja1 del archivo EE2_2.xlsx.

#### Ingresando los datos de la tabla de contingencia


tc<-matrix(c(160,120,100,80,94,
180,100,80,70,70,
190,91,85,60,40,
180,80,60,40,30,
160,60,30,20,20),
nrow=5, byrow = TRUE,
dimnames = list(c("City Market","Com. Mexicana","Soriana",
"Superama","Walmart"),
c("Una vez","Dos veces","Tres veces",
"Cuatro veces","Cinco veces")))
#### Totales fila y columna de la tabla
tctot <- cbind(tc, Total = rowSums(tc))
tctot <- rbind(tctot, Total = colSums(tctot))
tctot

Aplique el análisis de correspondencia simple, asuma una significación del 2.45%.


1. De los resultados de la prueba de asociación entre las variables, se puede afirmar que el
estadístico de prueba es 91.563 , mientras que el valor crítico es 28.917 .
#### Prueba de independencia de varibles
chisq.test(tc)
Pearson's Chi-squared test

data: tc
X-squared = 91.563, df = 16, p-value = 1.288e-12

#### Valor critico


alpha <- 0.0245
qchisq(alpha, 16, lower.tail = F)
[1] 28.91726

2. En este análisis son necesarias 4 dimensiones.


3. El punto columna Dos veces es el que contribuye menos a la inercia del primer
componente y es equivalente al 0.1270 %.
#### Paquetes requeridos
library(ggplot2)
library(factoextra)
library(FactoMineR)
#### Analisis de Correspondencias Simples
res.ca <- CA(tc, graph = FALSE, ncp = 2)
summary(res.ca)

Call:
CA(X = tc, ncp = 2, graph = FALSE)

The chi square of independence between the two variables is equal to 91.56317 (p-value
= 1.287882e-12 ).
Eigenvalues
Dim.1 Dim.2 Dim.3 Dim.4
Variance 0.038 0.004 0.000 0.000
% of var. 90.366 8.694 0.933 0.008
Cumulative % of var. 90.366 99.060 99.992 100.000

Rows
Iner*1000 Dim.1 ctr cos2 Dim.2 ctr cos2
City Market | 15.356 | 0.244 39.884 0.977 | -0.032 7.040 0.017 |
Com. Mexicana | 2.491 | 0.097 5.668 0.856 | -0.022 3.168 0.046 |
Soriana | 2.431 | -0.045 1.159 0.179 | 0.097 55.092 0.820 |
Superama | 4.887 | -0.163 12.541 0.965 | 0.027 3.529 0.026 |
Walmart | 16.454 | -0.341 40.749 0.931 | -0.092 31.169 0.069 |

Columns
Iner*1000 Dim.1 ctr cos2 Dim.2 ctr cos2
Una vez | 18.143 | -0.214 48.008 0.995 | -0.013 1.781 0.004 |
Dos veces | 0.293 | 0.015 0.127 0.163 | -0.023 3.127 0.386 |
Tres veces | 3.958 | 0.120 6.209 0.590 | 0.099 43.294 0.396 |
Cuatro veces | 5.271 | 0.196 12.477 0.890 | 0.057 11.065 0.076 |
Cinco veces | 13.955 | 0.329 33.178 0.894 | -0.113 40.732 0.106 |

4. Poniendo atención a los perfiles fila, cuando la frecuencia de compra es “Tres veces por
semana” la mayor proporción es igual a 0.182 y corresponde al punto fila Soriana
.
### Perfiles fila
perfil.fila <- prop.table(as.matrix(tctot[,-ncol(tctot)]),1)
perfil.fila <- round(perfil.fila,4)
perfil.fila
Una vez Dos veces Tres veces Cuatro veces Cinco veces
City Market 0.2888 0.2166 0.1805 0.1444 0.1697
Com. Mexicana 0.3600 0.2000 0.1600 0.1400 0.1400
Soriana 0.4077 0.1953 0.1824 0.1288 0.0858
Superama 0.4615 0.2051 0.1538 0.1026 0.0769
Walmart 0.5517 0.2069 0.1034 0.0690 0.0690
Total 0.3955 0.2050 0.1614 0.1227 0.1155

5. Con base a la lectura del mapa perceptual, se puede afirmar que el supermercado “Superama”
tiene correspondencia con el punto columna Una vez .
#--- La visualizacion conjunta:
fviz_ca_biplot(res.ca, repel = TRUE)
6. La inercia total explicado por los dos primeros componentes es igual 99.060 %.

Eigenvalues
Dim.1 Dim.2 Dim.3 Dim.4
Variance 0.038 0.004 0.000 0.000
% of var. 90.366 8.694 0.933 0.008
Cumulative % of var. 90.366 99.060 99.992 100.000

7. El punto fila Walmart es el que contribuye más a la inercia total.


Rows
Iner*1000 Dim.1 ctr cos2 Dim.2 ctr cos2
City Market | 15.356 | 0.244 39.884 0.977 | -0.032 7.040 0.017 |
Com. Mexicana | 2.491 | 0.097 5.668 0.856 | -0.022 3.168 0.046 |
Soriana | 2.431 | -0.045 1.159 0.179 | 0.097 55.092 0.820 |
Superama | 4.887 | -0.163 12.541 0.965 | 0.027 3.529 0.026 |
Walmart | 16.454 | -0.341 40.749 0.931 | -0.092 31.169 0.069 |

8. El punto columna Una vez es el que contribuye más la inercia del primer
componente y es equivalente al 48.008 %.
Columns
Iner*1000 Dim.1 ctr cos2 Dim.2 ctr cos2
Una vez | 18.143 | -0.214 48.008 0.995 | -0.013 1.781 0.004 |
Dos veces | 0.293 | 0.015 0.127 0.163 | -0.023 3.127 0.386 |
Tres veces | 3.958 | 0.120 6.209 0.590 | 0.099 43.294 0.396 |
Cuatro veces | 5.271 | 0.196 12.477 0.890 | 0.057 11.065 0.076 |
Cinco veces | 13.955 | 0.329 33.178 0.894 | -0.113 40.732 0.106 |

9. El primer componente contribuye menos a la inercia del punto fila Soriana y es


equivalente al 17.9 %.
CASO: Supermercados

Se desea hacer un estudio sobre los diferentes supermercados de la ciudad. Las variables que se
han considerado son las siguientes:

X Delegacion donde reside el clientes V Grupo de edad al que pertenece el cliente


X1 Lomas de Chapultepec V1 De 20 a 29 años
X2 Pedregal de San Ángel V2 De 30 a 39 años
X3 Polanco V3 De 40 a 49 años
X4 Santa Fe V4 De 50 años a más
Y Supermercado donde compra el cliente W Frecuencia de compra semanal del cliente
Y1 City Market W1 Una vez por semana
Y2 Comercial Mexicana W2 Dos veces por semana
Y3 Soriana W3 Tres veces por semana
Y4 Superama W4 Cuatro veces por semana
Y5 Walmart W5 Cinco veces por semana
Z Medio de pago que usa el cliente
Z1 Efectivo
Z2 Tarjeta de crédito
Z3 Tarjeta de débito

Los datos de una muestra de clientes que se presentan en la Hoja2 del archivo EE2_2.xlsx.

Al respecto, aplique el análisis de correspondencia múltiple y con los resultados responda lo


siguiente:
## Ingreso de datos
mdatos <-read.delim("clipboard")

1. En el análisis fueron necesarias 16 dimensiones.


2. En este caso, la tabla de Burt debe tener filas.
##### Tabla de Burt
library(factoextra)
library(FactoMineR)
library(GDAtools)
burt(mdatos)
X.X1 X.X2 X.X3 X.X4 Y.Y1 Y.Y2 Y.Y3 Y.Y4 Y.Y5 Z.Z1 Z.Z2 Z.Z3 V.V1 V.V2 V.V3 V.V4 W.W1 W.W2 W.W3 W.W4 W.W5
X.X1 13 0 0 0 1 3 3 4 2 3 2 8 4 3 4 2 1 1 6 3 2
X.X2 0 13 0 0 2 0 4 4 3 2 6 5 2 3 4 4 0 4 5 1 3
X.X3 0 0 12 0 3 1 5 1 2 4 2 6 1 3 7 1 2 3 3 4 0
X.X4 0 0 0 12 4 3 2 1 2 7 1 4 4 2 4 2 2 4 4 0 2
Y.Y1 1 2 3 4 10 0 0 0 0 3 1 6 2 2 4 2 1 2 3 2 2
Y.Y2 3 0 1 3 0 7 0 0 0 4 0 3 3 0 3 1 0 3 2 1 1
Y.Y3 3 4 5 2 0 0 14 0 0 4 4 6 5 5 4 0 1 2 7 2 2
Y.Y4 4 4 1 1 0 0 0 10 0 3 2 5 1 3 4 2 2 1 3 2 2
Y.Y5 2 3 2 2 0 0 0 0 9 2 4 3 0 1 4 4 1 4 3 1 0
Z.Z1 3 2 4 7 3 4 4 3 2 16 0 0 4 2 5 5 3 4 8 0 1
Z.Z2 2 6 2 1 1 0 4 2 4 0 11 0 2 1 6 2 0 4 2 4 1
Z.Z3 8 5 6 4 6 3 6 5 3 0 0 23 5 8 8 2 2 4 8 4 5
V.V1 4 2 1 4 2 3 5 1 0 4 2 5 11 0 0 0 1 2 5 0 3
V.V2 3 3 3 2 2 0 5 3 1 2 1 8 0 11 0 0 0 2 6 2 1
V.V3 4 4 7 4 4 3 4 4 4 5 6 8 0 0 19 0 2 4 5 6 2
V.V4 2 4 1 2 2 1 0 2 4 5 2 2 0 0 0 9 2 4 2 0 1
W.W1 1 0 2 2 1 0 1 2 1 3 0 2 1 0 2 2 5 0 0 0 0
W.W2 1 4 3 4 2 3 2 1 4 4 4 4 2 2 4 4 0 12 0 0 0
W.W3 6 5 3 4 3 2 7 3 3 8 2 8 5 6 5 2 0 0 18 0 0
W.W4 3 1 4 0 2 1 2 2 1 0 4 4 0 2 6 0 0 0 0 8 0
W.W5 2 3 0 2 2 1 2 2 0 1 1 5 3 1 2 1 0 0 0 0 7

3. El punto columna es el que tiene la mayor masa y es igual a .


4. El punto columna W4 es el que tiene la mayor contribución a la inercia total y es
equivalente al 5.800%.
### Inercia y contribuciones dimensiones y/o columnas
library(ca)
require(ca)
res.mjca <- mjca(mdatos, lambda='Burt')
summary(res.mjca)
Columns:
name mass qlt inr k=1 cor ctr k=2 cor ctr
1 | X:X1 | 52 211 43 | -33 2 0 | -377 210 52 |
2 | X:X2 | 52 234 49 | -298 117 30 | 298 117 32 |
3 | X:X3 | 48 146 48 | -341 145 36 | 17 0 0 |
4 | X:X4 | 48 601 49 | 700 595 153 | 69 6 2 |
5 | Y:Y1 | 40 20 43 | 119 16 4 | -63 4 1 |
6 | Y:Y2 | 28 312 54 | 687 302 86 | -125 10 3 |
7 | Y:Y3 | 56 272 44 | -190 57 13 | -370 215 54 |
8 | Y:Y4 | 40 53 46 | -202 44 11 | -91 9 2 |
9 | Y:Y5 | 36 623 52 | -146 18 5 | 844 605 180 |
10 | Z:Z1 | 64 636 47 | 601 608 151 | 129 28 7 |
11 | Z:Z2 | 44 627 55 | -609 365 106 | 517 263 82 |
12 | Z:Z3 | 92 446 33 | -127 56 10 | -337 390 73 |
13 | V:V1 | 44 489 50 | 494 267 70 | -451 222 63 |
14 | V:V2 | 44 336 48 | -303 104 26 | -452 232 63 |
15 | V:V3 | 76 257 37 | -289 209 41 | 138 48 10 |
16 | V:V4 | 36 637 56 | 376 112 33 | 812 525 167 |
17 | W:W1 | 20 138 53 | 476 105 29 | 267 33 10 |
18 | W:W2 | 48 494 47 | 163 34 8 | 602 460 122 |
19 | W:W3 | 72 218 38 | 115 31 6 | -281 187 40 |
20 | W:W4 | 32 575 58 | -919 572 176 | -63 3 1 |
21 | W:W5 | 28 138 50 | 136 13 3 | -427 125 36 |

5. El punto columna X1 es el que tiene la menor contribución a la inercia del primer


componente y es equivalente al 0.000%.
6. De la lectura del mapa perceptual, se puede afirmar que el medio de pago “Z3 Tarjeta de
débito” presenta más correspondencia con el punto columna X1 (o Y3) .
### Análisis de Correspondencias Múltiples
res.acm<-MCA(mdatos, method = "Burt",graph=F, ncp = 2)
## Mapa Perceptual: modalidades o categorías de las variables (sin individuos)
fviz_mca_var(res.acm, col.var = "purple", shape.var = 10, repel = TRUE,
ggtheme = theme_grey())+
labs(title = "Nube de puntos de las Modalidades/Categorías")
7. De los clientes observados, 7 casos corresponden a “W5 Cinco veces por semana”.
8. De los clientes observados, 9 casos corresponden a “Y5 Walmart”.
9. La primera dimensión tiene la menor contribución de la inercia del punto columna X1 y
es equivalente al 0.200%.
Columns:
name mass qlt inr k=1 cor ctr k=2 cor ctr
1 | X:X1 | 52 211 43 | -33 2 0 | -377 210 52 |
2 | X:X2 | 52 234 49 | -298 117 30 | 298 117 32 |
3 | X:X3 | 48 146 48 | -341 145 36 | 17 0 0 |
4 | X:X4 | 48 601 49 | 700 595 153 | 69 6 2 |
5 | Y:Y1 | 40 20 43 | 119 16 4 | -63 4 1 |
6 | Y:Y2 | 28 312 54 | 687 302 86 | -125 10 3 |
7 | Y:Y3 | 56 272 44 | -190 57 13 | -370 215 54 |
8 | Y:Y4 | 40 53 46 | -202 44 11 | -91 9 2 |
9 | Y:Y5 | 36 623 52 | -146 18 5 | 844 605 180 |
10 | Z:Z1 | 64 636 47 | 601 608 151 | 129 28 7 |
11 | Z:Z2 | 44 627 55 | -609 365 106 | 517 263 82 |
12 | Z:Z3 | 92 446 33 | -127 56 10 | -337 390 73 |
13 | V:V1 | 44 489 50 | 494 267 70 | -451 222 63 |
14 | V:V2 | 44 336 48 | -303 104 26 | -452 232 63 |
15 | V:V3 | 76 257 37 | -289 209 41 | 138 48 10 |
16 | V:V4 | 36 637 56 | 376 112 33 | 812 525 167 |
17 | W:W1 | 20 138 53 | 476 105 29 | 267 33 10 |
18 | W:W2 | 48 494 47 | 163 34 8 | 602 460 122 |
19 | W:W3 | 72 218 38 | 115 31 6 | -281 187 40 |
20 | W:W4 | 32 575 58 | -919 572 176 | -63 3 1 |
21 | W:W5 | 28 138 50 | 136 13 3 | -427 125 36 |

10. La segunda dimensión tiene la menor contribución de la inercia del punto columna X3 y
es equivalente al 0.000%.

También podría gustarte