Está en la página 1de 14

INFORME – ANALISIS DE COMPONENETES PRINCIPALES Y ANALISIS DE CORRESPONDENCIAS MULTIPLES

PARCIAL 1

METODOS MULTIVARIADOS

PRESENTADO POR: ANDERSON ARLEY GUERRERO GUATAQUIRA

CC: 1024510795

CÓD: 201910059441

PROFESOR: CRISTIAN ANDRÉS GONZÁLEZ PRIETO

ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA

FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES

19 DE AGOSTO DE 2019
Taller Parcial 1

Informe – Análisis Resultados del Estudio “Propiedades del Whiskey”

1. Realice un análisis de componentes principales (APC) sobre la base de Whisky y responda las siguientes
preguntas:

a. Seleccione las variables cuantitativas para realizar el análisis: Precio, Proporción, Vejez y Nota.
Nota: Si desea cambiarle el nombre a las categorías de Categoría utilice la sentencia W$Categoria<-
factor(W$Categoria,labels=c(’Bajo’,’Est´andar’,’PuroMalta’)), si el objeto donde guardo la base se
llama W

RTA: Lo anterior se resolvió teniendo en cuenta que para un análisis ACP se deben tener variables
cuantitativas.

b. ¿Cuantos ejes retiene para el análisis? ¿Por qué?

RTA: Sí tenemos en cuenta la siguiente diagrama de barras, podemos observar que existe un caída
que genera una gran diferencia entre la primera y la segunda variable; y a partir de la segunda barra
los demos tienen un tamaño muy similar, es decir, no hay gran diferencia entre sus alturas.

Por lo anterior, se retienen para el análisis 2 ejes


c. ¿Cuál es la variable que más contribuye al primer eje? ¿Por qué?

RTA: La variable que más contribuye al primer eje es El Precio con un porcentaje de contribución
de 32,98%, a continuación se describe el detalle del porcentaje de contribución de cada variable en
cada eje

d. ¿Cuál es la variable mejor representada en el primer eje? ¿Cuál la peor?

RTA: La variable que está mejor representada en el primer eje es El Precio con un 73.66, a
continuación se describe el detalle en como las variables se encuentran representas en cada eje

e. ¿Cuáles son las variables más correlacionadas? Use el círculo de correlaciones y verifique con la
matriz de correlaciones de los datos originales.

RTA: Sí tenemos en cuenta la siguiente diagrama de circulo, podemos observar que existe una
cercanía entre las variables Precio y Proporción, lo cual puede estar indicando que estas son las
variables más correlacionadas
Ahora bien, al comparar el diagrama de circulo con la matriz de correlación, se confirma que en
efecto estas son las variables más correlacionadas, sin embargo, se puede observar que la
correlación de la variable Precio y la variable Proporción no es tan fuerte, toda vez que su grado de
correlación es del 65%

f. ¿Qué nombre le pondría al primer eje? Analice el segundo eje y evalué la posibilidad de darle un
nombre.

RTA:
Nombre del Primer Eje: Teniendo en cuenta que en el primer eje la variable que más contribuye es
el Precio seguido de la proporción, el nombre que se le podría dar a éste es “Valor del Whisky en
el mercado según su proporción”

Nombre del Segundo Eje: Teniendo en cuenta que en el segundo eje la variable que más contribuye
es la nota con un valor de contribución del 79.57%, el nombre que se le podría dar a éste es
“Satisfacción del Cliente con el Whisky”

g. ¿Cuál es el individuo mejor y peor representado en el primer eje factorial? ¿Por qué?

RTA: De acuerdo con la tabla de representación de individuos en cada eje; El individuo mejor
representado es el número 18 con un valor de 94.75 de contribución relativa; y El individuo peor
representado es el número 11 con un valor de 0.23 de contribución relativa.

h. ¿Cuál es el individuo mejor y peor representado en el primer plano factorial?

RTA: Al realizar el procedimiento de sumar el “Signed row relative contributions” o los valores de
contribución relativa de cada individuo de en primer eje, obtenemos que; El individuo mejor
representado es el número 16 con un valor de 90317475,00000 de contribución relativa; y El
individuo peor representado es el número 23 con un valor de 146793,67913 de contribución
relativa.

i. ¿Qué características tienen las marcas de Whisky según sus ubicaciones en el plano? (a la derecha,
a la izquierda, arriba, abajo).

RTA: Para realizar este análisis, se obtiene el siguiente diagrama, con las ubicaciones en el plano de
las características del Whisky y cada una de las maras:
De acuerdo con la imagen anterior, se puede evidenciar que; Hacia la Derecha se dimensionan las
marcas de whisky más costosas o de mayor precio, como ejemplo esta la marca número 30 que
cuenta con un precio de 160 (La más alta); Hacia Arriba se dimensionan las marcas de whisky que
tienen mayor proporción, como ejemplo esta la marca número 35 que cuenta con una proporción
de 100 (Una de las más altas); Hacia Abajo se dimensionan las marcas de whisky que tienen mayor
nota, como ejemplo esta la marca número 16 que cuenta con una nota de 4 (Una de las más altas);
Hacia el Centro se dimensionan las marcas de whisky que tienen mayor vejes, como ejemplo esta
la marca número 23 que cuenta con una nota de 12.5 (La más altas)

j. A partir de la posición en el plano y con la respuesta anterior deduzca las características de las tres
categorías de whisky (bajo, estándar y pura malta)

RTA: Sí tenemos en cuenta el siguiente plano, podemos observar que; Hacia la Derecha se
encuentran los whisky con “puramalta”, que se relacionan con los whisky de mayor precio y
proporción; Hacia el Centro se encuentran los whisky con “estándar”, que se relacionan con los
whisky de mejor nota y vejes; y Hacia la Izquierda se encuentran los whisky con “bajo”, que se
relacionan con los whisky de menor precio, vejez y nota:
k. Supongamos que usted desea comprar una botella de Whisky con buena apreciación y que no sea
tan cara. De dos números de marcas que compraría. ¿Por qué? ¿Cuáles son las características de
las dos marcas?

RTA: Para conocer cuál es la marca de whisky con mejor apreciación “Nota” pero que no sea tan
cara, ordenaos los datos con el valor de la nota y precio:

Individuo Precio Proporción Vejez Nota


16 73 40 10.5 4
20 87 40 8.5 4
1 70 20 5.0 3
5 70 25 12.0 3
13 62 33 8.0 3
26 113 45 12.0 4
14 87 33 12.0 3
28 82 45 12.0 3
31 90 100 12.0 4
2 60 20 5.0 2
27 96 45 12.0 3
3 65 20 7.5 2
8 55 30 5.0 2
24 110 40 12.0 3
4 74 25 12.0 2
11 82 30 12.0 2
15 78 35 10.0 2
29 127 100 8.5 4
21 80 40 9.5 2
18 80 40 8.5 2
19 85 40 9.5 2
17 87 40 8.5 2
23 90 40 12.5 2
25 87 40 5.5 2
34 100 100 11.0 3
33 100 100 10.0 3
12 73 33 6.5 1
22 83 40 9.5 1
32 86 100 12.0 2
30 160 100 12.0 3
7 70 30 8.0 0
6 73 30 5.0 0
9 77 30 5.5 0
10 93 30 12.0 0
35 95 100 12.0 0

Con la información anterior; los dos número de marcas para comparar que tan buenos son por
apreciación y no sean tan costosos, son el número 16 y el número 20 toda vez que cuentan con
una de las notas de apreciación más alta que es “4” y su precio es de 73 y 87 respectivamente, los
cuales no son tan costosos comparados con los que tiene un valor de precio que supera los 100

Características de las marcas:

Marca Precio Proporción Vejez Nota


16 73 40 10.5 4
20 87 40 8.5 4

l. Seleccione dos marcas que definitivamente no compraría. ¿Por qué? ¿Qué características tienen?

RTA: De acuerdo con la información relacionada anteriormente; las dos marcas que no compraría
serían las marcas número 10 y la marca número 35, teniendo en cuenta que las dos marcas
obtienen una nota de 0 y el valor de cada una es de 93 y 95 respectivamente, muy cercano a las
marcas con un precio de whisky de 100 que tienen una mejor nota;

Características de las marcas:

Marca Precio Proporción Vejez Nota


10 93 30 12.0 0
35 95 100 12.0 0

Análisis de Correspondencias Multiples

Para realizar este análisis, se tomó sobre los tripulantes del Titanic, con información de un conjunto de pasajeros
sobre su nivel económico, sexo, edad(representado en si es niño o adulto) y si sobrevivió

 Tabla de Código Condensado: Se utiliza la base columnas (Clase, Sexo, Edad, Sobrevivió) y filas
(Individuos)
 Tabla Disyuntiva Completa: Se realiza una tabla binaria para conocer dónde están los individuos con
respecto a las variables

Class.1st Class.2nd Class.3rd Class.Crew Sex.Female Sex.Male Age.Adult Age.Child Survived.No Survived.Yes

1 1 0 0 0 0 1 0 1 1 0

2 0 1 0 0 0 1 0 1 1 0

3 0 0 1 0 0 1 0 1 1 0

4 0 0 0 1 0 1 0 1 1 0

5 1 0 0 0 1 0 0 1 1 0

6 0 1 0 0 1 0 0 1 1 0

7 0 0 1 0 1 0 0 1 1 0

8 0 0 0 1 1 0 0 1 1 0

9 1 0 0 0 0 1 1 0 1 0

10 0 1 0 0 0 1 1 0 1 0

11 0 0 1 0 0 1 1 0 1 0

12 0 0 0 1 0 1 1 0 1 0
13 1 0 0 0 1 0 1 0 1 0

14 0 1 0 0 1 0 1 0 1 0

15 0 0 1 0 1 0 1 0 1 0

16 0 0 0 1 1 0 1 0 1 0

17 1 0 0 0 0 1 0 1 0 1

18 0 1 0 0 0 1 0 1 0 1

19 0 0 1 0 0 1 0 1 0 1

20 0 0 0 1 0 1 0 1 0 1

21 1 0 0 0 1 0 0 1 0 1

22 0 1 0 0 1 0 0 1 0 1

23 0 0 1 0 1 0 0 1 0 1

24 0 0 0 1 1 0 0 1 0 1

25 1 0 0 0 0 1 1 0 0 1

26 0 1 0 0 0 1 1 0 0 1
27 0 0 1 0 0 1 1 0 0 1

28 0 0 0 1 0 1 1 0 0 1

29 1 0 0 0 1 0 1 0 0 1

30 0 1 0 0 1 0 1 0 0 1

31 0 0 1 0 1 0 1 0 0 1

32 0 0 0 1 1 0 1 0 0 1

 Tabla de Burt: Se realiza una tabla de contingencias múltiple para conocer la relación entre las variables

Class.1s Class.2n Class.3r Class.Cre Sex.Femal Sex.Mal Age.Adul Age.Chil Survived.N Survived.Y
t d d w e e t d o es
Class.1st 8 0 0 0 4 4 4 4 4 4
Class.2n
0 8 0 0 4 4 4 4 4 4
d
Class.3r
0 0 8 0 4 4 4 4 4 4
d
Class.Cr
0 0 0 8 4 4 4 4 4 4
ew
Sex.Fem
4 4 4 4 16 0 8 8 8 8
ale
Sex.Male 4 4 4 4 0 16 8 8 8 8
Age.Adul
4 4 4 4 8 8 16 0 8 8
t
Age.Chil
4 4 4 4 8 8 0 16 8 8
d
Survived
4 4 4 4 8 8 8 8 16 0
.No
Survived
4 4 4 4 8 8 8 8 0 16
.Yes

Con lo anterior, se debe establecer cuantos ejes tomar, sin embargo, para tomar esta decisión el diagrama de
barras no es de suficiente ayuda ya que todas se encuentran casi del mismo tamaño, no hay caídas pronunciadas
para establecer descriptivamente cuantos ejes tomar:
En consecuencia, se tiene en cuenta cuanta variabilidad se está dispuesto a perder y que aun así sea
representativa, por lo que se tiene en cuenta que se tome al menos el 50% de la variabilidad

Por lo anterior, se toman 3 ejes

a. Análisis desde el Primer Plano

Con el siguiente plano, se puede evidenciar que en de acuerdo con la muestra del estudio que no hay
una relación entre las variables de estudio con respecto a que si el pasajero del Titanic sobrevivió, sin
embargo, se puede ver que el sexo masculino es quizá el más cercano a decir que es un Adulto que
sobrevivió; por otra parte, se puede observar que el estrato está en el centro del plano, lo que hace
que esta variable sea nula con respecto a que si el pasajero sobrevivió o si es adulto o niño
b. Análisis desde el segundo plano

El segundo plano no entrega gran información, aunque se puede observar lo anteriormente concluido,
es que las variables género masculino adulto ´potencial relación con que sobrevivió ene l Titanic
c. Análisis de Contribuciones

Como se puede observar en la imagen anterior, el porcentaje de contribución de las variables es muy pequeña,

d. Análisis de Correlación
De acuerdo con el grafico anterior, se puede observar una correlación entre la variable “Edad” y la
variable “Sobrevivió”, y para el eje 2, la variable Clase y la variable sexo son las que mas aportan

También podría gustarte