Está en la página 1de 20

Nombres: Daniel Felipe Ayala Meza

Johan Daniel Fori

Taller Análisis Exploratorio de datos

Una empresa de muebles compra madera a tres proveedores diferentes. Es de interés para la
empresa comprobar la calidad de la materia prima que utiliza, por tal razón toma una muestra
aleatoria de 100 tablas donde mide:

Proveedor:

Proveedor 1, Proveedor 2, Proveedor 3

No de Nudos: No de nudos presentes en las tablas

Especie: Corresponde a la especie de madera

Longitud: longitud de la tabla en cm

Peso: Peso de la tabla en Kg

Grueso: Corresponde al grueso de la tabla en mm

No Proveedor Especie No de Longitud Grueso Peso


nudos

1 Proveedor Amarillo 0 499,1 51,0 5,1


1

2 Proveedor Sajo 1 496,2 53,1 3,4


1

3 Proveedor Cedro 2 500,7 49,5 6,6


1

4 Proveedor Sajo 1 503,8 48,5 3,6


1

5 Proveedor Amarillo 2 503,6 52,5 4,1


1

6 Proveedor Cedro 3 505,2 51,8 6,9


3

7 Proveedor Sajo 4 493,4 46,5 3,1


1

8 Proveedor Guayacán 4 499,3 49,1 3,6


3

9 Proveedor Sajo 5 503,3 51,1 3,7


1

10 Proveedor Sajo 6 496,7 46,3 2,5


3

11 Proveedor Cedro 6 497,9 46,9 7,5


2

12 Proveedor Guayacán 4 494,9 52,4 4,1


3

13 Proveedor Pino 3 494,5 52,2 6,1


2

14 Proveedor Guayacán 2 497,1 54,9 5,2


2

15 Proveedor Guayacán 0 497,7 45,9 5,4


1

16 Proveedor Guayacán 1 493,6 52,7 6,4


2
17 Proveedor Guayacán 1 498,3 51,9 3,8
3

18 Proveedor Amarillo 1 498,8 49,8 5,1


3

19 Proveedor Guayacán 1 500,4 47,7 6,0


1

20 Proveedor Sajo 2 498,9 49,2 3,5


1

21 Proveedor Cedro 2 499 47,8 7,9


3

22 Proveedor Pino 2 498,9 45,6 5,5


1

23 Proveedor Sajo 3 504 46,1 3,2


2

24 Proveedor Sajo 4 499,7 50,7 2,0


1

25 Proveedor Pino 3 499,4 47,5 2,7


1

26 Proveedor Sajo 1 498,5 48,0 3,4


1

27 Proveedor Amarillo 2 505,9 52,8 6,3


1

28 Proveedor Cedro 3 502,6 51,1 6,9


3
29 Proveedor Sajo 4 507,1 55,4 2,7
1

30 Proveedor Guayacán 4 498 52,8 6,1


3

31 Proveedor Sajo 5 505 51,4 3,8


1

32 Proveedor Sajo 6 495,2 44,7 2,5


3

33 Proveedor Cedro 6 501,6 49,6 7,6


2

34 Proveedor Guayacán 4 502,7 53,6 6,3


3

35 Proveedor Pino 3 505,8 51,8 3,9


2

36 Proveedor Guayacán 2 499,7 49,9 5,4


2

37 Proveedor Guayacán 0 498,4 50,2 5,8


1

38 Proveedor Guayacán 1 502 50,5 5,5


2

39 Proveedor Guayacán 1 498,9 50,2 4,2


3

40 Proveedor Amarillo 1 502,3 56,0 6,6


3
41 Proveedor Guayacán 1 495,7 47,8 6,2
1

42 Proveedor Sajo 2 497,5 49,9 3,2


1

43 Proveedor Cedro 2 495,4 48,9 6,7


3

44 Proveedor Pino 2 498,9 49,9 3,6


1

45 Proveedor Sajo 3 499,9 47,3 4,3


2

46 Proveedor Sajo 4 500,1 55,2 2,1


1

47 Proveedor Pino 3 499 57,7 5,4


1

48 Proveedor Sajo 1 506,6 49,2 3,3


1

49 Proveedor Amarillo 2 494,8 51,5 5,9


1

50 Proveedor Cedro 3 497,8 49,9 6,2


3

51 Proveedor Sajo 4 492,3 49,3 4,4


1

52 Proveedor Guayacán 4 504,3 54,6 4,9


3
53 Proveedor Sajo 5 496,2 51,0 3,6
1

54 Proveedor Sajo 6 498 52,9 4,9


3

55 Proveedor Cedro 6 502,3 53,9 6,7


2

56 Proveedor Guayacán 4 501,4 50,8 4,9


3

57 Proveedor Guayacán 0 502,6 50,8 3,5


1

58 Proveedor Guayacán 1 501,8 49,3 3,4


2

59 Proveedor Guayacán 1 495,9 53,0 5,7


3

60 Proveedor Amarillo 1 496,7 50,5 4,0


3

61 Proveedor Guayacán 1 502,1 51,8 4,6


1

62 Proveedor Sajo 2 501 50,4 5,0


1

63 Proveedor Cedro 2 497,2 48,9 6,8


3

64 Proveedor Pino 2 499,3 53,4 5,9


1
65 Proveedor Sajo 3 500,4 49,2 4,4
2

66 Proveedor Guayacán 0 501,7 54,0 5,0


1

67 Proveedor Guayacán 1 500,4 52,4 6,5


2

68 Proveedor Guayacán 1 497,3 48,9 8,6


3

69 Proveedor Amarillo 1 505,7 49,6 5,1


3

70 Proveedor Guayacán 1 501,5 50,3 3,7


1

71 Proveedor Sajo 2 500,2 49,5 2,8


1

72 Proveedor Cedro 2 502,5 52,3 7,0


3

73 Proveedor Pino 2 502,6 52,7 4,0


1

74 Proveedor Sajo 3 498,1 50,6 2,9


2

75 Proveedor Sajo 4 497,2 55,1 4,4


1

76 Proveedor Pino 3 503,3 47,4 3,5


1
77 Proveedor Sajo 1 496,4 49,0 2,2
1

78 Proveedor Amarillo 2 495,3 49,2 5,8


1

79 Proveedor Cedro 3 502,1 51,5 8,3


3

80 Proveedor Sajo 4 501,9 51,7 4,5


1

81 Proveedor Sajo 1 506,6 52,2 4,3


1

82 Proveedor Amarillo 2 494,8 50,7 5,9


1

83 Proveedor Cedro 3 497,8 50,2 5,2


3

84 Proveedor Sajo 4 492,3 52,3 5,4


1

85 Proveedor Guayacán 4 504,3 51,6 4,9


3

86 Proveedor Sajo 5 496,2 51,3 2,6


1

87 Proveedor Sajo 6 498 50,5 3,9


3

88 Proveedor Cedro 6 502,3 48,9 6,7


2
89 Proveedor Guayacán 4 501,4 49,8 4,9
3

90 Proveedor Guayacán 0 502,6 48,0 3,5


1

91 Proveedor Guayacán 1 501,8 49,1 3,4


2

92 Proveedor Guayacán 1 495,9 49,0 5,7


3

93 Proveedor Amarillo 1 496,7 50,6 4,0


3

94 Proveedor Guayacán 1 502,1 49,6 4,6


1

95 Proveedor Sajo 2 501 48,9 3,0


1

96 Proveedor Cedro 2 497,2 50,6 6,8


3

97 Proveedor Pino 2 499,3 49,2 3,9


1

98 Proveedor Sajo 3 500,4 50,6 6,8


2

99 Proveedor Guayacán 0 501,7 49,2 6,0


1

100 Proveedor Guayacán 1 500,4 54,1 9,5


2
1. ¿Cuál es la población bajo estudio?

· Los 3 proveedores de materia prima.

2. ¿Cuál es el elemento de interés?

· La calidad de la materia prima.

3. ¿La anterior información corresponde a una población o a una muestra?

· A una muestra.

4. ¿Cuántas variables hay en este conjunto de datos?

· 7 variables.

5. ¿Cuáles variables son cualitativas y cuales son cuantitativas?


● Son 2 cualitativas; proveedor, especie y las cuantitativas son 4; No. de nudos,
longitud, grueso, peso.
6. Resuma la anterior información mediante tablas, gráficos adecuados y algunas medidas
estadísticas

Datos Cualitativos:
Tabla de frecuencia:
Datos Cuantitativos:

7. Construya el diagrama de caja para la longitud de las tablas. ¿existen valores atípicos?

● Si, la longitud de la madera del proveedor 1 y 3 presentan valores valores


8. ¿Hay simetría en los datos? ¿Es coherente el diagrama de caja con el coeficiente de
asimetría, justifique su respuesta?
9. Construya la función empírica de distribución acumulada la longitud de las tablas. Construya
la ojiva
10. ¿A partir de qué valor el 95% de las tablas tienen una longitud menor que él?
● A Partir de 506 cm.
11. Determine el percentil 80 e interprételo
12. ¿Qué porcentaje de las tablas tienen una longitud menor 501,5 cm?
● El 60%.
13. ¿Qué porcentaje de las tablas tienen una longitud mayor a 504,3 cm?
● El 15%.
14. ¿Cuál es el valor de la mediana de la longitud de las tablas?

15. ¿Se consideran inservibles las tablas con una longitud inferior a 495 cm. ¿Qué porcentaje de
las tablas se deben rechazar por esta razón?
● El 8%
16. ¿Entre que valores de longitud esta por lo menos el 75% de las tablas?
● Entre 497,2 y 506,9 cm.
17. ¿Se podría afirmar que la mayoría de las tablas observadas son del proveedor 3?
● No, la mayoría de tablas observadas son del proveedor 1 con un total de 49 tablas.
18. ¿Hay un mayor porcentaje de tablas, en la muestra, de cedro?
● No, el mayor porcentaje de tablas en las muestras lo encontramos en la especie del
guayacán y el sajo.
19. Construya una tabla cruzada entre Especie y proveedor. ¿Cómo interpreta esta información?

● Podemos interpretar que el proveedor 1 nos proporciona el mayor número de tablas.


20. ¿Se consideran fuera de especificaciones las tablas que presentan 4 o más nudos? ¿Qué
porcentaje de las tablas se deben rechazar?
● El 16% de las tablas se deben rechazar.

21. ¿Cuál es el peso promedio de las tablas?


● El promedio es 4,9 kg
22. ¿Cuál es el peso promedio de las tablas por especie? Construya además los diagramas de
caja e interprételos

23. ¿Cuál es el promedio del grueso de las tablas por proveedor? Construya además los
diagramas de caja
24. ¿Qué sucede con el grueso promedio de las tablas si se cambia del proveedor 1 al proveedor
2? ¿Y si se cambia de proveedor 1 a proveedor 3?
● Tendría una variación.
25. Construya una nueva variable, donde clasifique las tablas así:

Longitud Clase

Menores o iguales a 495 cm. Clase 1

Mayores a 495 cm., pero Clase 2


menores o iguales a 505 cm.
Mayores de 505 cm. Clase 3

26. Construya una tabla cruzada de esta nueva variable con la especie. Interprete esta
información

Clase

Especie 1 2 3 Total general

Cedro 0 14 1 15

Sajo 3 26 3 32

Amarillo 2 7 2 11

Guayacán 2 30 0 32

Pino 1 8 1 10

Total General 8 85 7 100

27. ¿Qué porcentaje de las tablas tienen un peso menor a 4,0 Kg?
● El porcentaje el cual tiene un peso menor de 4,0 Kg es del 34 %
28. ¿Qué porcentaje de las tablas tienen un peso mayor a 6,0 Kg?
● El porcentaje el cual tiene un peso mayor a 6,0 Kg es del 25 %
29. ¿Qué porcentaje de las tablas tienen un grueso superior a los 47,5 mm. pero menor o igual a
52,3 mm.?
● El porcentaje de tablas que tienen un grueso superior a 47,5 mm y menor o igual a
los 52,3 mm es del 68 %
30. ¿Es más homogéneo el peso que la longitud?
● La longitud es mucho más homogénea.
31. Construya los diagramas de caja para las variables longitud, peso y grueso en interprételas
RIC=4,875
RIC=2,5
RIC= 3,1

32. Para el peso se quieren seleccionar las tablas cuyo peso esté entre el 10% y el 90% de los
valores de la muestra, ¿entre cuales valores lo debe hacer?
● Los valores los cuales se deben seleccionar son los que están entre estos
dos percentiles que nos dan, que son el percentil 10 con un valor de 2,91 kg
y el 90 de 6,8 kg.

También podría gustarte