Está en la página 1de 27

FACULTAD DE CIENCIAS EXACTAS E INGENIERÍA

ESCUELA DE MATEMÁTICAS

ESTADÍSTICA MATEMÁTICA

PRIMER TALLER - ESTADÍSTICA DESCRIPTIVA

ANGIE PAOLA OSORIO RIVERA

27 de abril de 2019

Docente:
Martha Lucia Corrales Bosio
1

PRIMER TALLER - ESTADÍSTICA DESCRIPTIVA

1. La directora de operaciones de una fábrica de cremas bronceadoras, quiere asegurarse de que el proceso que
se emplea para llenar los botes de 8 onzas (237 ml) está funcionando correctamente. Se selecciona una muestra
aleatoria de 100 botes de esta crema, se miden los contenidos y se almacenan los volúmenes (en ml). Describa el
estado del proceso a través de un análisis de las estadísticas descriptivas de los datos. Resuma los datos en una
tabla de distribución de frecuencias y realice los gráficos que estime convenientes.

237.00 236.00 244.00 238.00 236.00 232.00


241.00 231.00 240.00 236.00 241.00 238.00
234.00 236.00 233.00 245.00 229.00 241.00
234.00 240.00 231.00 231.00 247.00 249.00
241.00 231.00 238.00 242.00 241.00 242.00
235.00 224.00 238.00 238.00 229.00 234.00
242.00 236.00 240.00 233.00 242.00 232.00
229.00 249.00 232.00 243.00 243.00 238.00
242.00 236.00 240.00 234.00 237.00 238.00
233.00 246.00 240.00 244.00 234.00 241.00
242.00 238.00 234.00 237.00 235.00 236.00
231.00 234.00 237.00 231.00 234.00 238.00
231.00 236.00 234.00 240.00 235.00 243.00
236.00 245.00 233.00 231.00 232.00 238.00
242.00 237.00 231.00 239.00 231.00 237.00
239.00 242.00 235.00 231.00

Solución: Al consolidar toda la información en R se obtienen las siguientes medidas de tendencia central a
partir de los datos no agrupados suministrados

Mínimo = 224,0
Primer Percentil(25 %) = 233,8
Mediana o Segundo Percentil = 237,0
Media (Aritmetica) = 236, 9
Tercer Percentil(75 %) = 241,0
Máximo = 249,0

Ahora, se va a proceder a generar una tabla de distribución de frecuencias donde se dará el histograma de frecuen-
cias y el diagrama de torta.
2

Volúmenes (ml) Frecuencias Absoluta Simple (FAS) Porcentaje de FAS Porcentaje Acumulado
224 1.00 1% 1%
228 1.00 1% 2%
229 3.00 3% 5%
231 11.00 11 % 16 %
232 5.00 5% 21 %
233 4.00 4% 25 %
234 9.00 9% 34 %
235 4.00 4% 38 %
236 9.00 9% 47 %
237 8.00 8% 55 %
238 10.00 10 % 65 %
239 3.00 3% 68 %
240 6.00 6% 74 %
241 6.00 6% 80 %
242 8.00 8% 88 %
243 3.00 3% 91 %
244 3.00 3% 94 %
245 2.00 2% 96 %
246 1.00 1% 97 %
247 1.00 1% 98 %
249 2.00 2% 100 %
Total 100.00 100 % 100 %

Histograma
12

11

Diagrama de Torta
10
10

234 233
9 9
232
235
8 8
231
8

236

229
Frequency

6 6
228
6

224
5 237 249
247
246
4 4 245
4

244
3 3 3 3
238 243
2 2
239 242
2

1 1 1 1
240 241
0

224 229 232 234 236 238 240 242 244 246 249 F IGURA 2. Diagrama de Torta

F IGURA 1. Histograma

Así, se observa que existe una moda en 231 ml ya que es el dato que tiene mayor número de repeticiones con
11 registros en la muestra de 100 valores.
3

Ahora, se van a presentar las medidas de dispersión arrojando los siguientes valores

Varianza (muestra) = 23,80798


Desviación estandar = 4,879342
Desviación absoluta media = 5,9304
Rango Intercuartilico = 7,25

Además, se observa el siguiente diagrama de caja

Grafico de caja
250
245
240
235
230
225

F IGURA 3. Diagrama de cajas

Por lo anterior, se puede evidenciar que no hay presencia de datos atípicos. Por último, se tiene que las medidas
de simétria arrojan el siguiente resultado

Asimétria = 0,132026
Curtosis = −0,3347278

Como conclusión se observa que la media se acerca mucho al valor deseado de 237 ml. Además, la mediana resulta
ser el valor deseado encontrando el rango de los valores en 234 a 241. No obstante, al sacar la tabla de frecuencias
se evidencia que el valor 231 es la moda de los datos y le sigue en número de apariciones el valor de 238 obteniendo
un resultado que no se esperaría al no ser una moda el 237. Luego, se encuentra en las medidas de dispersión que
las varianzas oscilan entre 4,8 − 6,0 siendo una dispersión muy cómoda con respecto a la muestra. Por último, la
asímétria positiva muestra que los valores están mayormente situados por debajo de la media pero no muy lejos y
tienen una forma platicúrtica. En ese orden de ideas, la medición obtuvo valores adecuados en los volúmenes de la
muestra recomendando aumentar mínimamente la cantidad del producto para llegar a obtener un resultado mucho
4

mejor.

1 # A N G I E PAOLA O S O R I O R I V E R A
2 # a n g i e . o s o r i o @ c o r r e o . usa . edu . co
3
4 # Importar datos desde Excel
5
6 library ( readxl )
7 Datos <− read_excel ("Datos1 − taller1 .xlsx")
8 Datos1 <− data. matrix (Datos)
9
10 # Medidas de tendencia central
11
12 X <− mean( Datos1 )
13 M <− median ( Datos1 )
14 Res <− summary ( Datos1 )
15
16 # Tabla de fracuencia
17
18 library ( epiDisplay )
19 T <− tab1(Datos1 , decimal = 1, sort.group = TRUE ,
20 cum. percent = !any(is.na( Datos1 )), graph = TRUE ,
21 missing = TRUE , bar. values = " frequency ",
22 horiz = FALSE , cex = 1, cex.names = 1, main = " Histograma ",
23 xlab = "auto", ylab = "auto", col = "auto", gen.ind.vars = FALSE)
24 Tab <− data.frame(T)
25 Tab [,1] <− NULL
26
27 # Importar a LaTeX
28
29 library ( xtable )
30 print ( xtable (Tab , type = "latex"),file = " Tabla_frecuencia .tex")
31
32 # Diagrama de torta
33
34 pie.sales <− c(Tab [ ,2])
35 pie.sales <− pie.sales[− length (pie.sales )]
36 A <− c(row.names(Tab ))
37 A <− A[− length (A)]
38 names(pie.sales) <− A
39 pie(pie.sales , labels = names(pie.sales),
40 radius = 1,main = " Diagrama de Torta")
41
42 # Medidas de dispersion
43
44 s2 = var( Datos1 )
45 s = sd( Datos1 )
46 abs_s = mad( Datos1 )
5

47 RIC = IQR( Datos1 )


48
49 # Boxplot
50
51 boxplot (Datos1 ,main = " Grafico de caja")
52
53 # Medidas de simetria
54
55 library ( timeDate )
56 library ( fBasics )
57 # asimetria
58 skewness ( Datos1 )
59 # curtosis
60 kurtosis ( Datos1 )
.

X


2. La siguiente tabla muestra el resumen de una muestra de 50 amas de casa acerca de las veces que van al
supermercado en una semana:

Calcular:

a. Promedio de las veces que las amas de casa van al supermercado semanalmente
b. Mediana de las veces que las amas de casa van al supermercado semanalmente
c. Moda de las veces que las amas de casa van al supermercado semanalmente
d. Varianza y desviación estándar de las veces que las amas de casa van al supermercado semanalmente

Solución: Con el uso del siguiente código en R se puede expresar cada uno de los valores solicitados

1 # A N G I E PAOLA O S O R I O R I V E R A
2 # a n g i e . o s o r i o @ c o r r e o . usa . edu . co
3
4 V1 <− c(1 ,2 ,3 ,4 ,5 ,6)
5 V2 <− c(12 ,15 ,8 ,6 ,5 ,4)
6
7 Dat <− data. frame(V1 ,V2)
6

8
9 # Medidas de tendencia central
10
11 # Media aritmetica
12
13 n <− sum( Dat$V2 )
14 x <− sum( Dat$V1 * Dat$V2 ) / n
15
16 # Determinar paridad de la cantidad de elementos
17
18 # n es par
19 if (n % % 2 == 0) {
20 k1 <− (n)/(2)
21 k2 <− (n/2)+1
22 k = (k1 + k2 )/2
23 par <− TRUE
24 } else { # n e s i m p a r
25 k <− (n +1)/(2)
26 par <− FALSE
27 }
28
29 # Variables temporales
30
31 Temp <− 0 # A c u m u l a r s u m a
32 Res <− 0 # G u a r d a r i n d i c e s
33
34 # Buscar el valor de la media
35 # caso par
36 if(par == TRUE ){
37 for (i in 1: length ( Dat$V2 )){
38 Temp <− Temp + Dat$V2 [i]
39 if(k < Temp ){
40 Res <− i
41 # Determinar la mediana
42 if ( k2 <= sum( Dat$V2 [1:i − 1]) ){
43 m <− Dat$V1 [i −1]
44 } else if (k1 <= sum( Dat$V2 [1:i − 1]) & k2 <= sum( Dat$V2 [1:i])){
45 m <− ( Dat$V1 [i −1] + Dat$V1 [i])/2
46 } else {
47 m <− Dat$V1 [i]
48 }
49 break ()
50 }
51 }
52 } else { # c a s o i m p a r
53 for (i in 1: length ( Dat$V2 )){
54 Temp <− Temp + Dat$V2 [i]
55 if(k < Temp ){
56 Res <− i
7

57 # Determinar la mediana
58 if ( k <= sum( Dat$V2 [1:i − 1]) ){
59 m <− Dat$V1 [i −1]
60 } else {
61 m <− Dat$V1 [i]
62 }
63 break ()
64 }
65 }
66 }
67
68 # Modas
69
70 moda <− c()
71 temp1 <− 0
72 for (j in 1: length ( Dat$V2 )){
73 if ( Dat$V2 [j]>temp1 ){
74 moda <− c()
75 moda [1] <− j
76 temp1 <− Dat$V2 [j]
77 } else if ( Dat$V2 [j]== temp1 ) {
78 w <− c(j)
79 moda <− c(moda ,w)
80 }
81 }
82
83
84
85 # Varianza
86
87 aux <− 0
88 for (inx in 1: length ( Dat$V1 )){
89 aux <− aux + ( Dat$V1 [inx] − x)^2 * Dat$V2 [inx]
90 }
91
92 S2 <− aux/n
93 S1 <− sqrt(S2)

Así, se obtienen los siguientes valores

Media (Aritmetica) = 2,78


Mediana = 2
Moda = 2
Varianza = 2,4516
Desviación estandar = 1,565759

.
8

X


3. La directora de Marketing de una importante compañía de telefonía móvil, obtuvo los registros de los minutos
consumidos por una muestra aleatoria de 110 abonados al plan más barato de la empresa (250 minutos mensuales,
plan abierto). Los resultados obtenidos fueron los siguientes:

271.00 236.00 294.00 252.00 254.00 263.00 266.00 222.00 262.00 278.00 288.00
262.00 237.00 247.00 282.00 224.00 263.00 267.00 254.00 271.00 278.00 263.00
262.00 288.00 247.00 252.00 264.00 263.00 247.00 225.00 281.00 279.00 238.00
252.00 242.00 248.00 263.00 255.00 294.00 268.00 255.00 272.00 271.00 291.00
263.00 242.00 288.00 252.00 226.00 263.00 269.00 227.00 273.00 281.00 267.00
263.00 244.00 249.00 252.00 256.00 263.00 252.00 261.00 245.00 252.00 294.00
288.00 245.00 251.00 269.00 256.00 264.00 252.00 232.00 275.00 284.00 252.00
263.00 274.00 252.00 252.00 256.00 254.00 269.00 234.00 285.00 275.00 263.00
263.00 246.00 294.00 252.00 231.00 265.00 269.00 235.00 275.00 288.00 294.00
263.00 247.00 252.00 269.00 261.00 266.00 269.00 236.00 276.00 248.00 298.00

Solución: Al consolidar toda la información en R se obtienen las siguientes medidas de tendencia central a
partir de los datos no agrupados suministrados

Mínimo = 222,0
Primer Percentil(25 %) = 251,2
Mediana o Segundo Percentil = 262,0
Media (Aritmetica) = 258,8
Tercer Percentil(75 %) = 266,0
Máximo = 298,0

Ahora se va proceder a generar una tabla de distribución de frecuencias donde se dará el histograma de frecuencias
y el diagrama de torta.
9

Minutos Frecuencias Absoluta Simple (FAS) Porcentaje de FAS Porcentaje Acumulado


222 10.00 9.1 % 9.1 %
224 1.00 0.9 % 10 %
226 1.00 0.9 % 10.9 %
231 1.00 0.9 % 11.8 %
236 1.00 0.9 % 12.7 %
237 1.00 0.9 % 13.6 %
238 1.00 0.9 % 14.5 %
242 2.00 1.8 % 16.4 %
244 1.00 0.9 % 17.3 %
245 1.00 0.9 % 18.2 %
246 1.00 0.9 % 19.1 %
247 3.00 2.7 % 21.8 %
248 2.00 1.8 % 23.6 %
249 1.00 0.9 % 24.5 %
251 1.00 0.9 % 25.5 %
252 11.00 10 % 35.5 %
254 1.00 0.9 % 36.4 %
255 1.00 0.9 % 37.3 %
256 3.00 2.7 % 40 %
261 1.00 0.9 % 40.9 %
262 12.00 10.9 % 51.8 %
263 18.00 16.4 % 68.2 %
264 1.00 0.9 % 69.1 %
266 10.00 9.1 % 78.2 %
267 1.00 0.9 % 79.1 %
269 2.00 1.8 % 80.9 %
271 2.00 1.8 % 82.7 %
274 1.00 0.9 % 83.6 %
275 1.00 0.9 % 84.5 %
278 2.00 1.8 % 86.4 %
279 1.00 0.9 % 87.3 %
281 1.00 0.9 % 88.2 %
282 1.00 0.9 % 89.1 %
284 1.00 0.9 % 90 %
288 5.00 4.5 % 94.5 %
291 1.00 0.9 % 95.5 %
294 4.00 3.6 % 99.1 %
298 1.00 0.9 % 100 %
Total 110.00 100 % 100 %
10

Histograma

18

15 12
11
Frequency

10 10
10

5
4
5

3 3
2 2 22 2
111111 111 11 11 1 1 1 11 1111 1 1
0

222 236 244 248 254 262 267 275 282 294

F IGURA 4. Histograma

Diagrama de Torta
251
249
248247
252 246
245
244
242
254
255 238
237
256 236
231
261 226
224

222
262

298
294
291
288
263 284
282
281
279
278
275
274
264 269271
266 267

F IGURA 5. Diagrama de Torta


11

Así, se observa que existe una moda en 263 minutos ya que es el dato que tiene mayor número de repeticiones
con 18 registros en la muestra de 110 valores.

Ahora, se van a presentar las medidas de dispersión arrojando los siguientes valores

Varianza (muestra) = 341,3429


Desviación estandar = 18,47547
Desviación absoluta media = 14,826
Rango Intercuartilico = 14,75

Además, se observa el siguiente diagrama de caja

Grafico de caja
300
280
260
240
220

F IGURA 6. Diagrama de cajas

Por lo anterior, se puede evidenciar que hay presencia de datos atípicos siendo aquellos personas que consumie-
ron entre 220 − 238 y 281 − 298 minutos. Además, se observa que los datos caen en su mayoría entre el primer
percentil y la mediana. Por último, se tiene que las medidas de simétria arrojan el siguiente resultado

Asimétria = −0,258531
Curtosis = −0,08052568

Como conclusión se observa que la media supera el valor del plan de 250 en 9 minutos. Además, la mediana resulta
ser Mayor que la media obteniendo que la mayoría de los datos estén entre el primer percentil y la mediana. No
obstante, al sacar la tabla de frecuencias se evidencia que el valor 263 es la moda de los datos y le sigue en número
de apariciones el valor de 262 obteniendo un resultado que no se esperaría al no ser una moda el 250. Luego, se
12

encuentra en las medidas de dispersión que las varianzas oscilan entre 14 − 18,5 siendo una dispersión muy alta
con respecto a la muestra. Por último, la asímétria negativa muestra que los valores están mayormente situados
por encima de la media pero no muy lejos y tienen una forma platicúrtica. En ese orden de ideas, se sugiere a la
directora de Marketing ofrecer un plan de adición de minutos sugiriendo un plan entre un intervalo de 260 − 270
para recoger a los usuarios que representan la mayoría. Ahora, también se puede considerar una mejora del plan a
280 minutos para asegurar que los usuarios no sobrepasen el limite.

1 # A n g i e P a o l a O s o r i o R i v e r a De C l a v i j o
2 # a n g i e . o s o r i o @ c o r r e o . usa . edu . co
3
4 # Importar datos desde Excel
5
6 library ( readxl )
7 Datos <− read_excel (" punto3 .xlsx")
8 Datos1 <− data. matrix (Datos)
9
10 # Medidas de tendencia central
11
12 x <− mean( Datos1 )
13 m <− median ( Datos1 )
14 res <− summary ( Datos1 )
15
16 # Tabla de frecuencia
17
18 library ( epiDisplay )
19 T <− tab1(Datos1 , decimal = 1, sort.group = TRUE ,
20 cum. percent = !any(is.na( Datos1 )), graph = TRUE ,
21 missing = TRUE , bar. values = " frequency ",
22 horiz = FALSE , cex = 1, cex.names = 1, main = " Histograma ",
23 xlab = "auto", ylab = "auto", col = "auto",
24 gen.ind.vars = FALSE)
25 Tab <− data.frame(T)
26 Tab [,1] <− NULL
27
28 # Exportar a LaTeX
29
30 # T a b $ o u t p u t . t a b l e . P e r c e n t <− p a s t e ( T a b $ o u t p u t . t a b l e . P e r c e n t , " % " )
31 # T a b $ o u t p u t . t a b l e . Cum . . p e r c e n t <− p a s t e ( T a b $ o u t p u t . t a b l e . Cum . . p e r c e n t , " %
32 # library ( xtable )
33 # p r i n t ( x t a b l e ( Tab , t y p e = " l a t e x " ) , f i l e = " t a l l e r 1.3 − t f . t e x " )
34
35 # Diagrama de torta
36
37 pie.sales <− c(Tab [ ,2])
38 pie.sales <− pie.sales[− length (pie.sales )]
39 A <− c(row.names(Tab ))
40 A <− A[− length (A)]
41 names(pie.sales) <− A
42 pie(pie.sales , labels = names(pie.sales), radius = 1,
13

43 main = " Diagrama de Torta")


44
45 # Medidas de dispersion
46
47 s2 = var( Datos1 )
48 s = sd( Datos1 )
49 abs_s = mad( Datos1 )
50 RIC = IQR( Datos1 )
51
52 # Boxplot
53
54 boxplot (Datos1 ,main = " Grafico de caja")
55
56 # Medidas de simetria
57 library ( timeDate )
58 library ( timeSeries )
59 library ( fBasics )
60 # asimetria
61 skewness ( Datos1 )
62 # curtosis
63 kurtosis ( Datos1 )
.

X


4. La demanda de agua embotellada aumenta durante la temporada de huracanes en la Florida. El director de


operaciones de una planta que embotella agua quiere estar seguro de que el proceso de embotellado de botellas de
un galón esté funcionando correctamente. Actualmente, la compañía está comprobando el volumen de las botellas
de 1 galón (3, 7854118 litros). Se toma una muestra aleatoria de 75 botellas. Estudie el proceso y presente un
informe del estado del proceso de embotellamiento a través del uso de estadísticas descriptivas y gráficas que
considere necesarias.

3.81 3.72 3.63 3.75 3.71 3.84


3.93 3.77 3.88 3.74 3.93 4.06
3.78 3.91 3.81 3.82 3.95 3.96
3.98 3.96 3.94 3.90 3.71 3.94
3.82 3.77 3.64 3.79 3.77 3.72
3.77 3.76 3.89 3.75 3.82 3.71
3.94 3.75 3.77 3.73 3.74 3.65
3.76 3.82 3.89 3.99 3.79 3.74
4.11 3.81 3.87 3.94 3.86 3.80
3.78 3.67 3.85 3.84 3.86 3.69
3.67 3.74 3.79 3.67 3.57
3.79 3.77 3.81 3.85 3.69
3.87 3.74 3.82 3.81 3.71
14

Solución: Al consolidar toda la información en R se obtienen las siguientes medidas de tendencia central a
partir de los datos no agrupados suministrados

Mínimo = 3,570
Primer Percentil(25 %) = 3,740
Mediana o Segundo Percentil = 3,790
Media (Aritmetica) = 3,808
Tercer Percentil(75 %) = 3,870
Máximo = 4,110

Ahora, se va a proceder a generar una tabla de distribución de frecuencias donde se dará el histograma de frecuen-
cias y el diagrama de torta.
15

Volúmenes (ml) Frecuencias Absoluta Simple (FAS) Porcentaje de FAS Porcentaje Acumulado
3.57 1.00 1.3 % 1.3 %
3.63 1.00 1.3 % 2.7 %
3.64 1.00 1.3 % 4%
3.65 1.00 1.3 % 5.3 %
3.67 3.00 4% 9.3 %
3.69 2.00 2.7 % 12 %
3.71 4.00 5.3 % 17.3 %
3.72 2.00 2.7 % 20 %
3.73 1.00 1.3 % 21.3 %
3.74 5.00 6.7 % 28 %
3.75 3.00 4% 32 %
3.76 2.00 2.7 % 34.7 %
3.77 6.00 8% 42.7 %
3.78 2.00 2.7 % 45.3 %
3.79 4.00 5.3 % 50.7 %
3.8 1.00 1.3 % 52 %
3.81 5.00 6.7 % 58.7 %
3.82 5.00 6.7 % 65.3 %
3.84 2.00 2.7 % 68 %
3.85 2.00 2.7 % 70.7 %
3.86 2.00 2.7 % 73.3 %
3.87 2.00 2.7 % 76 %
3.88 1.00 1.3 % 77.3 %
3.89 2.00 2.7 % 80 %
3.9 1.00 1.3 % 81.3 %
3.91 1.00 1.3 % 82.7 %
3.93 2.00 2.7 % 85.3 %
3.94 4.00 5.3 % 90.7 %
3.95 1.00 1.3 % 92 %
3.96 2.00 2.7 % 94.7 %
3.98 1.00 1.3 % 96 %
3.99 1.00 1.3 % 97.3 %
4.06 1.00 1.3 % 98.7 %
4.11 1.00 1.3 % 100 %
Total 75.00 100 % 100 %
16

Histograma

6
5 55

5
4 4 4 4
Frequency

3 3
3

2 2 2 2 2222 2 2 2
2

1111 1 1 1 11 1 1111
1
0

3.57 3.67 3.73 3.77 3.8 3.84 3.88 3.93 3.98

F IGURA 7. Diagrama de cajas

Diagrama de Torta

3.75 3.74 3.73


3.72
3.76
3.71
3.77 3.69
3.67
3.78
3.65
3.64
3.79 3.63
3.57
3.8 4.11
4.06
3.99
3.81 3.98
3.96
3.95
3.82 3.94
3.84 3.93
3.853.86 3.91
3.9
3.87 3.89
3.88

F IGURA 8. Diagrama de cajas


17

Así, se observa que existe una moda en 3,77 litros ya que es el dato que tiene mayor número de repeticiones
con 6 registros en la muestra de 75 valores.

Ahora, se van a presentar las medidas de dispersión arrojando los siguientes valores

Varianza (muestra) = 0,01048728


Desviación estandar = 0,1024074
Desviación absoluta media = 0,088956
Rango Intercuartilico = 0,13

Además, se observa el siguiente diagrama de caja

Grafico de caja
4.1
4.0
3.9
3.8
3.7
3.6

F IGURA 9. Diagrama de cajas

Por lo anterior, se puede evidenciar que hay presencia de un dato atípico en 4,11 litros. Por último, se tiene que
las medidas de simétria arrojan el siguiente resultado

Asimétria = 0,4299727
Curtosis = 0,106257

Como conclusión se observa que la media se acerca mucho al valor deseado de 3, 7854118 litros. Además, la
mediana resulta ser muy cercana a el valor deseado encontrando el rango de los valores en 3,57 a 4,11. Luego,
al sacar la tabla de frecuencias se evidencia que el valor 3,77 es la moda de los datos y le siguen en número de
apariciones los valores de 3,74, 3,81, y 3,82 obteniendo un resultado esperarado al ser valores muy cercanos. Así,
se encuentra en las medidas de dispersión que las varianzas oscilan entre 0,8 − 0,11 siendo una dispersión muy
18

cómoda con respecto a la muestra. Por último, la asímétria positiva muestra que los valores están mayormente
situados por debajo de la media pero no muy lejos y tienen una forma platicúrtica. En ese orden de ideas, se
recomienda aumentar en una proporción muy mínima el contenido para ajustar más el producto al valor deseado.

1 rm(list = ls ())
2 cat("\014")
3
4 # A n g i e P a o l a O s o r i o R i v e r a De C l a v i j o
5 # a n g i e . o s o r i o @ c o r r e o . usa . edu . co
6
7 # Importar datos desde Excel
8
9 library ( readxl )
10 Datos <− read_excel (" punto4 .xlsx")
11 Datos1 <− data. matrix (Datos)
12
13 # Medidas de tendencia central
14
15 X <− mean( Datos1 )
16 M <− median ( Datos1 )
17 Res <− summary ( Datos1 )
18
19 # Tabla de fracuencia
20
21 library ( epiDisplay )
22 T <− tab1(Datos1 , decimal = 1, sort.group = TRUE ,
23 cum. percent = !any(is.na( Datos1 )), graph = TRUE ,
24 missing = TRUE , bar. values = " frequency ",
25 horiz = FALSE , cex = 1, cex.names = 1, main = " Histograma ", x
26 ylab = "auto", col = "auto", gen.ind.vars = FALSE)
27 Tab <− data.frame(T)
28 Tab [,1] <− NULL
29
30 # Exportar a LaTeX
31
32 # T a b $ o u t p u t . t a b l e . P e r c e n t <− p a s t e ( T a b $ o u t p u t . t a b l e . P e r c e n t , " % " )
33 # T a b $ o u t p u t . t a b l e . Cum . . p e r c e n t <− p a s t e ( T a b $ o u t p u t . t a b l e . Cum . . p e r c e n t , " %
34 # library ( xtable )
35 # p r i n t ( x t a b l e ( Tab , t y p e = " l a t e x " ) , f i l e = " T a b l a _ f r e c u e n c i a . t e x " )
36
37 # Diagrama de torta
38
39 pie.sales <− c(Tab [ ,2])
40 pie.sales <− pie.sales[− length (pie.sales )]
41 A <− c(row.names(Tab ))
42 A <− A[− length (A)]
43 names(pie.sales) <− A
44 pie(pie.sales , labels = names(pie.sales), radius = 1,main = " Diagrama de
45
19

46 # Medidas de dispersion
47
48 s2 = var( Datos1 )
49 s = sd( Datos1 )
50 abs_s = mad( Datos1 )
51 RIC = IQR( Datos1 )
52
53 # Boxplot
54
55 boxplot (Datos1 ,main = " Grafico de caja")
56
57 # Medidas de simetria
58 library ( timeSeries )
59 library ( timeDate )
60 library ( fBasics )
61 # asimetria
62 skewness ( Datos1 )
63 # curtosis
64 kurtosis ( Datos1 )
.

X


3. Dos operarios elaboran la siguiente cantidad de productos en una fábrica durante ocho días:

Cuál de los dos operarios parece ser (Justifique en forma estadística sus respuestas)

a. Más eficiente
b. Más consistente (uniforme en su producción)

Solución: Al consolidar toda la información en R se obtienen las siguientes medidas de tendencia central a
partir de los datos no agrupados suministrados
20

OPERARIO I:

Mínimo1 = 10,00
Primer Percentil1 (25 %) = 11,50
Mediana o Segundo Percentil1 = 13,00
Media (Aritmetica)1 = 12,88
Tercer Percentil1 (75 %) = 14,25
Máximo1 = 16,00

OPERARIO II:

Mínimo2 = 11,00
Primer Percentil2 (25 %) = 13,50
Mediana o Segundo Percentil2 = 15,00
Media (Aritmetica)2 = 14,50
Tercer Percentil2 (75 %) = 15,25
Máximo2 = 18,00

Ahora, se va a proceder a generar las tablas de distribución de frecuencias donde se darán los histograma de
frecuencias y los diagramas de tortas.

OPERARIO I:

Productos Frecuencias Absoluta Simple (FAS) Porcentaje de FAS Porcentaje Acumulado


10 2.00 25 % 25 %
12 1.00 12.5 % 37.5 %
13 2.00 25 % 62.5 %
14 1.00 12.5 % 75 %
15 1.00 12.5 % 87.5 %
16 1.00 12.5 % 100 %
Total 8.00 100 % 100 %

OPERARIO I:

Productos Frecuencias Absoluta Simple (FAS) Porcentaje de FAS Porcentaje Acumulado


11 1.00 12.5 % 12.5 %
12 1.00 12.5 % 25 %
14 1.00 12.5 % 37.5 %
15 3.00 37.5 % 75 %
16 1.00 12.5 % 87.5 %
18 1.00 12.5 % 100 %
Total 8.00 100 % 100 %
21

OPERARIO I:

Histograma Diagrama de Torta

2 2 12
2.0

10
1.5
Frequency

1 1 1 1 13
1.0

16
0.5

14 15
0.0

10 12 13 14 15 16

F IGURA 10. Histograma F IGURA 11. Diagrama de Torta

OPERARIO II:

Histograma Diagrama de Torta

3 14 12
3.0
2.5

11
2.0
Frequency

1.5

1 1 1 1 1
1.0

15 18
0.5

16
0.0

11 12 14 15 16 18

F IGURA 12. Histograma F IGURA 13. Diagrama de Torta

En los datos del Operario I se tiene que es bimodal siendo 10 y 13 las modas respectivas con dos apariciones.
Por el otro lado, se tiene que los datos del Operario II es unimodal. siendo 15 la moda con tres apariciones. Ahora,
se van a presentar las medidas de dispersión arrojando los siguientes valores

OPERARIO I:

Varianza (muestra) = 4,696429


Desviación estandar = 2,167124
Desviación absoluta media = 2,2239
Rango Intercuartilico = 2,75
22

OPERARIO II:

Varianza (muestra) = 4,857143


Desviación estandar = 2,203893
Desviación absoluta media = 1,4826
Rango Intercuartilico = 1,75

Además, se observan los siguientes diagramas de caja OPERARIO I:

Grafico de caja
16
15
14
13
12
11
10

F IGURA 14. Diagrama de cajas


23

OPERARIO II:

Grafico de caja

18
17
16
15
14
13
12
11

F IGURA 15. Diagrama de cajas

Por último, se tiene que las medidas de simétria arrojan los siguientes resultados

OPERARIO I:

Asimétria = −0,08175006
Curtosis = −1,557179

OPERARIO II:

Asimétria = −0,1401264
Curtosis = −1,174686

Por lo tanto el Operario II es más eficiente al obtener una media mucho mayor junto con un rango más alto.
Mientras que el Operario I resulta mucho más consistente en la producción ya que su varianza fue menor que la
del otro operario. Además, su asimétria está más cerca a tener un comportamiento normal.

1 rm(list = ls ())
2 cat("\014")
3
4 # A n g i e P a o l a O s o r i o R i v e r a De C l a v i j o
5 # a n g i e . o s o r i o @ c o r r e o . usa . edu . co
24

6
7 Ope1 <− c(10 ,12 ,13 ,14 ,15 ,16 ,13 ,10)
8 Ope2 <− c(12 ,15 ,18 ,16 ,15 ,14 ,11 ,15)
9
10 # Medidas de tendencia central Ope1
11
12 X1 <− mean(Ope1)
13 M1 <− median (Ope1)
14 Res1 <− summary (Ope1)
15
16 # Medidas de tendencia central Ope2
17
18 X2 <− mean(Ope2)
19 M2 <− median (Ope2)
20 Res2 <− summary (Ope2)
21
22 # Tabla de fracuencia Ope 1
23
24 library ( epiDisplay )
25 T1 <− tab1(Ope1 , decimal = 1, sort.group = TRUE ,
26 cum. percent = !any(is.na(Ope1 )), graph = TRUE ,
27 missing = TRUE , bar. values = " frequency ",
28 horiz = FALSE , cex = 1, cex.names = 1, main = " Histograma ", x
29 ylab = "auto", col = "auto", gen.ind.vars = FALSE)
30 Tab1 <− data.frame(T1)
31 Tab1 [,1] <− NULL
32
33 # Exportar a LaTeX
34
35 # T a b 1 $ o u t p u t . t a b l e . P e r c e n t <− p a s t e ( T a b 1 $ o u t p u t . t a b l e . P e r c e n t , " % " )
36 # T a b 1 $ o u t p u t . t a b l e . Cum . . p e r c e n t <− p a s t e ( T a b 1 $ o u t p u t . t a b l e . Cum . . p e r c e n t
37 # library ( xtable )
38 # p r i n t ( x t a b l e ( Tab1 , t y p e = " l a t e x " ) , f i l e = " T a b l a _ f r e c u e n c i a _ o p e 1 . t e x "
39
40 # Diagrama de torta Ope1
41
42 pie. sales1 <− c(Tab1 [ ,2])
43 pie. sales1 <− pie. sales1[− length (pie. sales1 )]
44 A <− c(row.names(Tab1 ))
45 A <− A[− length (A)]
46 names(pie. sales1 ) <− A
47 pie(pie.sales1 , labels = names(pie. sales1 ), radius = 1,main = " Diagrama
48
49 # Tabla de fracuencia Ope 2
50
51 library ( epiDisplay )
52 T2 <− tab1(Ope2 , decimal = 1, sort.group = TRUE ,
53 cum. percent = !any(is.na(Ope2 )), graph = TRUE ,
54 missing = TRUE , bar. values = " frequency ",
25

55 horiz = FALSE , cex = 1, cex.names = 1, main = " Histograma ", xlab


56 ylab = "auto", col = "auto", gen.ind.vars = FALSE)
57 Tab2 <− data.frame(T2)
58 Tab2 [ ,1] <− NULL
59
60 # Exportar a LaTeX
61
62 # T a b 2 $ o u t p u t . t a b l e . P e r c e n t <− p a s t e ( T a b 2 $ o u t p u t . t a b l e . P e r c e n t , " % " )
63 # T a b 2 $ o u t p u t . t a b l e . Cum . . p e r c e n t <− p a s t e ( T a b 2 $ o u t p u t . t a b l e . Cum . . p e r c e n t , " % " )
64 # library ( xtable )
65 # p r i n t ( x t a b l e ( Tab2 , t y p e = " l a t e x " ) , f i l e = " T a b l a _ f r e c u e n c i a _ o p e 2 . t e x " )
66
67 # Diagrama de torta Ope2
68
69 pie. sales2 <− c(Tab2 [ ,2])
70 pie. sales2 <− pie. sales2[− length (pie. sales2 )]
71 A <− c(row.names(Tab2 ))
72 A <− A[− length (A)]
73 names (pie. sales2 ) <− A
74 pie(pie.sales2 , labels = names(pie. sales2 ), radius = 1,main = " Diagrama de To
75
76 # Medidas de dispersion Ope1
77
78 s2_1 = var(Ope1)
79 s_1 = sd(Ope1)
80 abs_s_1 = mad(Ope1)
81 RIC_1 = IQR(Ope1)
82
83 # Medidas de dispersion Ope2
84
85 s2_2 = var(Ope2)
86 s_2 = sd(Ope2)
87 abs_s_2 = mad(Ope2)
88 RIC_2 = IQR(Ope2)
89
90 # Boxplot Ope1
91
92 boxplot (Ope1 ,main = " Grafico de caja")
93
94 # Boxplot Ope2
95
96 boxplot (Ope2 ,main = " Grafico de caja")
97
98 # Medidas de simetria Ope1
99
100 library ( timeSeries )
101 library ( timeDate )
102 library ( fBasics )
103 # asimetria
26

104 skewness (Ope1)


105 # curtosis
106 kurtosis (Ope1)
107
108
109 # Medidas de simetria Ope2
110
111 library ( timeSeries )
112 library ( timeDate )
113 library ( fBasics )
114 # asimetria
115 skewness (Ope2)
116 # curtosis
117 kurtosis (Ope2)
.

X


También podría gustarte