Está en la página 1de 14

Nombre: Tatiana Pila Fonseca

Docente: Ing. Ghem Carvajal

DEBER 1: Estadística Descriptiva

En un proceso industrial se requiere el llenado de un envase de 20 gal. Se esta evaluando el tiempo


en que la maquina de llenado “1” completa dicho volumen. Para ello se levanta la siguiente
información.
Tabla 1: Tabla de datos

Tabla de datos
48,64 49,74 50,28 50,96 51,93 52,52 53,4
49,09 49,75 50,32 51,07 52,00 52,53 53,5
49,16 49,76 50,46 51,11 52,09 52,57 53,55
49,29 49,76 50,49 51,28 52,14 52,58 54,06
49,32 49,79 50,56 51,28 52,18 52,72 54,12
49,45 49,83 50,62 51,34 52,22 52,78 54,33
49,45 49,84 50,63 51,52 52,24 52,82 58,79
49,7 49,93 50,87 51,62 52,24 52,85 59,26
49,73 50,19 50,9 51,82 52,4 52,9 60,39
49,74 50,19 50,95 51,93 52,43 52,91 62,45

Tabla 2: Tabla de frecuencia

Tabla de frecuencia
Marca de FR
Clases LI LS F ABS (F) F< F> %W< %W>
Clase (W)%
1 48,635 50,363 49,499 22 31,43 22 70 31,43 100,00
2 50,363 52,090 51,226 21 30,00 43 48 61,43 68,57
3 52,090 53,818 52,954 20 28,57 63 27 90,00 38,57
4 53,818 55,545 54,681 3 4,29 66 7 94,29 10,00
5 55,545 57,273 56,409 0 0,00 66 4 94,29 5,71
6 57,273 59,000 58,136 1 1,43 67 4 95,71 5,71
7 59,000 60,728 59,864 2 2,86 69 3 98,57 4,29
8 60,728 62,455 61,591 1 1,43 70 1 100,00 1,43
70
1. Definir la población y la variable aleatoria
Población: Tiempo en segundos que tarda en llenar la maquina de llenado “1” un
envase de 20 gal
Variable aleatoria: Tiempo en segundo
2. Dibujar el diagrama de puntos.

Imagen 1: Diagrama de Puntos

Fuente: Statgraphics Centurion

3. Dibujar el diagrama de tallo y hojas.

Imagen 2: Grafico de tallo y hojas

Fuente: Minitab

Imagen 3: Grafico de tallo y hojas

Fuente: Statgraphics Centurion


4. Dibujar los seis histogramas más utilizados (frecuencias, frecuencias relativas,
frecuencias acumuladas “menor que”, frecuencias relativas acumuladas “menor
que”, frecuencias acumuladas “mayor que”, frecuencias relativas acumuladas
“mayor que”).

Imagen 4: Histograma de Frecuencia

Fuente: Excel

Imagen 5: Histograma de Frecuencia relativa

Fuente: Excel
Imagen 6: Histograma de Frecuencia relativa

Histograma

40

30
porcentaje

20

10

0
48 51 54 57 60 63
Tiempo (s)

Fuente: Statgraphics Centurion

Imagen 7: Histograma de Frecuencia acumulada <

Fuente: Excel
Imagen 8: Histograma de Frecuencia acumulada <

Histograma

80

60
frecuencia

40

20

0
48 51 54 57 60 63
Tiempo (s)

Fuente: Statgraphics Centurion

Imagen 9: Histograma de Frecuencia acumulada <

Fuente: Excel
Imagen 10: Histograma de Frecuencia acumulada <

Histograma

100

80
porcentaje

60

40

20

0
48 51 54 57 60 63
Tiempo (s)

Fuente: Statgraphics Centurion

Imagen 11: Histograma de Frecuencia acumulada >

Fuente: Excel
Imagen 12: Histograma de Frecuencia relativa acumulada >

Fuente: Excel

5. Calcular media, mediana y moda. Interpretar estos valores.


Con Tabla de Datos
• Media
∑𝒏
𝒊=𝟏 𝒙𝒊 48,64+49,09+49,16+49,29+49,32+49,45+⋯+58,79+59,26+60,39+62,45
̅=
𝒙 =
𝒏 70

̅ = 51,7894286(s)
𝒙
• Mediana
✓ n par
𝑿(𝒏) + 𝑿(𝒏+𝟏) 51,28 + 51,34
𝟐 𝟐
𝑴𝒆 = =
𝟐 2

𝑴𝒆 = 51,32(𝑠)

• Moda
✓ Multimodal
𝑀𝑜1 = 49,45

𝑀𝑜2 = 49,74

𝑀𝑜3 = 49,76
𝑀𝑜4 = 50,19

𝑀𝑜5 = 51,28
𝑀𝑜6 = 51,93

𝑀𝑜7 = 52,24

Con tabla de frecuencia

• Media
∑𝒏
𝒊=𝟏 𝒇𝒊∗𝒎𝒊 (49,999∗22)+(51,226∗21)+(52,954∗20)∗(54,681∗3)+(56,409∗0)+(58,136∗1)+(59,864∗2)+(61,591∗1)
̅=
𝒙 =
𝒏 70

̅ = 51,82(s)
𝒙
• Mediana
✓ n par
𝒏 70
𝟐 − 𝑭𝒂(𝒊−𝟏) + 22
𝑴𝒆 = 𝑳𝒊 + = 50,363 + 2 ∗ 1,728
𝒇𝒊 21
𝑴𝒆 =51,432(s)

• Moda
✓ Frecuencia más alta

𝒇𝒎−𝒇(𝒎−𝟏) 22−0
𝑴𝒐 = 𝑳𝒊𝒎 + 𝟐𝒇𝒎−𝒇 ∗ 𝐴 = 48,635 + (2∗22)−0+21 ∗ 1,72
(𝒎−𝟏) −𝒇(𝒎+𝟏)

𝑴𝒐 =50,288 (s)

Interpretación:

Tabla de datos

• Media: El promedio en que la maquina “1” llena un recipiente de 20 gal es


aproximadamente 51,78 s
• Mediana: El valor que se encuentra a la mitad de entre todos los datos es 51,31 s es
decir que la mitad de los datos es menor a 51,31 s y la otra mitad es mayor a 51,31
s
• Moda: Existen mediciones de tiempo que se repiten más de una vez a lo largo de
los datos y estas son 49,45 s, 49,74 s, 49,76 s, 50,19 s, 51,28 s, 51,93 s, 52,24 s

Tabla de frecuencia

• Media: El promedio en que la maquina “1” llena un recipiente de 20 gal es


aproximadamente 51,82 s
• Mediana: El valor que se encuentra a la mitad de entre todos los datos es 51,43 s es
decir que la mitad de los datos es menor a 51,43 s y la otra mitad es mayor a 51,43
s
• Moda: Existe un valor mediciones de tiempo que se repiten más de una vez a lo largo
de los datos y estas es 50,288 s

6. Calcular la desviación media, desviación estándar, el coeficiente de variación y el


error estándar. Interpretar estos valores.
• Desviación media
̅ )| |(48,64 − 51,79) + (49,09 − 51,79) + ⋯ + (60,39 − 51,79) + (62,45 − 51,79)|
∑|(𝑿𝒊 − 𝑿
𝑫𝑴 = =
𝒏 70

𝑫𝑴 =1,6994 s

• Desviación estándar

̅ )𝟐
∑(𝑿𝒊 − 𝒙 (48,64 − 51,79)2 + (49,09 − 51,79)2 + ⋯ + (60,39 − 51,79)2 + (62,45 − 51,79)2
𝒔=√ =√
𝒏−𝟏 70 − 1

𝒔 = 2,53 𝑠

• Coeficiente de variación

𝒔 2,53 𝑠
𝝑= =
𝝁 51,79 𝑠

𝝑 = 0,04889

• Error estándar

𝒔 2,83 𝑠
𝑺𝒙̅ = =
√𝒏 √70

𝑺𝒙̅ = 0,33824 𝑠

Interpretación:
• Desviación media
Los datos de tiempo en que la maquina “1” lleva un recipiente de 20 gal se
desvían un promedio de 1,6994 s de la media.

• Desviación estándar

Tomando en cuanto el valor de la media (51,79 s) se establece que existe una


dispersión de los datos de 2,53 s alrededor de la medida de tendencia central.
• Coeficiente de variación
Respecto a la media (51,79 s) los datos se alejan un 4,89% de esta.

• Error estándar
Con un error estándar de 0,3384 lo que significa que debido al pequeño tamaño
de la muestra existe un gran error respecto a la media.

7. Calcular los percentiles del conjunto de datos. ¿Entre qué valores se encuentra el
25 % central de los datos

Tabla 3: Tabla de percentiles

N° Percentil posición Percentil N° Percentil posición Percentil


1 0,7 48,690 51 35,7 51,490
2 1,4 48,745 52 36,4 51,547
3 2,1 48,800 53 37,1 51,605
4 2,8 48,855 54 37,8 51,663
5 3,5 48,910 55 38,5 51,720
6 4,2 48,965 56 39,2 51,778
7 4,9 49,020 57 39,9 51,835
8 5,6 49,075 58 40,6 51,893
9 6,3 49,130 59 41,3 51,951
10 7 49,185 60 42 52,008
11 7,7 49,240 61 42,7 52,066
12 8,4 49,295 62 43,4 52,125
13 9,1 49,350 63 44,1 52,185
14 9,8 49,405 64 44,8 52,246
15 10,5 49,460 65 45,5 52,306
16 11,2 49,515 66 46,2 52,366
17 11,9 49,570 67 46,9 52,427
18 12,6 49,625 68 47,6 52,487
19 13,3 49,680 69 48,3 52,548
20 14 49,735 70 49 52,608
21 14,7 49,790 71 49,7 52,669
22 15,4 49,845 72 50,4 52,729
23 16,1 49,900 73 51,1 52,790
24 16,8 49,955 74 51,8 52,850
25 17,5 50,010 75 52,5 52,911
26 18,2 50,065 76 53,2 52,971
27 18,9 50,120 77 53,9 53,032
28 19,6 50,174 78 54,6 53,092
29 20,3 50,229 79 55,3 53,153
30 21 50,284 80 56 53,213
31 21,7 50,339 81 56,7 53,274
32 22,4 50,395 82 57,4 53,334
33 23,1 50,453 83 58,1 53,395
34 23,8 50,511 84 58,8 53,455
35 24,5 50,568 85 59,5 53,516
36 25,2 50,626 86 60,2 53,576
37 25,9 50,683 87 60,9 53,637
38 26,6 50,741 88 61,6 53,697
39 27,3 50,799 89 62,3 53,758
40 28 50,856 90 63 53,818
41 28,7 50,914 91 63,7 54,221
42 29,4 50,971 92 64,4 54,624
43 30,1 51,029 93 65,1 55,027
44 30,8 51,087 94 65,8 55,430
45 31,5 51,144 95 66,5 58,137
46 32,2 51,202 96 67,2 59,346
47 32,9 51,259 97 67,9 60,556
48 33,6 51,317 98 68,6 61,765
49 34,3 51,375 99 69,3 60,987
50 35 51,432 100 70 62,456

El 25% central de los datos están entre el percentil 37 y 63, es decir entre el dato 50,683
y el 52,185

8. Dibujar el diagrama de caja y bigotes. ¿Existen puntos atípicos en sus datos? ¿Por
qué?

Imagen 13: Caja y bigotes

Gráfico de Caja y Bigotes

48 51 54 57 60 63
Col_1

𝑳𝒊 = 𝑸𝟏 − 𝟏, 𝟓 ∗ (𝑸𝟑 − 𝑸𝟏 ) = 49,93 − 1,5 ∗ (52,57 − 49,93)

𝑳𝒊 = 45,97 𝑠
𝑳𝒔 = 𝑸𝟑 + 𝟏, 𝟓 ∗ (𝑸𝟑 − 𝑸𝟏 ) = 49,93 − 1,5 ∗ (52,57 − 49,93)

𝑳𝒔 = 56,53 𝑠

Gráfica y analíticamente se puede concluir que si existen puntos atípicos que son 58,79
s, 59,26 s, 60,39 s, 62,45 s. Esto ocurre por que estos cuatro puntos tienen un mayor
tamaño respecto al resto de los puntos.

9. Calcular dos estadísticos de asimetría y dos de apuntamiento, a su elección.


Calcular los coeficientes de sesgo estandarizado y curtosis estandarizada.
Interpretar estos valores.

Estadísticos de asimetría

̅, Me y Mo
1. Según el valor de 𝒙
• Media
∑𝒏
𝒊=𝟏 𝒇𝒊∗𝒎𝒊 (49,999∗22)+(51,226∗21)+(52,954∗20)∗(54,681∗3)+(56,409∗0)+(58,136∗1)+(59,864∗2)+(61,591∗1)
̅=
𝒙 =
𝒏 70

̅ = 51,82(s)
𝒙
• Mediana
✓ n par
𝒏 70
𝟐 − 𝑭𝒂(𝒊−𝟏) + 22
𝑴𝒆 = 𝑳𝒊 + = 50,363 + 2 ∗ 1,728
𝒇𝒊 21
𝑴𝒆 =51,432(s)

• Moda
✓ Frecuencia más alta

𝒇𝒎−𝒇(𝒎−𝟏) 22−0
𝑴𝒐 = 𝑳𝒊𝒎 + 𝟐𝒇𝒎−𝒇 ∗ 𝐴 = 48,635 + (2∗22)−0+21 ∗ 1,72
(𝒎−𝟏) −𝒇(𝒎+𝟏)

𝑴𝒐 =50,288 (s)

Respuesta: 𝑥̅ >Me> Mo lo datos tienen sesgo positivo como hacia la derecha

2. Coeficiente de Karl Pearson

̅ − 𝑴𝒆) 3 ∗ (51,82 s − 51,432 s)


𝟑 ∗ (𝑿
𝑨𝒔𝒑 = =
𝒔 2,53 𝑠

𝑨𝒔𝒑 = 0,46
Respuesta: Con un valor de 0,46 del coeficiente de Karl Pearson se concluye que debido que
es un coeficiente positivo los datos tiene un sesgo positivo (cola a la derecha)

Estadísticos de apuntamiento
1. Coeficiente percentilico

𝑸𝟑 + 𝑸𝟏 52,57 − 50,01
𝑲= =
𝟐 ∗ (𝑷𝟗𝟎 − 𝑷𝟏𝟎 ) 2 ∗ (53,82 + 49,19)

𝑲 = 0,2764

Interpretación: Con un coeficiente percentilico de 0,2764 que es mayor a 0,263 se


concluye que la curva conformada por datos de tiempo tiene una forma leptocúrtica.

2. Coeficiente de Yule Bowley

𝑸𝟑 + 𝑸𝟏 − 𝟐 ∗ 𝑸𝟐 52,91 + 50,01 − (2 ∗ 51,43)


𝑨𝒔𝒚 = =
𝑸𝟑 − 𝑸𝟏 52,91 − 50,01

𝑨𝒔𝒚 = 0,01931
Interpretación: Con un coeficiente de Yule Bowley de 0,01931 que es mayor a 0 se concluye
que la curva proveniente de los datos de tiempo tiene sesgo positivo (cola hacia la derecha)

Coeficientes de sesgo estandarizado


̅ )𝟑
𝒏 ∗ ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝑿 70 ∗ ((48,64 − 51,82)3 + (49,09 − 51,82)3 + ⋯ + (60,39 − 51,82)3 + (62,45 − 51,82)3 )
𝒈𝟏 = =
(𝒏 − 𝟏)(𝒏 − 𝟑) ∗ 𝒔𝟑 (70 − 1)(70 − 2) ∗ 2,533

𝒈𝟏 =1,63

𝒈𝟏 𝟐, 𝟐𝟑
𝒛𝟏 = =
√𝟔/𝒏 √𝟔/𝟕𝟎

𝒛𝟏 = 7,61

Interpretación: Con un coeficiente de Fisher con un valor de 1,63 se concluye que la curva que
proviene de los datos de tiempo tiene sesgo positivo (cola hacia la derecha) y con el valor de 7,61
del coeficiente de sesgo estandarizado se concluye que la curva no es normal.

Curtosis estandarizada
𝒏 ∗ (𝒏 + 𝟏) ∗ ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅) 𝟒 𝟑 ∗ (𝒏 − 𝟏)𝟐
𝒈𝟐 = −
(𝒏 − 𝟏) ∗ (𝒏 − 𝟐) ∗ (𝒏 − 𝟑) ∗ 𝒔𝟒 (𝒏 − 𝟐) ∗ (𝒏 − 𝟑)

70 ∗ (70 + 1) ∗ ((48,64 − 51,789)4 + (49,09 − 51,789)4 + ⋯ + (60,39 − 51,789)4 + (62,45 − 51,789)4) 3 ∗ (70 − 1)2
𝒈𝟐 = −
(70 − 1) ∗ (70 − 2) ∗ (70 − 3) ∗ 𝑠 4 (70 − 2) ∗ (70 − 3)

𝒈𝟐 =6,31
𝒈𝟐 6,31
𝒛𝟐 = =
√𝟐𝟒/𝒏 √24/70

𝒛𝟐 = 10.77

Interpretación: Con un valor de coeficiente de curtosis de Fisher de 10,77 se concluye que la


curva proveniente de los datos de tiempo es Leptocúrtica y mediante el valor de coeficiente de
curtosis estándar de 10,77 se concluye que la curva no es normal.

También podría gustarte