Está en la página 1de 13

Universidad Católica Andrés Bello

Facultad de Ingeniería
Estadística y probabilidades
Profesor: José Quintero

PROYECTO #1

Integrantes:
Betancourt Dwight C.I: 27.391.613
Luis Noriega C.I: 27.426.877
Rafael Pérez C.I: 26.026.575
1. Use un gráfico circular para representar el % de obreros cuyo peso es menor o igual
a 60 Kg. El % cuyo peso se encuentra entre 61 Kg y 70 Kg y finalmente el % que
pesan más de 70 Kg.

Peso de obreros (%)

4%

24%

72%

0 ≤ 60 61 ≤ 70 70+

Figura 1.

2. Construya una tabla de distribución de frecuencias para datos agrupados por valor y
otra para datos agrupados por intervalo usando una amplitud entera.
Tabla de distribución de frecuencias para datos agrupados por valor:
Clase Peso (Kg) fi Fi hi Hi
1 53 1 1 2% 2%
2 54 0 1 0% 2%
3 55 1 2 2% 4%
4 56 1 3 2% 6%
5 57 2 5 4% 10%
6 58 2 7 4% 14%
7 59 2 9 4% 18%
8 60 3 12 6% 24%
9 61 4 16 8% 32%
10 62 4 20 8% 40%
11 63 5 25 10% 50%
12 64 6 31 12% 62%
13 65 5 36 10% 72%
14 66 4 40 8% 80%
15 67 3 43 6% 86%
16 68 2 45 4% 90%
17 69 2 47 4% 94%
18 70 1 48 2% 96%
19 71 1 49 2% 98%
20 72 1 50 2% 100%
Tabla 1.

Tabla de distribución de frecuencia para datos agrupados por intervalos:


Intervalo (Kg)
Clase fi Fi hi Hi
Límite inferior Límite superior Marca de clase
1 53,00 56,00 54,50 3 3 6% 6%
2 56,00 59,00 57,50 6 9 12% 18%
3 59,00 62,00 60,50 11 20 22% 40%
4 62,00 65,00 63,50 16 36 32% 72%
5 65,00 68,00 66,50 9 45 18% 90%
6 68,00 71,00 69,50 4 49 8% 98%
7 71,00 74,00 72,50 1 50 2% 100%
Tabla 2.

3. ¿Qué % de obreros pesan entre 59 Kg y 61 Kg? ¿Qué % pesan menos de 62 Kg?


Basándonos en la tabla de datos agrupados por valor se puede ver que la frecuencia
relativa hi ofrece información de que porcentaje de obreros se ubican en los pesos
requeridos, para este caso específico para 59 Kg hay un porcentaje de 4%, para 60 Kg
hay un porcentaje de 6%, y para 61 Kg hay un porcentaje de 8%, sumando
algebraicamente los porcentajes, se obtiene que el porcentaje de obreros que pesan entre
59 Kg y 61 Kg es de 18%.
Para saber Cuántos obreros pesan menos de 62 Kg, se puede utilizar la frecuencia
relativa acumulada Hi de la misma tabla, en la que se puede ver que para el peso 61 Kg
se ha acumulado un 32% de los obreros, es decir 32% de los obreros pesan menos de 62
Kg.
4. Construya un polígono de frecuencias absolutas y un polígono de frecuencias
relativas para cada agrupación de datos.
Para datos agrupados por valor:

Histograma y polígono de frecuencias absolutas


7
Frecuencia Absoluta

6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Clase

Figura 3.
Histograma y polígono de frecuencias relativas
14%

Frecuencia Absoluta
12%
10%
8%
6%
4%
2%
0%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Clase

Figura 4.

Para datos agrupados por intervalos:

Histograma y polígono de frecuencias


absolutas
20
Frecuencia absoluta

15

10

0
54,50 57,50 60,50 63,50 66,50 69,50 72,50
Clase

Figura 5.

Histograma y polígono de frecuencias


relativas
35%
30%
Frecuencia relativa

25%
20%
15%
10%
5%
0%
54,50 57,50 60,50 63,50 66,50 69,50 72,50
Clase

Figura 6.
5. Construya una ojiva porcentual ascendente y ubique el porcentaje obtenido en el
apartado 3.
Para datos agrupados por valor:

OJIVA PORCENTUAL
ASCENDENTE PARA DATOS
AGRUPADOS EN VALORES
Obreros Peso menor a 62Kg peso entre 59Kg y 61Kg

100%
PORCENTAJE DE OBREROS

80%
60%
40%
20%
0%
53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
PESO DE OBREROS

Figura 7.

Para datos agrupados por intervalo:

OJIVA PORCENTUAL
ASCENDENTE PARA DATOS
AGRUPADOS EN
INTERVALOS
Obreros Peso menor a 62Kg peso entre 59Kg y 61Kg

100%
PORCENTAJE DE OBREROS

80%
60%
40%
20%
0%
54,50 57,50 60,50 63,50 66,50 69,50 72,50
PESO DE OBREROS

Figura 8.
6. Calcule la media aritmética, la mediana y la moda para los datos agrupados
por valor y para los datos agrupados por intervalo. ¿Encontró diferencias en
los valores anteriores comparando los resultados para la agrupación por valor
y por intervalos? Explique brevemente.
Para datos agrupados por valor:
Clase Peso (Kg) fi (xi)(fi)
1 53 1 53
2 54 0 0
3 55 1 55
4 56 1 56
5 57 2 114
6 58 2 116
7 59 2 118
8 60 3 180
9 61 4 244
10 62 4 248
11 63 5 315
12 64 6 384
13 65 5 325
14 66 4 264
15 67 3 201
16 68 2 136
17 69 2 138
18 70 1 70
19 71 1 71
20 72 1 72
Tabla 3.

Basándonos en la tabla se hacen los siguientes cálculos:


Media aritmética:
1 1
𝑀 = 𝑁 ∑𝑛𝑖=1 𝑥𝑖𝑓𝑖 ⟹ 𝑀 = 50 (53+0+55+…+70+71+72)=63,2

Mediana:
𝑥𝑖 +𝑥𝑖+1 𝑁 50 63+64
𝑀𝑒 = ;𝑖= ⟹ 𝑖= = 25 ; 𝑀𝑒 = = 63,5
2 2 2 2

Moda:
Como se puede observar en la tabla el dato con mayor frecuencia es el 64
perteneciente a la clase 12, por lo tanto:
𝑀𝑜 = 64
Para datos agrupados por intervalo:

Intervalo (Kg)
Clase fi (xi)(fi) Fi
Límite inferior Límite superior Marca de clase
1 53 56 54,5 3 163,5 3
2 56 59 57,5 6 345 9
3 59 62 60,5 11 665,5 20
4 62 65 63,5 16 1016 36
5 65 68 66,5 9 598,5 45
6 68 71 69,5 4 278 49
7 71 74 72,5 1 72,5 50
Tabla 4.

Basándonos en la tabla se hacen los siguientes cálculos:


Media aritmética:
1 1
𝑀 = 𝑁 ∑𝑛𝑖=1 𝑥𝑖𝑓𝑖 ⟹ 𝑀 = 50 (163,5 + 345,00 + ⋯ + 72,5) = 62,78

Mediana:
Para poder realizar este cálculo es necesario determinar antes la clase medianal
“K”, en la que se encuentra el dato 𝑥𝑖 que ocupa la posición N/2:
𝑁 50
=𝑖 ⟹ = 25 ⟹ 𝑥25 = 63
2 2
El dato obtenido se encuentra en el intervalo que va desde 62 hasta 65 por lo tanto la
clase medianal “K” es la clase 4. Se procede a calcular la mediana
𝑁 50
−𝐹𝑘−1 −20
𝑀𝑒 = 𝐿𝐼𝑘 + 2
(𝐿𝑆𝑘 − 𝐿𝐼𝑘 ) ⟹ 𝑀𝑒 = 62 + 2
(65 − 62) = 62,94
𝑓𝑘 16

Moda:
Para poder realizar este cálculo es necesario determinar antes la clase modal
“K”, en la que se encuentra el dato con mayor frecuencia. El valor del dato con mayor
frecuencia es 64 determinado previamente en la agrupación por valor, por lo tanto la
clase modal será la clase 4 que posee intervalos entre 62 y 65. Se procede a calcular la
moda.
𝑑1 16−11
𝑀𝑜 = 𝐿𝐼𝑘 + 𝑑 (𝐿𝑆𝑘 − 𝐿𝐼𝑘 ) ⟹ 𝑀𝑜 = 62 + (65 − 62) = 63,25
1 +𝑑2 16−11+16−9

7. Determine el mínimo peso del 25% de los obreros más pesados.


Como se ordenaron los pesos de los obreros de menor a mayor, se puede aplicar
el concepto de percentil para hallar el 25% de los obreros más pesados, es decir, los
obreros que pesan igual o más que el 75% de todos los obreros, para esto se calculará el
tercer cuartil y cuarto cuartil de los datos.
𝑘∗𝑁
𝑄𝑖 = 𝑃𝑖∗25 = 𝑥𝑚+1 ; 𝑚< ≤𝑚+1
100
75∗50
𝑃75 : 𝑚 < ≤𝑚+1 ⟹ 𝑚 = 37 ⟹ 𝑃75 = 𝑥38
100
100∗50
𝑃100 : 𝑚 < ≤𝑚+1 ⟹ 𝑚 = 49 ⟹ 𝑃100 = 𝑥50
100

En la posición 𝑥38 se halla el peso 66 Kg que corresponde al tercer cuartil, y en la


posición 𝑥50 se halla el peso 72 Kg que corresponde al cuarto cuartil. El menor peso en
este segmento de datos es el de 66 Kg por lo tanto este es el peso mínimo entre el 25%
de los obreros más pesados.

8. Grafique el diagrama de caja y bigotes correspondiente.


Para datos agrupados por valor:
Para realizar este diagrama de caja y bigotes se realizaron los siguientes cálculos:
Cálculo de los cuartiles:
𝑘∗𝑁
𝑄𝑖 = 𝑃𝑖∗25 = 𝑥𝑚+1 ; 𝑚< ≤𝑚+1
100
25∗50
𝑃25 : 𝑚 < ≤𝑚+1 ⟹ 𝑚 = 12 ⟹ 𝑃25 = 𝑥13
100
50∗50
𝑃50 : 𝑚 < ≤𝑚+1 ⟹ 𝑚 = 24 ⟹ 𝑃50 = 𝑥25
100
75∗50
𝑃75 : 𝑚 < ≤𝑚+1 ⟹ 𝑚 = 37 ⟹ 𝑃75 = 𝑥38
100
100∗50
𝑃100 : 𝑚 < ≤𝑚+1 ⟹ 𝑚 = 49 ⟹ 𝑃100 = 𝑥50
100

Entonces:
𝑄1 = 61; 𝑄2 = 64; 𝑄3 = 66; 𝑄4 = 72
Rango intercuartil:
𝐼𝑄 = 𝑄3 − 𝑄1 = 66 − 61 = 5

Cálculo de la distancia:
1.5𝐼𝑄 = 1,5 ∗ 5 = 7,5

Cálculo de los límites inferior y superior de los bigotes:


Límite inferior:
𝑎 = 𝐿𝑖 = 𝑄1 − 1,5𝐼𝑄 = 61 − 7,5 = 53,5
Límite superior:
𝑑 = 𝐿𝑠 = 𝑄3 + 1,5𝐼𝑄 = 66 + 7,5 = 73,5

Diagrama de caja y bigotes

Peso
(Kg)

50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75

Figura 9.

Para datos agrupados por intervalos:


Para realizar este diagrama de caja y bigotes se realizaron los siguientes cálculos:
Cálculo de los cuartiles:
𝑘∗𝑁
−𝐹𝑗−1
𝑄𝑖 = 𝑃𝑖∗25 ; 𝑃𝑘 = 𝐿𝐼𝑗 + 100 𝑓 (𝐿𝑆𝑗 − 𝐿𝐼𝑗 )
𝑗

25∗50
−9
𝑃25 = 59 + 100
∗ (62 − 59) = 59,95
11
50∗50
−20
𝑃50 = 62 + 100
∗ (65 − 62) = 62,94 ⟹ 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
16
75∗50
−36
𝑃75 = 65 + 100
∗ (68 − 65)=65,50
9
100∗50
−49
𝑃75 = 71 + 100
∗ (74 − 71)=74
1

Entonces:
𝑄1 = 59,95; 𝑄2 = 62,94; 𝑄3 = 65,50; 𝑄4 = 74
Rango intercuartil:
𝐼𝑄 = 𝑄3 − 𝑄1 = 65,50 − 59,95 = 5,55
Cálculo de la distancia:
1.5𝐼𝑄 = 1,5 ∗ 5,55 = 8,33

Cálculo de los límites inferior y superior de los bigotes:


Límite inferior:
𝑎 = 𝐿𝑖 = 𝑄1 − 1,5𝐼𝑄 = 59,95 − 8,33 = 51,57

Límite superior:
𝑑 = 𝐿𝑠 = 𝑄3 + 1,5𝐼𝑄 = 65,50 + 8,33 = 73,83

Diagrama de caja y bigotes

Peso (Kg)

50,00 51,00 52,00 53,00 54,00 55,00 56,00 57,00 58,00 59,00 60,00 61,00 62,00 63,00 64,00 65,00 66,00 67,00 68,00 69,00 70,00 71,00 72,00 73,00 74,00

Figura 10.

9. Calcule la cuasivarianza, la cuasidesviación estándar y el coeficiente de variación.


¿Qué se puede decir de la homogeneidad de los datos?
Para datos agrupados por valor:

Clase Peso (Kg) fi xi - M (xi - M)2 (fi)(xi - M)2


1 53 1 -10,2 104,04 104,04
2 54 0 -9,2 84,64 0
3 55 1 -8,2 67,24 67,24
4 56 1 -7,2 51,84 51,84
5 57 2 -6,2 38,44 76,88
6 58 2 -5,2 27,04 54,08
7 59 2 -4,2 17,64 35,28
8 60 3 -3,2 10,24 30,72
9 61 4 -2,2 4,84 19,36
10 62 4 -1,2 1,44 5,76
11 63 5 -0,2 0,04 0,2
12 64 6 0,8 0,64 3,84
13 65 5 1,8 3,24 16,2
14 66 4 2,8 7,84 31,36
15 67 3 3,8 14,44 43,32
16 68 2 4,8 23,04 46,08
17 69 2 5,8 33,64 67,28
18 70 1 6,8 46,24 46,24
19 71 1 7,8 60,84 60,84
20 72 1 8,8 77,44 77,44
Tabla 5.
Varianza:
𝑛
1 1
𝑠 = ∑ 𝑓𝑖(𝑥𝑖 − 𝑀)2 ⟹ 𝑠 2 =
2 (104,04 + 0 + 67,24 + ⋯ + 77,44) = 16,76
𝑁 50
𝑖=1
Desviación estándar:
𝑠 = √𝑠 2 ⟹ 𝑠 = 4,09
Cuasivarianza:
𝑁 50
𝑠𝑐2 = 𝑁−1 𝑠 2 ⟹ 𝑠𝑐2 = 50−1 ∗ 16,76 = 17,10
Cuasidesviación:
𝑠𝑐 = √𝑠𝑐2 ⟹ 𝑠𝑐 = 4,14
Coeficiente de variación:
𝑠𝑐 4,14
𝐶𝑉 = |𝑀| ∗ 100% ⟹ 𝐶𝑉 = 63,2 ∗ 100% = 6,54%

Según el coeficiente de variación el conjunto de datos es muy homogéneo ya que


dicho coeficiente no es mayor a 10%.

Para datos agrupados por intervalos:

Intervalo (Kg)
Clase Límite Límite Marca de fi (fi)(xi-M)2
inferior superior clase
1 53 56 54,50 3 205,68
2 56 59 57,50 6 167,27
3 59 62 60,50 11 57,18
4 62 65 63,50 16 8,29
5 65 68 66,50 9 124,55
6 68 71 69,50 4 180,63
7 71 74 72,50 1 94,48
Tabla 6.
Varianza:
1
𝑠 2 = 𝑁 ∑𝑛𝑖=1 𝑓𝑖(𝑥𝑖 − 𝑀)2
1
𝑠 2 = 50 (205,68 + 167,27 + 57,18 + ⋯ + 94,48) = 16,76
Desviación estándar:
𝑠 = √𝑠 2 ⟹ 𝑠 = 4,09
Cuasivarianza:
𝑁 50
𝑠𝑐2 = 𝑁−1 𝑠 2 ⟹ 𝑠𝑐2 = 50−1 ∗ 16,76 = 17,10
Cuasidesviación:
𝑠𝑐 = √𝑠𝑐2 ⟹ 𝑠𝑐 = 4,14
Coeficiente de variación:
𝑐𝑠 4,14
𝐶𝑉 = |𝑀| ∗ 100% ⟹ 𝐶𝑉 = 62,78 ∗ 100% = 6,60%

Según el coeficiente de variación el conjunto de datos es muy homogéneo ya que


dicho coeficiente no es mayor a 10%.

10. Calcule el coeficiente de asimetría de Pearson. ¿Cómo es el sesgo de la muestra?


Para datos agrupados por valor:
3(𝑀 − 𝑀𝑒) 3(63,2 − 63,5)
𝑆𝐾 = ⟹ 𝑆𝐾 = = −0,2176
𝑆𝑐 4,14
El valor coeficiente de Pearson obtenido es negativo, por lo tanto la asimetría es
negativa, lo que quiere decir que el sesgo será a izquierda, en otras palabras la curva
disminuye gradualmente hacia el extremo izquierdo del eje horizontal.
Para datos agrupados por intervalos:
3(𝑀 − 𝑀𝑒) 3(62,78 − 62,94)
𝑆𝐾 = ⟹ 𝑆𝐾 = = −0,1159
𝑆𝑐 4,14
El valor coeficiente de Pearson obtenido es negativo, al igual que en la agrupación
por valor, de igual forma la asimetría es negativa, lo que quiere decir que el sesgo será a
izquierda, en otras palabras la curva disminuye gradualmente hacia el extremo izquierdo
del eje horizontal.
11. Calcule el coeficiente de curtosis. ¿La curva es platicúrtica, mesocúrtica o
leptocúrtica?
Para realizar el cálculo del coeficiente de curtosis primero es necesario obtener el
momento r-ésimo usando la siguiente formula:
𝑛
1
𝑚𝑟 = ∑ 𝑓𝑖(𝑥𝑖 − 𝑀)𝑟
𝑁−1
𝑖=1
1
𝑚4 = (10.824,32 + 0 + ⋯ + 5.996,95) = 807,70
50 − 1
Con este resultado se procede a calcular el coeficiente de curtosis como se muestra:
𝑚4 807,70
𝐾= ⟹ 𝐾= = 2,75
𝑠𝑐4 4,144
Este coeficiente de curtosis (2,75<3) indica que la distribución es platicúrtica, es
decir, es una curva que presenta un pico ligero, achatado.
12. Establezca conclusiones breves adicionales que considere necesarias.
Gracias a la información recopilada de los pesos de obreros en la empresa
“QUINTERO Y ASOCIADOS” se realizaron análisis estadísticos con la ayuda de tablas
de distribución de frecuencias agrupadas por valor y agrupadas por intervalos con sus
respectivos histogramas. Gracias a esto se pudo hacer observaciones especiales como es
el caso del grafico 1 o el análisis hecho en el apartado de la pregunta 3.
Además de esto también se pudo realizar cálculos de basados en la distribución de
frecuencia que permitieron conocer la media, mediana y moda, en ambas agrupaciones,
obteniendo resultados muy cercanos, siendo más precisos los resultados obtenidos para
la agrupación por valor, de esto se puede concluir que para un numero grande de datos
recolectados, la agrupación por intervalos es más útil que la agrupación por valor, y en el
caso contrario, viceversa.
Con respecto a la cuasivarianza, cuasidesviación estándar y coeficiente de desviación
se obtuvieron los mismos resultados para ambos casos de agrupaciones, dejando una vez
más de manifiesto la utilidad de la agrupación de datos por intervalos. Por último fue
posible evaluar el comportamiento de la curva con el cálculo de coeficiente de asimetría
de Pearson y el coeficiente de curtosis.

También podría gustarte