Está en la página 1de 11

Efectúa una encuesta entre 15 de tus amigos y/o compañeros del grupo acerca del peso de cada

uno. Clasifícalos, determina los límites de clase, ancho de clase, marca de clase, las frecuencias
relativas. Grafica los datos en un histograma y un polígono de frecuencias, además calculas las
medidas de tendencia central y de dispersión adecuadas.

a) Clasifica y organiza los datos mediante la construcción de una distribución de frecuencias


es decir determina los límites de clase, ancho de clase, marca de clase.

Realizada la encuesta se obtuvieron los siguientes datos en kilogramos:

85,97,102,76,89,83,89,106,70,74,76,85,91,90,90

Se organizan los datos de forma ascendente:

70,74,76,76,83,85,85,89,89,90,90,91,97,102,106

Se procede a construir la tabla de distribución de frecuencias.

Se calcula el rango de los datos:

El rango se calcula como la diferencia entre el dato máximo y el dato mínimo.

𝑅𝑎𝑛𝑔𝑜 = 𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 106 − 70 = 36

Se procede a calcular el numero de intervalos de la distribución de frecuencias por medio


de la regla de Sturges.

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 𝐾 = 1 + 3.322 log(𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠) = 1 + 3.322 log(15)

= 1 + 3.322(1.1761) = 4.907

Se redondea o trunca al número impar más cercano:

𝐾 = 4.907 ≈ 5

Se procede a calcular el ancho de clase:

𝑅 36
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = 𝑊 = = = 7.2
𝐾 5

Se redondea o trunca al número más cercano:

𝑊 = 7.2 ≈ 7
Se procede a construir la tabla de distribución de frecuencias con datos agrupados.
Clases Marca Frecuencia Frecuencia Frecuencia Frecuencia
Límite Límite de Absoluta Relativa Absoluta Relativa
Inferior Superior clases [𝑓] [𝑓𝑟 ] Acumulada Acumulada
[𝐿𝑖] [𝐿𝑠] [𝑥] [𝐹] [𝐹𝑟 ]
70 77 73.5 4 0.2667 4 0.2667
77 84 80.5 1 0.0667 5 0.3334
84 91 87.5 6 0.4 11 0.7334
91 98 94.5 2 0.1333 13 0.8667
98 105 101.5 1 0.0667 14 0.9334
105 112 108.5 1 0.0667 15 1.0001
𝑁 = 15

Se forma el histograma de frecuencias:

Histograma Peso de 15 Amigos


7

5
Número de personas

0
70-77 77-84 84-91 91-98 98-105 105-112
Peso[Kg]
b) Calcula las medidas de dispersión: Varianza, desviación estándar y coeficiente de
variación.

• Medidas de tendencia central:

- Media:

Se calcula como:

∑𝑖(𝑥𝑖 𝑓𝑖 )
𝑥̅ =
𝑁

Por lo tanto se agregan nuevas columnas a la tabla de distribución de frecuencias:

Clases Marca Frecuencia Frecuencia Frecuencia Frecuencia 𝑥∗𝑓


Límite Límite de Absoluta Relativa Absoluta Relativa
Inferior Superior clases [𝑓] [𝑓𝑟 ] Acumulada Acumulada
[𝐿𝑖] [𝐿𝑠] [𝑥] [𝐹] [𝐹𝑟 ]
70 77 73.5 4 0.2667 4 0.2667 294
77 84 80.5 1 0.0667 5 0.3334 80.5
84 91 87.5 6 0.4 11 0.7334 525
91 98 94.5 2 0.1333 13 0.8667 189
98 105 101.5 1 0.0667 14 0.9334 101.5
105 112 108.5 1 0.0667 15 1.0001 108.5
𝑁 = 15 ∑(𝑥𝑖 𝑓𝑖 ) = 1298.5
𝑖

Por lo tanto la media es:

∑𝑖(𝑥𝑖 𝑓𝑖 ) 1298.5
𝑥̅ = = = 86.5667
𝑁 15

- Mediana:

La mediana para distribución de frecuencias de datos agrupados se calcula como:


𝑁
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 𝑊 ( 2 )
𝑓𝑖

Pero primero se debe de localizar el intervalo en donde se debe encontrar la mediana, para eso se
utiliza la siguiente regla.
Si el número de datos es par, entonces la mediana se ubica en el intervalo cuya 𝐹𝑖 sea igual o un
poco mayor a:
𝑁
2
Si el número de datos es impar, entonces la mediana se ubica en el intervalo cuya 𝐹𝑖 sea igual o un
poco mayor a:
𝑁+1
2
En este caso dado que el numero de datos es impar, por lo tanto:
15 + 1 16
= =8
2 2
Por lo tanto el intervalo en donde se debe encontrar la mediana es:

Clases Marca Frecuencia Frecuencia Frecuencia Frecuencia 𝑥∗𝑓


Límite Límite de Absoluta Relativa Absoluta Relativa
Inferior Superior clases [𝑓] [𝑓𝑟 ] Acumulada Acumulada
[𝐿𝑖] [𝐿𝑠] [𝑥] [𝐹] [𝐹𝑟 ]
70 77 73.5 4 0.2667 4 0.2667 294
77 84 80.5 1 0.0667 5 0.3334 80.5
84 91 87.5 6 0.4 11 0.7334 525
91 98 94.5 2 0.1333 13 0.8667 189
98 105 101.5 1 0.0667 14 0.9334 101.5
105 112 108.5 1 0.0667 15 1.0001 108.5
𝑁 = 15 ∑(𝑥𝑖 𝑓𝑖 ) = 1298.5
𝑖

Sustituyendo los datos en la fórmula:


𝑁 15
− 𝐹𝑖−1 −5
𝑀𝑒 = 𝐿𝑖 + 𝑊 ( 2 ) = 84 + 7 ( 2 ) = 86.9167
𝑓𝑖 6

- Moda:

Se calcula como:
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + 𝑊 [ ]
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
Pero primero se debe ubicar el intervalo en donde se encuentra la moda, para esto se debe
encontrar la 𝑓𝑖 que tenga el mayor valor.

Clases Marca Frecuencia Frecuencia Frecuencia Frecuencia 𝑥∗𝑓


Límite Límite de Absoluta Relativa Absoluta Relativa
Inferior Superior clases [𝑓] [𝑓𝑟 ] Acumulada Acumulada
[𝐿𝑖] [𝐿𝑠] [𝑥] [𝐹] [𝐹𝑟 ]
70 77 73.5 4 0.2667 4 0.2667 294
77 84 80.5 1 0.0667 5 0.3334 80.5
84 91 87.5 6 0.4 11 0.7334 525
91 98 94.5 2 0.1333 13 0.8667 189
98 105 101.5 1 0.0667 14 0.9334 101.5
105 112 108.5 1 0.0667 15 1.0001 108.5
𝑁 = 15 ∑(𝑥𝑖 𝑓𝑖 ) = 1298.5
𝑖

Sustituyendo los datos en la fórmula:

𝑓𝑖 − 𝑓𝑖−1 6−1 5
𝑀𝑜 = 𝐿𝑖 + 𝑊 [ ] = 84 + 2 [ ] = 84 + 2 [ ]=
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) (6 − 1) + (6 − 2) 5+4

85.1111
• Medidas de dispersión:

- Varianza:

Para calcular la varianza se utiliza la siguiente formula:

∑𝑖[𝑓(𝑥 − 𝑥̅ )2 ]
𝜎2 =
𝑛

Por tal motivo se extenderá la tabla de distribución de frecuencias:

Clases Marca Frecuencia 𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2 𝑓(𝑥 − 𝑥̅ )2


Límite Límite de Absoluta
Inferior Superior clases [𝑓]
[𝐿𝑖] [𝐿𝑠] [𝑥]
70 77 73.5 4 -13.0667 170.7386 682.9546
77 84 80.5 1 -6.0667 36.8048 36.8048
84 91 87.5 6 0.9333 0.8710 5.2263
91 98 94.5 2 7.9333 62.9372 125.8745
98 105 101.5 1 14.9333 223.0034 223.0034
105 112 108.5 1 21.9333 481.0696 481.0696
𝑁 = 15 𝑆𝑢𝑚𝑎 = 1554.9333

Sustituyendo los datos en la tabla:

∑𝑖[𝑓(𝑥 − 𝑥̅ )2 ] 1554.9333
𝜎2 = = = 103.6622
𝑛 15

- Desviación estándar:

Para calcular la desviación estándar se obtiene la raíz cuadra de la varianza:

𝜎 = √𝜎 2 = √103.6622 = 10.1815

- Coeficiente de variación:

El coeficiente de variación se obtiene como:


𝜎 10.1815
𝐶𝑣 = 100 ( ) = 100 ( ) = 11.76145
𝑥̅ 86.5667
En un estudio comparativo de marketing de refrescos de cola se reunieron datos muestrales de los
pesos (en libras) del contenido de latas de Coca-Cola regular y Coca-Cola dietética, con el objetivo
de identificar problemas de calidad en el llenado de estos. Los siguientes son los pesos de las
muestras

a) Calcule las medidas de dispersión que nos permita comparar ambos tipos de refresco.

Primero se calculara la media de cada presentación de Coca-Cola:

∑𝑖(𝑥𝑐𝑙á𝑠𝑖𝑐𝑎𝑖 )
𝑥̅𝑐𝑙á𝑠𝑖𝑐𝑎 = =
𝑁

0.790 + 0.806 + 0.807 + 0.811 + 0.812 + 0.817 + 0.818 + 0.819 + 0.821 + 0.824
=
10

8.125
= 0.8125
10

∑𝑖(𝑥𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎𝑖 )
𝑥̅𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = =
𝑁

0.775 + 0.777 + 0.780 + 0.782 + 0.780 + 0.785 + 0.786 + 0.786 + 0.787 + 0.788
=
10

7.826
= 0.7826
10

Se procederá a calcular la varianza de cada presentación de Coca-Cola:

Primero se organizan los datos de menor a mayor:

Pesos Coca-Cola
0.790 0.806 0.807 0.811 0.812 0.817 0.818 0.819 0.821 0.824
clásica
Pesos Coca-Cola
0.775 0.777 0.780 0.780 0.782 0.785 0.786 0.786 0.787 0.788
dietética
2
∑𝑖 [(𝑥𝑐𝑙á𝑠𝑖𝑐𝑎𝑖 − 𝑥̅𝑐𝑙á𝑠𝑖𝑐𝑎 ) ] (0.790 − 0.8125)2 + ⋯ + (0.824 − 0.8125)2
2
𝜎𝑐𝑙á𝑠𝑖𝑐𝑎 = = =
𝑁 10

0.0008785
= 8.785 × 10−5
10

2
∑𝑖 [(𝑥𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎𝑖 − 𝑥̅𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 ) ]
2
𝜎𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = =
𝑁

(0.775 − 0.7826)2 + ⋯ + (0.788 − 0.7826)2 0.0001804


= = 1.804 × 10−5
10 10

Se procede a calcular la desviación estándar:

𝜎𝑐𝑙á𝑠𝑖𝑐𝑎 = √8.785 × 10−5 = 9.3728 × 10−3

𝜎𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = √1.804 × 10−5 = 4.2473 × 10−3

Se procede a calcular el coeficiente de variación:

𝜎𝑐𝑙á𝑠𝑖𝑐𝑎 9.3728 × 10−3


𝐶𝑉𝑐𝑙á𝑠𝑖𝑐𝑎 = 100 ( ) = 100 ( ) = 1.1536%
𝑥̅𝑐𝑙á𝑠𝑖𝑐𝑎 0.8125

𝜎𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 4.2473 × 10−3


𝐶𝑉𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 100 ( ) = 100 ( ) = 0.5427%
𝑥̅𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 0.7826

Dado que en los dos coeficientes de variación se obtuvieron resultados menores al 10%, se
considera que los datos varían poco.

b) Concluya sobre las diferencias que encuentra entre ambas presentaciones de Coca, utilice
la comparación de diagramas de caja y las medidas estadísticas.

Se procede a calcular los cuartiles de los datos de cada tipo de Coca-Cola:

- Clásica:
Se aplica la fórmula para encontrar la posición de los cuartiles:

𝑃𝑄1 𝑐𝑙á𝑠𝑖𝑐𝑎 = 𝑁(0.25) = 10(0.25) = 2.5

𝑆𝑒 𝑝𝑟𝑜𝑐𝑒𝑑𝑒 𝑎 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 𝑎𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑚á𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜


𝑃𝑄1 𝑐𝑙á𝑠𝑖𝑐𝑎 = 2.5 ≈ 3

𝑃𝑄2 𝑐𝑙á𝑠𝑖𝑐𝑎 = 𝑁(0.5) = 10(0.5) = 5

𝑃𝑄3 𝑐𝑙á𝑠𝑖𝑐𝑎 = 𝑁(0.75) = 10(0.75) = 7.5

𝑆𝑒 𝑝𝑟𝑜𝑐𝑒𝑑𝑒 𝑎 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 𝑎𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑚á𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜


𝑃𝑄3 𝑐𝑙á𝑠𝑖𝑐𝑎 = 7.5 ≈ 8

Se buscan los cuartiles en la tabla con los datos ordenados ascendentemente:

Posición 1 2 3 4 5 6 7 8 9 10
Pesos Coca-Cola
0.790 0.806 0.807 0.811 0.812 0.817 0.818 0.819 0.821 0.824
clásica

Por lo tanto:

𝑄1𝑐𝑙á𝑠𝑖𝑐𝑎 = 0.807
𝑄2𝑐𝑙á𝑠𝑖𝑐𝑎 = 0.812
𝑄3𝑐𝑙á𝑠𝑖𝑐𝑎 = 0.819

También se pueden visualizar claramente los valores extremos:

𝑋𝑚𝑖𝑛 = 0.790
𝑋𝑚𝑎𝑥 = 0.824

- Dietética:

Se aplica la fórmula para encontrar la posición de los cuartiles:

𝑃𝑄1 𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 𝑁(0.25) = 10(0.25) = 2.5

𝑆𝑒 𝑝𝑟𝑜𝑐𝑒𝑑𝑒 𝑎 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 𝑎𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑚á𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜


𝑃𝑄1 𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 2.5 ≈ 3

𝑃𝑄2 𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 𝑁(0.5) = 10(0.5) = 5

𝑃𝑄3 𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 𝑁(0.75) = 10(0.75) = 7.5

𝑆𝑒 𝑝𝑟𝑜𝑐𝑒𝑑𝑒 𝑎 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 𝑎𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑚á𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜


𝑃𝑄3 𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 7.5 ≈ 8

Se buscan los cuartiles en la tabla con los datos ordenados ascendentemente:

Posición 1 2 3 4 5 6 7 8 9 10
Pesos Coca-Cola
0.775 0.777 0.780 0.780 0.782 0.785 0.786 0.786 0.787 0.788
dietética

Por lo tanto:

𝑄1𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 0.780
𝑄2𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 0.782
𝑄3𝑑𝑖𝑒𝑡é𝑡𝑖𝑐𝑎 = 0.786

También se pueden visualizar claramente los valores extremos:

𝑋𝑚𝑖𝑛 = 0.775
𝑋𝑚𝑎𝑥 = 0.788
Diagrama de caja Coca-Cola clásica:
Diagrama de caja Coca-Cola dietética:

Como se puede observar en los diagramas de caja la versión de Coca-Cola clásica tiene los datos
más dispersos pues el rango entre cada cuartil es mayor, además los valores limites tienen mayor
rango de separación, y en este caso se nota que en el último 25% del diagrama los datos están más
concentrados, mientras la versión de Coca-Cola dietética tiene menor dispersión dado que la
longitud entre sus bigotes es mas corta que en la versión clásica, teniendo de igual forma los datos
concentrados en el último 25% del diagrama.

También podría gustarte