Está en la página 1de 19

ESTADÍSTICA DESCRIPTIVA

Y PROBABILIDADES
TEMA: Medidas de dispersión para datos agrupados y no agrupados.

Semana 05
UTILIDAD
Las medidas de dispersión nos permiten saber cuán alejados se encuentran los datos con
respecto a la media.

Veamos:

Stephen vendió al mejor


distribuidor.
Daniel le dijo: “analice la
venta de los años
Stephen estaba Ello lo pudo hacer al
anteriores de ambos
confundido, no sabía que distribuidores”. escoger al distribuidor que
Stephen quería vender su distribuidor elegir, así que presentó menor
coche, al ofertarlo 2 le pidió ayuda a Daniel variabilidad en sus ventas
distintos distribuidores le
de años anteriores
ofrecieron el 82% de su
precio en promedio.
Datos/Observaciones
LOGRO DE LA SESIÓN

Al finalizar la sesión de clase el estudiante


calcula e interpreta las medidas de
dispersión dando con ello solución a
situaciones problemáticas
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son cantidades que miden el grado en que los datos numéricos
tienden a extenderse. Entre las principales medidas de dispersión que se van a estudiar
tenemos:

DESVIACION COEFICIENTE
VARIANZA
Rango 𝑅 ESTANDAR DE VARIACIÓN
𝑆2
(𝑆) (CV)
RANGO

Se define en un conjunto de n observaciones, como la diferencia entre el valor máximo y el


mínimo, esto permite obtener una idea de la dispersión de los datos.

𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

donde:
𝑥𝑚𝑎𝑥 : Valor máximo

𝑥𝑚𝑖𝑛 : Valor mínimo


VARIANZA
Es una medida que cuantifica el grado de dispersión o variación de los datos con respecto a su media
aritmética. Si los datos tienden a concentrase alrededor de la media, la varianza será pequeña. Si los
datos tienden a distribuirse lejos de la media, la varianza será grande.

La varianza de una muestra de n observaciones o mediciones, es la suma de las diferencias cuadradas de


las mediciones alrededor de la media 𝑥ҧ dividida entre 𝑛 − 1. Se representa por 𝑠 2 .

Datos no agrupados

Datos agrupados

Desviación Estándar(s): Se define como la raíz cuadrada


positiva de la varianza.
COEFICIENTE DE VARIACIÓN

El coeficiente de variación se utiliza para comparar la variabilidad de dos grupos o más grupos
que tengan medias iguales o diferentes, o que tengan unidades de medida iguales o diferentes

Es una medida de dispersión relativa y se calcula dividiendo la desviación estándar entre la


media aritmética, multiplicado por 100%.

𝑠
𝐶𝑉 = × 100%
𝑥ҧ Rango de valores CV.

CV < 10% -> Implica DATOS HOMOGÉNEOS


10% ≤ CV ≤ 30% -> Implica DATOS CON VARIABILIDAD ACEPTABLE
CV > 30% -> Implica DATOS HETEROGÉNEOS
EJERCICIO EXPLICATIVO - 1

Para estudiar la concentración de dióxido de carbono en el medio ambiente de nuestro país, se tomo una
muestra de ocho ciudades donde se midió el nivel de concentración de este contaminante, los resultados
de estas mediciones se muestran a continuación cuyas unidades están dadas en microgramos por metro
cúbico (𝜇𝑔/𝑚3 ) : 34.5; 13.1; 20.3; 18.5; 19.6; 29.9; 20.7; 16.5.
a) Indique la variable que está siendo estudiada y el tipo de esta variable.
b) Calcule la varianza.
c) Calcule la desviación estándar.

Datos/Observaciones
EJERCICIO EXPLICATIVO - 1

Para estudiar la concentración de dióxido de carbono en el medio ambiente de nuestro país, se tomo una
muestra de ocho ciudades donde se midió el nivel de concentración de este contaminante, los resultados
de estas mediciones se muestran a continuación cuyas unidades están dadas en microgramos por metro
cúbico (𝜇𝑔/𝑚3 ) : 34.5; 13.1; 20.3; 18.5; 19.6; 29.9; 20.7; 16.5.
a) Indique la variable que está siendo estudiado y el tipo de esta variable.
b) Calcule la varianza.
c) Calcule la desviación estándar.

Solución
a) Variable X: Concentración en microgramos por metro cúbico de CO2 en una ciudad.

b) Para calcular la varianza primero se debe calcular la media:

34.5 + 13.1 + 20.3 + 18.5 + 19.6 + 29.9 + 20.7 + 16.5


𝑥ҧ = = 21.6375 𝜇𝑔/𝑚3
8
𝑛 2 2 2 2 2 2
2
𝑥𝑖 − 𝑥ҧ 34.5 − 21.6375 + 13.1 − 21.6375 + 20.3 − 21.6375 + ⋯ + 20.7 − 21.6375 + 16.5 − 21.6375
𝑆 =෍ = = 49.9512 𝜇𝑔/𝑚3 2
𝑛−1 8−1
𝑖=1

Datos/Observaciones
EJERCICIO EXPLICATIVO - 1

Para estudiar la concentración de dióxido de carbono en el medio ambiente de nuestro país, se tomo una
muestra de ocho ciudades donde se midió el nivel de concentración de este contaminante, los resultados
de estas mediciones se muestran a continuación cuyas unidades están dadas en microgramos por metro
cúbico (𝜇𝑔/𝑚3 ) : 34.5; 13.1; 20.3; 18.5; 19.6; 29.9; 20.7; 16.5.
a) Indique la variable que está siendo estudiado y el tipo de esta variable.
b) Calcule la varianza.
c) Calcule la desviación estándar.

c) La desviación estándar es la raíz cuadrada de la varianza:


𝑛 2
2
𝑥𝑖 − 𝑥ҧ
𝑆 =෍ = 49.9512 𝜇𝑔/𝑚3 2
𝑛−1
𝑖=1

𝑆 = 49.9512 = 7.0676 𝜇𝑔/𝑚3

La concentración de CO2 del medio ambiente de estas ocho ciudades se desvían de la media con una intensidad de 7.0676 𝜇𝑔/𝑚3 .

Datos/Observaciones
EJERCICIO EXPLICATIVO - 2

Los gastos en publicidad constituyen un elemento significativo del costo de los artículos vendidos. En
seguida aparece una distribución de frecuencias que muestra los gastos en publicidad de 50
compañías manufactureras ubicadas en el sur de Estados Unidos.
Gastos en publicidad ($ Número de
millones/año) compañías
[25 - 35[ 3
[35 - 45[ 8
[45 - 55[ 19
[55 - 65[ 14
[65 - 75[ 6
Total 50

a. Calcule el coeficiente de variación e interprete.


b. También se tienen los resultados de los gastos realizados en publicidad, por parte de una muestra
de 80 compañías manufactureras que operan en el norte de los Estados Unidos, estos son: una
media de 50 millones de dólares y desviación estándar de 6.1 millones de dólares anuales. ¿En
dónde es más homogéneo los gastos en publicidad, en el sur o norte de Estados Unidos?

Datos/Observaciones
EJERCICIO EXPLICATIVO- 2

Los gastos en publicidad constituyen un elemento significativo del costo de los artículos vendidos. En
seguida aparece una distribución de frecuencias que muestra los gastos en publicidad de 50 compañías
manufactureras ubicadas en el sur de Estados Unidos.
a. Calcule el coeficiente de variación e interprete.

Variable X: Gasto en publicidad por una compañía manufacturera del sur de Estados Unidos.

Gastos en publicidad Número de 2


𝑥𝑖 𝑥𝑖× 𝑓𝑖 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 5 2
($ millones/año) compañías 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 5512
2 2
[25 - 35[ 3 30 90 1505.28 𝑠 =෍ = = 112.4898 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠/𝑎ñ𝑜
𝑛−1 49
[35 - 45[ 8 40 320 1230.08 𝑖=1
[45 - 55[ 19 50 950 109.44
[55 - 65[ 14 60 840 808.64
[65 - 75[ 6 70 420 1858.56
𝑠 = 112.4898 = 10.6061 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠/𝑎ñ𝑜
Total 50 2620 5512

σ𝑛𝑖=1 𝒙𝒊 × 𝒇𝒊 2620 𝐶𝑉 =
10.6061
× 100% = 20.24%
𝑥ҧ = = = 52.4 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠/𝑎ñ𝑜 52.4
𝑛 50
El gasto en publicidad por parte de las compañías manufactureras del sur de los Estados Unidos
tiene una variabilidad aceptable, ya que es del 20.24%.
Datos/Observaciones
EJERCICIO EXPLICATIVO - 2

Los gastos en publicidad constituyen un elemento significativo del costo de los artículos vendidos. En
seguida aparece una distribución de frecuencias que muestra los gastos en publicidad de 50 compañías
manufactureras ubicadas en el sur de Estados Unidos.
b. También se tienen los resultados de los gastos realizados en publicidad, por parte de una muestra de
80 compañías manufactureras que operan en el norte de los Estados Unidos, estos son: una media de
50 millones de dólares y desviación estándar de 6.1 millones de dólares anuales. ¿En dónde es más
homogéneo los gastos en publicidad, en el sur o norte de Estados Unidos?

6.1
𝐶𝑉𝑁 = × 100% = 12.2%
50

6.1
𝐶𝑉𝑁 = × 100% = 12.2% < 20.24% = 𝐶𝑉𝑆
50

Comparando los coeficientes de variación de los gastos en publicidad de las compañías


manufactureras del sur y del norte de los Estados Unidos, vemos que dicho gasto es más
homogéneo en el norte de los Estados de Unidos.

Datos/Observaciones
EJERCICIO RETO N° 1

Miguel y Raúl, dos amigos inseparables, desde el colegio, estudian en la UTP, pero llevan el curso de
Estadística en las secciones 4234 y 8541 respectivamente. Un día, luego de acceder a las notas de una
muestra representativa de ambas secciones, las que se encuentran en siguiente la tabla. Miguel afirma
que los estudiantes de ambas seccionen presentan igual rendimiento en Estadística, en cambio Raúl
indica que los estudiantes de su sección son los que tienen un mejor rendimiento.

¿Quién tiene la razón? , ¿Por qué?

Sección:
13 15 14 13 14 13 14 15
4234

Sesión:
18 17 11 10 14 12 13 15
8541

Datos/Observaciones
EJERCICIO RETO N°2

The Journal New Zealand presentó a sus 2 fábricas más exitosas en productos lácteos, estas
registraron pagos mensuales a sus empleados el año pasado según los siguientes datos:

Sueldo promedio Varianza


Dana Milk $ 6930 491401 $²
Wetsland Milk $ 7100 474721 $²

1. Jeremy realizará un gran pedido a aquella fábrica que presente una variabilidad aceptable
¿Con qué fábrica hará negocios?
2. Podemos asegurar que Dana Milk presenta mayor homogeneidad en sus sueldos? ¿Por qué?
EJERCICIO RETO N° 3

Una muestra de 100 estudiantes, refleja los resultados del tiempo promedio de duración de una
llamada, estos datos se obtuvieron en The University of Arizona, los cuales se detallan en la tabla
adjunta, mientras que The University Rutgers tiene un tiempo promedio de 27 minutos, s²=158,
P50=27.
1. ¿Podemos afirmar que The University of Arizona sobrepasa el tiempo promedio de duración
de las llamadas The University Rutgers? ¿Cuál es ese tiempo?
2. Si la variabilidad es homogénea, la universidad descontará a sus estudiantes el 3% de su
pensión ¿Qué universidad realizará este descuento?
Intervalo fi

[5 - 13[ 15
[13 - 21[ 18
[21 - 29[
[29 - 37[ 22
[37 - 45[ 15
¿QUÉ HEMOS APRENDIDO HOY?

¿Qué son las medidas de dispersión?

¿Cuál es la utilidad de las medidas de dispersión?


FINALMENTE

IMPORTANTE
1. Las MD me indican Gracias por tu PARA TI
cuán alejados están
mis datos con participación 1. Revisa los
respecto a la media. ejercicios indicados
2. Las MD me permiten Ésta sesión y realiza la Tarea
Hemos visto la de ésta sesión.
verificar la
importancia de quedará grabada
confiabilidad de las 2. Consulta en el
MTC realizar un repaso
antes de una FORO tus dudas.
3. El CV es la única MD evaluación.
que nos permite
comparar grupos.

Datos/Observaciones

También podría gustarte