Está en la página 1de 24

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Dpto. de Estadística e Informática

Semana 4. Medidas de variabilidad


• Motivación
• Logros
Inicio • Saberes previos

• Medidas de variabilidad
• Propiedades de transformación de variables
Desarrollo • Ejercicios resueltos

• Ejercicios propuestos
• Autoevaluación (Moodle)
Cierre

2
Los productores de leche del valle de Cajamarca:
 ¿Su producción diaria de leche (litros) por productor, es muy
similar?
 ¿La producción diaria de leche (litros), con la raza Hoistein es
más variable que con la raza Jersey?

3
Al término de la sesión, el estudiante estará en capacidad de:

 Calcular e interpretar medidas de variabilidad.


 Comparar la variabilidad de varios conjunto de datos.
 Aplicar las propiedades de transformación de variables.
 Resolver ejercicios propuestos.

¿Qué se entiende por variabilidad en un conjunto de


datos?
¿Porqué es importante medir la variabilidad?
¿Para qué sirven las medidas de variabilidad?
4
Rango y Rango intercuatil

Variancia y desviación estándar

Coeficiente de variabilidad

Transformación de variables

Ejemplos, ejercicios resueltos y propuestos

Autoevaluación (Aula virtual)

5
Son medidas de variabilidad permiten conocer el grado de
dispersión o variabilidad dentro de un conjunto de datos.
Se usan para comparar la variabilidad entre dos o más
conjuntos de datos. Cuando los datos presentan baja
variabilidad, se dice que son homogéneos y cuando
presentan alta variabilidad se dice que son heterogéneos.
Las principales medidas de variabilidad son las siguientes:

•La amplitud o rango


•El rango intercuartílico
•La variancia y la desviación estándar
•El coeficiente de variabilidad

6
Ejemplo 1.
Considerar los siguientes datos como las notas de la
primera práctica de una muestra de alumnos cada una de
las tres secciones de una asignatura:

Grupo Notas Media


A 14 14 14 14 14 14 14 14 14 14 14
B 14 13 15 14 12 15 16 13 12 16 14
C 19 8 19 11 16 18 6 13 10 20 14

Los grupos A, B y C tienen la misma media pero


diferente dispersión en torno a la media.
• Respecto a la variabilidad o dispersión: A < B < C
• Respecto a la homogeneidad : A > B > C
• Respecto a la confiabilidad de la media: A > B > C

7
El rango o amplitud de un conjunto de observaciones es
igual a la diferencia entre el valor máximo y el valor
mínimo.
R = Xmax – Xmin
Desventajas:
• Esta afectada por valores extremos
• No mide la variabilidad de los datos intermedios
Ejemplo 2.
Notas de PC1: 14,13,15,14,12,15,16,13,12,16,18,14,16
Hallar e interpretar el rango.
R = 18 – 12 = 6 puntos.
Interpretación. La amplitud de la nota de la primera
práctica fue de 6 puntos.
8
El rango intercuartílico, se calcula como la diferencia entre el
percentil 75 (P75 = Q3) y el percentil 25 (P25 = Q1).

RI = P75 - P25
El RI corresponde al rango del 50% central de los datos.

Ejemplo 3.
Notas de PC1: 12,12,13,13,14,14,14,15,15,16,16,16,18
Hallar e interpretar el rango intercuartílico.
Pos=25(14/100)=3.5, P25=13+0.5x(13-13)=13
Pos=75(14/100)=10.5, P75=16+0.5x(16-16)=16
RI = 16 – 13 = 3 puntos.
Interpretación. La amplitud del 50% central de las
notas de la primera práctica fue de 3 puntos .
9
La variancia es el promedio de la suma de cuadrados de
las desviaciones respecto a la media.
1 N 2 2
Poblacional:   N 
1 N
X j    N  X j  N  
2 2

j 1  j 1 
1  n 2
1 n
    X j  n X 
2

Muestral: S 
2
Xj X  2

n  1 j 1 n  1  j 1 

Desviación estándar muestral: S  S 2

Para una tabla de frecuencias:


1 k 1 k

 ( f i X i  n X )
2
S 
2
fi ( X i  X ) 
2 2

n  1 i 1 n  1 i 1
donde k número de categorías
10
Ejemplo 4.
Halle la variancia y desviación estándar muestral de las
notas de la primera práctica para los 3 grupos.
Grupo Notas Media x
A 14 14 14 14 14 14 14 14 14 14 14 1960
B 14 13 15 14 12 15 16 13 12 16 14 1980
C 19 8 19 11 16 18 6 13 10 20 14 2192
1  10 2 2
S  2
  xi  n x  
n  1  i1
1

1960  10 x142   0 y SA  0
 10  1
A

1  10 2 2
S 
2
  xi  n x  
n  1  i1
1

1980  10 x142   2.22 y S B  2.22  1.49
 10  1
B

1  10 2 2
S 
2
  xi  n x  
n  1  i1
1
2192  10 x142   25.78 y SC  25.78  5.08
 10  1
C

Las notas del grupo C son más variables que las del grupo B. Las
notas del grupo A es cero, son una constante. 11
El coeficiente de variabilidad es una medida de dispersión
relativa (no tiene unidades) y se define como la razón
entre la desviación estándar y la media aritmética de un
conjunto de observaciones.
 s
Poblacional: CV   100 Muestral: cv   100
 x
Ejemplo 5.
Halle el coeficiente de variabilidad de las notas de la
primera práctica para el grupo B.
SB 1.49
cvB  x100  x100  10.6%
xB 14
Interpretación. La variabilidad de la primera práctica
del grupo B es 10.6%. 12
Ejemplo 6.
Los siguientes datos corresponden al tiempo (en minutos),
al cabo del cual se duermen las ratas después de haber
recibido un tipo de tranquilizante (A o B).
Tipo A Tipo B
n 18 ratas 20 ratas
x 9.94 min 15.2 min
s 2.81 min 2.84 min

¿Con qué tranquilizante el tiempo es más homogéneo?

2.81 2.84
cvA  100%  28.27 % cvB  100%  18.68 %
9.94 15.2
Por lo tanto, el tranquilizante B tiene tiempos más
homogéneas que el A.
13
Ejercicio 1.
Los siguientes datos
corresponden a las mediciones
de la emisión diaria (en
toneladas) de óxido de azufre
de una planta industrial.

15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4


22.7 18.5 15.2 11.0 7.7 20.0 16.2

Calcule e interprete las medidas de variabilidad (Rango, Rango


intercuartílico, Varianza, Desviación estándar y Coeficiente de
variación).

14
Solución.
Los siguientes datos corresponden a las mediciones de la
emisión diaria (en toneladas) de óxido de azufre de una
planta industrial.
15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4
22.7 18.5 15.2 11.0 7.7 20.0 16.2

X=Mediciones diarias de óxido de azufre, n=15 mediciones

 Rango: r = Max-Min=26.4-7.7=18.7
Interpretación. La amplitud de la emisión de óxido de
azufre fue 18.7 Tn.
 Rango intercuartil: RI=P75–P25 = 22.7–11.2 = 11.5
P25: Pos=25x(15+1/100)=4, P25=11.2
P75: Pos=75x(15+1/100)=12, P75=22.7
Interpretación. La amplitud del 50% central de la
emisión de óxido de azufre fue 11.5 Tn.
15
Solución.
Variancia: X 2
i − nxX 2
S2 =
n−1
ΣXi=15.8+26.4+…+16.2 = 253.7, X = 16.91
ΣX2i=15.82+26.42+…+16.22 = 4755.67
S2 = (4755.67-15x16.912)/14 = 33.19
Interpretación. La variancia de la emisión de óxido de azufre fue
33.19 Tn2.
Desviación estándar: 𝐒 = 𝐒𝟐 = 𝟑𝟑. 𝟏𝟗 = 𝟓. 𝟕𝟔
Interpretación. La desviación estándar de la emisión de óxido
de azufre fue 5.76 Tn.
Coeficiente de variación.
𝐒 𝟓. 𝟕𝟔
𝐜𝐯 = 𝐱𝟏𝟎𝟎 = 𝐱𝟏𝟎𝟎 = 𝟑𝟒. 𝟏%
𝐗 𝟏𝟔. 𝟗𝟏
Interpretación. La variación de la emisión de óxido de azufre es
34.1%
16
Comparación de la variabilidad
Para comparar la variabilidad entre dos o más conjuntos
de datos, se debe considerar:
Unidades de Unidades de medidas iguales
medidas
Medias Medias
diferentes
similares diferentes
cv1 con cv2 S1 con S2 cv1 con cv2

Propiedades de transformación de datos


Sea la variable Y, entonces para
Medida Y  a  bX Y  bX Y a X
S 
2
Y
b 2 S X2 2
b S 2
X S X2
SY  bS X bS X SX
17
Ejemplo 7.
Se presentan las medidas estadísticas de las ventas
(soles) y tiempo extra (horas) de los vendedores de dos
zonas (A y B).
Desviación Coeficiente de
Promedio
estándar variabilidad
Zona Ventas Tiempo Ventas Tiempo Ventas Tiempo
A 236.3 3.5 82.6 1.5 35.0 42.9
B 450.5 3.6 98.5 2.8 21.9 77.7

a. ¿Las ventas de la zona A son menos variables que las de la zona B?.
Falso, cvA = 35.0% > cvB = 21.9% (Promedio diferentes)
b. El tiempo extra de la zona B muestra más variabilidad que la zona A.
Verdadero, SB = 2.8 > SA = 1.5 (Promedio similares)
c. Para la zona A, las ventas son menos variables que el tiempo extra.
Verdadero, cvVentas = 35.0% < cvTiempo = 42.9% (Variables diferentes)

18
Ejercicio 2
Los sueldos de 100 trabajadores de
una empresa de servicios de
limpieza tienen una media de $300
y una desviación estándar de $50.
Se proponen dos alternativas de
aumento:
Alternativa A: Aumentarles $75 a
cada uno;
Alternativa B: Aumentarles el 15%
del sueldo más $20 a cada uno.
¿Cuál de las alternativas será la
más conveniente para los siguientes
casos:?. Justifique su respuesta.
a. Si la empresa dispone sólo de $37000 para pagar el aumento
de sueldos.
b. Si la empresa quiere tener los aumentos de sueldos más
homogéneos.
19
Solución: 𝐧 = 𝟏𝟎𝟎, 𝐗 = 𝟑𝟎𝟎, 𝐒 = 𝟓𝟎
a. Calculando el monto total requerido: X 
 X
 Total   X  n  X
n
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐀: 𝐘𝐀 = 𝐗 + 𝟕𝟓 ⟹ 𝐘𝐀 = 𝟑𝟎𝟎 + 𝟕𝟓 = 𝟑𝟕𝟓 ⟹ 𝐓𝐨𝐭𝐚𝐥 = 𝐘𝐢 = 𝟏𝟎𝟎𝐱𝟑𝟕𝟓 = 𝟑𝟕𝟓𝟎𝟎

𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐁: 𝐘𝐁 = 𝟏. 𝟏𝟓𝐗+𝟐𝟎 ⟹ 𝐘𝐁 = 𝟏. 𝟏𝟓𝐱𝟑𝟎𝟎 + 𝟐𝟎 = 𝟑𝟔𝟓 ⟹ 𝐓𝐨𝐭𝐚𝐥 = 𝐘𝐢 = 𝟏𝟎𝟎𝐱𝟑𝟔𝟓 = 𝟑𝟔𝟓𝟎𝟎

Entonces, puesto que solo se tienen $37000 disponibles, se


escoge la alternativa B que sólo se necesita $36500.

b. Calculando los coeficientes de variación


𝟓𝟎
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐀: 𝐘𝐀 = 𝐗 + 𝟕𝟓 ⟹ 𝐒𝐘 = 𝐒𝐗 = 𝟓𝟎 ⟹ 𝐜𝐯𝐘 = 𝐱𝟏𝟎𝟎 = 𝟏𝟑. 𝟑%
𝟑𝟕𝟓
𝟓𝟕. 𝟓
𝐀𝐥𝐭𝐞𝐫𝐧𝐚𝐭𝐢𝐯𝐚 𝐁: 𝐘𝐁 = 𝟏. 𝟏𝟓𝐗 + 𝟐𝟎 ⟹ 𝐒𝐘 = 𝟏. 𝟏𝟓𝐒𝐗 = 𝟓𝟕. 𝟓 ⟹ 𝐜𝐯𝐘 = 𝐱𝟏𝟎𝟎 = 𝟏𝟓. 𝟖%
𝟑𝟔𝟓
Entonces, se escoge la alternativa A, puesto que tienen menos
variabilidad
20
Ejercicio 3.
En la siguiente tabla se presenta la distribución de número de parcelas
que poseen cada agricultor en una muestra al azar de 50 de la sierra
central.
Número de parcelas Número de agricultores
Xi fi
1 5
2 15
4 12
5 10
6 8
Total 50
Halle e interprete él coeficiente de variación.

2
fX 2
 nX
S 2
 i i

n 1
Σ fiXi =5x1+15x2+12x4+10x5+8x6 = 181 𝐗 = 𝟑. 𝟔𝟐
Σ fiX2i =5x12+15x22+12x42+10x52+8x62 = 795
S2 = (795 - 50x3.622)/49 = 2.85, S=1.69
cv = (1.69/3.62)x100 = 46.7%
21
Ejercicios propuestos.
1. En un supermercado se determinó que el tiempo que demora
una cajera en atender a los clientes tiene un Coeficiente de
Variación de 0.4, la empresa decide cambiar el tipo de
máquinas registradoras con lo cual los tiempos de atención al
cliente disminuyen en 2 minutos y el coeficiente de variación
es ahora de 60%. Determinar el tiempo promedio y la
desviación estándar de los tiempos de atención, antes y
después del cambio de máquinas registradoras.

22
2. Para evaluar la efectividad de sus empleados, una empresa
dedicada a la venta de teléfonos celulares ha recopilado la
siguiente información sobre el número de teléfonos vendidos
en la última semana por sus 64 empleados:
Número de empleados 13 15 16 8 5 4 3
Número de ventas 5 6 7 8 9 10 11

a. Calcule e intérprete las medidas de variabilidad.


b. La empresa le paga a sus empleados 100 soles semanales más
una comisión de 40 soles por celular vendido y sobre estos
ingresos los empleados deben aportar el 15% a su AFP. Calcule
el promedio y la desviación estándar para el ingreso neto
promedio semanal por empleado.

23
Referencias bibliográficas
 Anderson D., Sweendy D., Williams T. (2016) Estadística para
Administración y Economía. 12ª. Edición. México. Cengage
Learning Editores. Capítulo 3.
 Newbold, P. y Carlson, W. y Thorne, B. (2008). Estadística para
Administración y Economía (6ta. ed.) Madrid: Pearson
Education. Prentice Hall

24

También podría gustarte