Está en la página 1de 21

MÉTODOS ESTADÍSTICOS

TEMA 3 MEDICIÓN DE
VARIABLES:
MEDIDAS DE DISPERSIÓN

FERNANDO SUCA
4.1 Medidas de dispersión en conjunto de datos
2

 Las medidas de dispersión ó llamadas también de


variabilidad se ocupan de describir los valores
estudiados.
 Entre las técnicas más utilizadas para medir tal
variabilidad son: el rango, los rangos modificados,
la desviación promedio, la varianza, la desviación
estándar y el coeficiente de variación.

Ing. Fernando Suca


4.1 Medidas de dispersión en conjunto de datos
3

Ejemplo 1:
 Suponga que dos máquinas empacadoras producen
paquetes con un peso medio de 10.0 onzas de cereal,
pero que en un caso la variación en los pesos no es
mayor a 0.10 onzas, mientras que en el otro caso los
pesos pueden variar hasta 1.0 onza en cualquiera de
las dos direcciones. En esta situación la medición de
la variabilidad, o dispersión, de las cantidades que se
empacan es tan importante como la medición del
promedio.

Ing. Fernando Suca


4.2 Rango
4

 El rango, R, es la diferencia entre los valores mayor y


menor de un conjunto de datos. Así, si H representa
el valor mayor del grupo y L representa el valor
menor, el rango de los datos no agrupados es:
R=H–L
Ejemplo 2:
 Durante cierto mes de verano ocho vendedores de una
empresa de calefacción y aire acondicionado vendieron los
siguientes números de unidades de aire acondicionado: 8,
11, 5, 14, 8, 11, 16, 11. El rango del número de unidades
vendidas es: R = H – L = 16 – 5 = 11.0 unidades.

Ing. Fernando Suca


4.3 Rangos modificados
5

 Un rango modificado es aquel en el cual algunos extremos,


a ambos lados de la distribución, se eliminan y no se toman
en consideración.
 El 50 por ciento central es el rango entre los valores
correspondientes al punto percentil 25 y al punto percentil
75 de la distribución.
 Es también el rango entre el primer y el tercer cuartiles de
la distribución.
 Al rango del 50 por ciento central por lo general se le
designa como rango intercuartílico (RIC). Así:
RIC = Q3 – Q1

Ing. Fernando Suca


4.3 Rangos modificados
6

Ejemplo 3:
 Los datos de ventas de unidades de aire acondicionado que
se presentaron en el ejemplo 2, en orden ascendente, son:
5, 8, 8, 11, 11, 11, 14, 16. Entonces, el número de
observaciones en esta población de datos es N =8. Para
calcular el rango intercuartílico, primero se determinan los
valores de Q3 (el punto del percentil 75) y de Q1 (el punto
del percentil 25), y luego se resta Q1 de Q3 :
Q3 = X[(75N/100)+(1/2)] = X[6+(1/2)] = X6.5 =12.5
Q3 = X[(25N/100)+(1/2)] = X[2+(1/2)] = X6.5 =8.0
RIC = Q3 – Q1 = 12.5 -8.0 = 4.5 unidades

Ing. Fernando Suca


4.4 Gráficas de caja
7

 Una gráfica de caja es una gráfica que representa la


distribución de un conjunto de datos empleando los
valores de los cuartiles como medidas de posición y el
valor del rango intercuartílico como medida de
variabilidad.
 Proporciona una forma relativamente sencilla de
representar datos y de observar la magnitud del sesgo de
la distribución. Es también denominada gráfica de caja
y bigote.
 Por su facilidad de uso, la gráfica de caja es una técnica
primordial en el análisis exploratorio de datos.

Ing. Fernando Suca


4.4 Gráficas de caja
8

Ejemplo 4: La figura siguiente presenta la gráfica de caja correspondiente a los datos de unidades
vendidas del ejemplo 3. Los puntos límites inferior y superior de la caja rectangular que aparece en la
gráfica se llaman charnelas, y por lo general se localizan en Q1 y Q3. Entonces, de acuerdo con los
valores de los cuartilares determinados en el ejemplo 3, la charnela inferior se encuentra en 8.0 y la
superior en 12.5. La línea vertical dentro de la caja indica la posición de la mediana (es decir Q 2), la
cual se encuentra en 11.0. Las líneas horizontales punteadas se llaman bigotes y se prolongan hasta los
“límites interiores”, que se encuentran a 1.5 unidades del rango intercuartílico en ambas direcciones.
Así, los bigotes se prolongan hasta:
Q1 – (1.5 x RIC) = 8.0 – (1.5)(4.5) = 1.25
Q3 – (1.5 x RIC) = 12.5 + (1.5)(4.5) = 19.25
Límite Límite Límite Límite
exterior Q1 Mediana
interior Q3 interior exterior

1.5 (RIC) 1.5 (RIC)


RIC
3.0 (RIC) 3.0 (RIC)

- 5.5 1.25 8.0 11.0 12.5 19.25 25.0

Ing. Fernando Suca


4.5 La desviación media absoluta
9

 La desviación media absoluta, ó DAM, está basada en el valor absoluto


de la diferencia entre cada valor del conjunto de datos y la media del
grupo.
 Algunas veces se llama “desviación promedio”.
 Se determina entonces el promedio de la media de estos valores
absolutos. Se usan los valores absolutos de las diferencias porque la
suma de todas las diferencias, positivas y negativas (en lugar de las
diferencias absolutas), siempre es igual a cero.
 Las formulas para la DAM poblacional y muestral son:
σ[X−μ]
DAM poblacional =
N
σ[X− ]
DAM muestral = N

Ing. Fernando Suca


4.5 La desviación media absoluta
10
Ejemplo 5: Tabla. Hoja de cálculo para el cálculo de la
desviación promedio de los datos de ventas
 Para los datos de ventas de
(µ = 10.5)
acondicionadores de aire que se
dan en el ejemplo 2, la media X X-µ │X- µ│
aritmética es 10.5 unidades. 5 - 5.5 5.5
Mediante los cálculos de la 8 - 2.5 2.5
tabla siguiente, la desviación 8 - 2.5 2.5
media absoluta se determina
11 0.5 0.5
como sigue:
21.0
11 0.5 0.5
σ[X−μ]
DAM poblacional = = = 11 0.5 0.5
N 8
2.625 ≈ 2.6 unidades 14 3.5 3.5
Entonces, se puede decir que en promedio las 16 3.5 5.5
unidades vendidas por un vendedor difieren Total 21.0
de la media del grupo en 2.6 unidades, en
cualquiera de las dos direcciones.
Ing. Fernando Suca
4.6. La varianza y la desviación estándar
11

 La varianza se parece a la desviación media absoluta


en que se basa en la diferencia entre cada valor del
conjunto de datos y la media del grupo.
 Difiere en algo muy importante: cada diferencia se
eleva al cuadrado antes de sumarse.
 La varianza de una población se representa por V(X)
o más comúnmente, por la letra griega minúscula σ2
(léase “sigma al cuadrado”). La fórmula es:
σ(𝑋 − μ)2
V(X) = σ2 =
𝑁

Ing. Fernando Suca


4.6. La varianza y la desviación estándar
12

 La varianza muestral no es exactamente equivalente, desde el punto


de vista del cálculo, a la varianza poblacional. El denominador en la
fórmula para la varianza muestral es ligeramente diferente. Se trata
de un factor de corrección que se incluye, con el objeto de que la
varianza muestral sea un estimador no sesgado de la varianza
poblacional. Se representa por s2. Su fórmula es:
σ(𝑋 − )2
s2 = 𝑛 −1
 Es difícil interpretar el significado del valor de la varianza porque
las unidades en las que se expresa son valores al cuadrado. En parte,
por esta razón, se usa con más frecuencia la raíz cuadrada de la
varianza, presentada con la letra griega σ (o s cuando se trata de una
muestra), y se llama desviación estándar. Las fórmulas son:
Desviación estándar poblacional Desviación estándar muestral
Son útiles en
σ(𝑋 − μ)2 σ(𝑋 − )2 Distribución
σ= s= Normal
𝑁 𝑛 −1
Ing. Fernando Suca
4.6. La varianza y la desviación estándar
13
Ejemplo 6: Tabla. Hoja de cálculo para calcular la
desviación estándar poblacional de los
Para los datos de ventas de datos de ventas (µ = 10.5)
acondicionadores de aire que
se dan en el ejemplo 2 la X X-µ (X- µ)2
media aritmética es 10.5 5 - 5.5 30.25
unidades. Si se considera que
8 - 2.5 6.25
estos datos de ventas
mensuales son la población 8 - 2.5 6.25
estadística de interés, la 11 0.5 0.25
desviación estándar se 11 0.5 0.25
determina, a partir de los 11 0.5 0.25
cálculos de la tabla siguiente: 14 3.5 12.25
σ(𝑋 − μ)2 86
σ= = = 10.75 = 3.3 16 3.5 30.25
𝑁 8
Total 86.00

Ing. Fernando Suca


4.7 Cálculos simplificados para la varianza y la
desviación estándar
14
 Se han deducido otras
Varianza σ𝑋 2 + 𝑁μ2
fórmulas que son poblacional: σ2 =
𝑁
matemáticamente
equivalentes pero que no
Desviación estándar
requieren la poblacional: Σ𝑋 2 − 𝑁μ2
σ=
determinación de la 𝑁
desviación de cada uno
de los valores respecto a σ𝑋 2 + 𝑛 2
la media. Son más fáciles Varianza muestral: s2 =
𝑛 −1
de usar, se les llama
fórmulas de cálculo, y Desviación estándar Σ𝑋 2 − 𝑛 2
muestral: s=
son las siguientes: 𝑛 −1

Ing. Fernando Suca


4.7 Cálculos simplificados para la varianza y la
desviación estándar
15
Ejemplo 7: Con los datos de Σ𝑋 2 − 𝑁μ2 968 − 8(10.5)2
las ventas de σ= =
𝑁 8
acondicionadores de aire, se
calcula la desviación estándar = 10.75 = 3.3 unidades
poblacional mediante el uso
X X2
de la fórmula de cálculo y de 5 25
Hoja de cálculo
la tabla 4.3 para demostrar 8 64
para calcular la
que el resultado es el mismo desviación 8 64
al obtenido en el Ejemplo 6 estándar 11 121
empleando la fórmula de las poblacional de 11 121
los datos de
desviaciones. La media de ventas
11 121
14 196
estos datos es 10.5 unidades.
16 256
Total 968

Ing. Fernando Suca


4.8 Uso de la desviación estándar para la
descripción de datos
16

 Consideremos una distribución de valores de datos que sea


asimétrica y mesocúrtica (ni achatada ni puntiaguda).
 La curva de frecuencias de una distribución así se llama curva
normal.
 En un conjunto de valores que tienen distribución normal siempre
se tiene que aproximadamente 68% de los valores se encuentra a no
más de una desviación estándar de la media y aproximadamente
95% de los valores se sitúa a no más de dos unidades de desviación
estándar de la media.

a) b)
f f

68%
95%
µ - 1σ µ µ + 1σ X µ - 2σ µ µ + 2σ X

Ing. Fernando Suca


4.8 Uso de la desviación estándar para la
descripción de datos
17

Ejemplo 8:
 En un área residencial se observa que los recibos de
energía eléctrica tienen distribución normal. Si se calcula
que la media de los recibos de energía eléctrica es $84.00
y la desviación estándar $24.00, entonces se concluye
que aproximadamente 68% de las cantidades facturadas
están a no más de $24.00 de la media, esto es, entre
$60.00 y $108.00. También se concluye que
aproximadamente 95% de las cantidades facturadas
están a no más de $48.00 de la media, esto es entre
$36.00 y $132.00.

Ing. Fernando Suca


4.9 El coeficiente de variación
18

 El coeficiente de variación, CV, indica la magnitud


relativa de la desviación estándar en comparación
con la media de la distribución de las mediciones,
como porcentaje. Así, las fórmulas son:
Población Muestra
𝜎 𝑠
CV = x 100 CV = x 100
𝜇
 El coeficiente de variación es útil cuando se desea
comparar la variabilidad de dos conjuntos de datos
en relación con el nivel general de los valores (y por
tanto en relación con la media) de cada conjunto.
Ing. Fernando Suca
4.9 El coeficiente de variación
19

Ejemplo 9:
 Para dos emisiones de acciones de la industria electrónica, el precio de
cierre medio diario en el mercado durante un periodo de un mes fue
para la acción A de $150 con una desviación estándar de $5. Para la
acción B, el precio medio fue de $50 con una desviación estándar de
$3. Basándose en una comparación absoluta, la variabilidad en el
precio de la acción A fue mayor, debido a que la desviación estándar es
mayor. Pero en relación con el nivel de precios, deben compararse los
respectivos coeficientes de variación:

𝜎 5 𝜎 3
CV (A) = x 100 = x 100 = 3.3% y CV (B) = x 100 = x 100 = 6.0%
𝜇 150 𝜇 50

 Por lo tanto, en relación con el nivel promedio de precios de cada


emisión de acciones, se concluye que la acción B ha tenido una
variación casi del doble que la acción A.
Ing. Fernando Suca
4.10 El coeficiente de asimetría de Pearson
20

 El coeficiente de asimetría de Pearson mide el desvío


de la simetría expresando la diferencia entre la
media y la mediana en relación con la desviación
estándar del grupo de mediciones. Las fórmulas son
3(𝜇 −Med)
Asimetría de la población =
𝜎
3( −Med)
Asimetría de la muestra =
𝑠
 En una distribución simétrica, el valor del coeficiente de asimetría
siempre será cero, ya que la media y la mediana son de igual valor.
En una distribución con sesgo positivo, la media siempre es mayor
que la mediana; por tanto, el valor del coeficiente es positivo. En
una distribución con sesgo negativo, la media siempre es menor que
la mediana; por tanto, el valor del coeficiente es negativo.
Ing. Fernando Suca
4.10 El coeficiente de asimetría de Pearson
21

Ejemplo 10:
En los datos de ventas de los equipos de aire acondicionado
que se presentaron en el ejemplo 2, la media es 10.5
unidades, la mediana es 11.0 unidades y la desviación
estándar es 3.3 unidades. El coeficiente de asimetría es:

3(𝜇 −Med) 3(10.5 −11.0)


Asimetría = = = −0.45
𝜎 3.3

Por tanto, la distribución de los montos de las ventas tiene


un sesgo ligeramente negativo, es decir, a la izquierda.

Ing. Fernando Suca