Está en la página 1de 39

MEDIDAS DE DISPERSION

 i  nX
2 2
X
S2  i 1
n
4. MEDIDAS DE DISPERSIÓN
I. DATOS NO AGRUPAOS.
Todos los valores representativos discutidos en las secciones
precedentes, han sido una especie de promedio o medida de
posición. Sin embargo, el uso de un solo valor para describir
una distribución oculta muchos hechos importantes.
Por ejemplo, dos grupos separados de datos pueden contener
la misma media, pero un grupo puede estar más disperso o
esparcido alrededor del valor promedio que el otro.
Por lo que es necesario una medida de la dispersión,
esparcimiento o variación para ayudar a definir más
completamente la distribución.

04/01/2015 2
A. AMPLITUD TOTAL (A)

Se define como la diferencia entre el valor máximo


(Vmáx) y el valor mínimo (Vmín), es decir:

A = Vmáximo – Vmínimo

04/01/2015 3
AMPLITUD TOTAL:
Representa la medida de variación más simple y la que
presenta mayor valor intuitivo.
Una desventaja de la amplitud como medida de variación es
su medida a aumentar a medida que aumenta el tamaño de la
muestra (número de observaciones).
Sería deseable que para medir la variación, dicho valor
permanezca lo más estable posible, independiente del número
de observaciones. Además, sobre una base intuitiva, la
amplitud sólo utiliza las dos observaciones extremas
desestimando toda la información relacionada con la
variación que puede obtenerse a partir de las restantes
observaciones.

04/01/2015 4
Ejemplo 1:

Determinar la amplitud de la siguiente serie de datos:


139, 149, 159, 179
De acuerdo a la definición, se tiene que el Vmáx = 179 y el
Mmin = 139, por consiguiente:
A = 179 – 139 = 40
A veces se acostumbra mencionar solamente el valor mínimo
y el valor máximo. En relación a nuestro ejemplo, tenemos
que los datos están muy concentrados o apiñados en dicho
intervalo.

04/01/2015 5
B. VARIANZA (S2)Y DESVIACIÓN ESTÁNDAR (S)

La varianza es una medida de dispersión que cuantifica la


variabilidad de los datos con respecto a la media aritmética. Se
define como el promedio de las desviaciones al cuadrado de cada
uno de los datos con respecto a la media.
Simbólicamente podemos expresarlo como:
Dado un conjunto de n datos X1, X2, ..., Xn con una media
aritmética
n

X
n n

 i
X  X 2

 i
X  X 2
i
X i 1
S 
2 i 1
s 
2 i 1
n
n n -1

04/01/2015 6
Propiedades de la varianza:

a) El valor de la V (X) es mayor o igual que cero cualquiera


sea su distribución.
b) La varianza de una variable que toma el mismo valor es
cero.
c) La varianza de la suma de una variable y una constante
es igual a la varianza de la variable V (X + K) = V (X).
d) La varianza del producto de una constante por una
variable es igual al producto del cuadrado de la constante
por la varianza de la variable V (kX) = k2 V (X).
e) Consideremos un ejemplo que nos permita demostrar las
propiedades mencionadas anteriormente

04/01/2015 7
Fórmula de la varianza:
n

 Xi  X 2

S2  i 1
2
n  n

  Xi 
 i 1 
n


n

X 
2
 nX
2
2 X i
i n
S2  i 1 S 
2 i 1

n n

Las tres fórmulas anteriores nos conducen al mismo resultado

04/01/2015 8
Ejemplo 2:
Consideremos la siguiente serie de datos:
4, 7, 8, 3, 5, 9, 10, 2
Se pide calcular la varianza de este conjunto de datos.
Solución
Tomando la fórmula (1) de la varianza, primero la media
aritmética, es decir:

4  7  8  3  5  9  10  2 48
X  6
8 8

04/01/2015 9
Aplicando la formula:

Ahora encontraremos la varianza de acuerdo a la


definición:
n

 X  X 
2
i
S2  i 1
n

(4  6) 2
 (7  6) 2
 (8  6) 2
 ...  (2  6) 2
S 
2

8
60
S   7.5
2

8
04/01/2015 10
Usando las otras formulas:

a.- Utilizando la fórmula (2) de la varianza, primero


encontramos:
348  8 * 6 2
348  288
S    7.5
X X2 2
4 16 8 8
7 49
8 64 b.- Utilizando la fórmula (3) de la varianza,
3 9 tomando los mismos resultados hallados
5 25 previamente para la fórmula (2), es decir:
9 81
10 100
348  48 2
/8 60
2 4 S 
2
  7.5
48 348 8 8
04/01/2015 11
Varianza para muestras pequeñas:
Como podemos observar, la varianza puede calcularse por
cualquiera de las tres fórmulas y obtener el mismo resultado.
La desventaja que tiene la varianza es que hay dificultad en su
interpretación por que las unidades que utiliza están elevadas
al cuadrado.
Por otro lado, cuando se trabaja con muestra, se hace una
corrección con el denominados y en lugar de considerar n,
consideramos n-1, por consiguiente la varianza muestral se
calcula con:
n

 i
X  X 2

s2  i 1
n -1
04/01/2015 12
DESVIACIÓN ESTÁNDAR ( S )

A pesar que la varianza cuantifica correctamente la


variabilidad de las observaciones de los datos con respecto a
la media, sin embargo hay dificultades en su interpretación,
por que sus unidades están expresadas al cuadrado, por
consiguiente una medida alternativa es la DESVIACIÓN
ESTÁNDAR (σ) y se define como la raíz cuadrada de la
varianza, es decir:

n
n

 X i  X
2 
 i
X  X 2

S S 2
S i 1 s i 1
n n -1

04/01/2015 13
Ejemplo 3:
Supóngase que se tiene la estancia en días de 6 pacientes que
fueron admitidos en un hospital
3, 4, 7, 2, 6, 5
Se pide calcular la desviación estándar mediante la fórmula.

X X2 Solución
3 9 Primeramente necesitamos calcular:
4 16
7 49 27 2
2 4
139 
s2  6  3.5  1.87
6 36
5
5 25
27 139

04/01/2015 14
4. MEDIDAS DE DISPERSIÓN
I. DATOS AGRUPAOS:

Varianza (S2).
En este caso interviene las marcas de clase Xi con su respectiva
frecuencia fi, entonces la varianza quedará definida como:
2

m

  fkXk 
 k 1 
m

 
m

 f k X k  X 
2
2 f X
k k
n
S2  k 1 S 
2 k 1
n n
Donde m es el número de intervalos.

04/01/2015 15
Desviación estándar (S).
Por consiguiente, la desviación estándar está dada por:

S S 2

2 2
m
  m

  fkXk   k k 
f X
 k 1   k 1 
m m

 f X
k k
2

n
 f X
k k
2

n
S k 1
s k 1
n n -1

04/01/2015 16
Ejemplo 4:
Tomando los datos del ejemplo 11, calcular la desviación
estándar con la fórmula (10).

Edad xi fi fixi fixi2


55 - 58 56.5 20 1130.0 63845.0
59 - 62 60.5 30 1815.0 109807.5
63 - 66 64.5 80 5160.0 332820.0
64 - 70 68.5 70 4795.0 328457.5
71 - 74 72.5 40 2900.0 210250.0
75 - 78 76.5 10 765.0 58522.5
Total 250 16565.0 1103702.5

04/01/2015 17
Solución

Reemplazando en la fórmula:

165652
1103702.5 
S 250  4.94
250
S= 4.94, quiere decir que los datos se dispersan en promedio,
4.94 con respecto al valor central.
La varianza será:

S  4.94  24.4
2 2

04/01/2015 18
Ejemplo 5:

A continuación se tiene la siguiente serie de datos:


4, 5, 7, 6, 3
con media aritmética 5 y varianza 2.
A cada uno de los datos de la serie le vamos a agregar el valor
de 2, interesa encontrar la varianza de los nuevos datos.
Se tiene que la serie original es:

04/01/2015 19
Solución

xi + 2
xi yi yi2 yi-7 (yi-7)2 𝐘=7
4 6 36 -1 1
10
5 7 49 0 0
S 
2
2
7 9 81 2 4 5
6 8 64 1 1
3 5 25 -2 4 𝐒𝐲𝟐 = 𝐒𝐱𝟐 = 𝟐
35 10
𝐒𝐱𝟐 = 𝐒𝐘𝟐 = 𝟐
Como se puede apreciar la varianza de los nuevos datos sigue
siendo la misma de los datos originales (se cumple la propiedad 3).

04/01/2015 20
Caso:
Si a los datos originales le multiplicamos por la constante
2, se pide encontrar la varianza de estos nuevos datos.

2xi
xi yi yi2 yi-10 (yi-10)2
4 8 64 -2 4 𝐘 = 10
5 10 100 0 0
40
7 14 196 4 16
S 
2
8
6 12 144 2 4 5
3 6 36 -4 16
50 40 𝐒𝐲𝟐 = 𝒌𝟐 𝐒𝐱𝟐 = 𝟖

04/01/2015 21
Otras formulas de calculo de la S2:

𝐒𝐱𝟐 = 𝐒𝒅𝟐′
2
 ' 
 f d   
m m

k
' 2
k   fk dk 
Sd2'  k 1
  k 1  d' X  X 0
n  n 
 
 
𝐒𝐱𝟐 = 𝐜 𝟐 𝐒𝐝𝟐′′
2
 
 f d   
m m

k
'' 2
k   f k d 'k'  d' X X0
Sd2''  k 1
  k 1  d'' 
n  n  c c
 
 
04/01/2015 22
2
 m 
 f d   
m
  f k d 'k
2
k
'
k 
Ejemplo: Sd2 '  k 1
  k 1 
n  n 
 
 

𝐒𝐱𝟐 = 𝐒𝒅𝟐′
X´ i-1 X´ i Xi fi d' d' fi d' 2 fi
10 20 14,5 10 -15,5 -155 2402,50
20 30 24,5 18 -5,5 -99 544,50
30 40 34,5 32 4,5 144 648,00
40 50 44,5 20 14,5 290 4205,00
50 60 54,5 15 24,5 367,5 9003,75
d' X  X 0
60 70 64,5 5 34,5 172,5 5951,25
Total 100 720 22755,00
Media 7,2 227,55
Varianza 175,71
D. Estand 13,26
Me Sup 30

04/01/2015 23
2
 m 
   
m

 k k   f k d 'k'
2
f d ''

Ejemplo: Sd2 ''  k 1
  k 1 
n  n 
 
 

𝐒𝐱𝟐 = 𝐜 𝟐 𝐒𝐝𝟐′′
X´ i-1 X´ i Xi fi d'' d'' fi d'' 2 fi
10 20 14,5 10 -2,0 -20 40,00
20 30 24,5 18 -1,0 -18 18,00
30 40 34,5 32 0,0 0 0,00
d' X X0
40 50 44,5 20 1,0 20 20,00
d'' 
50 60 54,5 15 2,0 30 60,00 c c
60 70 64,5 5 3,0 15 45,00
Total 100 27 183,00
Media 0,27 1,83
Varianza 175,71
D. Estand 13,26

04/01/2015 24
Ejemplo:
Calcular la desviación estándar de la distribución de frecuencia que
aparece a continuación.
(X i- 37.2)2
X´ i-1 X´ i Xi fi X if i (X i- 37.2)2 fi

10 20 14,5 10 145,0 515,29 5152,90


20 30 24,5 18 441,0 161,29 2903,22
30 40 34,5 32 1104,0 7,29 233,28
m

 f k X k  X 
2 40 50 44,5 20 890,0 53,29 1065,80
50 60 54,5 15 817,5 299,29 4489,35
S2  k 1
n 60 70 64,5 5 322,5 745,29 3726,45
Total 100 3720,0 17571,00
Media 37,20
Varianza 175,71
D. Estand 13,26

04/01/2015 25
Ejemplo:
Calcular la desviación estándar por el primer método simple de
la distribución de frecuencia que aparece a continuación.
X´ i-1 X´ i Xi fi d' d' fi d' 2 fi
10 20 14,5 10 -15,5 -155 2402,50
20 30 24,5 18 -5,5 -99 544,50
30 40 34,5 32 4,5 144 648,00
40 50 44,5 20 14,5 290 4205,00
50 60 54,5 15 24,5 367,5 9003,75
60 70 64,5 5 34,5 172,5 5951,25
Total 100 720 22755,00
Media 7,2 227,55
Varianza 175,71
D. Estand 13,26

2
 m 
 f d   
m
  f k d 'k
2
k
'
k 
Sd2 '  k 1
  k 1  V(X) = V(d’)
n  n 
 
 
04/01/2015 26
Ejemplo:
Calcular la desviación estándar por el segundo método simple de
la distribución de frecuencia que aparece a continuación.
X´ i-1 X´ i Xi fi d'' d'' fi d'' 2 fi
10 20 14,5 10 -2,0 -20 40,00
20 30 24,5 18 -1,0 -18 18,00
30 40 34,5 32 0,0 0 0,00
40 50 44,5 20 1,0 20 20,00
50 60 54,5 15 2,0 30 60,00
60 70 64,5 5 3,0 15 45,00
Total 100 27 183,00
Media 0,27 1,83
Varianza 175,71
D. Estand 13,26
2

    
m m

 f k d 'k'   f k d 'k'
2

Sd2 ''  k 1
  k 1  V(X) = c 2V(d’’)
n  n 
 
 
04/01/2015 27
COEFICIENTE DE VARIACIÓN

Es una medida de dispersión relativa de la desviación


estándar con respecto a la media, es decir:
𝐒
𝐂𝐕 = 𝟏𝟎𝟎
𝐗
• El coeficiente de variación no tiene unidades.
• Este coeficiente se utiliza para comparar la dispersión o
variabilidad de dos conjuntos de datos expresados en
diferentes unidades.
• Es más, aunque se use la misma unidad de medición, las dos
medidas de dispersión usadas pueden ser muy diferentes.

04/01/2015 28
COEFICIENTE DE VARIACIÓN

S
CV  *100
X
 Así si se compara la desviación estándar de los pesos de los niños
de primer grado con la desviación estándar de los jóvenes de 1°
de facultad de ciencias, es posible que se encuentre que la
desviación estándar de estos últimos sea numéricamente mayor
que la de los primeros, por que los propios pesos son mayores y
no por que la dispersión sea mayor.
 En esta situación hay que utilizar una medida relativa de
dispersión que sería el coeficiente de variación.

04/01/2015 29
Ejemplo 6:

Supongamos que en dos grupos se han determinado los


siguientes resultados:
GRUPO 1 GRUPO 2 U
Año Promedio 25 11 años
Peso Promedio 72.2 40 Kg
s 5 5 Kg
n 15 15

¿Qué grupo es más homogéneo o menos variable con


relación al peso?

04/01/2015 30
Solución:
Para identificar qué grupo tiene menor variabilidad en
relación a la variable peso, se tiene que utilizar el coeficiente
de variación, por que los grupos están constituidos por
sujetos con distintas edades promedio.
El coeficiente de variación para la muestra 1 es:
5
CV  100  6.9%
72.5
El coeficiente de variación para la muestra 2 es:
5
CV  100  12.5%
40
De acuerdo a los resultados, la muestra 1 posee menos dispersión de los
pesos con respecto a la media en relación a la muestra 2.

04/01/2015 31
Nota:

 Si el C.V. es menor del 10% se dice que hay poca


dispersión,
 Si el C.V. oscila entre el 10% y el 33% la dispersión
existente es aceptable;
 Si el C.V. oscila entre el 33% y el 50% se dice que hay alta
dispersión;
 Pero si el C.V. es mayor del 50% se dice que la dispersión
es muy alta.

04/01/2015 32
Ejercicio.-

Se realizó un estudio sobre la edad de las mujeres que


utilizan anticonceptivos. Los resultados fueron:
20, 21, 21, 19, 17, 22, 23, 24, 21, 22
a) Calcular la media aritmética, mediana y moda.
b) Explique las eventuales diferencias.

04/01/2015 33
Ejercicio.-
Los siguientes datos son los resultados de la calificación de
85 estudiantes en un examen de Estadística, en una

CALIFICACION fi a) Calcular la media aritmética, la


30 39 5 mediana y la moda.
40 49 10 b) Calcular la desviación estándar y el
50 59 18 coeficiente de variación.
60 69 26 c) Si la nota mínima aprobatoria del
70 79 15 curso es 55 ¿Cuántos alumnos aprobaron
80 89 7 el curso?
90 99 4
85

04/01/2015 34
Funciones de Excel:
Varianza.

FORMULA FUNCION EXCEL


n

 i
X  X 2

S2  i 1
𝐒𝐱𝟐 = =VAR.P( Matriz x )
n
n

 X  X 
2
i
s2  i 1 𝐬𝐱𝟐 = =VAR.S( Matriz x )
n -1

NOTA.- Solo para datos no agrupados.


04/01/2015 35
Ejercicio.-
Calcular la varianza de los datos que se muestra en la hoja
electrónica que se muestra.

𝐒𝐱𝟐 = VAR.P(B2:I6)
𝐬𝐱𝟐 = VAR.S(B2:I6)
𝐒𝐱𝟐 = 66.99 𝐬𝐱𝟐 = 𝟔𝟖. 𝟕𝟏
04/01/2015 36
Funciones de Excel:
Desviación estándar.

FORMULA FUNCION EXCEL


n

 i
X  X 2

S i 1 𝐒𝐱 = =VAR.P( Matriz x )
n
n

 X  X
2
i
s i 1 𝐬𝐱 = =VAR.S( Matriz x )
n -1
NOTA.- Solo para datos no agrupados.
04/01/2015 37
Ejercicio.-
Calcular la desviación estándar de los datos que se muestra en
la hoja electrónica que se muestra.

𝐒𝐱 = DESVEST.P(B2:I6) 𝐬𝐱𝟐 = DESVEST.M(B2:I6)


𝐒𝐱 = 8.19 𝐬𝐱 = 𝟖. 𝟐𝟗
04/01/2015 38
Trabajo:
Los salarios semanales (en nuevos soles) de un grupo de
obreros son los siguientes:
153 123 129 132 147 138 137 134 131 147
134 148 125 139 146 145 148 135 152 128
138 138 122 146 137 151 145 124 132 138
137 146 138 146 140 137 129 126 117 136
128 127 146 144 137 128 143 141 136 138

1. Calcule la varianza de los datos originales.


2. Agrupe los datos en un cuadro de frecuencias con seis
intervalos
3. Calcule la varianza :
a) A base del primer método abreviado.
b) A base del segundo método abreviado.
c) Aplicando propiedades.
04/01/2015 39