Está en la página 1de 46

MEDIDAS DE VARIABILIDAD

SEMANA 2-B:

Rango, Rango Intercuartil, Varianza, Desviacin estndar,


Coeficiente de variacin, teorema de Chebyshev, La regla emprica, detencin de
valores atpicos.
Profesor: Jorge Esponda Vliz

MEDIDAS DE DISPERSIN
Se llaman medidas de dispersin aquellas que permiten
retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentracin de

los datos en un cierto sector del recorrido de la variable.


Llamadas tambin medidas de variabilidad. Son tiles
porque:

Permiten juzgar la confiabilidad de la medida de tendencia


central.
Los datos demasiados dispersos tienen un
comportamiento especial.
Es posible comparar dispersin de diversas muestras.

Las principales medidas de dispersin son:


Amplitud de variacin
Desviacin media
Varianza
Desviacin estndar

AMPLITUD DE VARIACIN:
Es la medida de dispersin ms sencilla, que trata de la
diferencia entre el valor ms grande y el ms pequeo en
un conjunto de datos.
Un defecto importante de la amplitud de variacin es que
se basa slo en dos valores, el mximo y el mnimo.

Amplitud de Variacin = Valor ms Valor ms


grande
pequeo

EJEMPLO:
Veamos la produccin de dos mquinas, una produce en promedio
por hora 13.375 botones y la otra mquina en promedio tambin
13.375 botones. Veamos la produccin por hora:
Horas 1 2 3 4 5 6 7 8
Mquina 1 2 5 12 13 14 16 20 25
Mquina 2 11 12 13 13 13.5 14.5 15 15
Ahora veamos la amplitud de variacin de cada mquina:

Vemos que la media de la mquina 2

Mquina 1 25 2 = 23
de la mquina 1, porque tiene menor Mquina 2 15 11 = 4
es ms representativa que la media

amplitud de variacin.

EJEMPLO: Para hallar la amplitud de variacin de la


siguiente tabla referida a las edades de los 100 empleados
de una cierta empresa:

Clase
16 - 20
20 - 24
24 - 28
28 - 32
32 - 36
36 - 40
40 - 44
44 - 48
48 - 52

ni
2
8
8
18
20
18
15
8
3
100

Entonces hallamos la amplitud de


variacin:

Amplitud de variacin : 52 16 = 36 aos

DESVIACIN MEDIA:
Es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media aritmtica. La desviacin
media viene a indicar el grado de concentracin o de

dispersin de los valores de la variable. Si es muy alta,


indica gran dispersin; si es muy baja refleja un buen
agrupamiento y que los valores son parecidos entre s.

XX

DM
n

X: Es el valor de cada observacin.

X : Es la media aritmtica de los valores.


n: Es el nmero de observaciones en la muestra.
| |: Indica el valor absoluto.

EJEMPLO:
Del ejemplo anterior, de las mquinas:

Diferencia con la Media


Maquina Maquina
y cada observacin
1
2
Maquina 1 Maquina 2
2
11
11.375
2.375
5
12
8.375
1.375
12
13
1.375
0.375
13
13
0.375
0.375
14
13.5
0.625
0.125
16
14.5
2.625
1.125
20
15
6.625
1.625
25
15
11.625
1.625
Media
13.375
13.375
Suma de las diferencias
43.0
9.0
Desviacin media
43/8 5.375 9/8 1.125

Esto quiere decir para la mquina 1, la variacin (en


promedio) es de 5.375 botones por hora con respecto a la

media de 13.375 botones; y para la maquina 2, la


variacin es de 1.125 botones por hora con respecto a la
media de 13.375 botones.

EJEMPLO: Para hallar la desviacin media de la


siguiente tabla referida a las edades de los 100
empleados de una cierta empresa:
Clase
ni
16-20
20-24
24-28

2
8
8

28-32
32-36
36-40

18
20
18

40-44
44-48
48-52

15
8
3
100

Entonces calculamos:
Clases
16-20
20-24

ni
2
8

Xi
18
22

n*X
36
176

24-28
28-32
32-36
36-40
40-44
44-48

8
18
20
18
15
8

26
30
34
38
42
46

208
540
680
684
630
368

48-52

50

150

100
3472
X
34.72
100

3472

|Media - Xi| |Media - Xi|*n


16,72
33,44
12,72
101,76
8,72
69,76
4,72
84,96
0,72
14,4
3,28
59,04
7,28
109,2
11,28
90,24
15,28

45,84

608,64
608.64
DM
6.09
100

VARIANCIA.-

Es

una

medida

de

desviacin

promedio con respecto a la media aritmtica.

POBLACIONAL

MUESTRAL

2 : Es el smbolo para la
variancia de una poblacin (es
la letra griega sigma).
: Es la media aritmtica de la
poblacin.
N: Es el nmero total de
observaciones en la poblacin.
X: Es el valor de las
observaciones en la poblacin.

X X

n 1

s2: Es el smbolo para


representar la variancia
muestral.
X : Es la media de la muestra.
n: Es el nmero total de
observaciones en la muestra.
X: Es el valor de las
observaciones en la muestra.

Nos damos cuenta que los denominadores no son


semejantes. Aunque el uso de n sea lgico, tiende a
subestimar la variancia de la poblacin. Es decir lo vuelve
ms pequeo de lo que en realidad es. Los estadsticos
han encontrado que la correccin a esto, es restarle 1
al nmero total de observaciones de la muestra.
Ahora para simplificar el clculo de la variancia, haremos
una pequea convergencia o equivalencia:

X X (X
2

La frmula de la desviacin muestral cambia, esto es solo

clculo.

X n

para facilidad del

s2

n 1

X X- X (X- X )
2 11.375 129.391
5
8.375 70.141
12 1.375 1.891
13 0.375 0.141
14 -0.625 0.391
16 -2.625 6.891
20 -6.625 43.891
25 -11.625 135.141
SUMA TOTAL
107
0
387.878

EJEMPLO:
Para el ejemplo anterior,
slo de la maquina 1,

cuya media es 13.375:

X
4
25
144
169
196
256
400
625
1819

X: dato del ejemplo

Entones la variancia muestral es:


Con la frmula normal

387.878
s
55.411
8 1

Con la frmula directa

s2

107
1819

8 1

55.411

DESVIACIN ESTNDAR.- Llamada tambin


desviacin tpica, representa la variabilidad (o desviaciones)

promedio de los datos con respecto a la media aritmtica.


Es la raz cuadrada positiva de la variancia.
Esto quiere decir que para una desviacin pequea, las

observaciones estarn localizadas cerca de la media. Y para


una desviacin grande, las observaciones estn lejos de la
media.

POBLACIONAL

X
N

MUESTRAL

X X

n 1

DESVIACIN ESTNDAR PARA DATOS AGRUPADOS:

Si los datos que interesan estn en forma agrupada (en

una distribucin de frecuencias), la desviacin estndar


muestral puede aproximarse al sustituir (ni X2) por
(X^2) y (ni X) por X. La frmula para la desviacin

estndar muestral se convierte entonces en:

ni * X X
2

N 1

ni * X

niX

N 1

S: Es la desviacin estndar muestral.


X: Es el punto medio de una clase.
ni: Es la frecuencia de clase.
N: Es el nmero total de observaciones en la muestra.
X : Es la media aritmtica.

EJEMPLO: Para la mquina 2

107
Entones la
desviacin
muestral es:

X2

2
X
X
)
(XX5.641
2.375
1.891
1.375
0.141
0.375
0.141
0.375
0.016
-0.125
1.266
-1.125
2.641
-1.625
2.641
-1.625
SUMA TOTAL
14.375
0

Maquina 2
11
12
13
13
13.5
14.5
15
15

Con la frmula normal


14.375
s
1.433
8 1
2

121
144
169
169
182.25
210.25
225
225
1445.5

Con la frmula directa


2

107
1445.5

s2

8 1

1.433

EJEMPLO: Las alturas en centmetros de un grupo de


103 personas se distribuyen as:
Clases
150 155
155 160
160 165
165 170
170 175
175 180
180 185

185 190
190 195
195 200

Xi

Xi * n

Xi - Media (XiMedia)^2 n* (XiMedia)^2

3 152,5
6 157,5

457,5

-20,34

413,71

1241,12

945,0

-15,34

235,31

1411,86

12 162,5
18 167,5

1950,0

-10,34

106,91

1282,94

3015,0

-5,34

28,51

513,24

25 172,5
17 177,5

4312,5

-0,34

0,12

2,89

3017,5

4,66

21,72

369,20

10 182,5
7 187,5

1825,0

9,66

93,32

933,19

1312,5

14,66

214,92

1504,45

4 192,5
1 197,5

770,0

19,66

386,52

1546,09

197,5

24,66

608,13

608,13

103

17802,5

9413,11

Para el calculo de la formula corta:


Clases

ni

Xi

Xi * n

ni * Xi^2

150 155

152,50

457,5

69768,75

155 160

157,50

945,0

148837,5

160 165

12

162,50

1950,0

316875,0

165 170

18

167,50

3015,0

505012,5

170 175

25

172,50

4312,5

743906,25

175 180

17

177,50

3017,5

535606,25

180 185

10

182,50

1825,0

333062,5

185 190

187,50

1312,5

246093,75

190 195

192,50

770,0

148225,0

195 200

197,50

197,5

39006,25

17802,5

3086393,75

103

Para hallar la variancia y la desviacin estndar


usaremos las siguientes formulas:
Mtodo largo:

ni * X X

N 1

9413.11
9.61
103 1

Mtodo corto:

ni * X

ni * X

N 1

17802.52
3086393.75
103

9.61
103 1

EJEMPLO:
Una distribucin de la duracin (en meses)
de una batera para carros.
(Media = 39.71698 meses)
Xmedia

(X-Media)^2

ni *
(X-Media)^2

15 -34.7170

1205.2688

3615.8063

25

75

1020 15

75 -24.7170

610.9292

3054.6458

225

1125

2030 25

175 -14.7170

216.5895

1516.1267

625

4375

Clases

Xi

ni

010

ni*X

X2

ni*X^2

3040 35 10

350

-4.7170

22.2499

222.4991

1225

12250

4050 45 12

540

5.2830

27.9103

334.9235

2025

24300

5060 55

495

15.2830

233.5707

2102.1360

3025

27225

6070 65

455

25.2830

639.2310

4474.6173

4225

29575

53

2105

15320.75472

11375

98925

Total

La desviacin muestral es:

Forma normal

Forma rpida

15320 .75472
s
17.165
53 1

2105 2
98925
53 17.165
s
53 1

DISPERSIN RELATIVA
Cuando queremos comparar dos o ms medidas de
dispersin que no estn en las mismas unidades

podemos utilizar el coeficiente de variacin.


COEFICIENTE DE VARIACIN:

Es la razn (cociente) de la desviacin estndar y la


media aritmtica, llamada tambin como coeficiente de
Pearson, expresada en porcentaje:

s
CV
* 100
X

EJEMPLO: En una cierta empresa se hizo un estudio de las

notas obtenidas en un curso de capacitacin y los aos de


servicio de los mismos empleados que tomaron el curso de
capacitacin. La calificacin media de los empleados fue de 14

puntos, y la desviacin estndar de 2 puntos. Y la media de los


aos de servicio fue de 18 aos y la desviacin estndar fue de
3 aos.

Para las notas

Para los aos de servicio

3
2
*100 16.67%
CV
*100 14.29% CV
14
18
Podemos ver que hay menor dispersin relativa con
respecto a las media en la distribucin de notas que
en la distribucin de aos de servicio (14.29% <
16.67%).

ASIMETRA: Es la medida de la falta de simetra en una


distribucin. Es decir que una distribucin es simtrica si no
tienes sesgo, esto se da cuando los valores de tendencia
central (media, moda, mediana) estn en un solo punto.
Asimetra Negativa.- Esto se da cuando hay observaciones
muy pequeas, esto va hacer que la media se vuelva la

menor de las 3 medidas de tendencia central.


Asimetra Positiva.- Esto se da cuando hay observaciones
muy grandes, esto va hacer que la media se vuelva la mayor
de las 3 medidas de tendencia central.

Para evaluar esto tenemos el coeficiente de asimetra (CA)


o tambin llamada el coeficiente de Kurtosis:

3 * Media Mediana
CA
Desviacin _ estndar
Generalmente el coeficiente de asimetra se

encuentra entre -3 y +3.


EJEMPLO:
En un estudio de salarios de empleados de una
cierta empresa. Se encontr que la media se calcul
en S/. 5 000, la moda en S/. 6 800, y la mediana en S/.
5 600 y la desviacin estndar en S/. 800.

Vemos que la media es la menor de todas, entonces


tiene una asimetra negativa.

3 * 5000 5600
CA
2.25
800
Ahora nos damos cuenta que el coeficiente de asimetra es
-2.25, esto indica un sesgo negativo importante. Esto indica
que a la mayora de empleados se le paga un salario mayor
que la media.

SELECCIN DE UN PROMEDIO PARA DATOS

DE UNA DISTRIBUCIN DE FRECUENCIAS


Obviamente, si todas las observaciones estuvieran

concentradas en un solo valor de la variable, media,


mediana y moda coincidiran en el mismo. Si las

observaciones se fueran distribuyendo en forma simtrica,


a la izquierda y a la derecha de ese valor central, media,

mediana y modo seguiran coincidiendo.

Supongamos ahora que las observaciones de la parte


izquierda

se

observaciones

alejan
de

la

del

valor

parte

central

derecha,

ms

que

generando

las
una

distribucin asimtrica hacia la izquierda; en este caso como


la media es la suma de los valores de las observaciones
dividido por la cantidad total de observaciones, su valor se
correr a la izquierda tambin y por el mismo motivo, la
media ser menor que la mediana y ambas menor que la

moda. En una distribucin asimtrica a la derecha, la media,


es mayor que la mediana y que la moda.

Este corrimiento de la media se explica porque si tomamos


un conjunto de datos cualquiera a los cuales calculamos

media, mediana y moda y agregamos un dato extremo y


volvemos a calcular la media, la mediana y la moda, veremos
que la media puede variar notablemente, mientras que la
mediana y la moda permanecen idnticas.
Esta no variacin de la mediana y la moda reciben el nombre
de robustez. Las medidas basadas en el orden (la mediana)
gozan de sta en tanto que las medidas basadas en la suma
(la media) se ven ms afectadas por las observaciones

extremas y son, por lo tanto, poco robustas.

ASIMETRA

ASIMETRA

NEGATIVA (-)

POSITIVA (+)

EJEMPLO:
Una distribucin de la duracin de una batera para carros.

Intervalos
0 10
10 20

X
5
15

ni
3
5

Ni
3
8

X * ni
15
75

20 30
30 40
40 50
50 60

25
35
45
55

7
10
12
9

15
25
37
46

175
350
540
495

60 70
Total

65

7
53

53

455
2105

Los resultados son:

Media

2105
X
39.72
53

Mediana
53
25
Mediana 40 2
*10 41.25
12

Moda

12 10
Moda 40
* 10 44.0
(12 9) (12 10)

En resumen:

Media

Mediana

Moda

39.72

41.25

44.0

Asimetra hacia la izquierda

Ejemplo
Intervalos
0 10
10 20

Xi
5
15

ni
10
20

Ni
10
30

Xi * ni
50
300

20 30
30 40
40 50
50 60

25
35
45
55

30
15
13
9

60
75
88
97

750
525
585
495

60 70

65

102

325

Total

102

3030

Los resultados son:

Media

Mediana

3030
X
29.71
102

102
30
Mediana 20 2
*10 27.0
30
Moda

30 20
Moda 20
* 10 24.0
(30 20) (30 15)

En resumen:

Moda

Mediana

Media

24.0

27.0

29.7

Asimetra hacia la derecha o positiva

TEOREMA DE CHEBYSHEV
Este teorema permite determinar la proporcin mnima de
los valores que se encuentran dentro de un nmero

especfico de desviaciones estndares con respecto a la


media.

Es

decir

para

un

conjunto

cualquiera

de

observaciones (puede tomar cualquier forma), la proporcin


mnima de los valores que se encuentran dentro de k
desviaciones estndares desde la media es al menos (1
1/k2), donde k es una constante mayor que 1.

EJEMPLO:
Una distribucin de la duracin (en meses)
de una batera para carros. Cuya media es 39.72
meses, con una desviacin estndar de 17.165 meses.
Qu porcentaje de las duraciones de la batera se
encuentra a una distancia de 2 desviaciones
estndares, respecto a la media y 3 desviaciones

estndares?

Valores de k

1
1 2
k

K=2

1
1 2 0.75
2

K=3

1
1 2 0.8889
3

REGLA EMPRICA:

Para una curva de distribucin simtrica de campana, se


logra ser ms precisos al explicar la dispersin con
respecto a la media. Estas relaciones entre la desviacin
estndar y la media se incluyen en la Regla Emprica, que
algunas veces se denomina como Regla Normal.

Entonces vemos que si una distribucin es simtrica con

forma de campana, prcticamente todas las


observaciones se encuentran entre la media 3
desviaciones estndares.

EJEMPLO:
Para una distribucin de salarios, sigue

aproximadamente una distribucin de frecuencias


simtrica de campana. La media se calcul que es S/. 5
000 y la desviacin estndar de S/. 500. Utilizando la regla
emprica:

Aproximadamente, entre cules dos cantidades est


el 68% de los salarios?
Aproximadamente, entre cules dos cantidades est
el 95% de los salarios?
Aproximadamente, entre cules dos cantidades estn
casi todos los salarios?

Entonces
aproximadamente el
68% estn entre:

S/. 4 500 y S/. 5 500

4 500 = 5 000 1*500


5 500 = 5 000 + 1*500

Entonces
aproximadamente el
95% estn entre:

S/. 4 000 y S/. 6 000

4 000 = 5 000 2*500


6 000 = 5 000 + 2*500

Entonces
aproximadamente
casi todo estn
entre:

S/. 3 500 y S/. 6 500

3 500 = 5 000 3*500


6 500 = 5 000 + 3*500

Nuestra conducta es impulsada por


una creencia central bsica: el deseo

y habilidad para aprender


constantemente y de cualquier fuente,
y convertir rpidamente ese
aprendizaje en accin, esta es la
verdadera ventaja competitiva
Jack Welch , General Electric

Gracias

También podría gustarte