Está en la página 1de 42

Eliminar el

Logo

De la izquierda

MEDIDAS DE DISPERSIN
Y DE FORMA
Docente: Gladys Enrquez Mantilla

Las estadsticas bsicas nos permiten tener una visin del


comportamiento de una serie de variables. Tenemos varias
herramientas estadsticas como son la Media, la Mediana y la
Moda.
Pero estas medidas no son suficientes, necesitamos conocer la
variabilidad de los datos, es decir, qu tan parecidos son los datos
reales en comparacin a las Medidas de Tendencia Central, para
esto contamos con las Medidas de Dispersin, que son
indicadores de variabilidad y cuya importancia reside en la
necesidad de tomar decisiones, basadas en estadsticas bsicas.

MEDIDAS DE DISPERSIN
Las medidas de dispersin permiten cuantificar lo prximos o
alejados que estn los datos de la muestra con respecto a un valor
central.

Indican por un lado el grado de variabilidad que hay en la muestra


y, por otro, la representatividad de dicho punto central:
Si se obtiene un valor pequeo, significa que los valores se
concentran alrededor de ese centro (por lo que habr poca
variabilidad y el centro representar bien a todos).
Si se obtiene un valor grande, significa que los valores no
estn concentrados, sino dispersos (por lo que habr
mucha variabilidad y el centro no ser muy representativo).
3

Las Medidas de Dispersin


Generalmente se utilizan para comparar grupos, en este caso
aquel grupo que presente la menor medida de dispersin ser:
Ms homogneo.
Ms uniforme.
Ms parejo.
Menos variable.
Menos disperso.
En ese grupo la medida de tendencia central (media
aritmtica, mediana o moda) ser ms representativa.

A mayor medida de dispersin mayor heterogeneidad de los datos y a


menor medida de dispersin mayor homogeneidad.
4

Clasificacin de las Medidas de Dispersin:

Medidas de Dispersin Absolutas:


Cuantifican el grado de concentracin o de dispersin de los
valores de la variable en torno de un promedio de la distribucin.
Son aquellas cuyo valor est expresado en unidades de medida de
la variable y que, por lo tanto para comparar grupos la variable a
comparar deber estar expresada en las mismas unidades en todos
los grupos.
Rango.
Varianza.
Desviacin Estndar.
Medidas de Dispersin Relativas:
El resultado de las medidas de dispersin relativa est expresado sin
unidades de medida por lo cual sirven para comparar la dispersin
de distribuciones de frecuencias en las cuales la variable a comparar
est expresada en distintas unidades.
Coeficiente de Variacin.
Puntuaciones Tpicas.
6

Rango: (Range)
El Rango o Recorrido es un estadgrafo de dispersin muy
inestable, ya que depende nicamente de los valores extremos de
los datos (mximo y mnimo) y no toma en cuenta los dems
datos.

R = X mximo - X mnimo
El Rango estima el campo de variacin de la variable.
Su obtencin es sumamente sencilla, sin embargo se considera
que no es una medida muy significativa.
Se afecta mucho por observaciones extremas.
Cuando se comparan grupos, el grupo ms homogneo ser el
que presente menor Rango; es decir los datos estn dispersos en
un menor rango.

Varianza: (Variance)
Es un valor numrico que cuantifica el grado de dispersin de los
valores de una variable respecto a su media aritmtica. Es el
promedio de los cuadrados de las desviaciones de la variable
respecto a su media aritmtica.

V X S M Xi x

La varianza nunca es negativa.


Cuando la variable toma un nico valor; es decir cuando es
constante entonces la varianza es cero.
Mientras ms se aproxima a cero, ms concentrados estn los
valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
8

Varianza para datos no agrupados:


Si se tienen n datos correspondientes a una muestra aleatoria
x1 , x2 , xn ; entonces la varianza se calcula mediante:

Xi
1
2
2
S
Xi n

n 1

Donde:
n

Xi2
Xi

es el nmero de datos de la muestra.


es la suma de cada uno de los datos elevado al cuadrado.
es la suma de todos los datos.
9

Ejemplo: Varianza datos no agrupados

Calcular e interpretar la varianza de los pesos de un grupo de


personas seleccionadas al azar. Los datos son los siguientes:

56

65

68

70

72

76

78

80

n8

Xi 56 65 68 70 72 76 78 80 565
Xi2 562 652 682 702 722 762 782 802 40329
2

1
565

60.84 61 kilos2
S2 40 329 8

X 7
8

En promedio los pesos del grupo de personas, se alejan con


respecto al promedio aritmtico en aproximadamente 61 kilos
al cuadrado.
10

Varianza para datos agrupados:

Si se tienen n datos agrupados en una tabla con o sin intervalos,


se utilizar la siguiente frmula:

f
1

i i
2

S2
X

i
i


n 1
n

Donde:

Xi2 fi

Xi fi

es la suma de las fi
es la suma de los productos de Xi elevado al
cuadrado multiplicado por fi
Es la suma de los productos de Xi multiplicado por fi
11

Ejemplo: Varianza datos agrupados

Calcular e interpretar la varianza para la siguiente tabla de


frecuencias que muestra la distribucin de las edades de un grupo
fi
de personas
seleccionadas en forma aleatoria.
Edad
Ii

N de personas
fi

Xi

4- 6

6 - 10

10 - 16

13

16 - 20

18

20 - 30

25

Total

1
S
19
2

2
3
0

3200 20
29.21

20

En promedio la edad de estas personas


se aleja con respecto a su promedio
aritmtico en aproximadamente 29 aos
al cuadrado.

n = 20

Xi2 fi 52 4 82 5 132 7 182 3 252 1 3200


Xi fi 5 4 8 5 13 7 18 3 25 1 230

12

Desviacin Estndar

Es la raz cuadrada positiva de la varianza y posee las mismas


unidades que la media aritmtica, las cuales ya no estn elevadas
al cuadrado como en la varianza.
La desviacin tpica, aporta informacin estadstica sobre la
variabilidad de los datos en relacin a su media. Nos da
informacin acerca de la homogeneidad o heterogeneidad de los
datos en relacin al valor medio de los mismos.

S2

El problema de la varianza es que sus


unidades son el cuadrado de las
unidades de los datos, y esto dificulta
su interpretacin. Por eso utilizamos
la raz cuadrada que viene a ser la
desviacin estndar, la cual es la
medida que ms se utiliza para
referirse a la variabilidad.

13

Comparando desviaciones estndar

El grupo B es el ms homogneo debido a su menor desviacin


estndar. El grupo ms heterogneo (ms disperso, ms variable) es
el grupo C porque presenta mayor desviacin estndar.

Ejemplo: Desviacin Estndar

Calcular e interpretar la desviacin estndar para la siguiente tabla


de frecuencias que muestra la distribucin de las edades de un
fi
grupo
de personas seleccionadas en forma aleatoria.
Edad
Ii

N de personas
fi

Xi

4- 6

6 - 10

10 - 16

13

16 - 20

18

20 - 30

25

Total

n = 20

2
1
2 30
S
3200 20
29.21

19
20

S 29.21 5.40

En promedio la edad de estas personas


se aleja con respecto a su promedio
aritmtico en aproximadamente 5 aos.

Xi2 fi 52 4 82 5 132 7 182 3 252 1 3200


Xi fi 5 4 8 5 13 7 18 3 25 1 230

15

El indicador ms comn del riesgo de un activo es la desviacin


estndar. Mide la dispersin de los rendimientos en torno al
rendimiento promedio o esperado de un activo
Ejemplo:
Considere dos inversiones alternativas A y B, que se describen en la tabla adjunta.
Obtener el rendimiento promedio y el riesgo asociado a cada activo. Cul
inversin es ms riesgosa?
Inversin A :
Tasa de rendimiento (%)
X2 1361.12 X 90

Ao
Inversin A
Inversin B
X 15
2010
15.6
8.4
S2A 1.85
S A 1.36
2011
12.7
12.9
2012

15.3

19.6

Inversin B :

2013

16.2

17.5

X2

2014

16.5

10.3

X 15

2015

13.7

21.3

2
SB
22.86

1487.16

X 90

SB 4.78

Ambas inversiones presentan igual promedio, sin embargo la inversin ms


riesgosa es la inversin B debido a su mayor desviacin estndar.

Coeficiente de Variacin: (Coefficient of Variation)


Se trata de una cantidad sin dimensin, puesto que, al efectuar el
cociente, se eliminan las unidades y nos indica el nmero de veces que
la desviacin estndar contiene a la media.
Mide la dispersin relativa de una distribucin. No tiene unidades y
suele expresarse en porcentaje.
Se utiliza para comparar distribuciones con distintas variables, por
ejemplo tallas y pesos.
Se utiliza para comparar distribuciones con la misma variable pero
expresada en diferentes unidades, por ejemplo soles y dlares.

CV

S
100
X

Si CV < 10% la dispersin es baja.


Si CV 30% la dispersin es ptima.
Si CV > 50% la dispersin es alta. Existe un alto grado de dispersin
y por lo tanto la media aritmtica es poco representativa.

17

Ejemplo: Coeficiente de Variacin

Se desea comparar los sueldos de los trabajadores de dos


empresas A y B. Para tal efecto se tienen los siguientes datos:
Empresa A
Sueldos
($)

N de
trabajadores

Sueldos
( S/. )

N de
trabajadores

Xi

380

10

600-650

625

410

650-700

675

450

12

700-750

14

725

480

750-800

775

500

800-850

825

x A 439.78
CVA

Empresa B

S A 43.02

43.02

100 9.78%
439.78

x B 713.75

60.43

S
B

CVB

60.43
100 8.47%
713.75

Los sueldos de la empresa B son ms homogneos porque su CV es menor.

18

Ejemplo: Coeficiente de Variacin

ESTATURA

PESO

Media

68.34 pulg.

172.55 lbs.

Desviacin Estndar

3.02 pulg.

26.33 lbs.

CVestatura

3.02
100 4.42%
68.34

CVpeso

26.33
100 15.26%
172.55

A pesar que la diferencia en unidades imposibilita la comparacin de la


desviacin estndar de 3.02 pulgadas, con la desviacin estndar de 26.33
libras, es posible comparar los coeficientes de variacin, que carecen de
unidades.
Se observa que la estatura (con CV=4.42%) tiene una variacin
considerablemente menor que el peso (con CV =15.26%).
19

Puntuaciones tpicas: (Puntuaciones Z)


Indican la distancia que separa a un sujeto que ha obtenido una
puntuacin determinada con respecto a la media de su grupo,
utilizando como unidad para medir esa distancia la desviacin
estndar del grupo.
Las puntuaciones tpicas permiten hacer comparaciones entre
unidades de distintos grupos, entre variables medidas de
distintas formas o incluso entre variables diferentes.

Xi x
ti
S
Si ti es positiva la unidad estadstica est ubicada por encima
del promedio.
Si ti es negativa la unidad estadstica est ubicada por
debajo del promedio.
20

Alumna Examen1
Katherine
0
Camila
13
Olga
13
Paola
9
Luisa
13
Carol
11
Andrea
2
Claudia
13
Leslie
12
Pilar
3
Carolina
0

Pilar, en ambos
exmenes est por
debajo del promedio
(ti negativo). En el
Examen 2 est
relativamente mejor
ubicada (ti es mayor)

ti1
-1.44
0.87
0.87
0.16
0.87
0.52
-1.09
0.87
0.70
-0.91
-1.44

Examen2
2
14
5
6
17
15
11
15
19
4
0

ti2
-1.18
0.63
-0.73
-0.58
1.09
0.78
0.18
0.78
1.39
-0.88
-1.48

Carol tiene 11 en el
Examen 1 y Andrea
11 en el Examen 2;
sin embargo es Carol
quien est mejor
ubicada (ti mayor).

En ambos exmenes
Camila est por encima
del promedio (ti es
positivo); sin embargo
en el Examen 1 est
relativamente
mejor
ubicada (ti es mayor)

Paola, en el Examen
1 est por encima
del promedio (ti
positivo) y en el
Examen 2 est por
debajo del promedio
(ti negativo). En el
Examen 1 est
relativamente mejor
ubicada.

Ejemplo 1:
Se tienen las notas correspondientes a dos asignaturas A y B de
un grupo de estudiantes:
A:

12

16

12

11

13

12

14

16

14

17

10

14

11

15

11

B:

12

13

12

12

11

10

11

12

11

13

10

12

En este caso:

x A 13.2

xB 10.93

SA 2.15

SB 1.62

Si quisiramos saber si el tercer sujeto que ha calificado con 12 en


ambas asignaturas ha sacado una puntuacin equivalente tendramos
que estandarizar ambas calificaciones.
z1

12 13.2
0.56
2.15

z2

12 10.93
0.66
1.62

Como se observa ambas calificaciones no son equivalentes, pues


mientras con un 12 en la primera asignatura se encuentra por debajo del
promedio, en la segunda con un 12 est superando al promedio.

Ejemplo 2:
Se tiene el nmero de artculos producidos por cinco trabajadores
de dos grupos diferentes:
G1:

G2 :

Se puede concluir que los trabajadores que producen 8 artculos,


han tenido el mismo rendimiento?

En este caso:

x1 5

x2 5

S1 2.24

S2 3.54

Pareciera que ambos trabajadores han tenido el mismo rendimiento


puesto que han producido la misma cantidad de artculos, pero para
averiguar el rendimiento relativo al resto del grupo, deber tenerse
en cuenta la dispersin de cada grupo y medir sus puntuaciones
tpicas.
85
85
z1
1.34
z2
0.85
2.24
3.54
Por lo tanto, el trabajador del Grupo 1 ha tenido un mejor rendimiento.

Puntuaciones de Z y valores infrecuentes:

Valores comunes
:
Valores inf recuentes :

2 puntuacin z 2
puntuacin z 2 puntuacin z 2

Siempre que un valor sea menor que la media, su puntuacin z


correspondiente ser negativa. Si es mayor que la media su puntuacin
z ser positiva.

Las puntuaciones z son medidas de posicin, porque describen la


localizacin de un valor (en trminos de desviaciones estndar), en
relacin con la media. Una puntuacin z de 2 indica que un valor est a
dos desviaciones estndar por encima de la media, en tanto que una
puntuacin z de -3 indica que un valor est a tres desviaciones estndar
por debajo de la media.
24

Ejemplo:
Michael Jordan de la NBA mide 78 pulgadas, en tanto que la jugadora
de basquetbol de la WNBA Rebecca Lobo mide 76 pulgadas. En
efecto, Jordan es ms alto por dos pulgadas, pero cul de los dos es
relativamente ms alto? La estatura de Jordan, entre los hombres,
excede la estatura de Lobo entre las mujeres? Se sabe que los
hombres tienen estaturas con una media de 69 pulgadas y con
desviacin estndar de 2.8 pulgadas; las mujeres tienen estaturas con
una media de 63.6 pulgadas, con una desviacin estndar de 2.5
pulgadas.
Jordan : z

x 78 69

3.21

2.8

Lobo : z

x 76 63.6

4.96

2.5

Por lo tanto, la estatura de Jordan est a 3.21 desviaciones estndar


por arriba de la media, pero la estatura de Lobo est a 4.96
desviaciones estndar por arriba de la media. La estatura de Lobo
entre las mujeres es relativamente mayor que la estatura de Jordan
entre los hombres.
25

EJEMPLO
Se tienen los pesos correspondientes a cuatro grupos de personas.

n1 10

n2 9

X 648
X2 43014
x1 64.8 kilos
S12

113.73 kilos

S1 10.66 kilos
CV1 16.46%

n3 8

n 4 11

X 1560
X2 277628

X 538
X2 37934

X 1485
X2 201023

x 2 173.3 libras

x 3 67.25 kilos

x 4 135 libras

S22 903.5 libras2

S32 250.50 kilos2

S24 54.80 libras2

S2 30.1 libras

S3 15.83 kilos

S4 7.40 libras

CV2 17.34%

CV3 23.53%

CV4 5.48%

a) En cul de los cuatro grupos el promedio aritmtico es ms representativo?

El promedio aritmtico ser ms representativo en el grupo que presente


la menor variabilidad.
Las unidades de medida de la variable a comparar (Peso) son diferentes
(kilos libras), entonces deber compararse los coeficientes de variacin.

CV1 16.46%

CV2 17.34%

CV3 23.53% CV4 5.48%

El promedio aritmtico ser ms representativo en el grupo 4 porque su


CV es menor.

b) Se puede afirmar que la dispersin es ptima en el grupo 3? Por qu?

Para que la dispersin sea PTIMA, el coeficiente de variacin debe ser


menor o igual que 30%.

CV3 = 23.53% < 30% la dispersin es ptima


c) Podemos afirmar que la media aritmtica del grupo 4 es menos representativa
que la media del grupo 1? Por qu?

Para que la media del grupo 4 sea menos representativa tendra que ser
mayor su coeficiente de variacin (las unidades en ambos grupos son
diferentes)

CV1 16.46%

CV4 5.48%

La media aritmtica en el grupo 4


no es menos representativa,
porque su CV no es mayor.

d) Se puede afirmar que la dispersin es baja en el grupo 4? Por qu?

Para que la dispersin sea BAJA el coeficiente de variacin debe ser


menor que el 10%.

CV4 5.48%
Entonces, s se puede afirmar que la dispersin es baja en el grupo 4
porque su coeficiente de variacin es inferior al 10%.

e) Se puede decir que la media aritmtica es poco representativa en el grupo 3?


Por qu?

Para que la media aritmtica sea poco representativa, el coeficiente de


variacin deber ser mayor que el 50%.

CV3 23.53%
Entonces, la media aritmtica no es poco representativa porque el
coeficiente de variacin no es mayor que el 50%

f) Se puede afirmar que el grupo 3 es ms homogneo que el grupo 1, en cuanto


a su peso ? Por qu?

La variable Peso en los grupos 3 y


1 est expresada en las mismas
unidades (kilos)

bastar con comparar las varianzas.


Ser ms homogneo el grupo que tenga MENOR varianza.

S12 113.73 kilos2

S32 250.50 kilos2

El grupo 3 NO es ms homogneo que el grupo 1, porque su varianza no es


menor. El grupo 3 es ms heterogneo; el ms homogneo es el grupo 1.

g) En cuntos kilos se alejan los pesos del grupo 3 con respecto al peso
promedio?

Nos piden el alejamiento en Kilos por lo tanto


deber calcularse la desviacin estndar.

S3 =15.83

Los pesos del grupo 3 se alejan


con respecto al peso promedio en
aproximadamente 16 kilos.

h) En cuntas libras al cuadrado se alejan los pesos del grupo 2 con


respecto al peso promedio?

Nos piden el alejamiento en libras al cuadrado por


lo tanto deber calcularse la varianza.

S22 = 903.5

Los pesos del grupo 2 se alejan


con respecto al peso promedio en
aproximadamente 904 libras al
cuadrado.

i) Cul es el porcentaje de alejamiento de los pesos del grupo 4 con


respecto al peso promedio?

Nos piden el alejamiento en porcentaje por lo


tanto deber calcularse el coeficiente de variacin.

CV4 = 5.48%

Los pesos del grupo 4 se alejan


con respecto al peso promedio
en aproximadamente 5%.

j) Cul es ms variable, el grupo 2 o el grupo 4? Por qu?

S22 903.5 libras2

S24 54.80 libras2

El grupo 2 es ms variable, porque


presenta mayor varianza.
Se compararon varianzas porque las
unidades de la variable a comparar son
las mismas (libras).

MEDIDAS DE DISTRIBUCIN O DE FORMA


Permiten identificar la forma en que se separan o aglomeran los
valores de acuerdo a su representacin grfica. Estas medidas
describen la manera como los datos tienden a reunirse de
acuerdo con la frecuencia con que se hallen dentro de la
informacin.

Su utilidad radica en la posibilidad de identificar las caractersticas de la


distribucin sin necesidad de generar el grfico.

33

Asimetra o Sesgo

Esta medida permite identificar si los datos se distribuyen de forma


uniforme alrededor del punto central (media aritmtica). La asimetra
presenta tres formas diferentes, cada una de las cuales define de forma
concisa cmo estn distribuidos los datos respecto al eje de simetra.
Simtrica, cuando
se distribuyen
aproximadamente la
misma cantidad de
valores a ambos
lados de la media.

Asimtrica
positiva, cuando
la mayora de los
datos se
encuentran por
encima del valor de
la media aritmtica.

Asimtrica
negativa, cuando
la mayora de los
datos se encuentran
por debajo del valor
de la media
aritmtica.

34

Coeficiente de Asimetra:
Mide el grado de concentracin de los datos de una distribucin
alrededor de la media. Indica la deformacin horizontal de una
distribucin de frecuencias

As

Asimtrica Negativa
Sesgada a la izquierda
La mayora de valores son
superiores a la media

x Mo
S

Simtrica

Asimtrica Positiva

La misma cantidad de
valores a ambos lados
de la media

Sesgada a la derecha
La mayora de valores son
inferiores a la media
35

Curtosis o Apuntamiento:

Mide el grado de elevacin o de agudeza de una distribucin


comparada con la curva normal.
Mide el grado de deformacin vertical de una distribucin.
Ms alta que la Normal

LEPTOCRTICA

Normal

MESOCRTICA

Ms baja que la Normal


PLATICRTICA
36

Coeficiente de Curtosis:

Indica la deformacin vertical de una distribucin de frecuencias.

P75 P25
K
0.263
2(P90 P10 )

K>0

Leptocrtica

K=0

Mesocrtica

K<0

Platicrtica
37

Kurtosis

Leptocrtica
Ms apuntada que la Normal

Mesocrtica
Igual de apuntada que la Normal

Platicrtica
Ms aplanada que la Normal
38

Ejemplo:
Calcular e interpretar las medidas de dispersin,
asimetra y curtosis para los siguientes datos correspondientes a las
notas de un grupo de estudiantes.

12
16

14
12

10
13

15
14

12
15

18
10

9
12

11
13

Solucin:
Stat Basic Statistics Display Descriptive Statistics

39

Interpretacin:
n = 16; la muestra considerada consta de 16 estudiantes.
Desviacin estndar = 2.391; en promedio las notas de los
estudiantes se alejan con respecto al promedio aritmtico en
aproximadamente 2 puntos.
Varianza = 5.717; en promedio las notas de los estudiantes se alejan
con respecto al promedio aritmtico en aproximadamente 6 puntos al
cuadrado.
Coeficiente de variacin = 18.57; en promedio las notas de los
estudiantes se alejan con respecto al promedio aritmtico en un 19%
aproximadamente.
Asimetra = 0.40; las notas presentan una distribucin asimtrica
positiva. La mayora de estudiantes presentan notas BAJAS.

Curtosis = -0.03; las notas presentan una distribucin platicrtica.


40

Ejemplo:
Calcular e interpretar las medidas de dispersin,
asimetra y curtosis para los siguientes datos correspondientes a las
notas de un grupo de estudiantes segn gnero.

F
16

F
12

M
13

F
14

M
15

M
10

F
12

M
13

Solucin:
Stat Basic Statistics Display Descriptive Statistics

41

Interpretacin:
n: el grupo consta de 4 mujeres y 4 varones.
Desviacin estndar: el grupo de varones es ms variable porque
presenta mayor desviacin estndar.

Varianza: el grupo de mujeres es ms homogneo porque su varianza


es menor.
Coeficiente de Variacin: el promedio aritmtico es ms representativo
en el grupo de mujeres porque su coeficiente de variacin es menor.

Asimetra: la mayora de mujeres presentan notas bajas (asimetra


positiva) mientras que la mayora de varones presentan notas altas
(asimetra negativa).
Curtosis: las notas de las mujeres presentan una distribucin
platicrtica en tanto que las notas de los varones presentan una
distribucin leptocrtica.

42