Está en la página 1de 44

Econ. Jaqueline Pacheco M.

Las medidas de dispersión, también llamadas medidas de


variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la media.

Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto


menor sea, más homogénea será a la media. Así se sabe si
todos los casos son parecidos o varían mucho entre ellos.
Al igual que sucede con cualquier conjunto de datos, la
media, la mediana y la moda sólo nos revelan una parte
de la información que debemos conocer acerca de las
características de los datos

La media o medidas de tendencia central sin medidas de


dispersión y otros índices correctores no sirven y eso nos
lo muestra el gráfico a continuación.
La media de las tres curvas es la misma, pero
la curva A tiene menor separación (o
variabilidad) que la curva B, y ésta tiene
menor variabilidad que la C. Si medimos sólo
la media de estas tres distribuciones,
estaremos pasando por alto una diferencia
importante que existe entre las tres curvas.
PRIMERO, NOS PROPORCIONA INFORMACIÓN ADICIONAL QUE
NOS PERMITE JUZGAR LA CONFIABILIDAD DE NUESTRA MEDIDA
DE TENDENCIA CENTRAL.

SEGUNDO, YA QUE EXISTEN PROBLEMAS CARACTERÍSTICOS PARA


DATOS MUY DISPERSOS, DEBEMOS SER CAPACES DE RECONOCER
¿POR QUÉ ES TAN ESA DISPERSIÓN AMPLIA PARA PODER ABORDAR ESOS
IMPORTANTE ENTENDER PROBLEMAS.
Y MEDIR LA DISPERSIÓN
DE LA DISTRIBUCIÓN?

TERCERO, QUIZÁ SE DESEE COMPARAR LAS DISPERSIONES DE


DIFERENTES MUESTRAS. SI NO SE DESEA TENER UNA AMPLIA
DISPERSIÓN DE VALORES CON RESPECTO DEL CENTRO DE
DISTRIBUCIÓN, O ESTO PRESENTA RIESGOS INACEPTABLES,
NECESITAMOS PODER RECONOCERLA Y EVITAR ELEGIR
DISTRIBUCIONES QUE TENGAN LAS DISPERSIONES MÁS GRANDES.
Los analistas financieros se preocupan de la dispersión
o variabilidad de las ganancias en una empresa, pues
ganancias extremas (altas o bajas) en la misma son
indicativo de riesgo para accionistas y acreedores que
aquellas que permanecen estables.

La calidad de un producto debe ser estable, pues una


variabilidad elevada puede llevar a pérdida de mercados
e incluso en un campo como la medicina puede ser
peligrosa para la vida humana.
RECORRIDO
(RANGO)

DESVIACIÓN
MEDIA
ABSOLUTAS

VARIANZA

MEDIDAS DE
DISPERSIÓN DESVIACIÓN
ESTÁNDAR

COEFICIENTE
RELATIVAS
DE VARIACIÓN
 Cuanto mayor es el Rango (R) o recorrido
mayor es la dispersión de la distribución de
la variable en estudio.
Es la media de los valores absolutos de
las desviaciones respecto a la media
aritmética.
Sólo nos ayuda a ver cuán dispersos se
hallan los datos respecto a su media de
forma absoluta. Cuanto mayor es la
desviación media más dispersos o
menos concentrados están los datos.
A mayor desviación media más dispersos o menos concentrados están los datos.

Intervienen para su cálculo todos los datos.

Cada vez que insertemos un dato nuevo se modificará.

Al intervenir un valor absoluto los cálculos son complicados.

A mayor concentración de los datos en torno a la media menor será su valor.

Dm >0

Dm=0 si y sólo si todos los valores son coincidentes.


La media es más representativa en la distribución (a), pues al
haber menor dispersión de datos, la mayoría de los mismos se
aproxima a la media (2.0)
 xi  x
Dm 
n
 Tres alumnos son sometidos a una
competencia para probar sus conocimientos
en 5 materias diferentes, cada una sustentada
con 10 preguntas. La idea del concurso es
encontrar al alumno más idóneo para
representar al colegio en un torneo a nivel
nacional.
 El número de respuestas acertadas por
materia se muestra a continuación:
MATERIA CARLOS LUIS IVÁN

1 7 7 9

2 8 5 6

3 7 6 3

4 4 5 8

5 4 7 4
 Primero hallamos la media aritmética de
respuestas acertadas por alumno:
787 4 4
Carlos x  6
5
75657
Luis x  6
5
9 638 4
Iván x  6
5
 Calculamos entonces la desviación media de
cada uno.
76  86  76  46  46
Carlos Dm 
5
1 2 1 2  2
  1,6
5
76  56  66  56  76
Luis Dm 
5
11 0 11
  0,8
5
96  66
 36  86  46
Iván Dm 
5
3 03 2 2
 2
5
 Carlos muestra una desviación media de 1,6
indicando que los datos se alejan en promedio de
la media en 1,6 respuestas. Luis disminuye su
variación (0,8), siendo Iván el que mayor
variación presenta con 2 respuestas acertadas
tanto por arriba como por debajo de la media
aritmética.
 Se recomienda al colegio elegir como ganador en
este caso a Luis, quien presenta resultados más
constantes que los otros dos alumnos, Juan en
promedio acierta 6 respuestas con una variación
muy baja (rondando entre 5,2 y 6,8, en otras
palabras entre 5 y 7).
 
  f i xi  x 
Dm 
n
 Una máquina dispensadora de gaseosas a
prueba está programada para llenar un
envase con 320 c.c. de un refresco popular. A
partir de una muestra de prueba realizada
sobre 50 envases se obtuvo la siguiente tabla
de frecuencias:
CANTIDAD ENVASADA
ENVASES
RECIPIENTE (C.C.)
[290 - 300) 3
[300 – 310) 4
[310 – 320) 15
[320 – 330) 18
[330 – 340) 6
[340 – 350) 4
Σ 50
Fuente: Control de calidad

Determinar la calidad del producto envasado,


desde el punto de vista de la cantidad de gaseosa
y determine si la empresa deberá invertir o no en
la máquina envasadora.
CANTIDAD
ENVASADA
RECIPIENTE
ENVASES xi xi f i x i  x f i x i  x
(C.C.)
[290 - 300) 3 295 885 26,4 79,2
[300 – 310) 4 305 1220 16,4 65,6
[310 – 320) 15 315 4725 6,4 96,0
[320 – 330) 18 325 5850 3,6 64,8
[330 – 340) 6 335 2010 13,6 81,6
[340 – 350) 4 345 1380 23,6 94,4
Σ 50 --- 16070 -- 481,6

16070
x Dm 
481,6
50 50
 321,4  9,632
x  321,4 Dm  9,632
Al hallar la media aritmética vemos un valor
aparentemente aceptable; pero al hallar la
desviación media nos damos cuenta que las
botellas envasadas pueden ser embotelladas con
desde 312 cc( x  Dm ) a 331 cc ( x  Dm ), lo cual
no nos muestra un producto con una calidad muy
aceptable para el mercado, debido a esta
variabilidad, por lo cual no sería conveniente
invertir en tal maquinaria.
VARIANZA

La varianza de la PROPIEDADES
población es la media
aritmética de las
desviaciones al
cuadrado de la media Todos los valores son utilizados en el
poblacional. cálculo.

No está influido por valores extremos.

Las unidades están desproporcionadas,


son los cuadrados de la unidad original.

S2  0
S 2  0 si x i es k
2 2
2 ( x i  ) 2 ( x i  x )
  S 
N n 1

POBLACIONAL MUESTRAL
2  2 
2  f i ( xi   )  f i ( x i  x)
 
  N
2
S  n 1

POBLACIONAL MUESTRAL
Tanto la varianza como la desviación típica dependen de todos los
valores de la distribución, así como de la media.

En los casos en los que no sea posible calcular la media aritmética, no


será posible tampoco obtener la varianza y la desviación típica, por ser
funciones de la media.

La varianza tiene el inconveniente de que no viene expresada en las


mismas unidades que los datos, debido a que las desviaciones están
elevadas al cuadrado. Si los datos fueran en metros, la varianza vendría
dada en metros cuadrados.
La desviación típica o estándar, es simplemente la raíz cuadrada
de la varianza.

La desviación estándar es la raíz cuadrada del promedio de los


cuadrados de las distancias entre las observaciones y la media.

Mientras que la varianza se expresa con el cuadrado de las unidades


utilizadas para medir los datos, la desviación estándar está en las
mismas unidades que las que se usaron para medir los datos.
Nos permite determinar, con un buen grado de precisión, dónde
están localizados los valores de una distribución de frecuencias con
relación a la media (teorema de Chebyshev).

El teorema de Chebyshev establece que, independientemente de la


forma de la distribución, al menos 75% de los valores caen dentro de
2 desviaciones estándar a partir de la media de la distribución, y al
menos 89% de los valores caen dentro de 3 desviaciones estándar a
partir de la media.
x  3S x  2S x  S x x  S x  2S x  3S
Es útil también para describir cuánto se apartan las
observaciones individuales de una distribución de
la media de la misma.

Una medida que se conoce como resultado


estándar nos da el número de desviaciones
estándar que una observación en particular (x)
ocupa por debajo o por encima de la media.
xx
Resultado estándar 
S
x  observación de la muestra
x  media aritmética
S  desviación estándar
Los siguientes datos son una muestra de la tasa de producción
diaria de botes de fibra de vidrio de la Hydrosport, Ltd., un
fabricante de Miami:

17 21 18 27 17 21 20 22 18 23

El gerente de producción de la compañía siente que una desviación


estándar de más de tres botes por día indica variaciones de tasas de
producción inaceptables. ¿Deberá preocuparse por las tasas de
producción de la planta?
1. Determinamos la media aritmética:
17  21  28  27  17  21  20  22  18  23
x  21,4
10

2. Determinamos la varianza:
19,36  0,16  43,56  31,36  19,36  0,16  1,96  0,36  11,56  2,56
S 2 
10
130,40
  13,04
10

3. Determinamos la desviación estándar:

S  13,04
 3,61
Ya que una desviación de más de tres botes por
día es inaceptable, el gerente de producción
deberá preocuparse por las tasas de producción
diaria de la planta, pues la desviación estándar
se coloca en 3,61 botes por día, pudiendo
variar entonces a 3 ó 4 botes más o menos por
día.
 En un intento de estimar la demanda
potencial futura, la National Motor Company
realizó un estudio, en 2005, en el que
preguntaba a parejas casadas cuántos
automóviles debe tener la familia promedio
actual. Para cada pareja, promediaron las
repuestas del hombre y la mujer, a fin de
obtener la respuesta global de la pareja. Las
respuestas se colocaron en una tabla:
Número 0 0,5 1 1,5 2 2,5
autos
Frecuencia 2 14 23 7 4 2
a) Calcule la varianza y la desviación estándar.

b) Dado que la distribución tiene, casi, forma de


campana, en teoría, ¿cuántas observaciones
deben caer entre 0.5 y 1.5? ¿Entre 0 y 2? ¿Cuántas
caen de hecho en esos intervalos?
 Un conjunto de 60 observaciones tiene una
media de 66.8, una varianza de 12.60 y una
forma de distribución desconocida.
 a) ¿Entre qué valores deberán caer al menos 75%
de las observaciones, de acuerdo con el teorema
de Chebyshev?
 b) Si la distribución es simétrica y con forma de
campana, aproximadamente cuántas
observaciones deberán encontrarse en el
intervalo 59.7-73.9?
 c) Encuentre los resultados estándar para las
siguientes observaciones tomadas de la
distribución: 61.45, 75.37, 84.65 y 51.50.
Nos permite la comparación entre distintas variables y poblaciones.

Mide el grado de homogeneidad o heterogeneidad en una o más poblaciones.

Su principal característica es estar desprovisto de unidades.

El valor se puede expresar en términos porcentuales

S
CV 
x
El concepto y la utilidad del coeficiente de variación son
evidentes si se intenta comparar a hombres con sobrepeso y
mujeres con sobrepeso.

Suponga que un grupo de hombres y mujeres tiene un


sobrepeso de 20 libras. Esas 20 libras no son una buena
medida del peso excesivo. El peso promedio para los
hombres es cerca de 160 libras, mientras que el peso
promedio para las mujeres es alrededor de 120 libras.
Con un cociente sencillo se puede ver que las mujeres tienen 20/120, es decir 16.7%,
de sobrepeso, y el de los hombres corresponde a 20/160, o sea cerca del 12.5%.
Aunque el coeficiente de variación es un poco más complejo que el cociente del
ejemplo, el concepto es el mismo: se usa para comparar la cantidad de variación en
grupos de datos que tienen medias diferentes.

Advertencia: no compare la dispersión en los conjuntos de datos usando las


desviaciones estándar, a menos que las medias sean parecidas.
 Una agencia de empleos temporales, ha probado
las habilidades para la captura de datos de
muchas personas. Se necesita un capturista
rápido y consistente. HumanPower revisa los
registros de velocidad de 4 empleados con los
siguientes datos en términos del número de
entradas correctas por minuto. ¿Qué empleado es
el mejor, según la dispersión relativa?
 John 63 66 68 62 69 72
 Jeff 68 67 66 67 69
 Mary 62 79 75 59 72 84
 Tammy 64 68 58 57 59
 Bibliografía

◦ Levin, R.,Rubin, D., Estadística para Administración


y Economía, Editorial Pearson Prentice Hall , 7ma.
Edición, 2004, México

También podría gustarte