Está en la página 1de 31

PROBABILIDAD

Y
ESTADÍSTICA
CLASE 7
MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN
 Para describir un conjunto de números vimos
que es de utilidad ubicar el centro del conjunto
de datos. Pero identificar una medida de
tendencia central rara vez es suficiente
 Una descripción más completa del conjunto de
datos puede obtenerse si se mide qué tan
dispersos están los datos alrededor de dicho
punto central
 Las medidas de dispersión indican cuánto se
desvían las observaciones alrededor de su
media
MEDIDAS DE DISPERSIÓN
 El Rango
 La medida de dispersión más simple (y menos útil) es
el rango o recorrido
 El rango es simplemente la diferencia entre la
observación más alta y la más baja
 Su ventaja es que es fácil de calcular
 Su desventaja es que considera sólo dos de los
cientos de observaciones que pueden haber en un
conjunto de datos. El resto de las observaciones se
ignoran
RANGO
 Datos sin agrupar
34, 56, 37, 33, 49 Rango = 56 – 33 = 23
 Datos agrupados
Altura de 100 estudiantes
varones de la Universidad XYZ
Número de
Altura (mts) estudiantes
1.60-1.62 5
1.63-1.65 18
1.66-1.68 42
1.69-1.71 27
1.72-1.74 8

Rango = 1.74 – 1.60 = 0.14 mts


VARIANZA Y DESVIACIÓN ESTÁNDAR

 La varianza y la desviación estándar


son medidas de dispersión mucho más
útiles

 Proporcionan una medida más


significativa sobre el punto hasta el
cual se dispersan las observaciones
alrededor de su media
VARIANZA

Lospromedios de las
observaciones
respecto a su media
elevados al cuadrado
VARIANZA POBLACIONAL
DATOS NO AGRUPADOS

( X   ) 2
 ( X   ) 2
 ( X   ) 2
 ...  ( X   ) 2
2  1 2 3 N
N

2 
 (x  ) 2

N
 x = elemento u observación individual
μ es la media poblacional
N es el número de observaciones de la
población
∑ = suma de todos los valores (x-µ)2
VARIANZA POBLACIONAL
DATOS SI AGRUPADOS
2

2   f ( x   ) 2

 f es la frecuencia de cada una de las clases


x = punto medio de cada clase (marca de clase)
μ es la media poblacional
N es el número de observaciones de la
población
∑ = suma de todos los valores f(x-µ)2
VARIANZA PARA UNA MUESTRA
DATOS NO AGRUPADOS

s 2

 ( x  x) 2

n 1
 x = elemento u observación individual
 x = media de la muestra
 n = número de observaciones de la muestra

Debe tomarse en cuenta que en el caso de la muestra se


divide entre n-1
VARIANZA PARA UNA MUESTRA
DATOS NO AGRUPADOS

s 2

 ( x  x) 2

n 1
Debe tomarse en cuenta que en el caso de la muestra se
divide entre n-1 porque generalmente los datos están un
poco menos dispersos que la población de la cual se tomó

También se explica por el concepto de grados de libertad


que se define como el número de variables aleatorias
menos las restricciones en un experimento; en este caso
hay n variables aleatorias y una restricción, que es
precisamente que la información se obtendrá de esa
muestra (GL = n -1)
VARIANZA PARA UNA MUESTRA
DATOS SI AGRUPADOS

s 2
  f ( x  x) 2

n 1
 f es la frecuencia de cada una de las clases
x = punto medio de cada clase (marca de clase)
x es la media de la muestra
n es el número de observaciones de la muestra
∑ = suma de todos los valores f(x-x)2
DESVIACIÓN ESTÁNDAR – POBLACIONAL
DATOS NO AGRUPADOS O SÍ AGRUPADOS

 Es la raíz cuadrada de la varianza poblacional


 Es una medida importante en la dispersión de
los datos

  2
DESVIACIÓN ESTÁNDAR – MUESTRA
DATOS NO AGRUPADOS O SÍ AGRUPADOS

 Es la raíz cuadrada de la varianza muestral

 Es una medida importante en la dispersión de


los datos

S S 2
LA VARIANZA Y
LA DESVIACIÓN ESTÁNDAR
 A pesar del uso común de la varianza, ésta presenta
dos problemas: es un número muy grande con respecto
a las observaciones. Como se puede ver, es varias veces
mayor incluso que la observación más grande. Debido a
su gran tamaño, con frecuencia la varianza se vuelve
difícil para trabajar

 Un problema aún mayor es que debido a que las


desviaciones son elevadas al cuadrado, la varianza
siempre se expresa en términos de los datos
originales elevados al cuadrado, lo cual dificulta su
interpretación
LA VARIANZA Y
LA DESVIACIÓN ESTÁNDAR
 En la mayoría de los casos la varianza se
expresa en términos que no tienen
significado o interpretación lógica

 Sin embargo, ambas complicaciones pueden


resolverse rápidamente. Tan sólo con
calcular la desviación estándar, sacando
la raíz cuadrada de la varianza
LA VARIANZA Y
LA DESVIACIÓN ESTÁNDAR
 El concepto de desviación estándar es muy
importante en los negocios, en la economía, en la
Ingeniería
 Por ejemplo, en finanzas la desviación estándar se
utiliza como medida de riesgo relacionada con varias
oportunidades de inversión. Mediante el uso de la
desviación estándar para medir la variabilidad en las
tasas de rendimiento ofrecidas por diferentes
inversiones, el analista financiero puede medir el nivel
de riesgo que tiene cada activo financiero.
Generalmente, entre mayor sea la desviación estándar
de la tasa de rendimiento de una inversión en particular,
mayor será el grado de riesgo
PARA CUALQUIER TIPO DE DISTRIBUCIÓN
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR (DISTRIBUCIÓN NORMAL)
Quizá la propiedad más importante de la
desviación estándar, está relacionada con la
distribución normal, ya que entre la media y 1
desviación estándar arriba y debajo de ella, se
concentra el 68.3% de todos los datos, entre 2
desviaciones estándar y la media se concentra
cerca del 95.5% de los datos y entre 3
desviaciones estándar y la media se concentra
el 99.8% de los datos
Esto se denomina REGLA EMPÍRICA
SOLO PARA LA DISTRIBUCIÓN NORMAL
Regla Empírica
DISPERSIÓN RELATIVA:
COEFICIENTE DE VARIACIÓN O DE PEARSON

 Como se ha enfatizado, un uso importante de


la desviación estándar es servir como medida
de dispersión. Sin embargo, se aplican ciertas
limitaciones, ya es una medida absoluta

 Cuando se consideran dos o más


distribuciones que tienen medias
significativamente diferentes, o que están
medidas en unidades distintas, es peligroso
sacar conclusiones respecto a la dispersión
sólo con base en la desviación estándar
COEFICIENTE DE VARIACIÓN

 Por tanto, con frecuencia se debe considerar el


coeficiente de variación CV, el cual sirve
como medida relativa de dispersión

 El coeficiente de variación determina el


grado de dispersión de un conjunto de datos
relativo a su media. Se calcula dividiendo la
desviación estándar de una distribución
entre su media y multiplicando por 100
COEFICIENTE DE VARIACIÓN
De una población:

CV  (100)

De una muestra:
s
CV  (100)
x
AL MULTIPLICAR POR 100 SE
EXPRESA COMO PORCENTAJE
EJEMPLO DATOS SIN
AGRUPAR, POBLACIÓN
 Seguros El Águila vendió en total cinco pólizas
de seguro diferentes de auto. Sus respectivas
primas mensuales son de Q 110, Q145, Q125,
Q95 y Q150.
 La prima promedio es:

Q110 Q145 Q125 Q95 Q150


  Q125
5
Ejemplo
 La varianza se calcula: 1) restando la media de
Q125 de cada una de las observaciones, 2)
elevando al cuadrado estas desviaciones, y 3)
hallando el promedio de estas desviaciones al
cuadrado.   ( X   )  ( X   )  ( X   )  ...  ( X   )
2 1
2
2
2
3
2
N
2

2 
 (x  ) 2

(110  125) 2
 (145  125) 2
 (125  125) 2
 (95  125) 2
 (150  125) 2
2 
5
 2  430 VARIANZA = 430 quetzales al cuadrado
Ejemplo…
 Desviación estándar

  430  Q20.74

 Coeficiente de variación CV:


Q20.74
CV  (100)  16.59%
Q125

 El dato de CV sería útil para compararlo con


las ventas de otro vendedor
EJEMPLO DE DATOS AGRUPADOS, MUESTRA

 Los estadísticos del programa de


“Ayuda a la casa” , el cual lleva
comidas calientes a enfermos a sus
casas, desean evaluar sus servicios. El
número de comidas diarias que
suministran aparece en la siguiente
tabla, tomando solo los datos de 27
días
Ejemplo
Número de
comidas por Número de
día Días = f
0-5 3
6-11 6
12-17 5
18-23 8
24-29 2
30-35 3
27
Ejemplo s 2
  f ( x  x) 2

n 1
Número de
comidas por Número de
día Días = f x f *x
0-5 3 2.5 7.50
6-11 6 8.5 51.00
12-17 5 14.5 72.50
18-23 8 20.5 164.00
24-29 2 26.5 53.00
30-35 3 32.5 97.50
27 445.5

La media = X = ∑ (f * x) / n
Ejemplo
Media de la muestra de datos agupados:

X = ∑ (f * x) / n

X = 445.5/27 = 16.5 comidas al día


Ejemplo
Número de
comidas por Número de
día Días = f x (x-x) (x-x)2 f(x-x)2
0-5 3 2.5 -14.0 196.0 588.0
6-11 6 8.5 - 8.0 64.0 384.0
20.0
12-17 5 14.5 - 2.0 4.0
18-23 8 20.5 128.0
4.0 16.0
24-29 2 26.5 10.0 100.0 200.0
30-35 3 32.5 16.0 256.0 768.0
27 2,088.0

s 2
  f ( x  x) 2

n 1
Ejemplo
s 2
  f ( x  x) 2

n 1
s s 2 s
CV  (100)
x
S2 = 2,088/ (27-1) = 80.31 comidas al cuadrado

S = √80.31 = 8.96 comidas (DESV ESTÁNDAR)

CV = 8.96/16.5 (100) = 54.3 %

También podría gustarte