Está en la página 1de 19

Descripción de Datos

Medidas de Dispersión

UANL-FACPYA 1
Las medidas de
tendencia central
nos describen una
serie de datos en
términos de un
valor central, sin
embargo, no nos
dice nada en
relación a qué
tanto difieren los
datos de ese valor
central, para ello
resulta apropiado
revisar las
medidas de
dispersión. A
continuación
presentamos las
más utilizadas.

UANL-FACPYA 2
Rango
Es la medida más simple de dispersión.
Representa la diferencia entre los valores máximo y
mínimo de un conjunto de datos
Salario Mínimo Salario Mínimo
AÑO Promedio
CONASAMI
AÑO Promedio
CONASAMI
Rango  Máximo  Mínimo
2000 35 2006 47
2001 38 2007 49
Rango  58  35
2002 40 2008 51
2003 42 2009 53 Rango  23
2004 44 2010 56
2005 45 2011 58

UANL-FACPYA 3
Desviación Media
La Desviación Media es la media aritmética de
los valores absolutos de las desviaciones con
respecto a la media aritmética


N
xi   x1    x2    ...  xn   ¿Porqué se utiliza
DM  i 1
 el valor absoluto?
N N
donde :
Si no se aplicara el
  Media Población resultado sería
n  Número total de valores en la población cero, lo cual no
tendría sentido
xi  el i  ésimo valor
  indica el operador suma
 indica el valor absoluto (resultado se cambian a valores positivos)

UANL-FACPYA 4
Desviación Media
Salario Mínimo Salario Mínimo
AÑO |X-media| AÑO X-media
Promedio CONASAMI Promedio CONASAMI
2000 35 |35-46.5|= 2006 47 |47-46.5|=
2001 38 |38-46.5|= 2007 49 |49-46.5|=
2002 40 |40-46.5|= 2008 51 |51-46.5|=
2003 42 |42-46.5|= 2009 53 |53-46.5|=
2004 44 |44-46.5|= 2010 56 |56-46.5|=
2005 45 |45-46.5|= 2011 58 |58-46-5|=

1N 35  38  ...  58 558


    xi    46.5
 N  i 1 12 12 El promedio de los
salario de 2000 a 2011
fue de $46.5 con una
(11 .5)  (8.5)  (6.5)  (4.5)  (2.5)  (1.5)  (0.5)  (2.5)  (4.5)  (6.5)  (9.5)  (11 .5)
DM  desviación media de
12 más/menos $5.83
70
DM   5.83
12
UANL-FACPYA 5
Varianza Poblacional
La varianza también mide la desviación promedio de los datos, pero
en lugar de calcular la desviación en términos absolutos como el
caso de la desviación media lo hace mediante desviaciones al
cuadrado, es decir:
La varianza poblacional es la media aritmética de las desviaciones de
la media elevadas al cuadrado.
2 
N
xi   2
 x   2
 x   2
 ...  x   2
  i 1  1 2 N
N N
donde :
 2  varianza poblacional
xi  el i  ésimo valor
N  número total de valores en la población
  indica el operador suma
UANL-FACPYA 6
Desviación Estándar Poblacional
Como se señaló la varianza mide en promedio las desviaciones
cuadráticas, sin embargo, en ocasiones resulta conveniente eliminar
el efecto cuadrático, para ello la desviación estándar es útil, para su
cálculo se obtiene la raíz cuadrada de la varianza, esto es,

2

i 1 i
N
x   2
x1   2  x2   2  ...  xN   2
   
N N
donde :
  desviación estándar poblacional
xi  el i  ésimo valor
N  número total de valores en la población
  indica el operador suma

UANL-FACPYA 7
Varianza Poblacional
Salario Mínimo Salario Mínimo
AÑO (X-media)2 AÑO (X-media)2
Promedio CONASAMI Promedio CONASAMI
2000 35 (35-46.5)2= 2006 47 (47-46.5)2=
2001 38 (38-46.5)2= 2007 49 (49-46.5)2=
2002 40 (40-46.5)2= 2008 51 (51-46.5)2=
2003 42 (42-46.5)2= 2009 53 (53-46.5)2=
2004 44 (44-46.5)2= 2010 56 (56-46.5)2=
2005 45 (45-46.5)2= 2011 58 (58-46-5)2=

  46.5
(132.25)  (72.25)  (42.25)  (20.25)  (6.25)  (2.25)  (0.25)  (6.25)  (20.25)  (42.25)  (90.25)  (132.25)
2 
12
567
2   47.25
12 Las desviaciones al cuadrado en promedio es de $47.25
  47.25  6.87 En promedio hay una desviación alrededor de la media de $6.87

UANL-FACPYA 8
Varianza y Desviación Estándar Muestral
Si consideramos sólo una muestra de la población entonces se
tendría que ajustar para evitar subestimar la varianza, por lo que la
fórmula de la varianza y la desviación estándar muestral quedaría
como:
2
n

i 1 ix  x 2
x1  x   x2  x   ...  xn  x 
2 2 2
s  
n 1 n 1
s  s2
donde :
s 2  varianza muestral
s  desviación estándar
xi  el i  ésimo valor
n  número total de valores en la muestra
  indica el operador suma
UANL-FACPYA Dr. Klender Cortez 9
Varianza y Desviación Estándar Muestral
Salario Mínimo Promedio
AÑO (X-Xmedia) (X-Xmedia)2
CONASAMI (x)
2008 51 (51-55.8)=-4.8 (-4.8)2=23.04
2009 53 (53-55.8)=-2.8 (-2.8)2=7.84
2010 56 (56-55.8)=0.2 (0.2)2=0.04
2011 58 (58-55.8)=2.2 (2.2)2=4.84
2012 61 (61-55.8)=5.2 (5.2)2=27.04

 x5
i  x
2

s2  i 1
5 1

23.04  7.84  0.04  4.84  27.04 62.8


s2    15.7
4 4
s  15.7  3.96

UANL-FACPYA 10
Cómo calcular la Desviación Estándar
de Datos Agrupados
Para aproximar la desviación estándar de datos agrupados
suponemos que las observaciones de cada clase se representa a
través del promedio de la clase y se pondera cada una de las
diferencias cuadradas por el número de frecuencias en cada clase. La
fórmula es:

 f  M  x 
F 2

s DA  i 1
F 1
donde :
xDA  media de datos agrupados
f  frecuencia de cada clase
M  es el punto medio de cada clase
F  número total de frecuencias
 indica el operador suma

UANL-FACPYA 11
Cómo calcular la Desviación Estándar
de Datos Agrupados
Clase Punto medio Frecuencia M-Xmedia (M-Xmedia)2 f*(M-Xmedia)2

[68-76) 72 2 (72-83)=-11 (-11)2=121 242


[76-84) 80 8 (80-83)=-3 (-3)2=9 72
[84-92) 88 4 (88-83)=5 (5)2=25 100

[92-100) 96 2 (96-83)=13 (13)2=169 338

xDA  83
242  72  100  338 752
s 2DA    50.13
16  1 15
 f  M  x 
F 2

sDA  i 1
sDA  50.13  7.08
F 1

UANL-FACPYA 12
Semidesviación
La desviación estándar en ocasiones es utilizada como una medida de riesgo,
ya que determina, la desviación promedio (hacia arriba y hacia abajo) de
nuestros datos en relación a la media.

Sin embargo, en ocasiones pudiera ser interesante sólo analizar una parte de
esa desviación, por ejemplo, la desviación hacia abajo de la media. La
semidesviación se toma como medida de riesgo a la baja, esto es, tiene en
cuenta sólo las observaciones menores al esperado.

UANL-FACPYA 13
Semidesviación estandar
Ejemplo: A continuación se presenta el IPC (Índice de Precios y Cotizaciones)
de la BMV (Bolsa Mexicana de Valores) calcule el rendimiento mensual
promedio utilizando la media geométrica y la semidesviación:

Fecha IPC Rendimientos 1+Rto


2001 6372 ND ND
x g  10 5.90
2002 6127 =6127-6372)/6372= -0.04 =0.96 x g  1.19
2003 8795 =(8795-6127)/6127= 0.44 =1.44
2004 12918 =(12918-8795)/8795= 0.47 =1.47
Rto  1.19  1  0.19
2005 17803 =(17803-12918)/12918= 0.38 =1.38 Rto  19%
2006 26448 =(26448-17803)/17803= 0.49 =1.49
2007 29537 =(29537-26448)/26448= 0.12 =1.12
2008 22380 =(22380-29537)/29537= -0.24 =0.76
2009 32120 =(32120-22380)/22380= 0.44 =1.44
2010 38551 =(38551-32120)/32120= 0.20 =1.20
2011 37078 =(37078-38551)/38551= -0.04 =0.96
n
x g  n  xi
i 1
10
UANL-FACPYA xg  0.96 * 1.44 * 1.47 * 1.38 * 1.49 * 1.12 * 0.76 * 1.4 * 1.20 * 0.96 14
Semidesviación estandar
Ejemplo: A continuación se presenta el IPC (Índice de Precios y Cotizaciones)
de la BMV (Bolsa Mexicana de Valores) calcule el rendimiento mensual
promedio utilizando la media geométrica y la semidesviación:
Fecha Rto (X-Media) Min[(X-Media),0] Min[(X-Media),0]2
Rto Prom  19%
2001 ND ND ND ND
1 N
2002 -0.04 -0.23 -0.23 0.053 Semidesv.  i 1
Min( X i   ; 0)2
N
2003 0.44 0.25 0 0.000
1
2004 0.47 0.28 0 0.000 Semidesv.  0.053  0.005  0.185  0.053
2005 0.38 0.19 0 0.000 10
2006 0.49 0.30 0 0.000 1
Semidesv.  0.296
2007 0.12 -0.07 -0.07 0.005 10
2008 -0.24 -0.43 -0.43 0.185 Semidesv.  0.17  17%
2009 0.44 0.25 0 0.000
2010 0.20 0.01 0 0.000 El rendimiento promedio del
2011 0.04 -0.23 -0.23 0.053 mercado es de 19% del 2002
al 2011 con una desviación
promedio (riesgo) a la baja
del 17%

UANL-FACPYA 15
Teorema de Chebyshev
En cualquier conjunto de observaciones (muestras o población), la
proporción de valores que se encuentran a k desviaciones estándar de la
media es de por lo menos 1-1/k2, siendo k cualquier constante mayor que 1.

EJEMPLO: La media aritmética del rendimiento de la Bolsa Mexicana de


Valores es del 22% con una desviación estándar del 15%, por lo menos
qué porcentaje de los rendimientos se encuentra en más de 2.5
desviaciones estándar y menos de 2.5 desviaciones de la media.

1
1 
2
k
1
1 
2.5 2

1
1 
6.25
1  0.16 
Al menos el 84%
UANL-FACPYA 16
Regla Empírica para Distribuciones
Simétricas
En cualquier distribución de frecuencias simétrica con forma de campana,
aproximadamente:
68% se encontrarán entre más y menos una desviación estándar de la media
95% se encontrarán entre más y menos dos desviaciones estándar de la media
99.7% se encontrarán entre más y menos tres desviaciones estándar de la media

EJEMPLO: El tipo de cambio pesos/dólar presentó una media diaria de 13


pesos en el 2011 con una desviación estándar de 1.1 pesos. Si el tipo de
cambio siguiera una distribución simétrica:
¿Entre qué dos cotizaciones se encontraba el 95% de los datos?

Límite inferior: 13-2*1.1=10.8 pesos por dólar


Límite inferior: 13+2*1.1=15.2 pesos por dólar
Respuesta: entre 10.8 y 15.2 pesos por dólar

UANL-FACPYA 17
Ejercicio 1
1) Si la población fuera todos los datos calcule
AÑO
Precio Acción de los precios: a) Rango, b) Desviación
Comercial Mexicana
Media, c) Desviación Estándar y d) si los
2003 11 datos siguen una distribución simétrica en
2004 12 ¿entre qué datos se encuentran el 68% de
2005 16 las observaciones?
2006 27 2) Calcule los rendimientos y determine la
2007 27 semidesviación estándar utilizando la media
2008 3
geométrica.
3) Considere los precios y calcule la desviación
2009 11
estándar muestral de los siguientes
2010 15
periodos y comente cuál de los dos tuvo
2011 23 mayor riesgo (desviación estándar) y
2012e 30 porqué cree: a) Pre-crisis: 2003-2007, y b)
Crisis y Post-crisis: 2008-2012.

UANL-FACPYA 18
Ejercicio 2

CLASE f
1) Utilizando las siguientes clases determine la
[3-12) 1 media y la desviación estándar de los
[12-21) 5 siguientes datos agrupados del precio de la
[21-30) 3 acción de Comercial Mexicana 2003-2012
[30-39) 1

UANL-FACPYA 19

También podría gustarte