Está en la página 1de 5

Probabilidades y Estadstica

Medidas de Dispersin
Las medidas de tendencia central entregan una medida respecto del valor central, promedio o ms frecuente de un conjunto de datos. Esta informacin es muy importante al momento de describir un fenmeno, pero puede no ser suficiente, ya que es necesario saber tambin qu tan dispersos estn los datos respecto de ese valor central. Dicho de otra manera, es necesario tener una medida del grado de variabilidad que presentan los datos. Las medidas de dispersin proveen de una medida del grado de variabilidad de los datos. Las ms utilizadas son: Rango Varianza Desviacin Estndar

Rango o Recorrido
El rango o recorrido es el estadgrafo de dispersin ms simple. Mide la diferencia entre el valor mximo y el valor mnimo del conjunto de datos. Si los datos no estn agrupados, el recorrido se calcula de acuerdo a la siguiente expresin:

R x = x mx x mn
Si los datos se encuentran agrupados en una tabla intervalos, el clculo del Recorrido se realiza de la siguiente manera:
' ' Rx = xk x0

' Donde x0 ' xk

es el lmite inferior del primer intervalo es el lmite superior del ltimo intervalo

Notar que el Rango slo considera dos valores de todo el conjunto de datos, por lo que no necesariamente puede proporcionar una idea de la real dispersin de stos. Por ejemplo, si en la distribucin existen valores extremos demasiado exagerados, esto afectar directamente el resultado que arroje el estadgrafo.

Varianza
Es un estadgrafo de dispersin que se encuentra asociado a la media aritmtica, entregando una medida respecto de la dispersin de los datos en torno de la media, razn por la cual es el estadgrafo de dispersin ms ampliamente utilizado. Al igual que en el caso de la media aritmtica, es necesario distinguir entre la media poblacional y la muestral. La notacin aplicada es la siguiente: Poblacin Tamao Media Varianza N Muestra n
x
s2

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

La varianza se define como el promedio de las diferencias al cuadrado de las observaciones respecto de su media aritmtica, de tal manera que mientras mayor sea la dispersin de las observaciones, mayor ser la magnitud de sus desviaciones respecto de la media aritmtica y por lo tanto mayor ser la varianza. De acuerdo a la definicin anterior, la varianza poblacional se calcula de la siguiente forma: Datos no Agrupados
2 =
i =1 2 ( xi ) n

o equivalentemente

2 =

i =1

2 2 xi ( xi ) / N i =1

2 =

i =1

xi N

Datos Agrupados

2 =

( xi )2 ni
i =1

o equivalentemente

2 =

xi2 ni ( xi ni )2 / N
i =1 i =1

2 =

x n
i =1

2 i i

Si los datos disponibles corresponden a una muestra, la varianza muestral se calcula de la siguiente manera: Datos no Agrupados

s2 =

i =1

( x i x) 2
n 1

o equivalentemente

s2 =

i =1

x i2 ( x i ) 2 / n
i =1

n 1

Datos Agrupados

s2 =

( x x) n
2 i =1 i

n 1

o equivalentemente

s2 =

x
i =1

2 i i

f ( xi ni ) 2 / n n 1
i =1

Se puede observar que la suma de las diferencias al cuadrado de las observaciones respecto de la media en el caso de la varianza poblacional es dividida por N, en tanto que en el caso de la muestra, la divisin es por n-1. Esta diferencia se debe a que matemticamente se ha demostrado que la expresin entregada para la varianza muestral provee de un estimador con mejores propiedades matemticas que si el divisor fuera n. Por otra parte, se debe tener en cuenta que desde el punto de vista de los clculos, a medida que aumenta el tamao de la muestra, la diferencia en la estimacin de la varianza con uno u otro denominador se reduce progresivamente. Propiedades de la Varianza 1. La varianza es un valor mayor o igual a cero.
V [x ] 0

2. La varianza de una constante es cero.

V [cte] = 0
3. La varianza de una variable ms una constante, es la varianza de la variable.

V [cte + x ] = V [x]
4. La varianza del producto de una variable por una constante es el cuadrado de la constante multiplicado por la varianza de la variable.

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

V [cte x ] = cte V [x ]
2

5. De las propiedades anteriores se desprende lo siguiente:


2 V [cte1 x + cte 2 ] = cte1 V [x ]

Desviacin Estndar
La varianza proporciona una idea de dispersin en una unidad de medida distinta a la de los datos, complicando su interpretacin. Por esto, en ocasiones es aconsejable utilizar la desviacin estndar, que es la raz cuadrada de a varianza.
= 2 y s=

s2

Ejemplo: Sean las siguientes observaciones correspondientes al peso en Kg. de una muestra de 40 adultos. Calcular la media, varianza y desviacin estndar.
90 108 80 95 75 83 91 54 61 74 59 76 59 72 77 66 63 102 104 51 73 61 75 64 88 64 56 67 65 58 94 76 58 99 74 63 61 88 67 79

x=

x
i =1

n
n

x1 + x2 + ... + xn i =1 i 90 + 75 + 61 + ... + 76 + 63 + 79 2970 = = = = = 74.250 n 40 40 40


i

40

s2 =

(x
i =1 n

x) 2 =
n

n 1
i =1 i =1

(90 74.250) 2 + (75 74.250) 2 + ... + (79 74.250) 2 = 225.987kg 2 s = 15.033kg 40 1


=

s2 =

xi2 ( xi ) 2 / n
n 1

229336 (2970) 2 40 229336 220522.500 8813.500 = = = 225.987kg 2 s = 15.033kg 40 1 40 1 39

Si los datos anteriores, en lugar de pertenecer a una muestra correspondiesen a la totalidad de la poblacin, tendramos:
2 =
i =1 2 ( xi ) N

N
N n i =1 i =1

(90 74.250) 2 + (75 74.250) 2 + ... + (79 74.250) 2 = 220.338kg 2 s = 14.844kg 40


229336 (2970) 2 40 229336 220522.500 8813.500 = = = 220.338kg 2 s = 14.844kg 40 40 40

2 =

2 2 xi ( xi ) / n

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Ejemplo: La siguiente tabla de distribucin de frecuencias, contiene de manera resumida las observaciones anteriores

xi' 1
50 60 70 80 90 100

xi'
60 70 80 90 100 110

xi
55 65 75 85 95 105

ni
7 11 10 4 5 3 40

x i ni
385 715 750 340 475 315 2980

x i2 ni
21175 46475 56250 28900 45125 33075 231000

( x i x) 2
380.250 90.250 0.250 110.250 420.250 930.250

( x i x) 2 n i
2661.750 992.750 2.500 441.000 2101.250 2790.750 8990.000

Ahora, si los datos anteriores provinieran de una muestra:


_

x=

xi ni
i =1

n
k i

x n + x n + ... + xk nk = 1 1 2 2 = n
_ 2 i

x n
i =1 i

40

55 ( 7 ) + 65 (11) + ... + 105 ( 3) 40

2980 = 74.500kg 40

s2 =

( x x) n
i =1

n 1
k 2 i i i =1

8990 = 230.513kg 2 40 1
2

s2 =

x n ( x n )
i =1 i i

/n
=

n 1

231000 (2980)2 40 231000 222010 8990 = = = 230.513kg 2 40 1 40 1 39

Si los consideramos como la poblacin total:

=
2

(x ) n
2 i =1 i

N
k k

8990 = 224.750kg 2 40
=

2 =

xi2 ni ( xi ni )2 / N
i =1 i =1

231000 (2980) 2 40 231000 222010 8990 = = = 224.750kg 2 40 40 40

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Ejemplo: Calcular la media y varianza del siguiente conjunto de datos, correspondiente a la estatura (en cm) de una muestra de 30 alumnos de una Universidad.
154 155 155 155 160 160
n 30

160 160 162 162 162 167

170 170 172 173 174 174

175 177 178 180 180 180

180 180 182 182 183 186

x=

x
i =1

n
n

x1 + x2 + ... + xn i =1 i 5108 = = = = 170,27 cm n 30 30


i

s =
2

(x
i =1

170,27) 2

30 1

2925,87 = 100,89 s = 10,04 cm 29

Ejemplo: Ahora considere que los datos del ejemplo anterior fueron entregados en forma agrupada. Calcule la media, varianza y desviacin estndar muestrales.
[x'i-1 ; x'i) xi ni Ni hi Hi

[154 ; 160) [160 ; 166) [166 ; 172) [172 ; 178) [178 ; 184) [184 ; 190)

157 163 169 175 181 187

4 7 3 6 9 1

4 11 14 20 29 30

0,1333 0,2333 0,1000 0,2000 0,3000 0,0333

0,1333 0,3667 0,4667 0,6667 0,9667 1,0000

x=

x n
i =1 i

30

5142 = 171,4 30
2

k xi ni k 2 2 2 i =1 ( ( 5142) 5142) x n 883830 883830 i i n 30 = 30 = 85,90cm 2 s = 9,27 cm s 2 = i =1 = n 1 30 1 29

Edmundo Pea Rozas, Juan Garcs Seguel

También podría gustarte