Está en la página 1de 18

Medidas de dispersin

CAPTULO 15

MEDIDAS DE DISPERSIN

En el captulo anterior se estudiaron las medidas de tendencia central, que son un indicador de cmo los datos se agrupan o concentran en una parte central del conjunto. Sin embargo, para una informacin completa de dicho conjunto de datos hace falta saber el comportamiento opuesto, es decir, de qu manera se dispersan o se alejan alA B gunos datos de esa parte central. 19.3 - 3 Por ejemplo, al tomar las temperaturas en una regin A durante diferentes pocas del ao y a distintas horas del da, se registraron los datos que se muestran en la columna A ; por su parte, las de otra regin diferente B, son las de la columna B . Al obtener la media, en ambos casos result que la temperatura promedio fue de 20.68, cuya interpretacin podra ser que en torno, al rededor o cerca a 20.68 fluctan los dems valores. 20 20.2 20.4 21 21.3 21.3 22 Promedio: 20.68 0 6 22 31.5 34 36 39 20.68

167

Medidas de dispersin

Como puede verse, eso es bastante aproximado para los datos de la columna A, no as para los de la B. Los datos ms alejados en A son 19.3 y 22, que realmente estn prximos a 20.68; en cambio, los datos ms alejados en B son -3 y 39, que estn muy distantes del promedio. Por qu si en ambos casos se tiene igual promedio, no se puede afirmar lo mismo de los valores que estn a su alrededor?. La respuesta est en que no se ha tomado en cuenta la dispersin, es decir, la manera en que se disgregan los datos respecto de la media, pues en A casi no se dispersan mientras que en B s, .Cabra decir que el conjunto de datos A es bastante compacto mientras que el B es muy dilatado. Las principales medidas de dispersin son tres: El rango, la desviacin media y la desviacin estndar. De manera semejante a las medidas de tendencia central, las medidas de dispersin deben considerarse en sus dos opciones: cuando no estn agrupados los datos y cuando estn por intervalos.

15.1 EL RANGO El rango es la diferencia entre los datos mayor y menor del conjunto. Tambin se le suele llamar recorrido . En un conjunto de datos, mientras mayor sea el rango, mayor ser su dispersin y, a la inversa, mientras menor sea su rango, menor su dispersin. En los casos de las temperaturas del ejemplo anterior, el rango de A es R = 22 - 19.3 = 2.7, en cambio, el de B es B = 39 - (-3) = 42.

15.2 LA DESVIACIN MEDIA Dado un conjunto de datos cuya media aritmtica o promedio es x , la diferencia o la distancia de cada valor nominal x a la media aritmtica se llama desviacin del dato x con respecto a la media x . Es decir, es una medicin de cunto se alej cada valor nominal x de la media.

168

Medidas de dispersin

Por ejemplo, de los datos mostrados en la tabla de la derecha, la media aritmtica es

x 50 60 70 80 50 - 75 60 - 75 70 - 75 80 - 75 90 - 75 100 - 75

d = - 25 = - 15 =-5 =5 = 15 = 25

x =
entonces

450 = 75 6

La desviacin del dato x = 50 con respecto de la media es d = 50 - 75 = - 25. Lo mismo puede decirse de los dems datos. Resulta obvio que siendo la media aritmtica x el punto central de todos los valo-

90 100

x = 450

res de los datos x, existan simtricamente valores positivos y negativos, o lo que es lo mismo, la suma de todas las desviaciones a la media siempre es cero. Para evitar lo anterior, dicha suma se toma como valor absoluto, esto es La desviacin del dato x = 50 con respecto de la media x es d = 50 75 = 25 La desviacin del dato x = 60 con respecto de la media x es d = 60 75 = 15 y as sucesivamente.

15.2.1 LA DESVIACIN MEDIA PARA FRECUENCIAS SIMPLES Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, es decir, sin agrupar, la desviacin media DM se calcula por medio de la frmula:

169

Medidas de dispersin

DM =

xx n

Por lo tanto, deben aadirse a la tabla original tres columnas: la primera encabezada con fx, que servir para calcular la media aritmtica; la segunda encabezada con x x , que servir para obtener la tercera, f x x con la que se obtiene el numerador de la frmula luego de realizar su sumatoria.

Ejemplo 1: Obtener la desviacin media del conjunto de datos mostrado en la tabla de la derecha. Solucin: La tabla de la derecha es la original a la que deben agregrsele tres columnas: a) la primera columna agregada se encabeza con fx que representa la multiplicacin de cada frecuencia f por su respectivo valor nominal x . Al concluir de llenar esta columna se debe efectuar la sumatoria

edad x 45 46 47 48 49

f 2 1 3 3 5 6 2 4 2 28

50 51 52 53

f x para calcular la media

aritmtica. Ver la tabla completa en la siguiente pgina. b) la segunda columna agregada se encabeza con

x x , que representa el valor absoluto de la


resta de cada valor nominal x menos la media x obtenida en el paso anterior, y

170

Medidas de dispersin

c) la tercera columna agregada se encabeza con f x x , que representa la multiplicacin de cada frecuencia f (2 columna) por el valor absoluto correspondiente obtenido en la 4 columna. Al concluir de llenar esta columna se debe efectuar la sumatoria La tabla, con esas columnas agregadas, queda as:

xx .

x 45 46 47 48 49 50 51 52 53

f 2 1 3 3 5 6 2 4 2 28

fx 90 46 141 144 245 300 102 208 106 1382

xx
4.357 3.357 2.357 1.357 0.357 0.643 1.643 2.643 3.643

f xx
8.714 3.357 7.071 4.071 1.785 3.858 3.286 10.572 7.286 50

x =

fx f

171

Medidas de dispersin

x =
Por lo tanto

1382 = 49.357 28

DM = DM =

f xx f
50 = 1.785 28

Esto significa que el promedio de alejamiento de todos los valores respecto de la media (de 49.357) es de 1.785.

C U E S T I O N A R I O 11

1)

Obtener la desviacin media de los datos organizados en el cuestionario 2.

172

Medidas de dispersin

15.2.2 LA DESVIACIN MEDIA CON TABLAS POR INTERVALOS Cuando los datos han sido organizados en clases o intervalos, la desviacin media se obtiene de manera similar a los procesos anteriores, es decir, con la misma frmula aplicada a la organizacin de frecuencias simples, solamente que x debe ser el punto medio del intervalo. Esto significa que al conjunto de datos original deben aadirse a la tabla ahora cuatro columnas: la primera encabezada con x para sealar el punto medio de cada intervalo; la segunda encabezada con fx que servir para calcular la media aritmtica; la tercera encabezada con x x que servir para obtener la cuarta, y la cuarta con f x x que servir para obtener el numerador de la frmula luego de realizar su sumatoria. intervalo Ejemplo 1: Cien datos recolectados se organizaron en siete intervalos, los que se muestran en la tabla de la derecha. Obtener la desviacin media. Solucin: La tabla de la derecha es la original a la que deben agregrsele cuatro columnas: a) la primera columna agregada se encabeza con x que representa el punto medio de cada intervalo. Ver la tabla completa en la siguiente pgina. b) la segunda columna agregada se encabeza con fx. Al concluir de llenar esta columna se debe efectuar la sumatoria lar la media aritmtica: 4-9 10 - 15 16 - 21 22 - 27 28 - 33 34 - 39 40 - 45 f 12 11 13 19 21 16 8 100

f x para calcu-

173

Medidas de dispersin

x = x =

fx f
2486 = 24.86 100

c) la tercera columna agregada se encabeza con x x que representa el valor absoluto de la resta de cada punto medio x del intervalo menos la media x obtenida en el paso anterior. Esta columna podra omitirse y directamente construir la del inciso d). d) la cuarta columna agregada se encabeza con f x x que representa la multiplicacin de cada frecuencia f (2 columna) por el valor absoluto correspondiente obtenido en la 5 columna. Al concluir de llenar esta columna se debe efectuar la sumatoria

xx .

intervalo 4-9 10 - 15 16 - 21 22 - 27 28 - 33 34 - 39 40 - 45

f 12 11 13 19 21 16 8 100

x 6.5 12.5 18.5 24.5 30.5 36.5 42.5

fx 78 137.5 240.5 465.5 640.5 584 340 2486

xx
18.36 12.36 6.36 0.36 5.64 11.64 17.64

f xx
220.32 135.96 82.68 6.84 118.44 186.24 141.12 891.6

174

Medidas de dispersin

DM = DM =

xx n

891.6 = 8.916 100

Esto significa que el promedio de alejamiento de todos los valores respecto de la media, es de 8.916.

C U E S T I O N A R I O 12

1)

Obtener la desviacin media de los datos organizados en el cuestionario 3.

175

Medidas de dispersin

15.3 LA DESVIACIN ESTNDAR La tercera medida de dispersin se llama desviacin estndar, porque con ella se pueden estandarizar en todos los casos, todas las desviaciones de datos recolectados, como se ver ms adelante. La desviacin estndar se simboliza con la letra griega si se trata de una poblacin y con la letra s si se trata de una muestra. Aqu el truco para quitar los valores negativos de la resta de x x es, aproximadamente, elevar al cuadrado y luego regresar con una raz cuadrada.

15.3.1 LA DESVIACIN ESTNDAR PARA FRECUENCIAS SIMPLES Cuando los datos estn ordenados en una distribucin de frecuencias simples, la desviacin estndar para una poblacin se calcula mediante la frmula

f (x x)
n

en donde

= desviacin estndar de la poblacin


f x = frecuencia = valor nominal = media aritmtica

Cuando los datos estn ordenados en una distribucin de frecuencias simples, la desviacin estndar para una muestra se calcula mediante la frmula

s=

f (x x)
n 1

176

Medidas de dispersin

en donde

s = desviacin estndar de la muestra f = frecuencia x = valor nominal x = media aritmtica

Significa que a la tabla original hay que agregarle cuatro columnas, aunque la segunda es opcional. La primera encabezada con fx, servir para calcular la media aritmtica. La segunda (opcional) encabezada con

( x x ) . La tercera con los cuadrados de la anterior, es decir con


2

(x x)

. Y la cuarta con el producto de la frecuencia f por la anterior, o sea f ( x x ) .

Ejemplo 1: Obtener la desviacin estndar del conjunto de datos de la muestra de la siguiente tabla. Solucin: La tabla de la derecha es la original a la que deben agregrsele cuatro columnas: a) la primera columna agregada se encabeza con fx que representa la multiplicacin de cada frecuencia f por su respectivo valor nominal x. Al concluir de llenar esta columna se debe efectuar la sumatoria

x 45 46 47 48 49 50 51 52 53

f 2 1 3 3 5 6 2 4 2 28

f x para calcular la media aritmtica:


x =

fx
n 1382 = 49.357 28

x =

177

Medidas de dispersin

(ver tabla completa de la siguiente pgina) b) la segunda columna agregada se encabeza con ( x x ) que representa la resta de cada valor nominal x menos la media x obtenida en el paso anterior. Esta columna es opcional, pues directamente se puede elevar al cuadrado y el respectivo valor vaciarlo en la columna que se especifica en el siguiente inciso; de la siguiente forma: primera fila: segunda fila: tercera fila: cuarta fila: quinta fila:

xx xx x xx xx

= 45 - 49.3571 = = 46 - 49.3571 = x = 47 - 49.3571 = 48 - 49.3571 = = 49 - 49.3571 =

- 4.3571 - 3.3571 = - 2.3571 - 1.3571 - 0.3571

c) la tercera columna agregada, o segunda en caso de haber omitido la anterior, se encabeza con

(x x)

que representa el cuadrado de cada valor obtenido en la

columna anterior: primera fila: segunda fila: tercera fila : cuarta fila: quinta fila:

(x x) (x x) (x x) (x x) (x x)

= (- 4.3571)2 = (- 3.3571)2 = (- 2.3571)2 = (- 1.3571)2 = (- 0.3571)2

= 18.9843 = 11.2701 = 5.5559 = 1.8417 = 0.1275


2

d) la siguiente columna agregada se encabeza con f ( x x ) que representa el producto de cada frecuencia f por su correspondiente cuadrado obtenido en la columna anterior.

178

Medidas de dispersin

La tabla con esas columnas agregadas queda as:

x 45 46 47 48 49 50 51 52 53

f 2 1 3 3 5 6 2 4 2 28

fx 90 46 141 144 245 300 102 208 106 1382

(x x)

f (x x)
37.9668 11.2694 16.6662 5.5242 0.6370 2.4804 5.3988 27.9416 26.5428 134.4272

18.9834 11.2694 5.5554 1.8414 0.1274 0.4134 2.6994 6.9854 13.2714

Se tiene con esta tabla toda la informacin requerida para utilizar la frmula de la desviacin estndar para una muestra:

s=

f (x x)
n 1
134.4272 28 1

s=

s = 2.231

179

Medidas de dispersin

Para calcular la desviacin estndar de una muestra a veces puede resultar ms simple emplear la siguiente frmula:

s=

fx

( f x)
n

n 1

Aplicndola a la tabla del ejemplo anterior, se tiene que

x 45 46 47 48 49 50 51 52 53

f 2 1 3 3 5 6 2 4 2 28

x2 2025 2116 2209 2304 2401 2500 2601 2704 2809

fx2 4050 2116 6627 6912 12005 15000 5202 10816 5618 68346

fx 90 46 141 144 245 300 102 208 106 1382

s=

68346

(1382 )
28

28 1

180

Medidas de dispersin

s=

68346 62.9851 27

s = 2.231

C U E S T I O N A R I O 13

1)

Obtener la desviacin estndar de los datos organizados en el cuestionario 2.

181

Medidas de dispersin

15.3.2 LA DESVIACIN ESTNDAR PARA FRECUENCIAS POR INTERVALOS Cuando los datos han sido organizados en clases o intervalos, la desviacin estndar se obtiene de manera similar a los procesos anteriores, es decir, con la misma frmula aplicada a la organizacin de frecuencias simples, solamente que x debe ser el punto medio del intervalo.

Ejemplo 1: Cien datos recolectados en una muestra se organizaron en los siete intervalos de la siguiente tabla. Obtener la desviacin estndar. Solucin: La tabla de la derecha es la original a la que deben agregrsele cuatro columnas: a) la primera columna agregada se encabeza con x que representa el punto medio de cada intervalo. b) la segunda columna agregada se encabeza con fx que representa la multiplicacin de cada frecuencia f por su respectivo punto medio x del intervalo. Al concluir de llenar esta columna se debe efectuar la sumatoria intervalo 4-9 10 - 15 16 - 21 22 - 27 28 - 33 34 - 39 40 - 45 f 12 11 13 19 21 16 8 100

f x para calcular la media aritmtica.

La tabla completa se muestra en la siguiente pgina.

x =

fx
n 2486 = 2.486 10

x =

182

Medidas de dispersin

c) la tercera columna agregada se encabeza con x x que representa la resta de cada punto medio x del intervalo menos la media x obtenida en el paso anterior. Aunque debe recordarse que esta columna es opcional si el estudiante puede sin equivocarse obtener directamente sus cuadrados. d) la cuarta columna agregada se encabeza con ( x x ) que representa los cuadrados
2

de cada resta obtenidos en la columna anterior. e) la quinta columna agregada se encabeza con f ( x x ) en donde se vaciarn los
2

resultados de cada producto de la frecuencia f por el respectivo valor de la columna anterior. La tabla, con esas columnas agregadas, queda as:

intervalo 4-9 10 - 15 16 - 21 22 - 27 28 - 33 34 - 39 40 - 45

f 12 11 13 19 21 16 8 100

x 6.5 12.5 18.5 24.5 30.5 36.5 42.5

fx 78 137.5 240.5 465.5 640.5 584 340 2 486

(x x)

f (x x)

337.0896 152.7697 40.4496 0.1296 31.8096 135.4896 311.1696

4 045.0752 1 680.4656 525.8448 2.4624 668.0016 2 167.8336 2 489.3568 11 579.04

183

Medidas de dispersin

Sustituyendo en la frmula de la desviacin estndar

s=

f (x x)
n 1 11579.04 100 1

s=

s = 10.8148

C U E S T I O N A R I O 14

1)

Obtener la desviacin estndar de los datos organizados en el cuestionario 3.

184

También podría gustarte