Está en la página 1de 12

MEDIDAS DE DISPERSIN

Contenido:
Poblacin y muestra
Amplitud o recorrido
Desviacin media. desviacin estndard y varianza
Coeficiente de variacin
Clculo de la varianza en una tabla de frecuencias

POBLACIN Y MUESTRA
Si un conjunto de datos consta de todas las observaciones concebibles (o
hipotticamente posibles) de cierto fenmeno, se denomina poblacin; si un
conjunto de datos consta solamente de una parte de estas observaciones se
conoce como muestra por lo que una muestra debe ser un subconjunto de la
poblacin.
Por ejemplo: Un peridico local imprime un artculo poltico para todos sus
lectores. El peridico desea considerar las actitudes de 200 lectores hacia el
artculo y conocer sus puntos de vista.
De acuerdo a lo planteado en el ejemplo el total de los lectores representara
la poblacin a la que le llega el artculo y los 200 lectores seleccionados
representaran la muestra para conocer su punto de vista.
Se utilizar la palabra "muestra" solo con relacin a datos que se puedan utilizar
en forma razonable para hacer generalizaciones acerca de la poblacin de la cual
provinieron. En este sentido ms tcnico, no son aceptables muchos conjuntos de
datos que por lo comn se denominan muestras.
Como el trmino estadstica(o) se introdujo con relacin a los datos de muestra,
se agregar que tambin existe un nombre para las descripciones estadsticas de
poblaciones llamadasparmetros. Como se observar, la distincin entre

estadstica y parmetros servir para simplificar nuestro lenguaje. En realidad,


hasta se usarn smbolos diferentes de medidas estadsticas, segn se utilicen
para describir muestras o poblaciones. Para poblaciones se utilizarn letras
griegas y para muestras, latinas.
Por ejemplo para representar la media o el promedio de una muestra se utiliz la
frmula:

La media de una poblacin de N elementos se define en la misma forma. Es la


suma de los N elementos, dividida entre el tamao de la poblacin N.

En las frmulas anteriores se representa a la media de la muestra por


media de la poblacin por para identificarlas entre s.

y la

MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del
centro. Sin embargo, estas medidas no son suficientes para caracterizar la
distribucin, puesto que otro aspecto que debe se tomar en cuenta es la
variabilidad de las observaciones.

Con el propsito de medir la dispersin o variabilidad, se discutirn en este


apartado las medidas de: Amplitud (llamada tambin rango o recorrido),
Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin
tpica) y Coeficiente de Variacin.

Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o
recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con
que se calcula. Es comn que se use tambin el nombre de Rango para esta
medida. La amplitud (A) de un conjunto de datos es la diferencia entre las
observaciones que tienen el mayor y el menor valor numrico en el mismo.
Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres
veces al da y que cierto da los registros de dos pacientes muestran:
Paciente 1: 73 77 74
Paciente 2: 64 90 73
Cul es la Amplitud en pulsaciones para cada paciente?
Para calcular la amplitud de los datos necesario identificar el valor ms grande y
el valor ms pequeo del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1:
A = 77 73 = 4

Para el Paciente 2:
A = 90 64 = 26

La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se


calcula. Tiene en cambio las siguientes desventajas:
En su clculo slo intervienen dos elementos del conjunto.
Al aumentar el nmero de observaciones, puede esperarse que aumente la
variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del
conjunto, no es una medida adecuada para comparar la variabilidad de dos
grupos de observaciones, a menos que stos sean del mismo tamao.

Desviacin media, desviacin estndar y varianza


Para presentar la desviacin estndar, que es por mucho la medida generalmente
ms til de la dispersin, obsrvese que la dispersin de un conjunto de datos es
pequea si los valores se agrupan en forma cerrada en torno a su media y es
grande si los valores se dispersan ampliamente en torno a su media. Por tanto,
parecera razonable medir la dispersin de un conjunto de datos en trminos de
las cantidades en las cuales difieren los valores individuales de su media. Si se
tiene un conjunto de nmeros:

que constituyen una poblacin con una media

, las diferencias entre:

se denominan las desviaciones de la media y esto sugiere que se podra usar el


promedio de estas desviaciones como medida de dispersin en la poblacin. A
menos que las X sean todas iguales, algunas de las desviaciones sern positivas y
otras negativas, la suma de todas las desviaciones de la media

y en consecuencia tambin su promedio es siempre cero.

Como realmente se est interesado en la magnitud de las desviaciones, y no si


son positivas o negativas, se pueden ignorar simplemente los signos y definir una
medida de variacin en trminos de los valores absolutos de las desviaciones de
la media. En realidad, si se suman las desviaciones de la media como si fueran
todas positivas o cero y las dividiramos entre N, se obtendra la media
estadstica que se denomina desviacin media y se representa por:

Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a
encontrar dificultades tericas en problemas de inferencia y rara vez se usa.
Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones
de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados
de nmeros reales no pueden ser negativos y pueden tomar el valor de cero.
Por consiguiente, si se promedia las desviaciones cuadradas de la media y se
toma la raz cuadrada del resultado (para compensar el hecho de que las
desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la
poblacin.

sta medida de variacin se representa por medio de sigma minscula ( ) y al


expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se
conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le
llama Varianza de la poblacin.

Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y ,


para la desviacin estndar de una muestra; pero, esto no es realmente lo que se
hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1)
y se define como desviacin estndar de la muestra, que se denota con s como

Su cuadrado s2, se llama la Varianza de la muestra.


Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se
dividiera entre n y se utilizara s2 como estimacin de
es decir, se utilizara la
varianza de una muestra para determinar la varianza de la poblacin de la cual
provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo
entre n-1 sino que es prctico para definir s como se hizo.

Coeficiente de variacin
Las medidas de dispersin anteriores son todas medidas de variacin absolutas.
Una medida de dispersin relativa de los datos, que toma en cuenta su magnitud,
est dada por el coeficiente de variacin.
El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un
conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto

entre su media aritmtica y se expresa como


y

para una muestra

para la poblacin.

Los coeficientes de variacin tienen las siguientes caractersticas:


Puesto que tanto la desviacin estndar como la media se miden en las
unidades originales, el CV es una medida independiente de las unidades de
medicin.
Debido a la propiedad anterior el CV es la cantidad ms adecuada para
comparar la variabilidad de dos conjuntos de datos.
En reas de investigacin donde se tienen datos de experimentos previos,
el CV es muy usado para evaluar la precisin de un experimento,
comparando en CV del experimento en cuestin con los valores del mismo
en experiencias anteriores.

Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10,


13 y 7 llamadas a su sitio para su servicio. Calcule:
a. Amplitud.
b. Media.
c. Desviacin media.
d. Desviacin estndar.
e. Varianza.
f. Coeficiente de variacin.

a) Para calcular la amplitud.


Valor mximo 13

Valor mnimo 7
A = 13 7 = 6

b) Para calcular la media.

c) Para calcular la desviacin media

d) Para calcular la desviacin estndar

Se puede utilizar la siguiente tabla:

-0.5

0.25

-2.5

6.25

11

1.5

2.25

10

0.5

0.25

13

3.5

12.25

-2.5

6.25

0.0

27.50

Al sustituir los valores se obtiene:

e) Para calcular la varianza:

f) Para calcular el coeficiente de variacin:

Clculo de la varianza en una tabla de frecuencias


Para calcular la varianza de una tabla de frecuencias se utiliza la siguiente
frmula:

Donde:
k es el nmero de intervalos de clase
Xi es el valor medio de cada clase
fi es el valor de la frecuencia absoluta

Al retomar el ejemplo de la tabla de distribucin de frecuencias de Precipitacin


pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.

intervalos

Punto medio
de clase (mi)

Conteo

fi

fAi

FRi

FRAi

(07.7 , 11.7]

9.7

||||| ||||| ||||| |||

18

18

18/90 18/90

(11.7 , 15.7]

13.7

||||| ||||| |||

13

31

13/90 31/90

(15.7 , 19.7]

17.7

||||| ||||| ||||| ||||| ||||

24

55

24/90 55/90

(19.7 , 23.7]

21.7

||||| ||||| ||||| ||

17

72

17/90 72/90

(23.7 , 27.7]

25.7

||||| ||||| |||

13

85

13/90 85/90

(27.7 , 31.7]

29.7

85

0/90

85/90

(31.7 , 35.7]

33.7

||||

89

4/90

89/90

(35.7 , 39.7]

37.7

90

1/90

90/90

90

90

90/90 90/90

TOTAL

Calcular s2 y s.

mi

fi

fimi

9.7

94.09

18

174.6

1693.62

13.7

187.69

13

178.1

2439.97

17.7

313.29

24

424.8

7518.96

21.7

470.89

17

368.9

8005.13

25.7

660.49

13

334.1

8586.37

29.7

882.09

33.7

1135.69

134.8

4542.76

37.7

1421.29

37.7

1421.29

TOTAL

#####

90

1653.0

34208.10