Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Recurdese que el smbolo se emplea para indicar que deben ser
considerados los valores absolutos de las diferencias, es decir, ignorando su signo.
Su clculo se ilustra seguidamente para los valores: 3, 10, 2, 8, 7. Primero se
obtiene la media aritmtica:
Se recomienda hacer una tabla como la que se muestra a continuacin:
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 6
3 -3 3
10 +4 4
2 -4 4
8 +2 2
7 +1 1
0 14
Luego se calcula la desviacin media:
La desviacin media, no obstante las ventajas conceptuales que rene, casi no
se utiliza debido a que requiere el manejo de valores absolutos por una parte, y por
el hecho de que existe otra medida, basada tambin en las desviaciones respecto a
la media aritmtica, que es mucho ms cmoda y til, y rene numerosas ventajas
prcticas y tericas. Esta medida es la desviacin tpica.
Desviacin tpica (Desviacin estndar)
La desviacin estndar -o tpica- utiliza en lugar de los valores absolutos, los
cuadrados de las desviaciones. La desviacin estndar nos indica cunto se alejan,
en promedio, las observaciones de la media aritmtica del conjunto.
Es la medida de dispersin ms usada en estadstica, tanto para aspectos
descriptivos como analticos. Es, la raz cuadrada del cuadrado de la suma de las
desviaciones entre el nmero total de observaciones, as:
Simblicamente es as:
Tambin tiene mucha importancia el cuadrado de la desviacin estndar, que
recibe el nombre de variancia (en algunos textos aparece como varianza).
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 7
La Variancia
Como se dijo atrs, la variancia es el cuadrado de la desviacin tpica, as:
Simblicamente as:
Es conveniente hacer algunas observaciones acerca de la definicin de varianza,
segn se considere una muestra o toda la poblacin.
Como ya se ha explicado, el estudio de una poblacin se realiza observando no
todos sus elementos, sino, tomando una muestra. Las medidas o valores calculados
a partir de las muestras se utilizan luego para representar o estimar los valores de la
poblacin en los que estamos interesados.
Con el propsito de establecer claramente si el clculo ha sido realizado para
toda la poblacin o para una muestra, se acostumbra indicar con smbolos
diferentes cada una de las situaciones. Comnmente se utilizan letras latinas
maysculas o letras griegas para indicar los valores de la poblacin y letras latinas
minsculas para los valores calculados a partir de los datos de la muestra
(estimadores).
Adems, es corriente emplear la letra N para indicar el nmero total de
elementos en la poblacin y la n para representar el tamao de la muestra.
Seguidamente se presentan los smbolos y definiciones para el promedio y la
variancia, segn se refieran a la poblacin o a una muestra:
GRUPO DE REFERENCIA PROMEDIO VARIANCIA
Muestra (n)
Poblacin (N)
Algo que llama la atencin inmediatamente es que, al definir
, se utiliza n-1
como divisor en vez de n. Esto obedece al hecho de que, de acuerdo con la teora de
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 8
la estadstica, al dividir por n-1 se obtiene una mejor estimacin del valor
poblacional
(variancia de la poblacin).
Debe sealarse, sin embargo, que si la muestra es grande no tiene
importancia alguna usar n n-1 como divisor, ya que el resultado numrico que se
obtendr ser prcticamente el mismo; en cambio, si la muestra es pequea,
entonces s es importante el usar la frmula apropiada, o sea, la correspondiente a
(minscula).
Clculo de la variancia en datos no agrupados
Seguidamente se presentar el clculo de la variancia cuando se tiene una
muestra de n datos sin agrupar. Como ya se vio, la frmula de
es la siguiente:
Utilizando esta frmula y sacando luego la raz cuadrada, puede obtenerse el
valor de la desviacin estndar (s). Ahora se ilustra el clculo de ambas medidas a
partir de la definicin.
EJEMPLO: Para los valores: 3, 10, 2, 8, 7. Calcular
y s.
Primero se obtiene la media aritmtica:
Se recomienda hacer una tabla como la que se muestra a continuacin:
3 -3 9
10 4 16
2 -4 16
8 2 4
7 1 1
=30 0 46
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 9
En el ejemplo anterior, el promedio result ser un nmero entero y por lo
tanto, el cmputo de las diferencias
, no
es la ms apropiada cuando se trabaja con calculadora, por ello, para fines de
clculo, es preferible emplear la expresin siguiente:
A la cual se llega realizando ciertas transformaciones algebraicas en el numerador
de
3 9
10 100
2 4
8 64
7 49
=30 =226
Puede verse que los resultados obtenidos para la desviacin tpica y la
variancia son idnticos a los hallados empleando la frmula de la pgina anterior.
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 10
EL COEFICIENTE DE VARIACIN
Una situacin corriente en la investigacin, es la necesidad de comparar dos o
ms conjuntos de datos en cuanto a su variabilidad. Si los datos estn dados en las
mismas unidades, y si los promedios de los conjuntos, es decir, la magnitud de los
datos, son bastantes similares, la desviacin estndar es una herramienta
perfectamente apropiada para realizar la comparacin.
Pero, si alguna de las condiciones antes citadas no se cumple, la desviacin
estndar, y cualquier medida absoluta de dispersin, pierde casi toda su utilidad
para este propsito.
Si los datos estn expresados en diferentes unidades, es obvio que no puede
compararse su variabilidad utilizando la desviacin estndar, ya que carece de
sentido comparar, por ejemplo, una desviacin estndar expresada en kg, con otra
dada en minutos o en aos luz.
Por otra parte, aun cuando los conjuntos de datos estn dados en la misma
unidad de medida, la diferencia entre sus promedios puede ser tan importante que
haga completamente inadecuada la comparacin directa de las desviaciones
estndar.
Se hace necesario entonces, disponer de valores que sean independientes de
las unidades de medida y que no dependan de la magnitud general de los datos que
se consideren. Con este propsito se utilizan las llamadas medidas de dispersin
relativa, la ms importante de las cuales es el coeficiente de variacin.
El coeficiente de variacin indica la importancia de la desviacin estndar en
relacin al promedio aritmtico y cuya definicin puede representarse de la siguiente
forma:
Ntese que se da multiplicado por 100. De acuerdo con la simbologa
presentada anteriormente, se tendran las siguientes frmulas segn se trate de una
poblacin o de una muestra:
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 11
Su definicin obedece a las necesidades mencionadas anteriormente de contar
con una medida independiente de las unidades y de la magnitud general de las
observaciones.
Al dividir la desviacin estndar ( medida de dispersin absoluta) entre la
media aritmtica ( medida de posicin), se eliminan las unidades
1
, por una parte,
y por otra, la inclusin del promedio en el divisor, permite corregir el efecto que
sobre la desviacin estndar tiene la magnitud general de los datos.
En otras palabras, si la desviacin estndar es grande porque los datos en s
son grandes, al dividirse entre la media aritmtica ese factor queda eliminado. En
cuanto a la multiplicacin por 100, no tiene otro propsito que el de amplificar el
nmero relativo y hacer ms cmodo su uso.
Ejemplo:
Los siguientes datos se refieren a estatura en centmetros de nias de 2 y 16
aos.
EDAD EN AOS ESTATURA PROMEDIO DESVIACIN ESTNDAR
2 84 3
16 160 5
En trminos absolutos es evidente que hay mayor variabilidad en el grupo de
nias de 16 aos, ya que la desviacin estndar es mayor; sin embargo, al calcular
los coeficientes de variacin se descubre que son muy parecidos, resultando ms
bien ligeramente inferior el correspondiente a nias de 16 aos.
Debe concluirse, entonces, que la dispersin relativa en ambos grupos de
nias es muy similar.
1
Tanto la desviacin estndar como la media aritmtica vienen referidas a unidades concretas; por ejemplo, si se
trata de la variable peso, ambas vendran dadas en kilogramos; al dividir una entre la otra, se dividen los kg
entre kg, desapareciendo las unidades de referencia, es decir kg, quedando un nmero abstracto (un escalar)
que no se refiere a ninguna unidad determinada.
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 12
ANEXO I
OBTENCIN DE LA FRMULA PARA CLCULOS
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 13
FRMULA PARA CLCULOS
La frmula para clculos introducida en la pgina 9, se obtuvo, como se dijo
antes, de manipular el numerador de la frmula para
Y desarrollamos (o expandimos) la frmula notable que se haya implcita en su
numerador:
As:
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 14
La expresin anterior corresponde al nuevo numerador de la frmula para
clculos; slo resta dividir esta expresin entre n-1, as:
As queda demostrado de dnde sale la frmula para clculos.
Medidas De Dispersin en Datos No Agrupados
Ing. Allan Villegas Alemn Pgina 15
Referencias
LIPSCHUTZ, SEYMOUR y SCHILLER, JOHN. Introduccin a la Probabilidad y
Estadstica, Editorial McGraw Hill. 2000.
QUINTANA, CARLOS. Estadstica Elemental, Editorial Mster Libro S.A.1992.
GMEZ, MIGUEL. Estadstica Descriptiva, Oficina de publicaciones de la Universidad
de Costa Rica, 1977.