Está en la página 1de 14

1.

MEDIDAS DE VARIABILIDAD

Las medidas de centralizacin contribuyen para la descripcin de un conjunto de datos pero para interpretar con ms detalle los mismos debemos conocer su dispersin en relacin a nuestra medida de tendencia central. Anteriormente se seal la existencia de variabilidad en los conjuntos de datos recolectados. La media aritmtica, la mediana y el modo son valores de la variable que definen la posicin central pero no proporcionan ninguna informacin respecto de la variabilidad del conjunto de datos al cual representan. Sin embargo, la variabilidad es una caracterstica muy importante en una distribucin de frecuencias puesto que la medida de tendencia central tiene escaso valor en s mismo a menos que se conozca el grado de variabilidad de la distribucin que representa. Ya sea que se estudie una sola distribucin de frecuencia o bien que se comparen distribuciones deber aadirse siempre a la medida de tendencia central la medida de variabilidad. 1) Para datos agrupados en tablas simples Donde di: Diferencia entre cada valor de la variable y la media aritmtica N: Total de observaciones del conjunto

DM =

f
i =1

di

Nmero de materias cursadas por los 100 alumnos que comenzaron su carrera en el ao 2006 en esta Universidad
N de materias (Xi) (1) N de alumnos fi 1 2 3 4 5 6 7 8 9 10 Total 100 2 3 5 12 15 20 22 15 4 2 | di| | Xi x| 4,96 3,96 2,96 1,96 0,96 0,04 1,04 2,04 3,04 4,04 25 9,92 11,88 14,8 23,52 14,4 0,8 22,88 30,6 12,16 8,08 149,05 | di| * fi

= 5,96

DM =

f
i =1

di

149,05 = 1,49 100

1 Para datos agrupados en intervalos

DM =

f
i =1

di

Donde: di: diferencia entre el punto medio del intervalo (marca de clase) y la media aritmtica fi: Frecuencia absoluta de cada intervalo

Poblacin femenina de 15 a 50 aos en una localidad del Edo Lara, ao 2011


Edad Mujeres Marca de Clase fi Xi 88 104 105 112 100 92 80 681 17,50 22,50 27,50 32,50 37,50 42,50 47,50

| di|

| di| * fi

15 20 20 25 25 30 30 35 35 40 40 45 45 50 Total
N

14,61 1285,68 9,61 4,61 0,39 5,39 10,39 15,39 999,44 484,05 43,68 539 955,88 1231,2 5538,93

DM =

f
i =1

di

5538,93 = 8,13 aos 681

= 32,11 (se halla por la formula de la media)

-Ventajas:
Es prctica en su clculo Proporciona informacin relativa a la dispersin de los valores de la variable en la distribucin

-Desventajas:
No es til para la interpretacin puesto que no es precisa la relacin matemtica que liga a la desviacin media con la situacin de los valores de la variable dentro de la distribucin

4.1.

Desviacin estndar

Se la emplea como medida de dispersin de los valores individuales alrededor de la media aritmtica y es la de uso ms frecuente como medida de variabilidad.

Se la define como la raz cuadrada de la suma de los cuadrados de los desvos con respecto a la media aritmtica dividida por el nmero de observaciones. Representa la mayor o menor dispersin de los datos obtenidos alrededor de la media aritmtica.

( X
N 1

X ) fi
2

1 N

X
1

2 i

fi X 2

Clculo del desvo estndar 1) Para datos agrupados en tablas simples Volvemos a retomar el Ejemplo N 10:

Nmero de materias rendidas por los 100 alumnos que comenzaron su carrera en el ao 1996 en esta Universidad
N de materias N de alumnos Xi 1 2 3 4 5 6 7 8 9 10 Total fi 2 3 3 12 15 20 22 15 4 2 100 (Xi x) 2 25 16 9 4 1 0 1 4 9 16 (Xi x) 2* fi 50 48 27 48 15 0 22 60 36 32 3908

( X
N 1

X ) fi
2

1 N

X
1

2 i

fi X 2 =

3908 5,96 2 100

= 39,08 35,5216 = 55,84 = 1,8864


= 5,96 = 6 2 Para datos agrupados en intervalos Retomando el ejemplo N 11:
Edad Mujeres Pto. Medio fi 15 20 88 20 25 104 25 30 105 30 35 112 35 40 100 40 45 92 45 50 80 Total 681 Mi 17,50 22,50 27,50 32,50 37,50 42,50 47,50 Xi*fi 1540 2340 2887,50 3640 3750 3910 3800 21867,5 0 Xi2fi 26950 52650 79406,25 118300 140625 166175 180500 764606,25

= 32,11

( X
N 1

X ) fi
2

1 N

X
1

2 i

fi X 2 =

1 764606,25 32,112 681

= 1122 ,7698 1031 ,0521 = 91,7177 = 9,5769

-Consideraciones Generales
La desvacion estndar es un valor importante pues da a conocer la dispersin de la variable alrededor del valor medio. Un desvo estndar pequeo se traduce en una curva de distribucin estrecha, mientras que un desvo estndar grande nos informa que la distribucin de frecuencias est muy dispersa en torno a la media. El desvo estndar sintetiza la informacin respecto de la variabilidad de cada distribucin dando a conocer numricamente la fluctuacin que presentan las frecuencias. El desvo estndar por proceder del clculo de las diferencias con respecto a la media aritmtica elevados al cuadrado es un valor no negativo.

-Ventajas:
Se calcula fcilmente Se basa en todas las observaciones Es la medida menos afectada por las fluctuaciones muestrales Se emplea en relacin con diversos mtodos estadsticos Es uno de los factores que describe curvas importantes como por ejemplo la distribucin normal

-Desventajas:
No suele ser fcilmente interpretado No puede calcularse el desvo estndar cuando no es posible calcular la media aritmtica por ser funcin de sta.

4.2.

Varianza

La varianza de un conjunto de observaciones es igual a la suma de los cuadrados de los desvos entre cada valor de la variable y la media aritmtica de los mismos divididos por el nmero de observaciones.

2 =

1 N

( X
N i =1

X ) fi =
2

1 N

X
i =1

2 i

fi X 2

Como se puede observar el desvo estndar es la raz cuadrada de la varianza por lo que esta ltima se calcula de acuerdo a lo sealado en los ejemplos 10 y 11 sin aplicar la raz. Para el ejemplo N 10

2 = 3,5584
Y para el Ejemplo N 11:

2 = 91,7177
Propiedades de la varianza La varianza es una cantidad no negativa cualquiera sea la distribucin, es decir 2 0 La varianza de una constante es cero, es decir,

2 =
-Ventajas:

1 N

( K K)
i =1

Para su clculo se tienen en cuenta todos los valores de la distribucin.

-Desventajas:
Cuando no es posible calcular la media aritmtica no podr obtenerse la varianza por ser funcin de sta. No viene expresada en las mismas unidades que los datos dado que las desviaciones se elevan al cuadrado.

2.

USOS DE LAS MEDIDAS DE LA VARIABILIDAD

La varianza y la desviacin estndar son las ms influidas por los datos extremos puesto que se elevan al cuadrado las desviaciones respecto a la media. La desviacin estndar o estndar es la ms utilizada teniendo en cuenta todo el desarrollo de la teora estadstica alrededor de ella. Si se atiende a la precisin el orden de aplicacin de las medidas de variacin son 1 desviacin estndar, 2 desviacin media, 3 rango. Si se quiere realizar un trabajo en el que no importe tanto la exactitud sino la rapidez y la simplicidad de la elaboracin el orden ser el inverso al indicado en el tem anterior.

5.1.

Medida de Dispersin Relativa 5.1.1. Coeficiente de variacin

El coeficiente de variacin es un nmero abstracto que expresa la dispersin relativa de una variable en un conjunto de datos. Esta medida es de utilidad cuando se desea comparar dos conjuntos de datos que difieren en relacin a su media, al desvo estndar o a ambas. Tambin resulta til en aquellos casos en que ambos conjuntos estn expresados en diferentes unidades de medida. Se calcula de la siguiente manera: C.V. = / X. Se lo puede tambin multiplicar por 100 y obtener el por ciento. Su utilidad es que informa el si el conjunto de datos observados es homogneo o heterogneo posibilitando la comparacin de dos series que estn o no expresadas en las mismas unidades de medida.

Medidas de dispersin
Mientras los estadsticos de tendencia central nos indican los valores alrededor de los cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o dispersin muestran si los valores de las observaciones estn prximos entre s o estn muy separados. Dos conjuntos de datos pueden tener la misma localizacin central y no obstante, ser muy distintos si uno se halla ms disperso que el otro. Por ejemplo, supongamos que usted es un agente de compras de una importante empresa manufacturera, y con regularidad coloca pedidos con dos proveedores distintos. Ambos le indican que necesitan alrededor de 10 das hbiles para surtir sus pedidos. Despus de varios meses de trabajar as encuentra usted que el promedio de das necesarios para surtir los pedidos es, realmente, unos 10 para cada proveedor. Los histogramas que resumen la cantidad de das hbiles requeridos para surtir los pedidos se ven en la figura. Aunque la cantidad promedio es, ms o menos, de 10 en ambos casos. Tienen stos el mismo grado de confiabilidad para entregar a tiempo?. Observe la dispersin, o variabilidad, en los histograma. Qu proveedor prefiere usted?

Para la mayora de las empresas es importante recibir materiales y suministros tiempo. Las entregas a los siete u ocho das de J. C. Clark Distributor pueden considerarse favorables; sin embargo, algunas de las entregas a los 13 o 15 das podran ser desastrosas en trminos de la utilizacin de la mano de obra y del cumplimiento de los programas de produccin. Este ejemplo ilustra un caso en el que la dispersin, o variedad, en los tiempos de entrega puede ser la consideracin ms importante para seleccionar un proveedor. Para la mayora de los agentes de compra, la menor dispersin que muestra Dawson Supply, Inc. hara que fuera el proveedor ms consistente y preferido. Dispersin: Es el grado en que los datos numricos tienden a extenderse alrededor de un valor medio. La dispersin de la distribucin suministra informacin complementaria que permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos estn ampliamente dispersos, la localizacin central ser menos representativa de los datos en su conjunto de lo que sera en el caso de datos que se acumulasen ms alrededor de la media. Adems, si no conviene tener una amplia dispersin de valores respecto al centro o si esa dispersin implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la mxima dispersin. Por ejemplo, a los analistas financieros les interesa la dispersin de las ganancias de una empresa, las utilidades con una fuerte dispersin indican un riesgo mayor parar los accionistas que las utilidades que permanecen relativamente estables. Las medidas de dispersin se dividen en dos grandes grupos: 1- Las medidas de dispersin absolutas: son aquellas que vienen expresadas en las mismas medidas que identifican a la serie de datos. 2- Las medidas de dispersin relativas: son relaciones entre medidas de dispersin absolutas y medidas de tendencia central.

Consideremos por ejemplo las calificaciones obtenidas por dos alumnos durante un perodo por dos alumnos, A y B: Alumno A: 6; 6; 5;6; 7; 6; 6; 6 Alumno B: 10; 2; 5; 7; 6; 10; 1; 7 Los dos alumnos A y B obtienen 6 de promedio sin embargo, han obtenido calificaciones muy diferentes pues mientras el alumno A consigui una regularidad el alumno B tuvo sus calificaciones dispersas entre valores extremos. Esta evidencia muestra la necesidad de introducir alguna medida que posibilite apreciar la propiedad con la que los valores centrales caracterizan al conjunto del que provienen. Las medidas de dispersin o variabilidad absoluta ms corrientes son: Rango Desviacin media Varianza Desviacin estndar

Rango
Tambin llamada ancho o recorrido o amplitud. Es una medida de clculo sencillo de la variabilidad. Consiste en calcular la diferencia entre el mayor y el menor valor de la serie. Rango R = XM - Xm XM = Valor mximo Xm = Valor mnimo

No se puede utilizar cuando se dispone de datos agrupados en intervalos de clase puesto que no se puede identificar el mnimo y el mximo de la distribucin. Es evidente que depende slo de los valores extremos por lo que est muy afectada por cualquier cambio brusco que se produzca en ellos. De acuerdo al ejemplo propuesto Para el alumno A: el rango = 7 5 = 2 ptos Para el alumno B: el rango = 10 1 = 9 ptos

-Ventajas:
Es fcil de calcular No necesita conocimiento de la estadstica para su interpretacin Es una medida poco precisa pero eficaz de variabilidad

-Desventajas:
Refleja nicamente los valores extremos, ignorando la informacin intermedia No es aconsejable para muestras grandes pues puede conducir a error.

Desviacin media
La desviacin media es una medida de dispersin bastante exacta que resulta de dividir la suma de los desvos en relacin a la media (sin tener en cuanta el signo) por el total de observaciones. La desviacin media es en realidad la media aritmtica de los valores absolutos de las desviaciones respecto a la media. 2) Para datos no agrupados

DM =
Donde:

d
i =1

di: Diferencia entre cada valor de la variable y la media aritmtica N: Total de observaciones del conjunto Alumno A: 6; 6; 5; 6; 7; 6; 6; 6 y su = 6 d1 = 6 6 =0; d2 = 6 6 =0; d3 = 5 6 = | -1| ; d4 = 6 6 =0; d5= 7 6 = 1 d6 = 6 6 =0; d7 = 6 6 =0; d8= 6 6 =0

De acuerdo al:

DM =

d
i =1

0 + 0 + 1 + 0 +1+ 0 + 0 8

= 0,25

Alumno B: 10; 2; 5; 7; 6; 10; 1; 7y su = 6 d1 = 10 6 =4; d2 = 2 6 =-4; d3 = 5 6 = -1; d4 = 7 6 =1; d5= 6 6 = 0 d6 = 10 6 =4; d7 = 1 6 = -5; d8= 7 6 =1

DM =

d
i =1

4 + 4 + 1 +1+ 0 + 4 + 5 +1 8

16 =2 8

3) Para datos agrupados en tablas simples

Donde di: Diferencia entre cada valor de la variable y la media aritmtica N: Total de observaciones del conjunto

DM =

f
i =1

di

Nmero de materias cursadas por los 100 alumnos que comenzaron su carrera en el ao 2006 en esta Universidad
N de materias (Xi) (1) N de alumnos fi 1 2 3 4 5 6 7 8 9 10 Total 100 2 3 5 12 15 20 22 15 4 2 | di| | Xi x| 4,96 3,96 2,96 1,96 0,96 0,04 1,04 2,04 3,04 4,04 25 9,92 11,88 14,8 23,52 14,4 0,8 22,88 30,6 12,16 8,08 149,05 | di| * fi

= 5,96

DM =

f
i =1 N

di

149,05 = 1,49 100

3 Para datos agrupados en intervalos

DM =

f
i =1

di

Donde: di: diferencia entre el punto medio del intervalo (marca de clase) y la media aritmtica fi: Frecuencia absoluta de cada intervalo

Poblacin femenina de 15 a 50 aos en una localidad del Edo Lara, ao 2011

Edad

Mujeres Marca de Clase fi Xi 88 104 105 112 100 92 80 681 17,50 22,50 27,50 32,50 37,50 42,50 47,50

| di|

| di| * fi

15 20 20 25 25 30 30 35 35 40 40 45 45 50 Total

14,61 1285,68 9,61 4,61 0,39 5,39 10,39 15,39 999,44 484,05 43,68 539 955,88 1231,2 5538,93

= 32,11 (se halla por la formula de la media)

DM =

f
i =1

di

5538,93 = 8,13 aos 681

-Ventajas:
Es prctica en su clculo Proporciona informacin relativa a la dispersin de los valores de la variable en la distribucin

-Desventajas:
No es til para la interpretacin puesto que no es precisa la relacin matemtica que liga a la desviacin media con la situacin de los valores de la variable dentro de la distribucin

Varianza Es la medida del cuadrado de la distancia promedio entre la media y cada elemento de la poblacin.
2 para la poblacin Notacin: 2 s para la muestra

Frmulas: Datos no agrupados Datos agrupados por frecuencias Datos agrupados en intervalos
N g g

2 =

( x i ) 2
i =1

N
2 ( x i x) i =1 n

2 =

( X i ) 2 * fi
i =1

N
2 (X i x ) * fi g i =1

2 =

( M i ) 2 * fi i =1
N

n -1

n -1

(M i x) i =1
g

*f

n -1

Donde Mi es la marca de clase de cada intervalo

Nota: La teora matemtica establece que si pretendemos estimar la varianza de una poblacin a partir de la varianza una de sus muestras, resulta que el error cometido es generalmente menor, cuando para la varianza de la muestra se divide por n 1 y no por n, porque el valor resultante da una mejor estimacin de la varianza de la poblacin. Sin embargo, para grandes valores de n (n >30) no hay prcticamente diferencia entre dividir por n o por n-1. Clculo de la desvacion estndar Para datos agrupados por frecuencia Nmero de cursadas rendidas por los 100 alumnos que comenzaron su carrera en el ao 1996 en esta Universidad
N de materias N de alumnos Xi 1 2 3 4 5 6 7 8 9 10 g fi 2 3 3 12 15 20 22 15 4 2 100 (Xi x) 2 25 16 9 4 1 0 1 4 9 16 (Xi x) 2* fi 50 48 27 48 15 0 22 60 36 32

2 338 = = = 99

( Xi ) 2 * fi i =1
Total

= 338

N3,41

(X i x ) i =1
g

*f

n -1

Para datos agrupados por intervalo

Un investigador que deseaba determinar cmo variaban las estaturas de las obreras de una empresa y toma una muestra de 50 mujeres para registrar luego sus estaturas en pulgadas obteniendo la siguiente tabla: Li - Ls [53 56) [56 59) [59 62) [62 65) [65 68) [68 71) [71 74) Para calcular la varianza agregamos una nueva columna: Li - Ls [53 56) [56 59) [59 62) [62 65) [65 68) [68 71) [71 74) fi 2 5 9 15 12 5 2 Mi 54,5 57,5 60,5 63,5 66,5 69,5 72,5 fi 2 5 9 15 12 5 2 Mi 54,5 57,5 60,5 63,5 66,5 69,5 72,5

( x i x) 2 *fi
168,5448 190,9620 91,0116 0,4860 95,4288 169,3620 155,5848 = 871,38

s2 =

871,38 = 17,7833 pulgadas2 49


*La varianza de una constante es cero. *Siempre es una cantidad positiva. *La varianza del producto de una constante por una variable es igual al producto de la constante al cuadrado por la varianza de la variable.

Algunas propiedades de la varianza:

Observaciones sobre la varianza: Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas ocasiones no son fciles de interpretar. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Desviacin estndar o estndar. Se define como la raz cuadrada positiva de la varianza Notacin:

Frmula: Se obtiene tomando raz cuadrada a la varianza Usando el resultado de las varianzas calculadas en los ejemplos anteriores, pulgadas. (ejemplo 2) s = 1,85 materias (ejemplo 1); y s = 4,2170

para la poblacin s para la muestra

Algunas propiedades de la desviacin estndar: *La desviacin estndar de una constante es cero. *Siempre es una cantidad positiva. *La desviacin estndar del producto de una constante por una variable es igual al producto de la constante por la desviacin estndar de la variable.

Observaciones sobre la desviacin estndar: Nos permite determinar con mayor grado de precisin dnde se sitan los valores de una distribucin de frecuencia en relacin con la media. Las unidades de la desviacin estndar se expresan en las mismas unidades de los datos. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Medidas de dispersin relativa:

Dispersin relativa =

dispersin absoluta promedio

Estas medidas vienen generalmente expresadas en porcentajes y su funcin es la de determinar entre varias distribuciones la de mayor o menor dispersin, esto tiene como ventaja que nos permite comparar distribuciones donde las unidades pueden ser diferentes ya que estas medidas son independientes de las unidades utilizadas. Adems, varias distribuciones pueden tener un mismo valor para determinada medida de dispersin y ser la variabilidad de sus datos en relacin con la media, diferente Se trabajar con: Coeficiente de variacin. Mide el grado de dispersin de un conjunto de datos en relacin con su media. Notacin: CV Frmulas: Observaciones: El CV es un estadstico til para comparar la dispersin de conjuntos de datos que tienen distintas desviaciones estndar y distintos promedios. El CV pierde su utilidad cuando la media se aproxima a cero. Para los efectos de la situacin del segundo ejemplo, tenemos s = 4,2170 pulgadas. x = 63,68 pulgadas. CV =

4,22 = 0,0662 63,68

Interpretacin: la desviacin estndar de la muestra representa apenas 0,0662 del valor de la media de la muestra. Es importante destacar que las medidas de dispersin relativa sirven para comparar las variabilidades de dos conjuntos de valores (poblaciones o muestras), mientras que si deseamos comparar a dos individuos de cada uno de esos conjuntos, es mejor usar valores tipificados.

También podría gustarte