Está en la página 1de 19

ESTADSTICA

SEMANA 4
NDICE

MEDIDAS DE DISPERSIN ......................................................................................................... 3


APRENDIZAJES ESPERADOS ....................................................................................................... 3
DEfinicin de Medida de dispersin ....................................................................................... 3
Rango o Recorrido ................................................................................................................ 3
Varianza Muestral (S2)........................................................................................................... 3
CLCULO DE LA VARIANZA .................................................................................................... 4
FRMULA PARA DATOS NO AGRUPADOS .............................................................................. 4
FRMULA PARA CALCULAR LA VARIANZA EN DATOS AGRUPADOS ........................................ 5
Desviacin Tpica o Estndar Muestral (S) .............................................................................. 7
CLCULO DE LA DESVIACIN TPICA O ESTNDAR CON DATOS NO AGRUPADOS Y
AGRUPADOS ......................................................................................................................... 8
Coeficiente de Asimetra ..................................................................................................... 10
Otras Medidas de Dispersin .................................................................................................. 10
Percentiles.......................................................................................................................... 10
CLCULO DEL PERCENTIL EN DATOS AGRUPADOS ................................................................ 11
Cuartiles ............................................................................................................................. 13
Diagrama de Caja ............................................................................................................ 14
Coeficiente de Variacin ..................................................................................................... 16
FRMULAS PARA DATOS NO AGRUPADOS Y AGRUPADOS ................................................... 16
COMENTARIO FINAL ........................................................................................................... 18
REFERENCIAS .......................................................................................................................... 19

2
ESTE DOCUMENTO CONTIENE LA SEMANA 4
MEDIDAS DE DISPERSIN

APRENDIZAJES ESPERADOS
Durante esta semana se trabajar el tema correspondiente a las medidas de dispersin. Para esto
se presentarn definiciones tericas apoyadas de ejemplos y ejercicios desarrollados los cuales
ilustrarn las principales aplicaciones de estas medidas en el contexto de la estadstica.

DEFINICIN DE MEDIDA DE DISPERSIN


Las medidas de dispersin son medidas que tienen como objetivo determinar qu tan disperso o
diseminado se encuentra el conjunto de observaciones, respecto a un punto, en el caso de la
desviacin estndar esta dispersin se calcula en relacin a la media (promedio). (Anderson,
Sweeney & Williams, 2008).

RANGO O RECORRIDO
En el caso que los datos se encuentren no agrupados se puede definir al estadgrafo como la
diferencia entre la mayor y la menor de las observaciones.

Si los datos estn agrupados, para calcular el recorrido, se tiene que revisar la tabla de distribucin
de frecuencias. Primero se selecciona el lmite superior del ltimo intervalo y, luego, el lmite
inferior del primer intervalo y se calcula la diferencia entre estos valores la frmula para calcularlo
es:

VARIANZA MUESTRAL (S2)


La varianza de una distribucin de frecuencias es la media aritmtica de los cuadrados de las
diferencias entre los valores de la distribucin y su media aritmtica. El valor numrico de la
varianza cuantifica el grado de dispersin de los valores de una distribucin de frecuencias
respecto a su media aritmtica. Mientras mayor es la dispersin de las observaciones, mayor es la
magnitud de sus desviaciones respecto a la media aritmtica y, por ende, ms alto el valor
numrico de la varianza. Grficamente:

3
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Si se comparan las representaciones grficas de las distribuciones A y B; claramente la
distribucin B posee una mayor dispersin de los datos.

CLCULO DE LA VARIANZA
FRMULA PARA DATOS NO AGRUPADOS

Esta es utilizada para calcular la varianza cuando la muestra de datos no se encuentra agrupada
(tabla distribucin de frecuencia) es:

Xi : corresponde a la i-sima observacin.


: corresponde al promedio de las observaciones.
N : es el tamao de la muestra.

Por ejemplo, si se compara la dispersin de los siguientes datos, los cuales corresponden a las
notas de dos grupos de alumnos:

Grupo 1:

4,5 5,2 4,8 5,9 5,7

Grupo 2:

6,5 2,2 3,3 5,0 4,7

Antes de calcular ya se puede adelantar, mirando las distribuciones, que el Grupo 2 tiene mayor
dispersin de notas.

4
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Calculando:

GRUPO 1

GRUPO 2

Reemplazamos: =

Resultado: el grupo 2 (2,73) tiene mayor varianza que el grupo 1 (0,348)

FRMULA PARA CALCULAR LA VARIANZA EN DATOS AGRUPADOS


A continuacin utilizaremos la siguiente frmula para calcular la varianza cuando tenemos los
datos agrupados en tablas.

Por ejemplo, los siguientes datos (agrupados) corresponden a las notas de dos grupos de
estudiantes, de los cursos A y B.

5
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Curso A Curso B
Notas Xi ni Ni fi Notas Xi ni Ni fi
[1,0-1,8) 1,4 9 9 0,18 [1,0-1,8) 1,4 8 8 0,16
[1,8-2,6) 2,2 4 13 0,08 [1,8-2,6) 2,2 10 18 0,20
[2,6-3,4) 3 14 27 0,28 [2,6-3,4) 3 11 29 0,22
[3,4-4,2) 3,8 8 35 0,16 [3,4-4,2) 3,8 9 38 0,18
[4,2-50) 4,6 7 42 0,14 [4,2-50) 4,6 7 45 0,14
[5,0-5,8) 5,4 6 48 0,12 [5,0-5,8) 5,4 3 48 0,06
[5,8-6,6) 6,2 2 50 0,04 [5,8-6,6) 6,2 2 50 0,04
50 1 50 1

Calculando:
Promedio Curso A

Remplazamos

Promedio Curso B

Remplazamos

Otra forma de realizar el clculo en Microsoft Excel

6
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Curso A
Notas Xi ni Ni fi
[1,0-1,8) 1,4 9 9 0,18 0,25 4,1 36,6
[1,8-2,6) 2,2 4 13 0,08 0,18 1,5 5,9
[2,6-3,4) 3,0 14 27 0,28 0,84 0,2 2,4
[3,4-4,2) 3,8 8 35 0,16 0,61 0,1 1,2
[4,2-50) 4,6 7 42 0,14 0,64 1,4 9,8
[5,0-5,8) 5,4 6 48 0,12 0,65 3,9 23,6
[5,8-6,6) 6,2 2 50 0,04 0,25 7,8 15,5
50 1 3,42 1,939

Otra forma de realizar el clculo en Microsoft Excel

Curso B
Notas Xi ni Ni fi
[1,0-1,8) 1,4 8 8 0,16 0,22 3,3 26,6
[1,8-2,6) 2,2 10 18 0,20 0,44 1,0 10,5
[2,6-3,4) 3,0 11 29 0,22 0,66 0,1 0,6
[3,4-4,2) 3,8 9 38 0,18 0,68 0,3 3,0
[4,2-50) 4,6 7 45 0,14 0,64 1,9 13,3
[5,0-5,8) 5,4 3 48 0,06 0,32 4,7 14,2
[5,8-6,6) 6,2 2 50 0,04 0,25 8,9 17,7
50 1 3,22 1,751

DESVIACIN TPICA O ESTNDAR MUESTRAL (S)


La desviacin estndar se define como la raz cuadrada de la varianza y se simboliza con un S, por
lo tanto, si elevamos al cuadrado la desviacin estndar se obtiene la varianza, segn esta
definicin la varianza se expresa en unidades distintas de la variable original (el resultado es un
valor al cuadrado), por ejemplo, si se tienen 10 alumnos de un curso de 8 bsico y se mide la
estatura de cada uno de ellos y, luego, se calcula su promedio y su desviacin estndar, el
resultado es el siguiente, el promedio de la estatura de los 10 alumnos del curso es de 1,65
centmetros y el valor calculado para la desviacin estndar es de 14,3 centmetros. Si se calculas
la varianza el valor obtenido es 204,49 centmetros cuadrados (Pagano, 2011).

7
ESTE DOCUMENTO CONTIENE LA SEMANA 4
CLCULO DE LA DESVIACIN TPICA O ESTNDAR CON DATOS NO
AGRUPADOS Y AGRUPADOS

Ejemplo para datos no agrupados: Para los siguientes datos de las estaturas de dos grupos de
mujeres, comparar dispersin entre el Grupo 1 y el Grupo 2, cuyas estaturas son:
Grupo 1:
1,56 - 1,81 - 1,75 - 1,98 - 1,59 - 1,80

Y el Grupo 2, siendo las estaturas: 1,76 - 1,86 - 1,96 - 1,76 - 1,61 - 1,89

Solucin:

8
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Ejemplo 2: Los siguientes datos (agrupados) corresponden a las estaturas (en centmetros) de dos
grupos de varones. En qu grupo hay mayor dispersin de estaturas?

Grupo A Grupo B
Estaturas Xi ni Ni fi Estaturas Xi ni Ni fi
[149;157) 153 5 5 0,13 [149;157) 153 2 5 0,04
[157;165) 161 4 9 0,10 [157;165) 161 8 9 0,18
[165;173) 169 7 16 0,18 [165;173) 169 7 16 0,16
[173;181) 177 8 24 0,20 [173;181) 177 11 24 0,24
[181;189) 185 10 34 0,25 [181;189) 185 10 34 0,22
[189;197) 193 6 40 0,15 [189;197) 193 7 40 0,16
40 45

Solucin:
Grupo A
Estaturas Xi ni Ni fi
[149;157) 153 5 5 0,13 19,13 501,76 2508,8
[157;165) 161 4 9 0,10 16,10 207,36 829,4
[165;173) 169 7 16 0,18 29,58 40,96 286,7
[173;181) 177 8 24 0,20 35,40 2,56 20,5
[181;189) 185 10 34 0,25 46,25 92,16 921,6
[189;197) 193 6 40 0,15 28,95 309,76 1858,6
40 media 175,40 Varianza 164,76
Desv.
12,84
Standard

Desarrollo Grupo B

Grupo B
Estaturas Xi ni Ni fi
[149;157) 153 2 5 0,04 6,80 534,1 1068,2
[157;165) 161 8 9 0,18 28,62 228,3 1826,8
[165;173) 169 7 16 0,16 26,29 50,6 354,0
[173;181) 177 11 24 0,24 43,27 0,8 8,7
[181;189) 185 10 34 0,22 41,11 79,0 790,1
[189;197) 193 7 40 0,16 30,02 285,2 1996,6
45 media 176,11 Varianza 137,4
Desv.
11,7
Standard

9
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Revisando los resultados el grupo B tiene menor dispersin que el grupo A

COEFICIENTE DE ASIMETRA
Karl Pearson (1895) desarroll una medida para evaluar el sesgo de una distribucin, denominada
coeficiente de asimetra (C. A).

Ejemplo: En un hospital se midieron los tiempos de estada en la unidad de tratamiento intensivo,


el resultado se organiz en una tabla de distribucin de frecuencias, la media fue de 28 das, la
mediana de 25 das y la moda de 23 das, se calcul una desviacin estndar de 4,2 das.

Al calcular el coeficiente de asimetra el resultado obtenido es de 2,14 se encuentra entre -3 y 3,


en este caso el valor e indica un grado importante de asimetra con sesgo positivo.

OTRAS MEDIDAS DE DISPERSIN

PERCENTILES
Cuando se tiene una muestra de valores perteneciente a una variable continua, se pueden ordenar
los valores de menor a mayor y de acuerdo a la posicin de cada valor numrico, se puede
determinar el porcentaje de elementos (valores) que son menores o mayores a un determinado
punto de corte, por lo tanto, cuando se habla de percentiles, se est dividiendo la muestra de
datos en 99 puntos de corte que dividen a la poblacin en 100 partes de igual frecuencia.

Ejemplo: Si x es 30 y n es 50, entonces el percentil 30 (P30) es un nmero tal que garantiza que
en la muestra un 30% (15 observaciones) son menores que (P30) y un 70% (35 observaciones) son
mayores a (P30). Algunos casos particulares son:

10
ESTE DOCUMENTO CONTIENE LA SEMANA 4
CLCULO DEL PERCENTIL EN DATOS AGRUPADOS
La frmula para el clculo del percentil es la siguiente:

11
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Ejemplo 1: Considrese el siguiente cuadro de distribucin, correspondiente a los pesos de un
grupo de mujeres:

Para encontrar, por ejemplo, el percentil 72 (P72):

12
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Consideremos el problema inverso, es decir, se conoce el percentil y queremos determinar qu
porcentaje de las observaciones es menor o mayor que l.

En el ejemplo anterior de los pesos del grupo de mujeres, se quera determinar, qu porcentaje de
ellas pesa menos de 77 kg. Pero al mirar la tabla de frecuencias, el resultado no es tan directo y se
tiene que encontrar el intervalo en donde se encuentra el peso (77 kg), es decir i = 4, de este
intervalo y aplicando la frmula, se desprende que:

Esto quiere decir que el 69,7% de las mujeres pesa menos de 77 kg.

CUARTILES
Cuando se habla de cuartiles la definicin se basa en los percentiles, ya que los cuartiles generan 3
puntos de corte que dividen el conjunto de datos en cuatro grupos con la misma frecuencia
(Pagano, 2011).

13
ESTE DOCUMENTO CONTIENE LA SEMANA 4
El primer cuartil Q1 es el valor que corresponde al punto por debajo del cual se encuentra el 25%
de las observaciones, el segundo cuartil Q2 corresponde a la mediana, es decir separa el 50%
superior de un conjunto de observaciones, del 50% inferior, el tercer cuartil Q3, corresponde al
punto que acumula al 75% de las observaciones.

La amplitud intercuartil es la diferencia entre el tercer (Q3) y el primer cuartil (Q1).

DIAGRAMA DE CAJA
El diagrama de caja permite resumir la dispersin de los datos en una grfica.

Ejemplo: Considrense los salarios mensuales de una muestra de 12 egresados de la Escuela de


Administracin.
$550.000 $678.000 $348.000 $923.000 $346.000 $335.000
$890.000 $467.000 $420.000 1.100.000 $490.000 $365.000

El primer paso es ordenar los valores:


$335.000 $346.000 $348.000 $365.000 $420.000 $467.000
$490.000 $550.000 $678.000 $890.000 $923.000 $1.100.000

Clculo de estadgrafos descriptivos:


mnimo mediana media mximo
$335.000 $478.500 $576.000 $ 1.100.000

14
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Diagrama de caja para la variable ingreso

15
ESTE DOCUMENTO CONTIENE LA SEMANA 4
COEFICIENTE DE VARIACIN
El coeficiente de variacin es una estandarizacin de la desviacin estndar y su principal utilidad
es que permite comparar la variabilidad de dos conjuntos de observaciones en distintas escalas de
medidas. Cuando las variables de dos distribuciones se expresan en unidades diferentes (aos,
centmetros, toneladas, entre otros) no tiene sentido comparar algunos de los estadgrafos de
dispersin, pues estos quedan influenciados por el valor numrico de dichas unidades. Esta
dificultad se puede superar mediante el coeficiente de variacin (Pagano, 2011).

Es importante considerar que el coeficiente de variacin (C.V.) es una medida muy til cuando:
1. Los datos estn en unidades diferentes (como dlares y das de inasistencia).
2. Los datos estn en las mismas unidades, pero las medias muy distantes (como sucede con los
ingresos de los ejecutivos y los ingresos de los empleados no calificados).
3. Cuando se desea comparar la variabilidad de dos conjuntos de datos.

A continuacin, se presentarn las frmulas que se utilizan para el clculo del coeficiente de
variacin con datos no agrupados y agrupados

FRMULAS PARA DATOS NO AGRUPADOS Y AGRUPADOS


Caso poblacin:

Caso muestra:

El valor del coeficiente por definicin se encuentra entre:

Ejemplo: Considrese el caso anterior de las estaturas (en centmetros) de dos grupos de varones.
En qu grupo hay mayor dispersin de estaturas?

16
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Ejemplo de clculo del coeficiente de variacin: En una empresa se desea comparar la variacin
en los ingresos mensuales de los ejecutivos y los ingresos mensuales de los trabajadores no
calificados.

Se obtiene una muestra de ejecutivos


El resultado de la muestra de trabajadores no calificados es:

Un error muy comn es afirmar que hay mayor dispersin en los ingresos mensuales de los
ejecutivos comparando la desviacin estndar $50.000 > $1.200 sin embargo, las medias estn tan
distantes que se necesitan convertir a un coeficiente para efectuar una comparacin significativa
de la variacin en los ingresos mensuales.

Conclusin: Para los ejecutivos, C.V = 10% y para los trabajadores no calificados; C.V = 10%

No existe diferencia entre la dispersin relativa de sueldos de los ejecutivos y los trabajadores no
calificados.

17
ESTE DOCUMENTO CONTIENE LA SEMANA 4
COMENTARIO FINAL
Durante esta semana aprendimos a calcular las distintas medidas de dispersin tanto para datos
No agrupados como para datos agrupados, cuando la medida de las variables es la misma
utilizaremos la desviacin estndar como el estadgrafo para realizar el anlisis e interpretacin de
resultados, ya que no cambia la magnitud de la variable, a diferencia de la varianza cuyos valores y
obviamente las unidades respectivas se encuentran al cuadrado, adems deben recordar que
cuando la unidad de las medidas es distinta el mejor estadgrafo que podemos utilizar es el
coeficiente de variacin, otra de las medidas que podemos aplicar con bastante frecuencia es el
clculo de los percentiles, ya que si quisiramos saber el porcentaje de casos que se encuentra
sobre o bajo un determinado valor, nuestra respuesta tiene que estar relacionada con aplicar la
frmula del clculo de percentil.

18
ESTE DOCUMENTO CONTIENE LA SEMANA 4
REFERENCIAS
Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadstica para
administracin y economa (10 edicin). Cencage Learning

Canavos, George. (1988). Introduccin y estadstica descriptiva. Probabilidad y estadstica.


Mxico: McGraw-Hill/Interamericana S. A.

Pagano, Robert R. (2011). Estadstica para las ciencias del comportamiento (9 edicin).
Cencage Learning.

Karl Pearson (1857-1936)

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2012). Estadstica. Semana 4.

19
ESTE DOCUMENTO CONTIENE LA SEMANA 4

También podría gustarte