Está en la página 1de 9

TUTOR: PEDRO AGUSTIN DUARTE ACOSTA

Medidas descriptivas de las distribuciones de frecuencia.




Medidas de dispersin

Mientras los estadsticos de tendencia central nos indican los valores alrededor de los
cuales se sitan un grupo de observaciones, los estadsticos de variabilidad o dispersin
muestran si los valores de las observaciones estn prximos entre s o estn muy
separados.
Dos conjuntos de datos pueden tener la misma localizacin central y no
obstante, ser muy distintos si uno se halla ms disperso que el otro.
Por ejemplo, supongamos que usted es un agente de compras de una importante empresa
manufacturera, y con regularidad coloca pedidos con dos proveedores distintos. Ambos le
indican que necesitan alrededor de 10 das hbiles para surtir sus pedidos. Despus de
varios meses de trabajar as encuentra usted que el promedio de das necesarios para
surtir los pedidos es, realmente, unos 10 para cada proveedor. Los histogramas que
resumen la cantidad de das hbiles requeridos para surtir los pedidos se ven en la figura.
Aunque la cantidad promedio es, ms o menos, de 10 en ambos casos. Tienen stos el
mismo grado de confiabilidad para entregar a tiempo?. Observe la dispersin, o
variabilidad, en los histograma. Qu proveedor prefiere usted?



Para la mayora de las empresas es importante recibir materiales y suministros tiempo.
Las entregas a los siete u ocho das de J. C. Clark Distributor pueden considerarse
favorables; sin embargo, algunas de las entregas a los 13 o 15 das podran ser desastrosas
en trminos de la utilizacin de la mano de obra y del cumplimiento de los programas de
produccin. Este ejemplo ilustra un caso en el que la dispersin, o variedad, en los
tiempos de entrega puede ser la consideracin ms importante para seleccionar un
proveedor. Para la mayora de los agentes de compra, la menor dispersin que muestra
Dawson Supply, Inc. hara que fuera el proveedor ms consistente y preferido.

Dispersin:
Es el grado en que los datos numricos tienden a extenderse alrededor de un
valor medio. La dispersin de la distribucin suministra informacin
complementaria que permite juzgar la confiabilidad de nuestra medida de
tendencia central. Si los datos estn ampliamente dispersos, la localizacin
central ser menos representativa de los datos en su conjunto de lo que sera
en el caso de datos que se acumulasen ms alrededor de la media. Adems,
si no conviene tener una amplia dispersin de valores respecto al centro o si
esa dispersin implica un riesgo inaceptable, deberemos ser capaces de
reconocerlo y no escoger las distribuciones que presentan la mxima
dispersin.
Por ejemplo, a los analistas financieros les interesa la dispersin de las
ganancias de una empresa, las utilidades con una fuerte dispersin indican
un riesgo mayor parar los accionistas que las utilidades que permanecen
relativamente estables.
Las medidas de dispersin se dividen en dos grandes grupos:
1- Las medidas de dispersin absolutas: son aquellas que vienen
expresadas en las mismas medidas que identifican a la serie de datos.
2- Las medidas de dispersin relativas: son relaciones entre medidas de
dispersin absolutas y medidas de tendencia central.








Medidas de dispersin absoluta:

Rango o recorrido
Es la diferencia entre el valor ms alto y el ms bajo observado
Notacin: R
Frmula: R = x
mx
- x
min

Un rango pequeo indica poca variacin, uno grande indica una gran
variabilidad.
Observaciones:
No es muy til porque slo toma en cuenta los valores mximo y
mnimo de una distribucin por lo que no da una idea de la verdadera
concentracin de los valores.

Igual rango, pero diferente variabilidad.
No se puede utilizar en distribuciones que tengan intervalos abiertos.
Puede ser afectado por observaciones externas.

Rango intercuartlico o rango intercuartil.
Es la diferencia entre los valores de Q
1
y Q
3
, esta diferencia refleja la
variabilidad de las observaciones del 50% intermedio de los datos y tiene la
ventaja de no verse influenciado por valores extremos.
Notacin : RI
Frmula: RI = Q
3
- Q
1
Grficamente:

A travs del rango intercuartil podemos ver (aproximadamente) qu tan lejos
de la mediana tenemos que ir en cualquiera de las dos direcciones antes de
que podamos recorrer una mitad de los valores del conjunto de datos.
Para los efectos de la situacin que se ha mantenido como ejemplo, el rango
intercuartil es:
Q
3
-Q
1
= (66,63 60,83) pulgadas = 5,80 pulgadas.
Sin embargo, una medida ms usada es el rango semi-intercuartil.

Rango semi-intercuartlico o rango semi-intercuartil.
Es la semidiferencia entre los valores de Q
1
y Q
3
, al igual que el rango
intercuartlico tiene la ventaja de no verse influenciado por valores extremos.
Notacin : RSI
Frmula: RSI =
2
Q Q
1 3


Utilizando el resultado anterior, tenemos que RSI = 9 , 2
2
83 , 60 63 , 66
=

pulgadas. De esto, pudiramos establecer que un 50% de las estaturas caen


en el intervalo [63,82,9] pulgadas.


Varianza
Es la medida del cuadrado de la distancia promedio entre la media y cada elemento de la
poblacin.
Notacin:

muestra la para s
poblacin la para

2
2
o

Frmulas:
Datos no agrupados Datos agrupados
( )
( )
1 - n
x x
N
x

n
1 i
2
i
2
S
N
1 i
2
i
2

=
=

=

( )
( )
1 - n
f * x x
N
f x

g
1 i
i
2
i
2
S
g
1 i
i
*
2
i
2

=
=

=


Nota: La teora matemtica establece que si pretendemos estimar la varianza de una
poblacin a partir de la varianza una de sus muestras, resulta que el error cometido es
generalmente menor, cuando para la varianza de la muestra se divide por n 1 y no por n,
porque el valor resultante da una mejor estimacin de la varianza de la poblacin.
Sin embargo, para grandes valores de n (n >30) no hay prcticamente
diferencia entre dividir por n o por n-1.

Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se haba obtenido la siguiente tabla:



l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 56) 2 54,5 2 0,0400 4 0,0400 4
[56 59) 5 57,5 7 0,1000 10 0,1400 14
[59 62) 9 60,5 16 0,1800 18 0,3200 32
[62 65) 15 63,5 31 0,3000 30 0,6200 62
[65 68) 12 66,5 43 0,2400 24 0,8600 86
[68 71) 5 69,5 48 0,1000 10 0,9600 96
[71 74) 2 72,5 50 0,0400 4 1,0000 100

Para calcular la varianza agregamos una nueva columna:
l
i
- l
i+1
f
i
x
i

( )
i i
f * x x
2

[53 56) 2 54,5 168,5448
[56 59) 5 57,5 190,9620
[59 62) 9 60,5 91,0116
[62 65) 15 63,5 0,4860
[65 68) 12 66,5 95,4288
[68 71) 5 69,5 169,3620
[71 74) 2 72,5 155,5848
E = 871,38
s
2
=
49
38 , 871
= 17,7833 pulgadas
2

Algunas propiedades de la varianza:
*La varianza de una constante es cero.
*Siempre es una cantidad positiva.
*La varianza del producto de una constante por una variable es igual al
producto de la constante al cuadrado por la varianza de la variable.

Observaciones sobre la varianza:
Las unidades de la varianza son los cuadrados de las unidades de los
datos y en muchas ocasiones no son fciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.


Desviacin tpica o estndar.
Se define como la raz cuadrada positiva de la varianza
Notacin:

muestra la para s
poblacin la para

o

Frmulas:
Datos no agrupados Datos agrupados
( )
( )
1 - n
x x
N
x

n
1 i
2
i
S
N
1 i
2
i

=
=

=

( )
( )
1 - n
f * x x
N
f x

g
1 i
i
2
i
S
g
1 i
i
*
2
i

=
=

=


Tomando el resultado de la varianza calculada anteriormente, s = 4,2170
pulgadas.

Algunas propiedades de la desviacin tpica:
*La desviacin tpica de una constante es cero.
*Siempre es una cantidad positiva.
*La desviacin tpica del producto de una constante por una variable es igual
al producto de la constante por la desviacin tpica de la variable.

Observaciones sobre la desviacin tpica:
Entre sus aplicaciones tenemos el teorema de Chebyshev, el cual
afirma que para cualquier conjunto de datos, al menos
2
k
1
1 de la
observaciones estn dentro de k desviaciones tpicas de la media (K
>1). En virtud de esto, si por ejemplo, k = 2 nos dara 0,75. Lo que
significa que si formamos un intervalo de 2 desviaciones tpicas por
debajo de la media hasta 2 desviaciones tpicas por encima de la
media, en dicho intervalo se encontrarn como mnimo el 75% de
todas las observaciones.
Nos permite determinar con mayor grado de precisin dnde se sitan
los valores de una distribucin de frecuencia en relacin con la media.
Las unidades de la desviacin tpica se expresan en las mismas
unidades de los datos.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.


Medidas de dispersin relativa:

promedio
absoluta dispersin
relativa Dispersin =
Estas medidas vienen generalmente expresadas en porcentajes y su funcin
es la de determinar entre varias distribuciones la de mayor o menor
dispersin, esto tiene como ventaja que nos permite comparar distribuciones
donde las unidades pueden ser diferentes ya que estas medidas son
independientes de las unidades utilizadas. Adems, varias distribuciones
pueden tener un mismo valor para determinada medida de dispersin y ser la
variabilidad de sus datos en relacin con la media, diferente Se trabajar
con:







Coeficiente de variacin.
Mide el grado de dispersin de un conjunto de datos en relacin con su
media.
Notacin: CV
Frmulas:
poblacin la para 100% * CV
muestra la para 100% *
x
s
CV

o
=
=

Observaciones:
El CV es un estadstico til para comparar la dispersin de conjuntos
de datos que tienen distintas desviaciones estndar y distintos
promedios.
El CV pierde su utilidad cuando la media se aproxima a cero.
Para los efectos de la situacin que se ha mantenido como ejemplo, tenemos
s = 4,2170 pulgadas.
68 , 63 x = pulgadas.
CV = % 62 , 6 % 100 *
68 , 63
22 , 4
=
Interpretacin: la desviacin tpica de la muestra es el 6,62% del valor de la
media de la muestra.

Es importante destacar que las medidas de dispersin relativa sirven para comparar las
variabilidades de dos conjuntos de valores (poblaciones o muestras), mientras que si
deseamos comparar a dos individuos de cada uno de esos conjuntos, es mejor usar
valores tipificados.

Variables tipificadas
Los distintos conjuntos de datos estn asociados por lo general a diferentes medias, ya
sea porque son de naturaleza diferente o porque al ser la misma caracterstica medida, sus
centros no son los mismos. Con el propsito de reducir los datos a un mismo punto de
referencia y a una escala comn, se realiza entre ellos una transformacin llamada
tipificacin.



Se conoce por tipificacin de una variable x a efectuar el cambio de origen
y de escala de la variable.
Notacin: z
Frmulas:

=
poblacin para
- x
z
muestras para
s
x x
o

z


Esta nueva variable carece de unidades de medida y permite comparar dos o ms
cantidades que en un principio no son comparables porque aluden a conceptos diferentes.
Tambin es aplicable a casos en que se quieran comparar individuos semejantes de
poblaciones diferentes. Por ejemplo, si deseamos comparar el nivel acadmico de dos
estudiantes de diferentes universidades, z nos indica cuntas desviaciones estndar est
un valor por arriba o por debajo de la media del conjunto de datos al cual pertenece.

Ejemplo:
Un estudiante obtuvo 84 puntos en el examen final de matemticas, en el
que la nota media fue 76, y la desviacin tpica 10. En el examen final de
fsica obtuvo 90 puntos, siendo la media 82 y la desviacin tpica 16. En qu
examen sobresali ms?.

Examen de matemtica Examen de fsica
x = 76
s = 10
x = 84
z = 8 , 0
10
76 84
=


x = 82
s = 16
x = 90
z = 5 , 0
16
82 90
=



Sobresali ms en matemticas.

También podría gustarte