Está en la página 1de 35

ESTADÍGRAFOS DE

DISPERSIÓN
CIV – 282
UAJMS – 2017
Miden la dispersión de
los datos de una
muestra.

¡O cuan alejados se encuentran


los datos unos de otros!
Para obtener una primera impresión de la
dispersión que existe en un conjunto de
datos o en una tabla estadística se
emplean 2 tipos de recorrido:

El recorrido de la variable o amplitud de


recorrido

El recorrido intercuartil, el recorrido


interdecil, etc.
Recorrido de la variable
El recorrido “R” de la variable es la diferencia entre
los valores extremos:

R = Xmáx – X min
Si el recorrido de la variable es mayor en un
conjunto de observaciones, que en otro, es de
suponer que la dispersión de datos sea superior en
uno que en otro.
Sin embargo en ciertas ocasiones este recorrido
ofrece una medida errónea de la dispersión, esto se
subsana al menos en parte, utilizando el recorrido
inter cuartílico.
RECORRIDO INTER CUARTILICO
Es la diferencia entre el 3er. y 1er.
cuartil, o también la diferencia entre los
percentiles 75avo y 25avo, es decir

RI = Q3 – Q1

RI = P75 – P25
RECORRIDO INTER DECIL

Es la diferencia entre los percentiles 90avo


y 10 (décimo) es decir:

RID = P90 – P10


DESVIACIÓN DEL CUARTIL
La mitad del recorrido inter cuartil es una
medida llamada desviación del cuartil:

Qd = Q 3 – Q1
2

La desviación del cuartil mide el recorrido


promedio de un cuarto de los datos
Pero:
Las descripciones más claras de la
dispersión son aquellas que tienen que ver
con la desviación promedio a partir de
alguna medida de tendencia central.
Las mas importantes son:
a. La desviación media absoluta,
b. la desviación mediana absoluta,
c. la varianza
d. la desviación típica.
a.Desviación Media Absoluta
Sean x1, x2, x3,…………………………………………….xn
una muestra de tamaño n. La Desviación Media
Absoluta o simplemente “DM” (DESVIACIÓN
MEDIA), es la media aritmética en valores
absolutos de las desviaciones de los valores
observados, con respecto a la media aritmética de
éstas; es decir:
n

Si los datos no están agrupados xx i

DM  i 1

n
m

Si los datos están agrupados n y  yi i

DM  i 1

n
Esta última fórmula también se podría escribir:

m
DM   hi yi  y
i 1

¡La DM se puede utilizar en todas aquellas en que la


medida de tendencia central más significativa es la media
aritmética !
Ejemplo (Datos Discretos):
El Nro. de libros en inglés, en 8 bibliotecas de
facultades de la UAJMS es la siguiente : 15, 12, 10, 18,
14, 22, 17, 20
Determinar la Desviación Media absoluta
Solución: Se determina como sigue:
1. Ordenar los datos
2. Hallar la media aritmética de los datos
ordenados
3. Se encuentra las desviaciones de cada valor
observado con respecto a la media
4. Se toma el valor absoluto de las desviaciones
obtenidas en (3)
5. Se suma los valores absolutos de las desviaciones
obtenidas en (4) y se divide entre el número
total de las observaciones (n).
Resolución: Con los datos ya ordenados
n
xi
10
xi-x
-6
xi-x
6
x i
128
12 -4 4
x i 1
  16
n 8
14 -2 2
Aplicando la fórmula para obtener la DM:
15 -1 1 n

17 1 1 xx i

18 2 2 DM  i 1

n
20 4 4
26
22 6 6
DM   3,25
128 26 8
Respuesta:

La desviación del Nro. de libros en


las ocho bibliotecas con respecto a
la X calculada (16) es de 3 libros
Ejemplo: para datos agrupados y Continuos:

yi ni yi.ni La distribución de las


cuotas anuales de 100
Intervalo

28 - 30 29 8 232 compañías de un seguro


30 - 32 31 15 465 de $1.000, para trabaja
32 - 34 33 15 495 dores de 40 años es:
34 - 36 35 12 420
1ero. Determinamos la media
36 - 38 37 15 555
m

ny
38 - 40 39 20 780
i i
40 - 42 41 10 410 3.572
42 - 44 43 5 215 y i 1
  35,7
100
n 100
3.572
REGLA:
1. Conformar la tabla de distribución de frecuencias
2. Determinar la media aritmética
3. Encontrar las desviaciones de cada yi con respecto a la media
4. Tomar el valor absoluto de las desviaciones obtenidas
5. Multiplicar los valores absolutos obtenidos por ni y sumarlos.
Finalmente el resultado dividir por el Nro. total de
observaciones.

Intervalo yi ni yi.ni Yi - Y Yi - Y ni Yi - Y

28 - 30 29 8 232 -8 8 64
30 - 32 31 15 465 -6 6 90
32 - 34 33 15 495 -4 4 60
34 - 36 35 12 420 -2 2 70
36 - 38 37 15 555 0 0 0
38 - 40 39 20 780 2 2 40
40 - 42 41 10 410 4 4 40
42 - 44 43 5 215 6 6 30
Sumatorias 100 3.572 394
m

n i yi  y
DM  i 1
n

394
DM   3,94
100
La DM (absoluta), indica que tan lejos en promedio
se encuentra cada observación con respecto a la
media.
Si la distancia es muy alta indica que existe gran
dispersión entre los datos observados.
Si es muy baja, refleja un gran agrupamiento y que
los valores son parecidos entre si.
b) La Desviación Mediana Absoluta
DMe es el promedio de los valores absolutos de las
diferencias entre cada observación y la mediana de estas es
decir :
n

 x  Me
i
Para datos No Agrupados
DMe  i 1

n
m

 n y  Me i i Para datos agrupados


DMe  i 1

n
VARIANZA (s2)
y DESVIACIÓN TÍPICA (s)

Estas medidas son las mas utilizadas en el


estudio de la dispersión.

La varianza (s2) mide la dispersión de los


datos con respecto a la media aritmética y
la desviación típica o desviación estándar
(s) es simplemente la raíz cuadrada
positiva de la varianza
c)Varianza
n

 ( xi  x ) 2
Para datos No agrupados
V ( x )  sx 2 i 1
n

 n i ( yi  y ) 2
Para datos agrupados
V ( y )  sy 2  i 1
n

La varianza de una muestra


Cuando el Nro. de observaciones es menor a
60 se usa en la fórmula la llamada
corrección de Bessel [en el denominador (n-1)]

 ( xi  x ) 2
Para datos No Agrupados
V ( x )  sx 2  i 1
n1
n

 n i ( yi  y ) 2
Para datos Agrupados
V ( y )  sy 2  i 1
n1
Varianza Poblacional
La varianza de una población finita de N
elementos X1,X2, X3………..XN, se define como
la media aritmética del cuadrado de las
desviaciones de las observaciones con
respecto a la media de la población, y se
denota por:
N

 (X i u) 2

σ 
2 i 1
N
Ejemplo: Datos Discretos
Las frecuencias cardiacas por minuto, de 5 niños
son : 130, 132, 127, 129, 132
Determinar la varianza de las frecuencias
cardiacas de la muestra:
Solución:
1. Se calcula 1ero. la media aritmética de la muestra
2. Se calcula la diferencia entre cada observación y
la media aritmética.
3. Se eleva al cuadrado estas desviaciones
(diferencias)
4. Se suman los cuadrados de las desviaciones
5. La suma se divide por n-1, si la muestra es
pequeña y por n-1 o simplemente n, si la muestra
es muy grande.
Siguiendo el ejemplo:
n= 5
n
xi- x (xi- x)2
xi
x 650
i

127 -3 9 x i 1
 130 pulsaciones / min
129 -1 1
n 5

 x x
130 0 0 n
2
i
132 2 4 18
132 2 4 s' 
2 i 1
  3,6
n 5
650 18 Con la corrección de Bessel:

 x x 
n
2
Podemos observar que S’2, es i
claramente menor que S2, debido 18
a que la muestra es pequeña. s 
2 i 1
  4,5 pulsaciones
n1 4
Respuesta:
La varianza en la muestra de las
frecuencias cardiacas de los niños
con respecto a la X calculada (130
pulsaciones/minuto) es de 4,5.
Ejemplo para datos continuos:
La distribución de las cuotas anuales de 100
compañías de un seguro de $1.000, para
trabajadores de 40 años es:
2 2
Intervalo yi ni yi.ni Yi - Y (Yi – Y) 2 ni ( Yi – Y) 2

28 - 30 29 8 232 -6,7 44,89 359,12


30 - 32 31 15 465 -4,7 22,09 331,35
32 - 34 33 15 495 -2,7 7,29 109,35
34 - 36 35 12 420 -0,7 0,49 5,88
36 - 38 37 15 555 1,3 1,69 25,35
38 - 40 39 20 780 3,3 10,89 217,8
40- 42 41 10 410 5,3 28,09 280,9
42 - 44 43 5 215 7,3 53,29 266,45
Sumatorias 100 3.572 1.596,2
m

ny i i
3.572 Luego:
y i 1
  35,7 Aplicando la fórmula
n 100
n

 n ( y  y)
i i
2

V ( y )  sy 2  i 1
n

1.596,2
V ( y )  sy   15,96
2

100
Luego:
La varianza es 15,96.

O sea:
La distancia de cada una de las
observaciones con respecto a la
media encontrada 35,7, es de
15,96 $us.
Propiedades de la Varianza

La varianza de un conjunto de
observaciones x1, x2, x3………….
………………………… xn, siempre es
un Nro. no negativo
d) DESVIACIÓN TÍPICA o Desviación
Estándar (s)
Si bien ya se sabe como calcular la varianza, con la
fórmula que expresa cuantitativamente la dispersión
de un conjunto de observaciones, existe un
inconveniente en su interpretación, ya que está
expresada en el cuadrado de la dimensión en que
se expresa la característica de la variable, lo que
crea confusión.
Por esta razón basándonos en el valor calculado para
la varianza se calcula una medida de dispersión en la
misma dimensión en que están los datos. Esta
medida o estadígrafo es la desviación típica o
estándar
d) DEFINICIÓN DE LA
DESVIACIÒN TÍPICA
La desviación típica o estándar “S” de
las observaciones x1, x2, x3………….
………………………… xn, de una característica
x. se define como la raíz cuadrada
positiva de la varianza
Si los datos
no están D ( x )  sx  V ( x )  s 2
agrupados

Si los datos
están
agrupados
D ( y )  sy  V ( y )  s 2
Siguiendo el Ejemplo: para datos
No agrupados y discretos:

D ( x )  sx  V ( x )  sx 2

D
(
x)
sx4
,
5 
2,
12

D( x )  sx  2 ,12
Luego:
La desviación en las pulsaciones de los
niños, respecto a la media encontrada
de 130 es de 2,12 pulsaciones/min.
Al tratarse de una dispersión
pequeña, se puede afirmar que la
pulsación promedio obtenida de los
niños es representativa.
Siguiendo el ejemplo: para datos
Agrupados y continuos:

D ( y )  sy  V ( y )  s 2

D( y )  sy  15,96  15,96

D( y )  sy  3 ,99
Luego:
La distancia de cada una de las
cuotas de las 100 empresas, respecto
a la media encontrada 35,7 es de
3,99 $us.
Al tratarse de una dispersión
pequeña, se puede afirmar que el
precio promedio obtenido de las
cuotas del seguro para los 100
empresas es representativo.
Gracias
por su
atención