Está en la página 1de 10

Departamento de Matemticas Profesor: Roberto Medina P.

Guia N4 de Autoaprendizaje de Estadstica.


Ejercicios resueltos y propuestos

Medidas de dispersin.
Consideremos las notas de dos grupos de 50 alumnos, en el primero 25 alumnos obtienen
un 10 y 25 un 4, en el segundo los 50 alumnos obtienen un 7. Si calculamos la media en
ambos conjuntos es la misma (7), si slo nos fijamos en la media podemos afirmar que los
dos grupos de alumnos son bastantes buenos, pero lo cierto es que en el primer grupo hay
25 alumnos que han obtenido una nota excelente y 25 con mala nota, mientras que en el
segundo todos los alumnos han sacado una buena nota.

La media para el primer grupo es menos representativa que para el segundo. Hemos visto
un ejemplo, bastante exagerado para comprobar que las medidas de tendencia central
necesitan un complemento, una medida que nos permita otorgar mayor o menor
representatividad estas medidas.

1) Rango o Recorrido.

Es la diferencia entre el mayor valor de la variable y el menor valor de la misma.

Propiedades.

Es fcil de calcular y sus unidades son las mismas que las de la variable.
Slo usa las unidades extremas.
Se puede ver afectada por observaciones anmalas.
Con cada observacin nueva el rango puede aumentar o permanecer invariante, pero
nunca disminuir.
Al usar slo dos datos no es una medida fiable.

Ejemplos:

1) Determine el rango o recorrido del siguiente conjunto de datos:

Variable Frecuencia Frecuencia


estadstica absoluta acumulada
Xi ni Ni
350 4 4
400 6 10
450 9 19
500 20 39
550 31 70

Solucin:
En este caso el rango es simplemente: R = 550 350 = 200
Departamento de Matemticas Profesor: Roberto Medina P.

2) Rango intercuartlico.

Viene dado por la diferencia entre el cuartil superior e inferior.

Las propiedades aplicables al rango lo son tambin al rango intercuartlico con la salvedad
de que es una medida menos sensible a anomalas, nos da el rango de valores en el que se
encuentra el 50% central de los datos.

Ejemplos:

1) Considere la siguiente tabla de valores y determine el rango intercuartilico:

Intervalos Frecuencia Frecuencia


de la absoluta acumulada
Variable ni Ni
estadstica
Xi
350-399 4 4
400-449 6 10
450-499 9 19
500-549 20 39
550-599 31 70
600-649 80 150
650-699 42 192
700-749 10 202
750-799 8 210
800-849 2 212

Solucin:
Primero debemos recordar que, el cuartil de orden k se obtiene de la formula:

donde k=1,2,3

Donde los smbolos significan:


Qk = cuartel de orden k
k = orden del cuartel con k = 1,2, o 3
li-1 = lmite real inferior del intervalo donde se encuentra el quartil buscado (clase del quartil
buscado)
n = nmero total de datos
Ni-1 = frecuencia acumulada del intervalo anterior al intervalo o clase del cuartil
ni = frecuencia absoluta de los datos del intervalo donde se encuentra el cuartil
Departamento de Matemticas Profesor: Roberto Medina P.

ai = amplitud del intervalo o clase del cuartil

Para calcular el rango intercuartilico, es necesario primero, determinar el valor del primer
cuartil, Q1 y el valor del tercer cuartil, Q3 para los datos de la tabla, es decir, los valores que
dejan o caen por debajo del 25%, y del 75% de los datos u observaciones.
25
El 25% de 212 es: g212 = 53 que cae en el intervalo de 550-599
100
75
El 75% de 212 es: g212 = 159 que cae en el intervalo de 650-699
100
Calculando los respectivos cuartiles para cada uno de los intervalos tenemos:
Orden del cuartil: k = 1
Nmero total de datos: n = 212
Amplitud del intervalo o clase del cuartil buscado, corresponde a la diferencia entre el
limite real inferior y el limite real superior de este intervalo, es decir:
ai = (li - li-1 ) = (599,5 549,5) = 50
Frecuencia absoluta de los datos del intervalo donde se encuentra el cuartil buscado:
ni = 31
Frecuencia acumulada del intervalo anterior al intervalo o clase del cuartil:
Ni-1 = 39
Por lo tanto, aplicando la frmula anterior se obtiene el valor del cuartil del 25% o Q1 que
corresponde a:
1g212
- 39
4
Q1 = 549,5 + g50
31
Q1 = 572, 08
Y de manera anloga para el tercer cuartil tenemos:
Orden del cuartil: k = 3
Nmero total de datos: n = 212
Amplitud del intervalo o clase del percentil buscado, corresponde a la diferencia entre el
limite real inferior y el limite real superior de este intervalo, es decir:
ai = (li - li-1 ) = (699,5 649,5) = 50
Frecuencia absoluta de los datos del intervalo donde se encuentra el cuartil buscado:
ni = 42
Frecuencia acumulada del intervalo anterior al intervalo o clase del cuartil:
Ni-1 = 150
Por lo tanto, aplicando la frmula anterior se obtiene el valor del cuartil del 75% o Q3 que
corresponde a:
3g212
- 150
4
Q3 = 649,5 + g50
42
Q3 = 660, 21
Por lo tanto el rango intercuartlico ser de:
RQ = 660,21 572,08
RQ = 88,13
Departamento de Matemticas Profesor: Roberto Medina P.

Esto significa, que el 50% de los datos centrales, se encuentran ubicados dentro de este
rango de valores, o se extienden dentro de este rango.

2) Considere la siguiente tabla de valores y determine el rango intercuartilico:

Intervalos Frecuencia Frecuencia


de la absoluta acumulada
Variable ni Ni
estadstica
Xi
350-399 4 4
400-449 12 16
450-499 15 31
500-549 20 51
550-599 60 111
600-649 121 232
650-699 12 244
700-749 50 294
750-799 25 319
800-849 30 349

3) Desviacin media, DM:


Las medidas de dispersin como el rango o el rango intercuartlico son poco significativas y
slo se apoyan en dos datos. Es conveniente tener una medida de la dispersin de los datos
respecto a la media aritmtica (valor en el que se resumen todos los datos) y en la que
tomsemos informacin de todas la observaciones.
Una medida para conocer la dispersin de los datos sera ver que errores se comenten al
dar la media en lugar del autntico valor, en el valor i-simo cometeramos un error .
Si sumamos todas las desviaciones

.
Nos da un valor de cero. Se compensan las desviaciones positivas y negativas, por lo tanto,
no podemos conocer la desviacin. Para corregir ese problema podemos considerar todos
los errores que calculemos como positivos, para ello basta con tomar el valor absoluto, si
adems consideramos la media de esos errores obtenemos la desviacin media.
Departamento de Matemticas Profesor: Roberto Medina P.

Definimos la desviacin media como

donde n1 + n2 +...+ nk = n.

Ejemplos:
1) Variable discreta; considere la siguiente tabla de valores de una variable estadstica
discreta o de datos no agrupados.
Variable Frecuencia absoluta Desviacin respecto a la
estadstica ni media
Xi Xi - X
2 2 2 4,71 = -2,71
3 5 3 4,71 = -1,71
4 10 4 4,71 = -0,71
5 7 5 4,71 = 0,29
6 13 6 4,71 = 1,29
7 1 7 4,71 = 2,29
n = 38
(2g2 + 3g5 + 4g10 + 5g7 + 6g13 + 7g1)
La media aritmtica X , corresponde a: X =
38
179
X= = 4,71
38
Y considerando los valores absolutos de las desviaciones respecto de la media que aparecen
en la tabla y la frmula anterior de DM, tenemos:

DM =
( -2, 71 g2 + -1,71 g5 + -0,71 g10 + 0, 29 g7 + 1, 29 g13 + 2, 29 g1)
38
42,16
DM =
38
DM = 1,109
Departamento de Matemticas Profesor: Roberto Medina P.

2) Variable continua; Considere la siguiente tabla de datos agrupados para una variable
continua y determine la DM.
Intervalos de la Frecuencia Marca de clase Desviacin Ponderacin por
variable absoluta, ni X absoluta la frecuencia
estadstica Xi respecto de la ni gX - X
media X - X
350-399 4 375 239 956
400-449 6 425 189 1134
450-499 9 475 139 1251
500-549 20 525 89 1780
550-599 31 575 39 1209
600-649 80 625 11 880
650-699 42 675 61 2562
700-749 10 725 111 1110
750-799 8 775 161 1288
800-849 2 825 211 422
N = 212 Suma = 12592

Recordando que la marca de clase corresponde al promedio de los valores extremos,


lmites inferior y superior de cada intervalo:
l +l
X = i -1 i
2
Y que la media (aritmtica) en este caso corresponde a:
i =k

X gn i
X= i =1

n
X = 614
Por lo tanto la desviacin media DM es:
i =k

X i - X gni
DM = i =1

n
12592
DM = = 59,396
212
Es decir, se puede establecer que los valores de la variable estadstica, se desvan 59,396
puntos respecto del valor de la media.
Departamento de Matemticas Profesor: Roberto Medina P.

4) La desviacin tpica o Standard.

Tambin expresa el grado de dispersin de los datos con respecto al promedio, pero
evitando el valor absoluto, para simplificar los clculos. Se simboliza con la letra S, y se
calcula por la frmula o expresin:

i =k

( X - X ) gni
2
i
S= i =1

Ejemplos:

1) Calcule la desviacin tpica de los siguientes datos:

Variable Frecuencia Desviacin Cuadrado de la Ponderacin


estadstica absoluta respecto a la media desviacin por la
Xi ni Xi - X tpica frecuencia
( Xi - X ) ( X i - X ) gni
2 2

2 2 2 4,71 = -2,71 7,3441 14,6882


3 5 3 4,71 = -1,71 2,9241 14,6205
4 10 4 4,71 = -0,71 0,5041 5,041
5 7 5 4,71 = 0,29 0,0841 0,5887
6 13 6 4,71 = 1,29 1,6641 21,6333
7 1 7 4,71 = 2,29 5,2441 5,2441
n = 38 (total de datos) Suma = 61,8158
(2g2 + 3g5 + 4g10 + 5g7 + 6g13 + 7g1)
La media aritmtica X , corresponde a: X =
38
179
X= = 4,71
38
Y considerando los valores anteriores tenemos:
61,8158
S= = 1, 2754
38

5) La Varianza.

La desviacin media es una medida de dispersin de datos correcta pero presenta un


inconveniente y es la complejidad de manipulacin al intervenir valores absolutos. Sera
conveniente encontrar otra medida que no presente el problema inicial (que no se
compensen las dispersiones negativas con las positivas) y cuyo manejo se ms sencillo.
Otra forma de evitar la compensacin de dispersiones es elevar al cuadrado la diferencia y
es ms sencillo trabajar con cuadrados que con valores absolutos, teniendo en cuenta esta
consideracin introduciremos el concepto de Varianza, que se designa con la letra griega
sigma al cuadrado, s 2
Departamento de Matemticas Profesor: Roberto Medina P.

Definimos la varianza como la media de los cuadrados de las desviaciones respecto a la


media.

donde n1 + n2 +...+ nk = n.

Ejemplos:
1) Para el mismo caso anterior, calcule la varianza de los siguientes datos:

Variable Frecuencia Desviacin Cuadrado de la Ponderacin


estadstica absoluta respecto a la media desviacin por la
Xi ni Xi - X tpica frecuencia
( Xi - X ) ( X i - X ) gni
2 2

2 2 2 4,71 = -2,71 7,3441 14,6882


3 5 3 4,71 = -1,71 2,9241 14,6205
4 10 4 4,71 = -0,71 0,5041 5,041
5 7 5 4,71 = 0,29 0,0841 0,5887
6 13 6 4,71 = 1,29 1,6641 21,6333
7 1 7 4,71 = 2,29 5,2441 5,2441
n = 38 (total de datos) Suma = 61,8158

(2g2 + 3g5 + 4g10 + 5g7 + 6g13 + 7g1)


La media aritmtica X , corresponde a: X =
38
179
X= = 4,71
38
Y considerando los valores anteriores tenemos:
61,8158
s2 = = 1, 6267
38

Nota: para el caso de datos agrupados de una variable continua el procedimiento, tanto para
calcular la desviacin tipica, como la varianza, es el mismo, slo que ahora, en vez de usar
el dato puntual de la variable estadstica, Xi se utiliza el valor de la marca de clase, X, que
representa a cada intervalo.
Es decir, ahora las expresiones anteriores quedan como:

Desviacin tpica, S:
i =k

( X - X )
2
gni
S= i =1

n
Departamento de Matemticas Profesor: Roberto Medina P.

Varianza:
i =k

( X - X )
2
gni
s =
2 i =1

n
Ejemplos:
1) Variable continua; Considere la siguiente tabla de datos agrupados para una variable
continua y determine la varianza y la desviacin tpica.

Intervalos de la Frecuencia Marca de clase Cuadrado de la Ponderacin por


variable absoluta, ni X desviacin la frecuencia
estadstica Xi tpica ( X i - X ) gni
2

( Xi - X )
2

350-399 4 375 57121 228484


400-449 6 425 35721 214326
450-499 9 475 19321 173889
500-549 20 525 7921 158420
550-599 31 575 1521 47151
600-649 80 625 121 9680
650-699 42 675 3721 156282
700-749 10 725 12321 123210
750-799 8 775 25921 207368
800-849 2 825 44521 89042
N = 212 Suma = 1407852

Recordando que la marca de clase corresponde al promedio de los valores extremos,


lmites inferior y superior de cada intervalo:
l +l
X = i -1 i
2
Y que la media (aritmtica) en este caso corresponde a:
i =k

X gn i
X= i =1

n
X = 614
Tenemos que la:

Varianza:
i =k

( X - X )
2
gni
s =
2 i =1

n
1407852
s2 = = 6640,81
212
Departamento de Matemticas Profesor: Roberto Medina P.

Desviacin tpica, S:
i =k

( X - X )
2
gni
S= i =1

n
1407852
S= = 81, 491
212

También podría gustarte