Está en la página 1de 9

1

Hernn Daro Toro - 9


1 Medidas de dispersin
Loe estadsticos de localizacin (como las medidas de tenddencia central) no son sucientes
para describir un conjunto de datos y es necesario incluir otros elementos como la variabili-
dad, entendida como la dispersin entre datos. Los estadsticos mas utilizados para describir
la variabilidad son: el rango, la desviacin estndar y el coeciente de variacin, entre otros.
Estos estadsticos tambin se llaman de escala y se calculan nicamente para variables reales.
1.1 El rango
El rango es el ms simple de los estadsticos de escala y consiste en medir la dispersin de un
conjunto de datos por medio de la longitud del menor intervalo que los contenga. Se calcula
como la diferencia entre el mayor y el menor de los datos del conjunto, esto es:
1 = r
max
r
min
donde r
max
representa el valor mximo y r
min
representa el valor mnimo que toma la variable.
El rango es un indicador muy dbil de la variabilidad ya que no toma en cuenta la forma
de la distribucin de los datos y est adems inuenciado por valores atpicos. Observa el
siguiente ejemplo:
Example 1 Las tres grcas que aparecen a continuacin muestran cada una una distribu-
cin de frecuencias de un conjunto de datos: (insertar grcas)
Como se puede observar en las guras las tres distribuciones son bien diferentes, sin
embargo los tres conjuntos de datos tienen el mismo rango, esto es, 1 = 13 7 = 6
Exercise 2 En la clase de educacin fsica el profesor tom la medida de la estatura de los
alumnos del grado noveno; l apunt los datos aproximando en centmetros, as: si meda
entre 154.1 cm. y 154.4 cm. anotaba 154 cm.; pero si meda entre 154.5 cm. y 154.9 cm.
anotaba 155 cm. En una primera presentacin el profesor agrup los datos como se dan en
la siguiente tabla:
Estatura en cm. 146 148 150 152 153 155 157 161 163 166 168 170
N
o
de alumnos 1 2 2 3 5 9 7 4 3 2 1 1
Determina el rango de la variable estatura.
Realiza un diagrama de frecuencias para esta distribucin.
2
Hernn Daro Toro - 9
Exercise 3 En una ciudad costera, un sbado de agosto, se midi con radar la velocidad,
en kilometros por hora, de 50 motocicletas que pasaron frente a un paso de nivel (qu es un
paso de nivel?). Los datos se encuentran en la siguiente tabla:
90 85 110 80 75 120 105 100 103 98
96 89 135 108 125 130 120 102 97 86
132 128 115 142 106 102 95 89 96 107
121 132 126 128 134 138 139 110 123 108
102 98 92 90 128 135 138 143 109 133
i. Determina el rango de la distribucin.
ii. Agrupa los datos en intervalos de clase de longitud 10. Elabora la distribucin de fre-
cuancias, el histograma, el polgono de frecuencias y ubica las marcas de clase.
1.2 Desviacin media
La desviacin media es un estadstico de escala que mide la dispersin en un conjunto de datos
promediando las desviaciones absolutas de todos ellos con respecto a la media aritmtica.
Si el conjunto de datos r
1
. r
2
. . . . . r
n
tiene media
j =
X
n
i=1
r
i
:
la desviacin media se calcula mediante la frmula,
d: =
X
n
i=1
jr
i
jj
:
Example 4 Se tom el peso en libras de 25 estudiantes del colegio y los resultados se orga-
nizaron en la siguiente tabla:
98 105 100 110 75
86 120 102 135 125
107 95 89 115 106
108 139 110 126 134
133 138 143 92 128
a. Calcula la desviacin media del conjunto de datos.
3
Hernn Daro Toro - 9
b. Interpreta.
Cuando los datos estn resumidos en una tabla de frecuencias con datos no agrupados,
la desviacin media se calcula como:
d: =
X
m
i=1
jr
i
jj ,
i
:
donde : es el nmero de categoras de la variable y ,
i
es la frecuencia en la categora r
i
.
Example 5 Se le tom el pulso a 103 personas que visitaban un centro comercial y los
resultados se registraron en la siguiente tabla:
Pulsaciones 55 59 62 68 76 78 80 85 90 95
,
i
2 3 5 6 37 28 15 4 2 1
a. Determina la desviacin media del conjunto de datos.
b. Cul es el nmero de pulsaciones por minuto ms comn en este grupo de personas?
c. Cul es el nmero de pulsaciones que tendran los visitantes al centro comercial si todos
hubieran registrado el mismo nmero y la suma total de pulsaciones fuera la misma?
d. Realiza una grca lineal que muestre como se dan las pulsaciones entre las personas que
asistan al centro comercial.
Si los datos han sido previamente agrupados en intervalos de clase, la desviacin media
se obtiene de la siguiente manera:
d: =
X
m
i=1
j
i
jj ,
i
:
donde
i
es la marca de clase del intervalo i y : es el nmero de intervalos.
Example 6 Una patrulla de carreteras controla la velocidad de los autos que transitan un
tramo de una va. El domingo pasado registraron la velocidad de 200 autos en este tramo.
Velocidad (km/h) N
o
autos
[60. 70) 10
[70. 80) 28
[80. 90) 67
[90. 100) 45
[100. 110) 33
[110. 120) 12
[120. 130) 5
4
Hernn Daro Toro - 9
1. Elabora la tabla de frecuencias (,
i
), frecuencias acumuladas (1
i
), frecuencias realtivas
(/
i
), frecuencias relativas acumuladas (H
i
) y encuentra las marcas de clase.
2. Determina la clase modal y la clase mediana.
3. Utiliza el polgono de frecuencias acumuladas (o relativas) para ubicar la mediana.
4. Utilia el histograma para ubicar la moda.
5. Si se impone una velocidad mxima de 99.5 km/h en ese tramo, cuntos autos seran
sancionados por exceso de velocidad?
6. Si se impone una velocidad mnima de 69.5 km/h Cuntos autos seran sancionados?
7. Calcula la desviacin media y el rango. Interpreta tus resultados.
Exercise 7 Considere que r
n
representa el nmero de pulsaciones por minuto de 10 de-
portistas controlados durante un evento deportivo.
: 1 2 3 4 5 6 7 8 9 10
r
n
80 75 83 60 66 75 90 87 69 84
1. Calcular la media de los datos.
2. Calcular la desviacin media de los datos.
1.3 Varianza
Otra forma de cuanticar la dispersin de los datos es promediando los cuadrados de sus
desviaciones con respecto a la media; el estadstico as obtenido se llama Varianza y al igual
que en el caso de la desviacin media, en el calculo, se presentan tres casos.
Si el conjunto de datos r
1
. . . . . r
n
Proviene directamente de una distribucin de datos sin
agrupar, se calcula por medio de,
o
2
=
P
n
i=1
(r
i
j)
2
:
donde : es el total de los datos y j es la media.
Example 8 Calcular la varianza de los datos dados en el ejercicio anterior.
5
Hernn Daro Toro - 9
Exercise 9 Una fbrica de gaseosas pretende lanzar al mercado un nuevo sabor, para ello
realiza una prueba de aceptacin en una muestra de 10 nios utilizando una escala de 10
puntos para medir el grado de aceptacin. Los puntajes obtenidos son los siguientes: 2, 6,
8, 4, 5, 10, 6, 8, 8, 7. Determina el rango (1), la media (j), la desviacin media (d:) y la
varianza (o). Ten en cuenta que los datos no estn agrupados.
Cuando los datos estn resumidos en una tabla de frecuencias con datos no agrupados,
el clculo de la varianza se obtiene de:
o
2
=
P
m
i=1
,
i
(r
i
j)
2
:
donde : es el nmero de categoras de la variable y ,
i
es la frecuencia absoluta del dato i.
Example 10 En una carpintera de 36 carpinteros se recogi la informacin de cuntas
cajas elaboran ellos en un da. En la siguiente tabla se resume la informacin
r
i
13 14 15 16 17 18 19
,
i
6 3 9 7 4 3 4
Calcula la media, la desviacin media y la varianza para estos datos
Exercise 11 Retomemos el ejercicio del profesor de educacin fsica el profesor que tom
las estaturas de sus estudiantes; los datos resultaron como se dan en la siguiente tabla:
Estatura en cm. 146 148 150 152 153 155 157 161 163 166 168 170
N
o
de alumnos 1 2 2 3 5 9 7 4 3 2 1 1
Calcula el rango, la media, la desviacin media y la varianza.
Si los datos han sido previamente agrupados en intervalos de clase, la varianza se calcula
a travs de:
o
2
=
P
m
i=1
,
i
(
i
j)
2
:
donde
i
es la marca de clase y : es el nmero de intervalos.
Example 12 La estatura del ejemplo anterior puede agruparse en intervalos de la forma:
Estatura ,
i

i
[145. 150) 5 147.5
[150. 155) 17 152.2
[155. 160) 7 157.5
[160. 165) 7 162.5
[165. 170) 4 167.5
Calcula el rango, la media, la desviacin media y la varianza.
6
Hernn Daro Toro - 9
Exercise 13 La velocidad de 50 vehculos esta agrupada en la siguiente tabla.
Intervalo de clase ,
i
1
i
/
i
H
i

i
[70. 78) 1
[78. 86) 2
[86. 94) 6
[94. 102) 7
[102. 110) 10
[110. 118) 3
[118. 126) 5
[126. 134) 8
[134. 142) 6
[142. 150) 2
Total 50
Determina el rango, la media, la desviacin media y la varianza.
2 Medidas de asimetra
Hasta ahora se han estudiado medidas de tendencia central y de dispersin que son las
medidas ms frecuentes que se calculan en cualquier estudio estadstico. Sin embargo existen
tambin medidas que indican de la simetra o asimetra de la distribucin y del achatamiento
o no de la misma.
Empezando con la simetra, es lgico pensar que si la distribucin tiene una nica moda
y es simtrica, entonces las tres medidas de centralizacin coinciden. Si no es simtrica, suele
suceder que la mediana est comprendida entre la moda y la media.
La simetra es importante para saber si los valores de la variable se concentran en una
determinada zona del recorrido de la variable.
Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios:
Comparando la Media y la Moda.
Comparando los valores de la variable con la media.
En el primer caso si la diferencia j `o es positiva, diremos que hay asimetra positiva
o a la derecha (gura 1):
En el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda (gura
2):No obstante, esta medida es poco operativa al no ser una medida relativa, ya que esta
7
Hernn Daro Toro - 9
Figure 1: Simetra positiva o a la derecha, 0
inuida por la unidad en que se mida la variable, por lo que se dene el coeciente de
Asimetra de Pearson como:
=
j `o
o
donde j es la media, es la moda y o es la desviacin. dada por al frmula
o =
v
u
u
u
t
n
X
i=1
(r
i
j)
2
:
Si la distribucin es simtrica, el ndice de Person es cer; si es asimtrica a la derecha, es
positivo; y si es asimtrica a la izquierda, es negativo.
Example 14 Se le tom el pulso a 103 personas que visitaban un centro comercial y los
resultados se registraron en la siguiente
Pulsaciones 55 59 62 68 76 78 80 85 90 95
Frecuencia 2 3 5 6 37 28 15 4 2 1
Exercise 15 a. Determina la media de la distribucin.
b. Determina la desviacin estndar de la distribucin.
c. Determina la moda de la distribucin.
8
Hernn Daro Toro - 9
Figure 2: Simetra negativa o a la izquierda, < 0
e. Determina la asimetra de la distribucin usando el coeciente de Pearson.
f. Representa grcamente la informacin y explica tus resultados.de la grca 3 se con-
cluye que la asimetra de la distribucin es muy cercana a cero, como efectivamente
comprueban los datos.
Exercise 16 Segn la informacin del DANE, los datos de la siguiente tabla corresponden
a la evolucin del salario mnimo y de la inacin en el pas, desde el ao 1990 hasta 1998.
Ao Salario mnimo % de aumento Inacin
1990 41025 26 32,3
1991 51720 26 26,8
1992 65190 26 25,13
1993 81510 25 22,6
1994 98700 21 22,5
1995 118933 20 19,4
1996 142125 19,5 21,6
1997 172005 21 17,6
1998 203826 18,5 16,0
a. Calcula el salario mnimo promedio de esos aos, el porcentaje promedio de aumento
salarial y el porcentaje promedio de inacin.
9
Hernn Daro Toro - 9
Figure 3: Graca de barras correspondiente a las pulsaciones de 103 personas.
b. Cul de las tres variables presenta mayor rango de variacin? Es signicativo ese
resultado? Por qu?
c. Si calculas la desviacin media de las tres variables, qu indica esa informacin?
d. Realiza un diagrama de lneas para cada variable.

También podría gustarte