Está en la página 1de 24

ANGEL FRANCISCO ARVELO LUJAN

Angel Francisco Arvelo Lujn es un Profesor Universitario Venezolano en el rea


de Probabilidad y Estadstica, con ms de 40 aos de experiencia en las ms
reconocidas universidades del rea metropolitana de Caracas.
Universidad Catlica Andrs Bello : Profesor Titular Jubilado 1970 a 2003
Universidad Central de Venezuela: Profesor por Concurso de Oposicin desde
1993 al presente
Universidad Simn Bolvar: Profesor desde 2005 al presente
Universidad Metropolitana: Profesor desde 1973 a 1987
Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004

Sus datos personales son :


Lugar y Fecha de Nacimiento: Caracas, 16-02-1947
Correo electrnico: angelf.arvelo@gmail.com
Telfono: 58 416 6357636

Estudios realizados:
Ingeniero Industrial. UCAB Caracas 1968
Mster en Estadstica Matemtica CIENES , Universidad de Chile 1972
Cursos de Especializacin en Estadstica No Paramtrica Universidad de Michigan
1982
Doctorado en Gestin Tecnolgica: Universidad Politcnica de Madrid 2006 al
Presente

El Profesor Arvelo fue Director de la Escuela de Ingeniera Industrial de la


Universidad Catlica Andrs Bello (1974-1979) , Coordinador de los
Laboratorios de esa misma Universidad especializados en ensayos de Calidad,
Auditor de Calidad, y autor del libro Capacidad de Procesos Industriales UCAB
1998.

En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales


en el rea de Estadstica General y Control Estadstico de Procesos.

Para ms informacin consulte la pgina web. www.arvelo.com.ve


Medidas de Dispersin 2
Angel Francisco Arvelo L.

MEDIDAS DE DISPERSION
Las medidas que hasta ahora conocemos, medias, moda, percentiles, etc., tienen
todas ellas la propiedad de ubicarse siempre entre los dos valores extremos de los
datos, mnimo y mximo, pues indican posicin, bien sea central, o bien sea
extrema como por ejemplo el percentil 5 , o el percentil 95.
Las medidas que van a ser estudiadas en este captulo no gozan de esta
propiedad, y persiguen como objetivo describir la homogeneidad o heterogeneidad
de los datos.
Las medidas de tendencia central son insuficientes para describir el
comportamiento de los datos, pues no proporcionan informacin acerca de cuan
cerca o cuan lejos se encuentran estos datos, con relacin a ese valor central.
As por ejemplo el tro de datos {8 , 9 , 10 } y { 1 , 10 , 16 } tienen ambos media 9;
pero resulta obvio, que en el primero de ellos existe una menor desviacin con
respecto a este valor central, que en el segundo.
Medir la variabilidad resulta muy importante en diversas situaciones prcticas,
pues a travs de su medicin se podrn comparar conjuntos de datos, y
establecer cuando existe una mayor concentracin de ellos en la regin central.
As por ejemplo, en estudios sociales las medidas de dispersin proporcionan la
informacin requerida para analizar como es la distribucin de los ingresos dentro
de la sociedad; en los estudios de calidad industrial, estas mismas medidas de
dispersin se utilizan para medir la precisin de las mquinas utilizadas en el
proceso de produccin.
Antes de comenzar a analizar las medidas de dispersin, se recomienda revisar
las propiedades de la media aritmtica. (Vase Medidas de Tendencia Central.
Arvelo)

1 Varianza y Desviacin Tpica: Cuando se tiene un conjunto de datos {


x1, x2 ,x3 , ......, xn} sin agrupar, se define como desvo de cada dato con relacin a
su media aritmtica , a la diferencia : di= xi - X .
Aunque los desvos pueden ser calculados respecto de cualquier valor, salvo que
se indique lo contrario, se sobreentiende que estos se calculan respecto de X , y
como sabemos, la suma de sus cuadrados es mnima, cuando estos desvos se
calculan respecto de la media aritmtica
Cuanto mayor sea este desvo, mas alejado se encuentra el dato xi de X .
Estos desvos pueden ser positivos o negativos, segn el dato xi se encuentre a la
derecha o la izquierda de X , y su suma algebraica da siempre cero.
En consecuencia, no se puede tomar al promedio de los desvos como medida de
dispersin, debido a que este promedio sera siempre nulo.
El problema del signo de los desvos puede ser resuelto de dos maneras, o bien
tomando su valor absoluto, o como segunda opcin elevndolos al cuadrado.
Para definir la varianza, se adopta esta segunda alternativa.
Medidas de Dispersin 3
Angel Francisco Arvelo L.

La varianza de un conjunto de datos cuantitativos { x1, x2 ,x3 , ......, xn} sin agrupar,
se define como la media aritmtica del cuadrado de sus desvos.
i=n
(xi X) 2
S2 = i=1
n
La expresin anterior es una definicin, y por lo tanto debe ser aceptada como tal,
sin demostracin.
Sin embargo, debido a que la varianza es la ms importante de las medidas de
dispersin, es importante hacer las siguientes aclaratorias:
1) La varianza es una medida de dispersin que representa exclusivamente lo
que establece la definicin: Media aritmtica del cuadrado de los desvos.
Cuanto ms desviado est un dato de X , mayor ser su cuadrado , y en
consecuencia mayor ser varianza.
La varianza no puede ser interpretada como algo diferente a lo que la definicin
misma establece.
2) La varianza viene expresada en unidades de los datos al cuadrado, y as por
ejemplo, si los datos estn en centmetros, la varianza est en centmetros
cuadrados.
Esto ocasiona que el orden de magnitud de la varianza sea completamente
diferente al de los datos originales, y que adems no sean comparables con ellos
pues vienen expresados en unidades diferentes.
Por estos dos motivos, en muchas oportunidades interesa regresar a las unidades
originales, y all es cuando aparece el concepto de Desviacin Tpica, que se
define simplemente como la raz cuadrada de la varianza.
i n
( xi X) 2
i 1
S
n
La desviacin tpica o estndar , viene en las mismas unidades de los datos, y
constituye junto con la varianza las ms importantes medidas de dispersin.
3) Otro comentario importante con relacin a la varianza, es el que se refiere a su
denominador, si es n o n-1, pues a lo largo de toda la bibliografa estadstica,
existe una gran confusin con relacin a este punto.
Cuando una medida se calcula tomando en consideracin a toda una poblacin
recibe el nombre de Parmetro Poblacional ; mientras que cuando de calcula
sobre una muestra se llama Estadgrafo , Estadstico Muestral , o simplemente
estadstico.
La nomenclatura ms utilizada en Inferencia Estadstica consiste en designar a
los parmetros poblacionales con letras griegas, y a los estadsticos con letras
latinas.
As por ejemplo , si se tienen N datos cuantitativos que constituyen una
poblacin y sobre ellos se quiere calcular su media, la misma vendra
i N
xi
representada por : i 1
, y se llamara Media Poblacional
N
Medidas de Dispersin 4
Angel Francisco Arvelo L.

Si de esa poblacin de N elementos, se toma al azar una muestra de n y se


i n
xi
i 1
calcula su media, sta se designara por : X .
n
Uno de los problemas importantes que se estudia en Inferencia Estadstica es el
de estimacin, que trata sobre la metodologa a seguir para inferir el valor
desconocido de un parmetro poblacional a partir del estadstico muestral.
Cuando esta nomenclatura se aplica sobre la varianza, se obtiene que la
i N
( xi )2
2 2 i 1
poblacional designada por ,viene dada por : ; mientras que la
N
i n
( xi X) 2
muestral : S2 i 1
.
n
Sin embargo, en Inferencia Estadstica se demuestra que especialmente para
i n
( xi X) 2
muestras pequeas (n < 30), un mejor estimador1 de 2
es: S2c i 1
que
n 1
recibe el nombre de cuasi varianza muestral .
Como la diferencia en la estimacin, entre uno y otro es realmente muy pequea
especialmente para muestras grandes y adems S 2c es mejor estimador, muchos
autores definen de una vez a S 2c como varianza muestral y omiten definir al otro.
La Estadstica Descriptiva no hace distincin entre poblacin y muestra, su nico
objetivo es describir el comportamiento de los datos, y por este motivo usa a S 2
con divisor n como definicin de Varianza de los datos, sin pronunciarse sobre
si es muestral o poblacional.

Propiedades de la Varianza

Propiedad N1: S2 0.
Resulta obvio que por ser la varianza la media de cuadrados de los desvos, sea
siempre una cantidad positiva, pues los cuadrados siempre lo son.
Es importante destacar que el caso S2 = 0 implica que todos los datos son iguales,
es decir que no existe variabilidad, y recprocamente cuando todos los datos son
iguales entonces S2 = 0.
Esta propiedad es comn para todas las medidas de dispersin, es decir:
Medida de Dispersin = 0 x1= x2 = x3 = ...... = xn

Propiedad N2: Cuando los datos son sometidos a una transformacin lineal
Y = a + b X , entonces S2Y = b2 S2X .

1
Es un estimador Insesgado. Vanse textos de Inferencia Estadstica .
Medidas de Dispersin 5
Angel Francisco Arvelo L.

Demostracin : Supongamos que se tiene un conjunto de datos { x1, x2 ,x3 , ......, xn}
y se le somete a la transformacin Y = a + b X , dando lugar a unos nuevos datos
{ y1, y2 ,y3 , ......, yn} .
i n

Por definicin : S 2Y i 1
(yi Y) 2
;
RSy i a bxi ; por la transformacin

i n
n TY a bX ; por propiedad N 5 de la media
i n
2
(a bxi a bX) b 2 ( x X) 2
Por lo tanto: S2Y i 1
= i1 = b2 S2X .
n n
Como corolario de esta propiedad N 2 se deducen las siguientes:
2.a) Si se le suma a cada dato una constante, la varianza no se altera.
Es el caso : b = 1.
2.b) Si cada dato es multiplicado por una constante, la varianza queda multiplicada
por el cuadrado de dicha constante. Es el caso a = 0.
2.c) Si se somete a los datos a una transformacin lineal, la desviacin tpica que
multiplicada por la pendiente de la transformacin: Sy = b Sx .

Ejemplo 1 Los siguientes datos representan el peso de 4 personas expresados en


kilogramos: 64 , 70 , 66 y 80.
a) Calcular la varianza y la desviacin tpica .
b) Transformar los datos en libras, y recalcular su varianza y su desviacin tpica.
Solucin: a) Para calcular la varianza, es necesario calcular primero la media.
64 70 66 80
X = 70 Kgs.
4
(64 70) 2 (70 70) 2 (66 70) 2 (80 70) 2
S2 = = 38 S = 38 = 6,16 Kgs.
4
b) El factor de conversin de kilogramos a libras es 2,2 , de manera que si el peso
de estas 4 personas se expresara en libras los datos quedaran transformados en:
140,80 , 154,00 , 145,20 y 176,00 .
Para la varianza de los nuevos datos, se puede repetir el procedimiento anterior.
140,80 154,00 145,20 176,00
Y = 154,00
4
2 (140,80 154) 2 (154 154) 2 (145,20 154) 2 (176 154) 2
SY = 183,92
4
SY= 183,92 = 13,56
Gracias a la propiedad N 2 de la varianza, este procedimiento es innecesario,
pues los datos Y en libras son los datos X en kilogramos sometidos a la
transformacin: Y=2,2 X, y por lo tanto:
S2Y = b2 S2X = (2,2)2 38 = 183,92 ; Sy = b Sx = (2,2) 6,16 = 13,56
Medidas de Dispersin 6
Angel Francisco Arvelo L.

Propiedad N3 : La varianza tambin puede ser calculada mediante la expresin:


i n
xi2
2
S2 i 1
X
n
Esta es una expresin alternativa, cuyo clculo suele ser ms sencillo que el
explicado con anterioridad a partir de la definicin.
Esta expresin recibe el nombre de clculo de la varianza por momentos, por
una razn que se explicar en el capitulo siguiente, y establece que la varianza es
igual a la media de los cuadrados menos el cuadrado de la media.
Demostracin: Partiendo de la definicin , y desarrollando el cuadrado, se tiene:
i n i n i n I n i n
2
( xi X) 2 ( xi2 2xi X X ) xi2 2X xi X2
S2 i 1
= i1 = i1 i 1 i 1
n n n
Como es X una constante, segn las propiedades de las sumatorias se tiene que
i n I n
X 2 = n X 2 , y adems xi = n X . Sustituyendo:
i 1 i 1
i n i n i n
2 2
xi2 2X (nX) n X xi2 nX xi2
2 i 1 i 1 i 1 2
S = X
n n n
Como consecuencia de esta propiedad se tiene que una frmula alternativa para
i n
xi2
i 1 2
calcular la desviacin tpica es: S= X
n

Ejemplo 2 Calcular la varianza y la desviacin tpica de los pesos en kilogramos


64 , 70 , 66 y 80 del Ejemplo 7.1 , aplicando la frmula por momentos.
Solucin: Hay que calcular la media X = 70
2 64 2 70 2 66 2 80 2 2
S = - (70) = 38 S = 38 =6,16
4
El clculo de la varianza y de la desviacin tpica por momentos suele ms breve
que por definicin ; sin embargo se corre el riesgo de perder de vista lo que se
est calculando, pues no se necesitan calcular los desvos.

Propiedad N 4: Desigualdad de Tchebychev. Dado un conjunto de datos


......
{ x1, x2 ,x3 , , xn} con media X ; la proporcin de datos que se desvan de X en
S2
una cantidad menor que , es por lo menos 1 - 2 .

Esta propiedad es general, y una vez demostrada veremos que es mucha utilidad
prctica, especialmente cuando se aplica en ciertos casos particulares como por
ejemplo, en la curva normal.
Medidas de Dispersin 7
Angel Francisco Arvelo L.

Demostracin: Supongamos que existen m datos que se desvan de X en una


cantidad menor que . Llamemos C al conjunto de esos m datos.
Se tiene: m n , y adems xi - X < , cuando xi C
m
p = = Proporcin de datos que pertenecen al conjunto C, y que por tanto
n
difieren de X en una cantidad menor que .
i n
( xi X) 2 i n
Por definicin : S 2 i 1
n S 2
= ( xi X)2
n i 1

i n
La suma ( xi X ) 2 puede ser descompuesta en dos partes, sobre los datos que
i 1
pertenecen al conjunto C , y sobre los que no pertenecen a l.
i n
Por tanto : ( xi X)2 = ( xi X) 2 ( xi X) 2
i 1 xi C xi C
i n
Como: ( xi X) 2
0 n S 2
= ( xi X)2 ( xi X) 2
xi C i 1 xi C
Existen (n - m) datos { xi } no pertenecientes al conjunto C , y para ellos se
2 2 2
verifica: xi C xi - X (xi - X ) ( xi X) 2 (n - m)
xi C

2 2 2 S2 n m
Por lo tanto : n S ( xi X) (n - m) 2
=1p
xi C n
S2
y en conclusin: p 1- 2
tal como se quera demostrar.

Frecuentemente se toma como un mltiplo de S , de la forma: = k S , y en


este caso la desigualdad de Tchebychev establece que la proporcin de datos que
difiere su media en una cantidad menor que k veces la desviacin tpica , es por
1 1
lo menos 1 - 2 , es decir : p 1 - 2
k k
Es evidente que cuando k=1 , esta desigualdad carece de utilidad prctica alguna,
pues en este caso se concluye en: p 0 , lo que es obvio.
Sin embargo, para valores de k mayores que la unidad se obtienen conclusiones
importantes, y as por ejemplo para k = 2 concluye que en un conjunto de datos
cualquiera, la proporcin de datos que difiere de su media en menos de dos veces
1 3
la desviacin tpica es por lo menos 1 - , es decir p 75% .
4 4
Cuando se toma k = 3 , la conclusin es que la proporcin de datos que difiere de
1 8
su media en menos de tres desviaciones tpicas es por lo menos de 1 -
9 9
lo que equivale al 88,89 % .
Medidas de Dispersin 8
Angel Francisco Arvelo L.

Para cualquier distribucin de frecuencias distribuciones , y segn lo explicado


anteriormente por la desigualdad de Tchevishev , en el intervalo ( X 2 S) deben
caer por lo menos el 75% , y en el intervalo ( X 3 S) por lo menos el 88,89 % de
los datos .

En el caso de la distribucin normal , esta proporcin de datos ha sido determinada


exactamente , y los resultados obtenidos son de amplia utilidad en muchas
aplicaciones.
Para una normal, en el intervalo ( X S) deben caer el 68,27% de los datos
muestrales , en el intervalo ( X 2 S) deben caer el 95,45% de los datos
muestrales , y en el intervalo ( X 3 S) deben caer el 99,73% de los datos
muestrales .

Propiedad N 5. Para el caso de datos agrupados, el clculo de la varianza se


i k i k
(L*i 2
X ) fi (L*i ) 2 fi
2
hace mediante la expresin : S 2 = i 1
i k
= i 1
i k
X
fi fi
i 1 i 1
La expresiones anteriores son sencillas de justificar , pues constituyen
adaptaciones de la definicin de varianza, y de su clculo por momentos, tomando
en cuenta que para el caso de datos agrupados, la marca de clase L*i representa a
todos los datos que caen dentro del intervalo.
Otra expresin til para el clculo, es la que resulta de sustituir en la frmula de la
derecha para el clculo de S 2 por momentos, la media X por su correspondiente
para datos agrupados en funcin de las marcas de clase, y por lo tanto:
Medidas de Dispersin 9
Angel Francisco Arvelo L.

i k F i k I 2

(L*i ) 2 fi GG L*i fi JJ
S2 = i 1 i 1
i k
GG i k
JJ
i 1
fi
H i 1
fi
K
Ejemplo 3 Calcular la varianza y la desviacin tpica de la siguiente distribucin
de frecuencias.
Intervalo 0 a 10 10 a 20 20 a 30 30 a 40 40 a 50 50 a 60 60 a 70
frecuencia 8 34 76 60 31 28 13
Solucin : Hay que organizar los clculos en la siguiente tabla :

Lmites reales fi = frecuencia L*i = Marca de clase L*i fi (L*i ) 2 fi


0 a 10 8 5 40 200
10 a 20 34 15 510 7650
20 a 30 76 25 1900 47500
30 a 40 60 35 2100 73500
40 a 50 31 45 1395 62775
50 a 60 28 55 1540 84700
60 a 70 13 65 845 54925
Sumatorias 250 8.330 331.250
331250
. FG
8.330 IJ 2

H K
2
S = = 214,78 S = 214,78 = 14,66
250 250
Mtodo abreviado para el clculo de la varianza en tablas de frecuencia para
datos agrupados de igual amplitud
Los clculos requeridos en el Ejemplo 7.3 pueden resultar complicados si no se
tiene una buena calculadora.
Un procedimiento abreviado para efectuar los clculos consiste en definir unas
marcas de clase artificiales designadas por Ui* .
Al intervalo de mayor frecuencia o clase modal se le da una marca de clase
*
artificial Um = 0 , a los anteriores marcas de clases artificiales -1 , -2 , etc., y a los
posteriores +1 , +2 , +3 , etc.
Con este artificio , la tabla queda :

Lmites reales fi = frecuencia Ui* = Marca de Ui* fi (Ui* ) 2 fi


clase artificial
0 a 10 8 -2 - 16 32
10 a 20 34 -1 - 34 34
20 a 30 76 0 0 0
30 a 40 60 1 60 60
40 a 50 31 2 62 124
50 a 60 28 3 84 252
60 a 70 13 4 52 208
Sumatorias 250 208 710
Medidas de Dispersin 10
Angel Francisco Arvelo L.

Posteriormente se calcula la varianza de los datos artificiales, mediante la


i k F i k I 2

(Ui* ) 2 fi GG Ui* fi JJ 710 FG 208 IJ 2


expresin : SU2 =
H 250 K
i 1 i 1
i k
GG i k
JJ =
250
= 2,1478

i 1
fi
H i 1
fi
K 2
Finalmente : S2 c 2 SU2 , donde c = Amplitud = 10 S 2 = (10) 2,1478 =214,78
que coincide con el resultado anterior.

Justificacin del mtodo abreviado : Se ha definido una funcin lineal de los datos,
que los transforma en unos datos artificiales ms sencillos de trabajar.
X L*m
Esta transformacin es de la forma : U ; donde tericamente L*m pudiera
c
ser cualquier origen , pero que por conveniencia se toma la marca de clase del
intervalo de mayor frecuencia, pues as la mayor frecuencia queda multiplicada por
cero simplificando an ms los clculos.
Por efecto de la transformacin, las marcas de clase anteriores se convierten en
-1, -2 , (siempre que la amplitud c sea igual para todos los intervalos) , y las
marcas de clase posteriores se convierten en +1 , +2 , etc.
La expresin para calcular SU2 es la correspondiente al clculo de la varianza por
momentos para los datos artificiales U.
La relacin entre los datos originales X y los artificiales U es lineal pues :
X L*m c U Por la propiedad N 2 de la varianza : S2X c 2 SU2 , lo que
constituye la justificacin del mtodo abreviado de clculo.

2 La Media de las desviaciones absolutas : En virtud de que los


desvos respecto de X se compensan, otra manera de omitir su signo es
considerar sus valores absolutos , en lugar de elevarlos al cuadrado como se hace
en el clculo de la varianza..
Cuando se promedian los desvos absolutos, aparece otra medida de dispersin,
que se conoce con el nombre de Media de las desviaciones absolutas, o
Desviacin Media, y que representa lo que en promedio se desvan los datos de
X , sin considerar su signo.
i n
xi X
i 1
D.M
n
Ejemplo 4 Los siguientes datos representan la duracin de cinco cuas de T.V
expresadas en segundos: 38 , 46 , 42 , 28 , 26 . Calcular la media de las
desviaciones absolutas.
38 46 42 28 26
Solucin : Se calcula su media X = = 36, y posteriormente
5
los desvos: 38-36 =2 , 46-36 = 10 , 42 36 = 6 , 28-36 = -8 y 26-36 = -10
Medidas de Dispersin 11
Angel Francisco Arvelo L.

La suma algebraica de los desvos resulta ser cero, tal como debe ocurrir siempre,
y para calcular la desviacin media se promedian los desvos absolutos:
2 10 6 8 10
D.M 7,20
5
Este resultado significa que en promedio, la duracin de las cuas se alejan en
forma absoluta de su media 36 segundos, en 7,20 segundos .
La desviacin media absoluta tiene las siguientes propiedades:

1) Al igual que cualquier otra medida de dispersin D.M 0 , y D.M = 0 es


condicin necesaria y suficiente para que todos los datos sean iguales.

2) En el caso de una distribucin normal con desviacin tpica poblacional ,


existe una relacin directa entre la D.M y , dada por la expresin2 :
2
D.M =

A partir de esta propiedad se obtiene una frmula aproximada entre la desviacin


media absoluta y la desviacin tpica, segn la cual para curvas de frecuencias
4
simtricas o con poco grado de asimetra, se verifica : D.M S
5

3) Para datos agrupados, la marca de clase sustituye al verdadero valor de cada


de cada dato, y la desviacin media absoluta se calcula mediante la expresin:
i k
L*i X fi
i 1
D.M i=k
fi
i=1
Ejemplo 5 Calcular la D.M para los datos del Ejemplo 3 , y verificar que se
cumple la propiedad N 2 .
8.330
Solucin: La media es X = = 33,32, y se organizan los clculos
250
Lmites reales fi = frecuencia L*i L*i X L*i X fi
0 a 10 8 5 28,32 226,56
10 a 20 34 15 18,31 622,54
20 a 30 76 25 8,32 632,32
30 a 40 60 35 1,68 100,80
40 a 50 31 45 11,68 362,08
50 a 60 28 55 21,68 607,04
60 a 70 13 65 31,68 411,84
Sumatorias 250 208 2.963,18

2
Para una demostracin de esta propiedad, vase la obra de este mismo autor: Capacidad de los
Procesos Industriales , U.C.A.B 1998 .
Medidas de Dispersin 12
Angel Francisco Arvelo L.

2.963,18
D.M= = 11,85
250
4
S = 14,66 Por la propiedad N3: D.M ( 14,86 ) = 11,89
5
3 La media de las desviaciones absolutas respecto de la
mediana: La media de las desviaciones absolutas puede ser calculada tambin
respecto de la mediana , dando lugar as a otra medida de dispersin, conocida
tambin Desviacin Media respecto de la Mediana, y que se define de la
siguiente manera:
I n
xi Mediana
i 1
D.MMed
n
Como una de las propiedades de la Mediana, estable que la suma de las
desviaciones absolutas es mnima, cuando estas se calculan respecto de la ella,
entonces se puede garantizar que : D.MMed D.M
I k
L*i Mediana fi
i 1
Para datos agrupados : D.MMed i k
fi
I=1

Ejemplo 6 Calcular la D.MMed para los datos del Ejemplo .4


Solucin : La mediana entre { 38 , 46 , 42 , 28 , 26} es 38, y las desviaciones
respecto de ella son {0, 8, 4 , -10 y 12} respectivamente.
0 8 4 10 12
Por lo tanto: D.MMed = = 6,80 < D.M = 7,20
5

4 El Rango o Recorrido: Esta medida de dispersin se define como la


diferencia entre el mayor y el menor valor de los datos.
R = Mximo Valor - Mnimo Valor
El uso del rango o recorrido , es muy difundido en las aplicaciones industriales de
la Estadstica, pues dada su sencillez de clculo se utiliza en la construccin de
las grficas de control3 conocidas como ( X , R) cuyo objetivo es detectar a tiempo
la aparicin de causas especiales dentro de un proceso de produccin.
En el caso de la distribucin normal, existe una relacin aproximada entre el rango
y la desviacin tpica, y as por ejemplo cuando :
R R
n=100: S ; y cuando n=1.000: S
4 6
estas relaciones empricas son consecuencia de la propiedad ya estudiada para la
distribucin normal, segn la cual en el intervalo ( X 2 S) deben caer el 95,45%
de los datos, y en el intervalo ( X 3 S) deben caer el 99,73% .

3
Para una mayor informacin sobre estas grficas, vase la misma referencia citada en la nota 2.
Medidas de Dispersin 13
Angel Francisco Arvelo L.

Cuando n=100 , el rango debe ser aproximadamente 4 veces S que


corresponde a la longitud del intervalo, y cuando n= 1.000 , el rango debe ser
aproximadamente 6 veces S , que es la longitud del intervalo X 3S .

Ejemplo 7 Calcular el rango para los datos del ejemplo 7.4


Solucin : En este conjunto de datos el mayor valor es 46 y el menor 26 , en
consecuencia: R = 46 26 = 20.

VII. 5 Otras Medidas absolutas de dispersin: Adems de las ya


estudiadas, existen otras medidas de menor aplicacin prctica, tales como:

a)El Rango intercuartlico: Se define como la diferencia entre el tercer y primer


cuartil, y representa la amplitud del intervalo 50% central.
Rq = Q3 Q1

c)El Rango semi intercuartlico : Es la mitad del rango intercuartlico, y


representa el radio del intervalo 50% central .
Q 3 Q1
Q .
2
Con el rango semi-intercuartlico, el intervalo 50 % central puede ser escrito como:
Q1 Q 3 Q 3 Q1 Q1 Q 3
= Q
2 2 2
2
Para distribuciones acampanadas: Q S
3
c)El Rango Percentlico : Se define como la diferencia entre el Percentil 90 y el
Percentil 10, y representa la longitud del intervalo 80 % central .
Rp = P90 P10

Todas estas medidas de dispersin al igual que las anteriores son absolutas, pues
no toman en cuenta el orden de magnitud de los datos, y vienen en sus mismas
unidades, a excepcin de la varianza que viene en unidades al cuadrado.

6 El Coeficiente de Variacin o Dispersin Relativa: Las medidas


absolutas de dispersin, al no tomar en cuenta el orden de magnitud de los datos,
no proporcionan una informacin completa sobre su variabilidad, pues no es lo
mismo por ejemplo, una desviacin tpica de 100 en unos datos que sean del
orden de cientos, que esa misma desviacin tpica de 100 en unos datos que sean
Medidas de Dispersin 14
Angel Francisco Arvelo L.

del orden de millones. Resulta obvio que en el primer caso existe una variabilidad
mucho mayor que en el segundo, a pesar de que el valor absoluto de la desviacin
tpica sea el mismo.
Otro problema que tienen las medidas absolutas de dispersin es el de las
unidades, pues esto impide hacer comparaciones entre conjuntos de datos que
tengan diferente naturaleza.
As por ejemplo, si se quisiera saber cual variable tiene un comportamiento ms
homogneo, el peso o la estatura de un conjunto de personas, no es posible
comparar las desviaciones tpicas entre esas ellas, por venir expresadas en
diferentes unidades.
Para solucionar este par de inconvenientes que presentan las medidas absolutas
de dispersin, se utiliza al coeficiente de variacin o dispersin relativa, definido
S
por : C. V = 100%
X

Propiedades del Coeficiente de Variacin

1) Es un porcentaje de razn entre la desviacin tpica y la media , de manera


que representa cuantas veces es la desviacin tpica con relacin a la media.
As por ejemplo, un C.V = 50% significa que la desviacin tpica es la mitad de la
media, lo que revela una alta variabilidad.
Valores del C.V menores al 10 % revelan poca variabilidad de los datos ; y as
por ejemplo, para en el Control de Calidad de la preparacin de mezclas, es
frecuente exigir un C.V menor al 5% entre las muestras tomadas en distintos
puntos de la mezcla, a fin de garantizar su homogeneidad.

2) El C.V es un nmero abstracto, es decir sin unidades, pues tanto S como X


vienen en las mismas unidades de los datos, y al hacer la divisin se simplifican.
Esta propiedad permite utilizar al C.V para hacer comparaciones entre varios
conjuntos de datos, y concluir que cuanto ms pequeo sea su valor, ms
homogneo es el comportamiento.

3) El C.V no se altera cuando los datos son multiplicados por una constante, pues
en virtud de las propiedades de X y de S ambos quedan multiplicados por esa
constante, sin alterar al cociente.
Esta propiedad trae como consecuencia que el C.V sea invariante frente a
cambios de unidades, como por ejemplo, pasar de libras a kilogramos o de pies a
centmetros, etc.

Ejemplo 8 Calcular el C.V para los datos del ejemplo 3


8.330 14,66
Solucin : S = 14,66 , X = 33,32 C.V = 100% = 44 %
250 33,32

Ejemplo 9 : Al analizar la estatura y el peso de un conjunto de personas, se


obtuvo, para el peso una media de 68,50 Kgs. con una desviacin tpica de 9,20
Medidas de Dispersin 15
Angel Francisco Arvelo L.

kgs.; y para la estatura una media de 165 cms., con una desviacin tpica de 11,30
cms. Cul de las dos variables tiene un comportamiento ms homogneo?.
9,20
Solucin: Para el peso: C.V = 100% = 13,43 %
68,50
1130
,
Para la estatura : C.V = 100% = 6,85 %
165
Se concluye que la estatura tiene un comportamiento ms homogneo.
.
Una de las limitaciones que tiene el coeficiente de variacin, es que slo puede
ser utilizado cuando los datos corresponden a mediciones sobre una escala de
razn, y por lo tanto existe el cero absoluto.
Cuando existen datos positivos y negativos, la media puede resultar igual a cero ,
negativa o muy prxima a cero, en cuyo caso este coeficiente de variacin carece
de sentido como medida de dispersin.

EJERCICIOS RESUELTOS

Ejemplo 10 Al examinar el dimetro de 300 tornillos, en milmetros, se encuentra:


Dametro 2,00 a 2,49 2,50 a 2,99 3,00 a 3,49 3,50 a 3,99 4,00 a 4,49 4,50 a 4,99
Frecuencia 17 51 93 86 41 12
a) Calcule la varianza ,la desviacin tpica, el coeficiente de variacin, la media de
desviaciones absolutas, la media de desviaciones absolutas respecto de la
mediana, el rango intercuartlico y el rango percentlico.
b) Calcule el porcentaje de observaciones que caen en los intervalos X S,
X 2S y X 3 S.

Solucin : Para calcular la varianza, se organizan los clculos:


2
L*i =Marca de clase fi= Frecuencia L*i fi ( L*i ) fi
2,245 17 38,1650 85,6804
2,745 51 139,9950 384,2863
3,245 93 301,7850 979,2923
3,745 86 322,0700 1.206.1522
4,245 41 174,0450 738,8210
4,745 12 56,9400 270,1803
Sumatorias 300 1.033,0000 3.664,4125
2 3.664,4125FG 1033
. IJ
,00
2
S =
300 H 300 K = 0,3582 S= 0,3582 = 0,5985

Utilizando el mtodo abreviado de clculo:


Ui* = 2
Marca de clase artificial fi= Frecuencia U* fi ( Ui* ) fi
i
-2 17 -34 68
-1 51 -51 51
0 93 0 0
1 86 86 86
Medidas de Dispersin 16
Angel Francisco Arvelo L.

2 41 82 164
3 12 36 108
Sumatorias 300 119 477
477 FG 119 IJ 2
SU2
300
2 2
H 300 K = 1,4327
2
c= Amplitud Real = 0,50 S = c SU2 = (0,50) 0,1,4327 = 0,3582
1033
Para calcular el coeficiente de variacin, se necesita: X = = 3,4433
300
119
Por el mtodo abreviado: U = 0,3967
300
X = L*m + c U X = 3,245 + (0,50) 0,3967 = 3,4433

S 0,5985
y por lo tanto : C.V = 100% = 100% = 17,38 %.
X 3,4433

Para calcular la desviacin media:


L*i =Marca de clase fi= Frecuencia L*i X L*i X fi
2,245 17 1,1983 20,3711
2,745 51 0,6983 35,6133
3,245 93 0,1983 18,4419
3,745 86 0,3017 25,9462
4,245 41 0,8017 32,8697
4,745 12 1,3017 15,6204
Sumatorias 300 148,8626

148,8626
Por lo tanto D.M = = 0,4962
300
Si se quisiera obtener un clculo rpido pero aproximado, se pudiera aplicar la
propiedad para distribuciones acampanadas como esta, segn la cual:
4 4
D.M S= (0,5985) = 0,4788
5 5
Para las restantes medidas de dispersin se necesitan los cuartiles, y los
percentiles 10 y 90, a partir de las frecuencias acumuladas:
Dimetro < 2,495 < 2,995 < 3,495 < 3,995 4,495 4,995
Frecuencia 17 68 161 247 288 300

300
68
3
300 161 b g
Q1 = 2,995 + 4 0,50 = 3,0326 ; Q3 = 3,495 + 4 0,50 = 3,8671
93 86
1
2
300 68 b g
Q2 =Med= 2,995 + 0,50 =3,4359
93
Medidas de Dispersin 17
Angel Francisco Arvelo L.

10
100
b g
300 17
P10 =2,495 + 0,50 = 2,6225
51
90
b g
300 247
P90 =3,995 + 100 0,50 = 4,2755
41
Para calcular la desviacin media absoluta, respecto de la mediana, hay que
organizar los clculos en una tabla similar a la de la D.M , pero calculando los
desvos absolutos respecto de la mediana.
L*i =Marca de clase fi= Frecuencia L*i Med L*i Med fi
2,245 17 1,1909 20,2453
2,745 51 0,6909 35,2359
3,245 93 0,1909 17,7537
3,745 86 0,3091 26,5826
4,245 41 0,8091 33,1731
4,745 12 1,3091 15,7092
Sumatorias 300 148,6998
148,6998
D.M Med = = 0,4957
300
El rango intercuartlico: Rq = Q3 - Q1 = 3,8671 - 3,0326 = 0,8345
El rango percentlico: Rp = P90 - P10 = 4,2755 - 2,6225 = 1,6530
Estos rangos representan la amplitud de los intervalos 50% central, y 80% central
respectivamente.

Para calcular el porcentaje de valores que cae en los intervalos X S , X 2S


y X 3 S, hay que determinar la posicin percentil que le corresponde a cada
uno de los extremos de los intervalos, para luego restarlos.
Para X S se tiene : 3,4433 0,5985 = [2,8448 ; 4,0418]
100 FG 4,0418 3,995 IJ
El % por debajo de 3,9418 : p2=
300 H247
0,5 K
41 = 83,61%

100 F IJ
El % por debajo de 2,8448 : p =1 G17
300 H
2,8448 2,495
0,5 K
51 = 17,56%

Dentro de X S , caen entonces 83,61% - 17,56% = 66,05 % , que es


aproximadamente el porcentaje terico de 68,27 % dado por la normal.
Para los intervalos X 2S y X 3 S, se procede de manera anloga, y se
obtiene 95,45 % y 100 % respectivamente.

Ejemplo 11 Dada la siguiente tabla de frecuencias, para datos sin agrupar:


Valor 0 1 2 3 4 5 6 7
frecuencia 8 14 25 13 20 12 6 2
a) Calcule su varianza, la desviacin tpica, el coeficiente de variacin , el rango,
la media de las desviaciones absolutas, la media de las desviaciones absolutas
respecto de la mediana , el rango intercuartlico.
Medidas de Dispersin 18
Angel Francisco Arvelo L.

b) Determine el porcentaje de observaciones que caen en el intervalo X S .


Solucin : A diferencia del ejemplo anterior, en este caso los datos no estn
agrupados, y por lo tanto para calcular la varianza no se toma a la marca de clase,
sino al verdadero valor del dato.
2
Xi= Valor del dato fi= Frecuencia Xi fi (Xi) fi
0 8 0 0
1 14 14 14
2 25 50 100
3 13 39 117
4 20 80 320
5 12 60 300
6 6 36 216
7 2 14 98
Sumatorias 100 293 1165
2 1165 FG 293 IJ 2
293
S =
100 H 100 K = 3,07 S= 3,07 = 1,75 ; X =
100
= 2,93

175
,
C.V = 100% = 59,75 % ; R=70=7
2,93
Xi= Valor del dato fi= Frecuencia Xi X Xi X fi
0 8 2,93 23,44
1 14 1,93 27,02
2 25 0,93 23,25
3 13 0,07 0,91
4 20 1,07 21,40
5 12 2,07 24,84
6 6 3,07 18,42
7 2 4,07 8,14
Sumatorias 100 147,42
147,42
D.M =
= 1,4742
100
Para hallar la mediana, y dems cuartiles hay que proceder segn lo explicado en
el Ejemplo 6.13 donde se obtuvo Q1 = 2 , y siguiendo la misma metodologa
Q2 = Med = 3 , Q3 = 4
Xi= Valor del dato fi= Frecuencia X i Med X i Med fi
0 8 3 24
1 14 2 28
2 25 1 25
3 13 0 0
4 20 1 20
5 12 2 24
6 6 3 18
7 2 4 8
Sumatorias 100 147
Medidas de Dispersin 19
Angel Francisco Arvelo L.

147
D.M Med = = 1,47 ; Rq = Q3 Q1 = 4 - 2 = 2
100
En cuanto al porcentaje de datos comprendidos en el intervalo X S, tenemos que
ste es : 2,93 1,75 = [ 1,18 ; 4,68 ] , y en l caen todos los valores
comprendidos entre 2 y 4 ambos inclusive, que representan el 58 % de los datos.

Preguntas de Revisin
1) Si se tienen dos conjuntos de datos expresados en las mismas unidades,
puede decirse que el que tenga mayor varianza presenta una mayor dispersin?.

2) Si en un conjunto de datos todos los valores son negativos, puede alguna de


las medidas absolutas de dispersin ser negativa? .

3) Cul es la diferencia entre las medidas absolutas y las medidas relativas de


dispersin?. Cul de las dos mide mejor la variabilidad?.

4) Analice las modificaciones que sera necesario realizar, si se quisiera aplicar


el mtodo abreviado de clculo para la varianza, en una tabla de frecuencias con
intervalos de diferente amplitud.

5) En un conjunto de datos, el menor es 30 , el rango es 10 , y la media 35.


Puede el coeficiente de variacin ser igual a 40%? .

6) El valor ms bajo de un conjunto de datos es 75, y el ms alto 110. Puede ser


la desviacin tpica 39,50?.

7) Qu representa el rango percentlico? .

8) Suponga que un conjunto de datos es sometido a una transformacin no lineal,


2
como por ejemplo: Y = a + bX . Explique el procedimiento a seguir para calcular la
varianza de los datos transformados.

9) Si un conjunto de datos es sometido a una transformacin lineal: Y = a +bX.


Se altera el coeficiente de variacin? .

10) Por qu la desigualdad de Tchebychev no proporciona informacin alguna


cuando se quiere hallar el porcentaje de datos que difieren de la media en menos
de la desviacin tpica?.

11) Segn la desigualdad de Tchebychev cul es el porcentaje mnimo de datos


que difieren de la media en menos de 1,50 veces la desviacin tpica?.

12) Puede un coeficiente de variacin ser mayor al 100% ?.


Medidas de Dispersin 20
Angel Francisco Arvelo L.

13) Suponga que sobre un conjunto de datos { x1, x2 ,x3 , ......, xn} con media X , y
x X
desviacin tpica S, se define la transformacin: zi = i dando lugar a otro
S
conjunto de datos { z1, z2 ,z3 , ......, zn} llamados datos tipificados.
Cul es la media y la varianza de los datos tipificados?.

14) En un conjunto de datos en donde la mitad sea igual a un valor, y la otra


mitad sea igual a otro valor diferente, puede afirmarse que la media de las
desviaciones absolutas es igual a la desviacin tpica?.

15) Si { x1, x2 ,x3 , ......, xn} es una muestra que tiene media muestral X , y proviene
de una poblacin con media poblacional . Cual de las siguientes dos
i n i n
2
expresiones es menor: ( xi ) ( xi X) 2 ? . Justifique su respuesta.
i 1 i 1

16) Explique el porqu en el mtodo de abreviado de calculo para la varianza, se


toma como referencia cero al punto medio de la clase modal. Pudiera tomarse a
otra marca de clase sin modificar el mtodo? .

Temas complementarios para investigar


1) Investigue sobre las aplicaciones del Coeficiente de Variacin en el control de
la calidad para la preparacin de mezclas, como por ejemplo el concreto.

2) Investigue sobre el uso y significado de otras medidas relativas de dispersin,


como por ejemplo el coeficiente de variacin cuartil.

3) Investigue sobre las aplicaciones del rango muestral en el Control Estadstico


de Procesos.

Problemas Propuestos

I. Nivel Elemental

7.12) Una empresa tiene dos agencias , una en Caracas y otra en el interior .
El sueldo de los empleados de esa empresa en cada una de esas dos agencias es
como sigue:
Caracas : Media = Bs. 150.000 Desviacin Tpica = Bs. 25.000
Interior : Media = Bs. 120.000 Desviacin Tpica = Bs. 16.000
En cual de las dos agencias, los sueldos son ms homogneos? .
Solucin : En la del interior.

7.13) Se tiene un conjunto de seis datos, cuyos valores son : 3 , 8 , 2 , 3 , 5 y 4.


a) Calcule su rango, varianza y coeficiente de variacin.
b) Calcule la media de las desviaciones absolutas.
Medidas de Dispersin 21
Angel Francisco Arvelo L.

c) Calcule la media de las desviaciones absolutas respecto de la mediana.


Solucin : a) 6 , 3,81 , 46,82% b) 1,56 c) 1,50

7.14) La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de


estudiantes:
Estatura 60 a 62 63 a 65 66 a 68 69 a 71 72 a 74
Frecuencia 5 18 42 27 8
Determine el rango, la media de las desviaciones absolutas, el porcentaje de
estudiantes dentro del intervalo X 2 D.M, el rango intercuartil , el rango percentil ,
la desviacin tpica , y el coeficiente de variacin .
Solucin: 15 , 2,26 , 85,67 % , 3,97 , 7,94 , 2,92 y 4,33 % .

7.15) La longitud de unas piezas en milmetros se da en la siguiente tabla:

Longitud 250,00 250,99 260.00-269,99 270,00-279,99 280,00-289,99 290,00-299.99 300,00-309,99 310,00-319,99


Frecuencia 8 10 16 14 10 5 2
Use el mtodo abreviado de clculo, para hallar el coeficiente de variacin.
Solucin : 5,58 % .

7.16)Calcule el coeficiente de variacin para la siguiente tabla de frecuencias


relativas acumuladas:
Lmites
Reales < 49.5 < 99.5 < 149.5 < 199.5 < 249.5 < 299.5 < 349.5 < 399.5
Hi % 0% 12% 38% 45% 63% 80% 96% 100%
Solucin: 43,40 %

7.17) Calcule el porcentaje de datos que en la distribucin anterior caen en el


intervalo X 1,50 S . Solucin: 87,29%

7.18) Durante un periodo de 150 horas, se observ el nmero de clientes por hora
que acuden a un comercio, encontrando:
Clientes 0 1 2 3 4 5 6 7 8
frecuencia 5 19 29 30 22 16 14 9 6
a) Determine la desviacin tpica y la media de las desviaciones absolutas.
b) El porcentaje de veces en que la observacin cae en el intervalo X 2S .
Solucn: a) 2,02 y 1,68. b) 96 % .

7.19) La media de unos datos es 10, y su coeficiente de variacin es del 20% .


Calcule el nuevo coeficiente de variacin en cada uno de los siguientes casos:
a) A cada uno de los datos se le suma 2.
b) Cada uno de los datos se incrementa en un 35%.
Solucin : a) 16,67 % . b) 20% .

II. Nivel Intermedio

7.20) El coeficiente de variacin de 21 datos es 9,95227 % , y la suma de sus


cuadrados 13255.
Medidas de Dispersin 22
Angel Francisco Arvelo L.

Si los datos se incrementan en 6 unidades, cul es el nuevo coeficiente de


variacin?. Solucin: 8,03% .

7.21) Si cada uno de los datos de un conjunto se multiplica por 3, la media


aritmtica es 108 ; y si a cada dato se le suma 10, la media cuadrtica es 48.
Cual es el coeficiente de variacin de los datos?. Solucin : 38,09 %

7.22) Sean los datos : 3 , 6 , 6 , x , y . Si el coeficiente de variacin es 29,0144 % , y


2
la varianza es S = 2,64 . Determine los datos que faltan x , y . Solucin : 5 y 8

7.23) El sueldo promedio del personal de una empresa es de $1.200 con una
desviacin tpica de $250.
El personal va a ser beneficiado con un bono fijo y un aumento porcentual , y segn
el orden en que se apliquen estos beneficios, el futuro sueldo promedio puede ser
de $ 1.810 si aplica primero el incremento porcentual y luego el bono, o de $ 1.885
si se aplica primero el bono y luego el incremento porcentual.
a) Determine el monto del bono fijo y del aumento porcentual.
b) Analice cual de estas modalidades proporciona una mayor homogeneidad en los
sueldos del personal.
Solucin : $ 250 de bono con 30% de incremento porcentual , o $ 360 de bono con
20,8333 % de incremento porcentual .

7.24) La media de un conjunto de datos es 8 , y la media cuadrtica 10.


Cual ser el nuevo coeficiente de variacin, si cada dato es incrementado en:
a) 2 unidades?. b) 20% ?.
Solucin: a) 60% b) El mismo anterior al incremento = 75%.

7.25) Si cada uno de los datos de un conjunto es incrementado en 2 unidades, el


nuevo coeficiente de variacin es del 10%, y la nueva varianza 4 .
Cual era la media de los datos originales ? . Solucin: 18

7.26) Los salarios en una empresa tienen una desviacin tpica de 1.200.
Si todos los salarios son incrementados en 2.000, el coeficiente de variacin
disminuye en 2%. Calcule el salario medio despus del aumento. Solucin: 12.000

7.27) En el almacn de una empresa existen diversas cajas, que pueden ser
clasificadas as: pequeas cuyo peso es menos de 150 kilos, regulares con un peso
desde 150 hasta 250 kilos, grandes con un peso desde 250 kilos hasta 500 kilos, y
extra grandes desde 500 kilos en adelante.
Si el peso medio de las cajas es de 200 kilos, con una desviacin tpica de 20 kilos.
Cul es el porcentaje mnimo de las cajas de tamao regular dentro del almacn? .
Solucin : 84 % por lo menos.
Medidas de Dispersin 23
Angel Francisco Arvelo L.

III. Nivel Avanzado


i n
xi2
7.28) Para n datos cualesquiera { x1, x2 ,x3 , ......, xn} , demuestre que: X i 1
n

Utilice el resultado anterior para demostrar: D.M . S . Cundo son iguales?.

7.29) La media de un conjunto de datos es 1,50 , la desviacin tpica es 3,50 , y la


mitad de ellos son iguales a un valor a , mientras que la otra mitad son iguales a
otro valor b. ( a < b) .
a) Determine a y b.
b) Si se aaden cinco nuevos datos que resultan ser iguales a b, y se obtiene que
la nueva media es 2,20. Cuntos datos haba inicialmente?.
Solucin : a) a = -2 , b= 5 b) 20
2
7.30) Se tiene n datos con media X y varianza S .
Suponga que se obtiene un nuevo dato xn 1 que se incorpora al conjunto anterior
dando lugar a un conjunto de (n+1) datos.
Demuestre que la varianza Sn2 1 del nuevo conjunto de datos, viene dada por :
n n
Sn2 1 S2 + 2
( X - xn+1 ) 2
n 1 (n + 1)

7.31) Generalice el resultado anterior , para dos conjuntos de datos disjuntos, de


tamaos n1 y n2 , con medias X1 y X 2 , y varianzas S12 y S22 respectivamente.
Deduzca una frmula que permita calcular la varianza de su unin.
n S2 + n2 S22 n1n2 ( X1 X 2 )2
Solucin : S2 = 1 1
n1+n2 (n1 n2 )2

7.32) Suponga que se tienen dos conjuntos de datos disjuntos , con igual media X ,
pero de diferentes tamaos n1 y n2 , y con diferentes coeficientes de variacin CV1
y CV2 respectivamente .
Al unir estos dos conjuntos, qu tipo de media entre sus coeficientes de variacin
debe utilizarse, para obtener el coeficiente de variacin de la unin?.
n1 C. V12 n 2 C. V22
Solucin: C.V = = Media cuadrtica ponderada entre sus
n1 n 2
coeficientes de variacin.

7.33) Se tienen dos conjuntos de datos, en donde:


Medidas de Dispersin 24
Angel Francisco Arvelo L.

i n1
1 Conjunto: n1= 75 ; X 12i = 67688,75 ; C.V1 = 5%
i 1
i n2
2 Conjunto: n2 = 80 ; X 22i = 46540,80 ; C.V2 = 10%
i 1
Calcule el coeficiente de variacin de su unin.
Solucin: 13,43%

7.34) El sueldo promedio del personal de una industria es de 40.000.


2 1
Se sabe que del personal de esa industria, son obreros y son empleados, y
3 3
que adems, el sueldo promedio de los empleados es el doble del de los obreros .
La desviacin tpica en el sueldo de los obreros es de 5.000 ; mientras que en el
sueldo de los empleados es de 15.000 .
a) Cual es el sueldo promedio de los empleados y cual el de los obreros?.
b) Si se aumentan los sueldos en 20% para los empleados, y en 50% para los
obreros.
Encuentre el nuevo coeficiente de variacin en los sueldos, para todo el personal
Solucin : a) 60.000 y 30.000 b) 32,47% .

7.35) En una plantel se administr un examen sobre 100 puntos, y los alumnos
concurrieron en dos turnos: maana y tarde.
Para el turno de la maana se obtuvo una media de 52,00 puntos ,y para el turno
de la tarde donde presentaron 330 alumnos, se obtuvo una media de 46,00 puntos.
La media de todo el grupo result ser de 48,04 puntos.
Tanto para el turno de la maana como para el de la tarde, se obtuvo la misma
desviacin tpica; pero la desviacin tpica de todo el grupo result ser 30% mayor
que la de la maana (o de la tarde) .
En base a esta informacin, obtenga el coeficiente de variacin para cada uno de
los turnos, y el de todo el grupo.
Solucin: Maana : 6,58 % . Tarde: 7,43 % . General : 9,25 % .

7.36) Determine la varianza de n datos que sean iguales a los primeros n


n2 1
nmeros naturales: 1, 2, 3 , .. , n. Solucin : .
12
7.37) Aproveche el resultado del ejercicio anterior para encontrar la varianza de n
datos que se encuentren en progresin aritmtica: a , a + r , a + 2r , ., a+ (n -1) r .
r 2 (n 2 1)
Solucin :
12

También podría gustarte