Está en la página 1de 28

Elementos de

Estadística para Preparación y


Evaluación de Proyectos

mario murillo oporto

La Paz - Bolivia - 1990

PRÓLOGO

¿Es posible prescindir del concurso de la Estadística en la tarea de Preparación


y Evaluación de Proyectos?...., indudablemente que no.

1
Es innegable que una de las herramientas principales para la elaboración de todo
trabajo de investigación, donde los factores que intervienen sufren cambios
constantes que implican incertidumbre y que frente a ellos hay necesidad de
hacer predicciones para tomar la acción adecuada en una política de decisiones,
es la Estadística.

El presente trabajo fue realizado tomando como base las notas de las clases que
me correspondió dictar en la Universidad Mayor de San Andrés, Universidad
Católica Boliviana y en el primer Curso de Preparación y Evaluación de
Proyectos (Programa BID-ISAP-CONEPLAN-OEA - Ciudad de La Paz, 1973).
Se han incluido los temas que se consideraron más importantes, tratando de
dejar claras las ideas centrales y sus aplicaciones, sin entrar a muchas
demostraciones matemáticas, de acuerdo al objetivo perseguido. Se recomienda
a los estudiantes ampliar la lectura de cada Capítulo, al menos con uno de los
textos mencionados en la bibliografía.

Deseo resaltar la persona de Don Hugo Javier Ochoa G., Director del Curso de
Preparación y Evaluación de Proyectos, citado anteriormente, de quién surgió la
idea de realizar el presente documento. Para él, mis mejores palabras de elogio
y agradecimiento por su colaboración desinteresada, tolerancia y estímulo
constante de que fui objeto durante el tiempo que duró mi labor.
La Paz - Bolivia 1974

PRÓLOGO
A LA TERCERA EDICIÓN

Al presentar esta nueva edición, deseo expresar especialmente mi más profundo


sentir de agradecimiento a todos cuantos me honraron con la lectura de las dos
impresiones anteriores.

La aceptación que tuvo el texto y el actual interés manifestado por contar con él,
sobre todo por estudiantes de carrera y muchos egresados, han constituido
2
motivos suficientes para haber emprendido la tarea de hacer las correcciones
que eran necesarias y de añadir las soluciones de ejercicios seleccionados.

Abrigo, nuevamente, la esperanza de que esta obra en el nivel dado, pueda


servir de un elemento más de apoyo para quienes están incursionando en el
conocimiento de la Estadística y sus aplicaciones; entre ellos, a estudiantes de
la Universidad Boliviana y de otras Instituciones donde se enseña esta ciencia.
Mario Murillo Oporto

La Paz - Bolivia
Agosto, 1990

3
CAPITULO 4
ESTADIGRAFOS DE DISPERSIÓN
En el presente capítulo estudiaremos una característica importante de las
distribuciones de frecuencias que es el grado de variación o de variabilidad, que
algunas veces se llama dispersión de los valores observados. Una medida de
dispersión es importante desde dos puntos de vista: en primer término, puede
ser usada para mostrar el grado de variación entre los valores de los datos
observados. Por ejemplo, una pequeña dispersión de los salarios mensuales de
un grupo de trabajadores en una fábrica, indicará que a los trabajadores se les
paga salarios aproximadamente iguales; por otro lado, una dispersión alta, dará
la idea de que los salarios son muy diferentes. En segundo lugar, puede ser
usada para complemento de un promedio, para describir un conjunto de datos o
para comparar una serie de información con otra. Cuando la dispersión es baja,
el valor del promedio se vuelve altamente significativo, o sea que la media es un
valor realmente representativo; en cambio, si la dispersión es alta, la media se
vuelve poco o nada representativa.
Por ejemplo, si se tuvieran los números 10, 20, 30, 40 y 900, la media de ellos
es 200; mientras que la media de los números 180, 200, 240, 200 y 180, también
es 200. En el primer caso, el valor de la media no está próximo a ningún número
del grupo, por tanto, se espera una alta dispersión; en cambio en el segundo
caso, la media está próxima a cada número del grupo, por lo que se espera una
menor dispersión. El hecho de que la medida de dispersión del primer grupo de
datos es más alta que el de la segunda, da una mejor comprensión en la
comparación de las medidas de dispersión de los dos conjuntos de datos.
Cuando se habla de dispersión, es natural que se trate de medir las diferencias
o comparaciones respecto de algún valor, tal que nos indique en promedio las
variaciones que existen entre los valores observados comparados con ese valor.
Generalmente para medir las variaciones se toma como referencia un punto
central de los valores observados, tal como la media. Una de las medidas de
dispersión más importantes es la desviación estándar, que es una medida que
considera qué tan lejos de la media están localizados cada uno de los valores de
la serie estadística en observación. De esta manera, parece lógico pensar que
mientras menor sea la desviación estándar de una distribución de frecuencias,
más significativo será generalmente un promedio como medida de la tendencia

4
central para dicha distribución. El uso de esta medida es grande debido a que
nos permite tomar en cuenta los elementos de variación para extraer
conclusiones sólidas y tomar decisiones apropiadas de la información disponible.
En los capítulos subsiguientes, se verán muchas aplicaciones de esta medida.
Veremos a continuación con cierto detalle, cada una de las distintas medidas de
dispersión y sus propiedades.
4.1
Recorrido

La medida más simple de la dispersión de un conjunto de observaciones es el


recorrido (o rango) de la variable, que es la diferencia entre el mayor y menor
valores observados.

DEFINICIÓN 4.l Si se simboliza con RX al recorrido de la variable X, con xmáx al


valor máximo observado y con xmín al menor valor observado, entonces el
recorrido es:
RX = xmáx – xmín (4.1)
Ejemplo 4.l De los valores dados en la Tabla 2.5 se observan que, xmáx = 430 y
xmín = 280; luego el recorrido es: R = 430 - 280 = 150
Esta medida no está afectada por los valores comprendidos entre el valor más
alto y más bajo, por tanto, el recorrido no es un indicador muy relevante de
dispersión.
El recorrido es la medida más simple que sirve como complemento de la me día,
por ejemplo: la producción media de un grupo de trabajadores en una fábrica A,
puede ser 50 unidades diarias con un recorrido de 20 a 65 unidades; y la
producción media en una fábrica B, puede ser también 50 unidades, pero con
recorrido de 35 a 60 unidades. Considerando los dos diferentes recorridos
podemos concluir que la media es más representativa de las unidades
producidas por los trabajadores de la fábrica B comparado con la producción
media de la fábrica A.

La Desviación Cuartilica

5
Definición.- La Desviación Cuartillita denotada por DQ se define como el
𝑄3 −𝑄1
4 4
cociente del Recorrido Intercuartílico entre dos (2); o sea, DQ = .
2

La desviación cuartillita tiene las siguientes características:

1) Mide la dispersión solo del 50% de las observaciones, cuyos valores se


encuentran entre la primera y la tercera cuartilas.
2) No mide la dispersión respecto a ningún valor en particular.
3) Este estadígrafo de dispersión suele utilizarse en situaciones similares en
las cuales se utiliza la Mediana en sustitución de la Media Aritmética. Por
ejemplo, cuando la distribución de frecuencias está muy afectada por
valores extremos muy grandes o muy pequeños; es decir, la distribución
de frecuencias es muy asimétrica a la derecha o la izquierda.

4.2
Desviación Media
Una primera medida basada en todos los elementos observados y diseñada
para medir la dispersión alrededor de un promedio, es la llamada desviación
media o desviación promedio. La medida de referencia puede ser la media o la
mediana. Por ser de mayor aplicación, veremos la desviación media (DM)
respecto de la media.

DEFINICIÓN 4.2 La desviación media es simplemente la media aritmética de los


desvíos en valor absoluto de los valores individuales con respecto al promedio
de ellos mismos.
Como teóricamente la suma de los desvíos respecto de la media es nula
(Sección 3.3 del capítulo 3), es decir ∑𝑛1 𝑑𝑖 = ∑𝑛1(𝑋𝑖 − 𝑋̅) = 0, para el cálculo de la
desviación media, se usan los valores absolutos de los desvíos; de esta manera,
si se tiene un conjunto de valores sin ordenar, la DM es:
n

x x
DM  M  d  
i
i 1
(4.2)
n
y para distribución de frecuencias,
∑𝑚 ̅ |𝑛𝑖
1 |𝑋𝑖 −𝑋
DM = M(|𝑑 |) = = ∑𝑚 ̅
1 |𝑋𝑖 − 𝑋 |ℎ𝑖 (4.3)
𝑛

6
En ambos casos, se supone que se está trabajando con observaciones. Como
puede apreciarse por (4.2), el cálculo de la DM es muy simple. Primero se calcula
la media aritmética de los valores observados; luego los desvíos de las
observaciones respecto de la media y, finalmente se determina la media
aritmética de los valores absolutos de los desvíos. Ilustraremos este proceso con
los siguientes ejemplos:

Ejemplo 4.2 Sea la información del ejemplo 3.1 del capítulo anterior (Ver Tabla
4.1). De manera que la desviación media es

DM 
d 
11
 1,1
n 10
Desde el punto de vista práctico, puede obviarse la segunda columna. 3,6 y 5,8

TABLA 4.1 Cálculo de la desviación


media, para datos originales
𝑋𝑖 𝑑𝑖 = 𝑋𝑖 – 4,7 |𝑑𝑖 | = |𝑋𝑖 − 𝑋̅ |
3 - 1,7 1,7
4 - 0,7 0,7
5 0,3 0,3
4 - 0,7 0,7
6 1,3 1,3
5 0,3 0,3
4 - 0,7 0,7
…6 1,3 1,3
7 2,3 2,3
3 - 1,7 1,7
∑ 0 11

Ejemplo 4.3 Sea ahora la información del Ejemplo 3.2 y la Tabla 3.2

TABLA 4.2 Cálculo de la. desviación

7
media para datos agrupados
xi ni |di| |di| ni
3 2 1,7 3,4
4 3 0,7 2,1
5 2 0,3 0,6
6 2 1,3 2,6
7 1 2,3 2,3
∑ 10 11,0

Luego, la desviación media resulta: DM 


d i ni

11
 1,1
n 10
Como se ha visto, la DM considera a todos los valores observados para su
cálculo, por lo tanto, da una mejor descripción de la dispersión. De manera que
nos mide la dispersión alrededor del valor medio. Sin embargo, esta medida es
un poco débil puesto que se ignora el signo positivo o negativo de las
desviaciones.
Una medida más fina o más adecuada de la dispersión, es la que recibe el
nombre de desviación estándar.
4.3
La Varianza y Desviación Estándar

La medida del grado de variación de una distribución de frecuencias más


comúnmente usada en el análisis estadístico, es la desviación estándar1. Es la
más importante entre todas las medidas de dispersión, de ahí que, le
prestaremos la mayor atención posible, puesto que de ello dependerá nuestro
éxito cuando se realicen aplicaciones y se puedan tomar conclusiones sólidas
de decisión. Una medida que en cierto modo es previa a la desviación estándar,
es la “varianza”, que es una medida de dispersión de excepcional importancia.
La ventaja de estas dos medidas, a diferencia de la DM, es que consideran a los
desvíos con sus respectivos signos.

1
Algunos autores denominan también desviación típica o tipificada.

8
Cuando se toman a todos los elementos de una población finita en estudio, se
∑𝑁
1 (𝑋𝑖 −µ)
2 ∑𝑁
1 (𝑋𝑖 −µ)
2
usa el símbolo 𝛔2 = y 𝛔=√ , respectivamente, para indicar a la
𝑁 𝑁

varianza poblacional y desviación estándar poblacional. En cambio, si los valores


provienen de una muestra de n observaciones, se usará 𝑆 2 y S, para indicar a la
varianza muestral y desviación estándar muestral, respectivamente. En general,
usaremos el operador V(x) para indicar la varianza de una variable X que indica
una característica cualquiera de la población en estudio.

DEFINICIÓN 4.3 La varianza de n observaciones (datos originales) de una


variable X correspondiente a una muestra de tamaño n, está definida como
sigue:
∑𝑛 ̅ )2
1 (𝑋𝑖 −𝑋
𝑆 2 = 𝑆𝑋2 = V(X) = M(d2) = = M{[𝑋𝑖 − 𝑀(𝑋)]2 } (4.4)
𝑛

y la desviación estándar, se define como la raíz cuadrada de la varianza con el


signo positivo, o sea:
s = √𝑠 2 (4.5)
Las expresiones (4.4) y (4.5), se utilizan para calcular la varianza y desviación
estándar de datos sin agrupar, es decir cuando se tiene el conjunto de
observaciones originales. En el caso de tener una distribución de frecuencias, es
decir datos agrupados, entonces la varianza y la desviación estándar se calculan
según las fórmulas
∑𝑚 ̅ )2 𝑛𝑖
1 (𝑋𝑖 −𝑋
𝑆 2 = V(X) = (4.6)
𝑛
y

 x  x  ni
2

s
i

n
Los dos ejemplos siguientes nos muestran el procedimiento general de cálculo.
Ejemplo 4.4 Tomemos la información del ejemplo 4.2
16,1
De manera que V ( X )  M (d )   1,61 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 2
2

10
y la desviación estándar será
s  1,61  1,2689 %

TABLA 4.3 Calculo de la varianza para

9
datos sin agrupar
xi d i  xi  x d i2  xi  x 
2

3 - 1,7 2,89
4 - 0,7 0,49
5 0,3 0,09
4 - 0,7 0,49
6 1,3 1,69
5 0,3 0,09
4 - 0,7 0,49
6 1,3 1,69
7 2,3 5,29
3 - 1,7 2,89

 0 16,10

Ejemplo 4.5 Sea el ejemplo 4.3

TABLA 4.4 Cálculo de la varianza para datos agrupados


𝑋𝑖 ni 𝑑𝑖 = (𝑋𝑖 − 4,7) 𝑑𝑖 2 =(𝑋𝑖 − 4,7)2 (𝑋𝑖 − 4,7)2 𝑛𝑖

3 2 -1,7 2,89 5,78


4 3 -0,7 0,49 1,47
5 2 0,3 0,09 0,18
6 2 1,3 1,69 3,38
7 1 2,3 5,29 5,29
 10 - - 16,10

 x  x  ni
2
16,1
 
i
Luego, V ( x) 1,61
n 10
y s  V ( x)  1,61  1,2689 (4,7-1,3 = 3,4); (4,7+1,3 = 6)

(5 - 1 = 4); (5 + 1 = 6)
A continuación, veremos las propiedades más importantes de la varianza, que
obviamente implican las propiedades de la desviación estándar.
PROPIEDADES

10
En lo que sigue, supondremos que se tienen n valores observados x 1, x2, … ,xn
de una característica particular X de una muestra de tamaño n.
TEOREMA 4.1 V(x) ≥ 0; la varianza es una cantidad no negativa (4.7)
Demostración: Por definición, V(X) = M(d2), y como di2  xi  x   0 cualquiera
2

que sea el valor de di, entonces M(d2) ≥ 0


TEOREMA 4.2 Si todos los valores de Xi = k para i = 1, 2, 3, . . . , n son iguales
a una constante K, entonces:
V(K) = O (4.8)
 
Demostración: Por definición, V ( K )  M K  M ( K )2 , pero como
M(K) = K (por 3.9), entonces
M(K - K)2 = M(0) = 0
Por lo que, la desviación estándar es también igual a cero, o sea 𝑆𝑘 = 0.

TEOREMA 4.3 Si K es una constante cualquiera, entonces


V(X+K) = V(X) (4.9)
Demostración: V ( X  K ) M   X  K   M X  K    2

 M  X  K  M ( X )  M (K )  
2

 M   X  M ( X )   V ( X )
2

Por lo que, la desviación estándar resulta: 𝑆𝑋+𝑘 = 𝑆𝑋

TEOREMA 4.4 Si K es una constante cualquiera, entonces


2
𝑆𝑘𝑋 = V(KX) = K2 V(X) = 𝐾 2 𝑆𝑋2 (4.10)
Demostración: Por definición
  
V ( KX )  M KX  M KX   M KX  KM ( X ) 
2
 2

 M K ( X  M  X    M K ( X  M ( X )  
2 2 2

 K M  X  M  X    K V ( X )
2 2 2

2
La anterior igualdad se puede escribir como sigue: 𝑆𝑘𝑋 = k2∗ 𝑆𝑋2 ; aplicando la raíz
cuadrada a ambos lados de la igualdad se tiene: SKX = k*SX ; Por lo que, la
desviación estándar de k por X es igual al producto de k por la desviación
estándar de X.
TEOREMA 4.5 V ( X )  M ( X 2 )  ( M ( X ))2 (4.11)

11
∑(𝑥𝑖 − 𝑥̅ )2 ∑(𝑥𝑖2 −2𝑥̅ 𝑥𝑖 +𝑥̅ 2 )
Demostración: V(X) = =
𝑛 𝑛


x 2
i  2 x  xi  n( x ) 2
n

 
2 2
x x
i
 2 xx  ( x ) 2 i
 ( x )2
n n
 M ( x 2 )  ( M ( X ))2
Esta última propiedad, que es una forma equivalente de escribir la varianza, es
muy útil para trabajos de computación. La gran ventaja, radica en que no es
necesario el cálculo de los desvíos. Entonces, para fines de cálculo
recomendamos usar las siguientes fórmulas:
Para datos sin agrupar
2
n
 n 
 xi2   xi 
V (X )  i 1
  i 1  (4.12)
n  n 
 
 
y para datos tabulados.
∑𝑚 2 ∑𝑚 2
1 𝑥𝑖 𝑛𝑖 1 𝑥𝑖 𝑛𝑖
V(X) = -( ) (4.13)
𝑛 𝑛
∑ 𝑥𝑖2
Luego la desviación estándar para datos originales es: 𝑆𝑋 = √ − 𝑥̅ 2 ; y para
𝑛

∑ 𝑥𝑖2 𝑛𝑖 ∑ 𝑥𝑖 𝑛𝑖 2
datos tabulados es la siguiente: 𝑆𝑋 = √ −( )
𝑛 𝑛
Ejemplo 4.6.- La siguiente Tabla nos muestra ejemplos prácticos para éstas
últimas tres propiedades.
TABLA 4.5 Cálculos para la propiedad (4.11) aplicados a los teoremas 4.3 y 4.4.
Datos Originales Cada valor de X es Cada valor de X es
incrementado en 5 multiplicado por 3
Valor de X X2 X+5 (X+5)2 3X (3X)2
1 1 6 36 3 9
2 4 7 49 6 36
4 16 9 81 12 144
5 25 10 100 15 225
12 46 32 266 36 414
12 32 36
M (X )  3 M(X+5) = =8 M (3 X )  9
4 4 4

12
46 266 414
M (X 2 )   11,5 M ( X  5) 2   66,5 M (3 X ) 2   103,5
4 4 4
V ( X )  11,5  9  2,5 V ( X  5)  66,5  64  2,5 V(3X) = 103,5 - 81 =
22,5
𝑆𝑋 = √2,5 = 1,58 𝑆𝑋+5 = 1,58 𝑆3𝑋 = √22,5 = 4,74

Los resultados anteriores pueden obtenerse de forma más rápida utilizando las
propiedades de la media aritmética, la varianza y de la desviación estándar; es
decir, sin elaborar la tabla: a) Para el caso de la suma, la media M(X+5) = 𝑋̅ + 5
= 3 + 5 = 8, la varianza V(X+ 5) = V(X) = 2,5, la desviación estándar 𝑆𝑋+5 = 1,58.
b) Para el caso del producto: la media M(3X) = 3𝑋̅ = 3*3 = 9, la varianza V(3X) =
32 V(X) = 9*2,5 = 22,5, la desviación estándar 𝑆3𝑋 = 3𝑆𝑋 = 3*1,58 = 4,74.
Nota: En el caso de tener datos resumidos en una tabla de distribución de
frecuencias, los cálculos son idénticos, teniendo únicamente el cuidado de
multiplicar los valores de la variable por sus frecuencias (ni)
ESTADISTICA DESCRIPTIVA 12-10-2023
Ejemplo 4.7.- Los salarios percibidos por un grupo de 25 empleados en dos
empresas privadas se presentan en la siguiente Tabla;

TABLA 4.8 Comparación de salarios de los empleados de dos empresas


privadas

Salarios EMPRESA A EMPRESA B


(En cientos de $) 𝑿𝑨𝒊 𝒏𝑨𝒊 𝑿𝑨𝒊 𝒏𝑨𝒊 𝑿𝟐𝑨𝒊 𝒏𝑨𝒊 𝒏𝑩𝒊 𝑿𝑩𝒊 𝒏𝑩𝒊 𝑿𝟐𝑩𝒊 𝒏𝑩𝒊
5 - 10 7,5 1 7,50 56,25 5 37,50 281,25
10 - 15 12,5 3 37,50 468,75 1 12,50 156,25
15 - 20 17,5 8 140,00
2.450,00 3 52,50 918,75
20 - 25 22,5 5 112,50
2.531,25 7 157,50
3.543,75
25 - 30 27,5 6 165,00
4.537,50 5 137,50
3.781,25
30 - 35 32,5 2 65,002.112,50 4 130,00
4.225,00
Totales 25 527,50 12.156,25 25 527,50 12.906,25

13
527,50
xA  21,1
25
527,50
xB   21,1
25
12.156,25
S A2   (21,1) 2  486,25  445,21  41,04
25
S A  41,04  6,4063  640,63 $
12.906,25
S B2   445,21  516,25  445,21  71,04
25
S B  71,04  8,4285  842,85 $

La media aritmética menos una vez la desviación estándar y más una vez la
desviación estándar genera un intervalo que tiene el límite inferior y el superior
respectivamente; o sea:
EMPRESA A:
2.110 – 640,63 = $ 1.469,37
2.110 + 640,63 = $ 2.750.63
EMPRESA B:
2.110 - 842,85 = $ 1.267,15
2.110 + 842,85 = $ 2.952,85
Como puede apreciarse, si bien el ingreso medio de los empleados en ambas
empresas es igual, vemos que hay mayor dispersión en los salarios que perciben
en la empresa B.
La variación media de los salarios de la Empresa A es de $ 1.469,37 hasta $
2.750.63
En cambio, de la Empresa B varía en promedio desde $1.267,15 hasta $
2.952,85$
Es importante notar que la desviación estándar, como una medida descriptiva,
es esencialmente una media de dispersión; y como se trata de una media de
desviaciones, por lo que, una desviación estándar pequeña indica un alto grado
de uniformidad en los valores de las observaciones de la serie estadística; y si la
desviación estándar es un valor grande, nos indica poca uniformidad en los datos
observados. De esta manera, si se comparan dos o más series de valores, que
tienen aproximadamente la misma media, la media más representativa será
aquella que tenga menor desviación estándar.
Ejemplo 4.8

14
a) Los salarios de las empresas del ejemplo 4.7 se incrementan a cada uno de
los trabajadores 500 $ (Bs. 500.-), las nuevas medias, varianzas y desviaciones
estándar, utilizando sus propiedades son:
Para la empresa A se tiene: 𝑀𝐴 (X + 5) = 𝑋̅ + 5 = 21,1 + 5 = 26,1 cientos de Bs.;
𝑉𝐴 (X + 5) = 𝑉𝐴 (X) = 41,04 (cientos de Bs.)2; 𝑆𝐴 = 6,406 cientos de Bs.
Para la empresa B se tiene: 𝑀𝐵 (X + 5) = 𝑋̅ + 5 = 21,1 + 5 = 26,1 cientos de Bs.;
𝑉𝐵 (X + 5) = 𝑉𝐵 (X) = 71,04 (cientos de Bs.)2; 𝑆𝐵 = 8,428 cientos de Bs.

b) Los salarios de las empresas del ejemplo 4.7 se incrementan a cada uno de
los trabajadores en 10%, las nuevas medias, varianzas y desviaciones estándar
son:
Y = X + 0,1X = 1,1X
Para la empresa A se tiene: 𝑀𝐴 (kX) = k𝑋̅ = 1,1*21,1 = 23,21 cientos de Bs.; 𝑉𝐴 (kX)
= 𝑘 2 𝑉𝐴 (X) = (1,1)2 41,04 = 49,658 (cientos de Bs.)2; 𝑆𝑘𝑋 = (1,1)6,406 = 7,047
cientos de Bs.

Para la empresa B se tiene: 𝑀𝐵 (kX) = k𝑋̅ = 1,1*21,1 = 23,21 cientos de Bs.;


𝑉𝐵 (kX) = 𝑘 2 𝑉𝐵 (X) = (1,1)2 71,04 = 85,958 (cientos de Bs.)2; 𝑆𝑘𝐵 = (1,1)8,428 =
9,271 cientos de Bs.
4.4
Dispersión Relativa

Las medidas de variabilidad absolutas, como las que acabamos de ver, no


siempre son posibles de utilizar, por ejemplo, para comparar la dispersión de dos
conjuntos de valores, sobre todo si estos tienen distintas unidades de medida.
Por esto, en muchos problemas, una medida de variabilidad relativa para
distribuciones de frecuencias suele ser más significativa que la variabilidad
absoluta.
Si dos conjuntos de valores se están comparando, los valores absolutos son
convenientes solamente cuando las medias de los dos conjuntos son
aproximadamente iguales y las unidades de medida son idénticas.
Efectivamente, la comparación de dos diferentes unidades de medida, tales
como número de libros comparados con el número de horas de viaje, no tiene

15
sentido. Incluso cuando las unidades son las mismas, la comparación del grado
de dispersión basada en los valores absolutos de los diferentes conjuntos suele
ser aún difícil. Así por ejemplo, supongamos que se tiene la siguiente
información: El ingreso medio mensual de cierto grupo de trabajadores adultos
es 𝑋̅ = 1.875 $ con una desviación estándar s = 285 $; en tanto que el ingreso
medio mensual para un grupo de voceadores, es 315 $ con una desviación
estándar de 80 $. No se puede concluir que la desviación estándar más alta (285
$) indica más alto grado de dispersión (en los ingresos de los trabajadores
adultos). La desviación estándar es significativa solamente en relación a la
media, respecto a la cual se calcula la medida de dispersión relativa.
De esta manera es que se requiere de una medida de dispersión que exprese
en términos relativos, para comparaciones como los casos indicados
anteriormente. En general, una dispersión relativa es el cociente de una medida
de dispersión dividida por el promedio con respecto al cual las desviaciones
fueron medidas.
La medida de dispersión relativa más usada es el coeficiente de variación (CV)
𝑠
DEFINICIÓN 4.4,- El coeficiente de variación está dado por: CV =
𝑥̅
En donde s es la desviación estándar y x la media aritmética, de un mismo
𝑠
conjunto de observaciones. O también 𝑥̅ *100% (en términos de porcentaje).

Así, en nuestro ejemplo hipotético, para los trabajadores adultos, se tiene


285
CV   0,152 o sea 15,2 %, mientras que el coeficiente de variación de los
1875
80
ingresos de los voceadores es CV   0,254 o sea 25,4%. De esta manera,
315
es posible hacer comparación de la variabilidad de los ingresos de ambos
conjuntos de trabajadores. Como puede apreciarse, la variabilidad de los
ingresos de los voceadores es mayor que la de los trabajadores adultos.

Otro coeficiente también usado con bastante frecuencia, es el coeficiente de


desviación media, que está definido por:
𝐷𝑀
CDM = (4.15)
𝑥̅

Se interpreta en forma análoga al caso anterior.


4.5

16
Formas de las distribuciones de
frecuencias
Se considera conveniente mencionar algunos otros tipos de medidas, pero que
no son de dispersión propiamente dicha. Así, por ejemplo, tenemos el coeficiente
de Asimetría de Pearson (CAS).
M ( X )  Mo
CAS  (4.16)
s
El cual, mide el grado de asimetría de una distribución de frecuencias. En general
se presentan los tres casos en la Figura 4.l.

Figura 4.1 Ejemplos de asimetría: El primer caso muestra simetría perfecta. El segundo caso se dice que
tiene asimetría negativa; y el tercer caso indica asimetría positiva.

Una medida de la mayor o menor concentración alrededor de la media, es el


coeficiente de apuntamiento, denominado también coeficiente de curtosis, que
es

17
M (d 4 )
C AP 
V ( X )2
Que cumple las siguientes relaciones:
Si CAP = 3 indica distribución normal
Si CAP > 3 indica apuntamiento hacia arriba
Si CAP < 3 indica apuntamiento hacia abajo

Figura 4.2 Ilustración aproximada del mayor o menor apuntamiento relativo

Tal como se verifica en la última ecuación, el coeficiente de apuntamiento y


también el coeficiente de asimetría se calcula con base a los momentos; por lo
que, a continuación, se describen los mismos:

Los momentos de una distribución de frecuencias


Algunas de las definiciones vistas hasta ahora, como la de la media aritmética y
la varianza, son en realidad casos particulares de una definición más general.

Si se tiene una muestra de la variable estadística X, la cual toma los valores


𝑋1 , 𝑋2, . . . , 𝑋𝑚 con sus frecuencias absolutas 𝑛1 , 𝑛2 , . . . , 𝑛𝑚 , se define el
∑𝑚 𝑟
1 (𝑋𝑖 −𝑐) 𝑛𝑖
momento de orden r, respecto al parámetro c como sigue: 𝑀𝑟 (𝑋) = 𝑛

Momentos centrados respecto al origen (0)


Un caso particular especialmente interesante de la definición de momentos es
cuando c = 0. De esta forma se define el momento de orden r, respecto al origen
∑𝑚 𝑟
1 (𝑋𝑖 −0) 𝑛𝑖 ∑ 𝑋𝑖𝑟 𝑛𝑖
(respecto a cero) como: 𝑚𝑟 = = ; donde r = 1, 2, 3, 4, . . .
𝑛 𝑛

18
Los momentos centrados respecto al origen suministran entonces medidas de
tendencia central. Es fácil ver que los primeros momentos respecto al origen son:
∑ 𝑋𝑖1 𝑛𝑖 ∑ 𝑋𝑖2 𝑛𝑖 ∑ 𝑋𝑖3 𝑛𝑖 ∑ 𝑋𝑖4 𝑛𝑖
𝑚1 = = M(X) = 𝑋̅; 𝑚2 = = M(X2); 𝑚3 = = M(X3); 𝑚4 = =
𝑛 𝑛 𝑛 𝑛

M(X4); etc.
Es decir, la media aritmética es el primer momento centrado respecto al origen
(c = 0).
Momentos centrados respecto a la media
De la misma manera, se pueden obtener los momentos centrados respecto a la
media sustituyendo la media aritmética por la c en la definición de momentos
centrados respecto a c. Se tiene así los momentos de orden r respecto a la
∑(𝑋𝑖 −𝑋̅)𝑟𝑛𝑖 ∑(𝑋𝑖 −𝑋̅)0 𝑛𝑖
media: 𝑀𝑟 = 𝑛
, en donde los primeros momentos son: 𝑀0 = 𝑛
= 1;
∑(𝑋𝑖 −𝑋̅ )1 𝑛𝑖
𝑀1 = 𝑛
= 0. El momento de orden 1 se anula por la propiedad de la media
∑(𝑋𝑖−𝑋̅ )2 𝑛𝑖
aritmética expresada en las propiedades de la media aritmética; 𝑀2 = 𝑛

= 𝑆 2 ; etc.,
Puede observarse que el momento de orden 2 respecto a la media es igual a la
varianza.
Asimetría y curtosis
La descripción estadística de una muestra de datos no concluye con el cálculo
de su tendencia central y de su dispersión. Para dar una descripción completa
es necesario estudiar también el grado de asimetría o simetría de las
distribuciones de frecuencias respecto a su medida central y la concentración de
los valores de la variable alrededor de esa medida de tendencia central.

Coeficientes de asimetría
Se dice que una distribución de frecuencias es simétrica cuando los valores de
la variable equidistantes, a uno y otro lado, del valor central tienen la misma
frecuencia absoluta (𝑛𝑖 ) o relativa (ℎ𝑖 ). Es decir, en este caso tendremos simetría
en el histograma (o en el diagrama de barras) alrededor de una vertical trazada
por el punto central. En el caso de una distribución perfectamente simétrica los
valores de la media aritmética, mediana y moda coinciden (𝑋̅ = Me = Mo).
En el caso de no tener simetría, diremos que tenemos asimetría a la derecha (o
positiva) o a la izquierda (o negativa) dependiendo de que el histograma muestre

19
una cola de medidas hacia valores altos o bajos de la variable respectivamente.
También se puede decir que la distribución está sesgada a la derecha (sesgo
positivo) o a la izquierda (sesgo negativo).
En el caso de una distribución asimétrica, la media, mediana y moda no
coinciden, siendo 𝑋̅ > Me > Mo para una asimetría positiva y 𝑋̅ < Me < Mo para
una asimetría negativa, ver el grafico presentado anteriormente.
Con el fin de cuantificar el grado de asimetría de una distribución de frecuencias
se pueden definir los coeficientes de asimetría. Aunque no son los únicos,
existen dos coeficientes principales:

Coeficiente de asimetría de Fisher


Se define como el cociente entre el momento de orden 3 respecto a la media y
𝑀3 ∑(𝑋𝑖 −𝑋̅)3𝑛𝑖
el cubo de la desviación estándar: 𝐶𝐴𝐹 = , donde 𝑀3 =
𝑆3 𝑛

En el caso de una distribución simétrica, las desviaciones respecto a la media se


anulan (puesto que en 𝑀3 el exponente es impar se anularan los números
positivos y negativos) y el coeficiente de asimetría será nulo (C𝐴𝐹 = 0). En caso
contrario, 𝑀3 tendrá valores positivos para una asimetría positiva (a la derecha)
y negativos cuando la asimetría sea en el otro sentido. Se debe indicar que la
división por el cubo de la desviación estándar se hace para que el coeficiente
sea adimensional y, por lo tanto, comparable entre diferentes conjuntos de datos.

Coeficiente de asimetría de Pearson


𝑋̅ −𝑀0
Este coeficiente, también adimensional, se define como: C𝐴𝑃 = . Su
𝑆

interpretación es similar a la del coeficiente de Fisher, siendo nulo para una


distribución simétrica (en ese caso media y moda coinciden) y tanto más positivo,
o negativo, cuanto más sesgada esté la distribución hacia la derecha, o hacia la
izquierda.

El objetivo de establecer la existencia de la asimetría o ausencia de ella en una


distribución de frecuencias, es básicamente para escoger el uso de la media
aritmética o de la mediana como indicador de tendencia central. Cuando la
distribución de frecuencias es muy asimétrica el indicador de tendencia central
es la mediana en sustitución de la media aritmética; en cambio, cuando la

20
distribución de frecuencias es aproximadamente normal es posible utilizar
cualquiera de los dos indicadores de tendencia central, inclusive es posible
utilizar la moda.

Coeficiente de curtosis
Además de la simetría, otra característica importante de la forma en que se
distribuyen los datos de la muestra es cómo el agrupamiento en torno al valor
central. Como se observa en la figura presentada anteriormente, los datos se
pueden distribuir de forma que tengamos un gran apuntamiento (o pico en el
histograma) alrededor del valor central, en cuyo caso diremos que tenemos una
distribución leptocúrtica, o en el extremo contrario, el histograma puede ser muy
aplanado, lo que corresponde a una distribución platicúrtica. En el caso
intermedio, diremos que la distribución es mesocúrtica y el agrupamiento
corresponde al de una distribución denominada normal, o en forma de campana
de Gauss.
Esta característica del apuntamiento de la distribución de frecuencias se
denomina curtosis y para cuantificarla se define el coeficiente de curtosis como
el cociente entre el momento de cuarto orden centrado respecto a la media y la
𝑀4 ∑(𝑋𝑖 −𝑋̅)4 𝑛𝑖
cuarta potencia de la desviación estándar: C𝐶4 = , donde 𝑀4 = . Se
𝑆4 𝑛

demuestra que el valor de este coeficiente para la distribución normal (campana


de Gauss) es 3 y se denomina distribución mesocúrtica. Este coeficiente cuyo
valor es adimensional alcanza valores mayores a 3 para distribuciones más
puntiagudas que la normal. Estas distribuciones se denominan leptocúrticas, y
las distribuciones con valores de este coeficiente menores a 3, se denominan
platicúrticas.

Figura 4.2 Ilustración aproximada del mayor o menor apuntamiento relativo

21
El objetivo de establecer si una distribución de frecuencias es más puntiaguda o
más aplanada que la distribución normal, es básicamente para cualificar la
representatividad de un estadígrafo de tendencia central (la media aritmética).
Cuando la distribución de frecuencias es más puntiaguda que de la normal, la
dispersión es pequeña; por lo que, la media es altamente representativa como
indicador de tendencia central; en cambio, las distribuciones de frecuencias más
aplanadas que de la normal tienen alta dispersión; por lo que, la media es poco
representativa como indicador de tendencia central.
En Inferencia Estadística es extremadamente importante que la distribución de
probabilidad del estimador de un parámetro sea más puntiaguda que la
distribución de la Normal, ello significa que el estimador tiene menor varianza
(menor variabilidad de sus valores respecto al valor del parámetro); esto
significa, que el valor del estimador obtenido de una muestra aleatoria tiene alta
probabilidad de estar cerca del valor del parámetro.

Ejemplo. Las distribuciones de frecuencias y sus correspondientes estadígrafos


descriptivos más importantes de dos variables son las siguientes:

Distribución de frecuencias del ingreso semanal (X en dólares)

Ingreso
𝒏𝒊 𝑿𝒊 𝑿𝒊 𝒏𝒊 (𝑿𝒊 − 𝟏𝟐𝟕)𝟐𝒏𝒊 (𝑿𝒊 − 𝟏𝟐𝟕)𝟑 𝒏𝒊 (𝑿𝒊 − 𝟏𝟐𝟕)𝟒 𝒏𝒊
𝑿′𝒊−𝟏 − 𝑿′𝒊

70 - 100 12 85 1.020 21.168 -889.056 37.340.352


100 – 130 2 115 230 288 -3.456 41.472
130 – 160 2 145 290 648 11.664 209.952
160 – 190 7 175 1.225 16.128 774.144 37.158.912
190 – 220 2 205 410 12.168 949.104 74.030.112
TOTAL 25 3.175 50.400 842.400 148.780.800

22
∑ 𝑋𝑖 𝑛𝑖 3.175 50,400
La media aritmética: 𝑋̅ = = = 127$; la varianza: 𝑆𝑋2 = = 2.016 $2 ;
𝑛 25 25

La desviación estándar: 𝑆𝑋 = √2.016$2 = 44,90$; el coeficiente de variación es:


44,9$
CV = = 0,354 (35,4%); el tercer momento centrado respecto a la media es:
127$
842.400
𝑀3 = = 33.696 $3 ; el cuarto momento centrado respecto a la media resulta:
25
148.780.800
𝑀4 = = 5.951.232 $4 ; el coeficiente de asimetría de Fisher es: 𝐶𝐴𝐹 =
25
33.696 5.951.232
(44,9)3
= 0,37; el coeficiente de curtosis es: 𝐶𝐶4 = (44,9)4
= 1,46.

Por la información anterior, se establece que la distribución del ingreso semanal


de la muestra de 25 hogares, presenta leve sesgo positivo y es mucho más
aplanada que la distribución normal; por lo que, tiene mayor dispersión de los
valores de la variable respecto de su media aritmética.

Distribución del gasto semanal (Y en dólares)

Gasto 𝟐 𝟑 𝟒
𝒏𝒋 𝒀𝒋 𝒀𝒋 𝒏𝒋 ̅ ) 𝒏𝒋
(𝒀𝒋 − 𝒀 ̅ ) 𝒏𝒋
(𝒀𝒋 − 𝒀 ̅ ) 𝒏𝒋
(𝒀𝒋 − 𝒀
𝒀′𝒋−𝟏 − 𝒀′𝒋
60 – 78 10 69 690 7.096,9 -189.061,3 5.036.593,3
78 – 96 4 87 348 298,6 -2.579,9 22.290,3
96 – 114 4 105 420 350,4 3.280,1 30.701,8
114 – 132 3 123 369 2.245,7 61.442,6 1.681.069,3
132 – 150 4 141 564 8.230,1 373.318,2 16.933.712,2
TOTAL 25 2.391 18.221,8 246.399,7 23.704.366,9

2.391 18.221,8
La media aritmética es: 𝑌̅ = = 95,64$; la varianza: 𝑆𝑌2 = = 728,87$2 ; la
25 25

desviación estándar resulta: 𝑆𝑌 = √728,87$2 = 27$; el coeficiente de variación:


27$
CV = = 0,282 (28,2%); el tercer momento centrado respecto a la media es:
95,64$
246.399,7
𝑀3 = = 9.855,99; el cuarto momento centrado respecto a la media: 𝑀4 =
25
23.704.366,9 9.855,99
= 948.174,68; el coeficiente de asimetría: 𝐶𝐴𝐹 = (27)3
= 0,50; el
25
948.174,68
coeficiente de curtosis: 𝐶𝐶4 = (27)4
= 1,78.

Por la información anterior, se establece que la distribución de frecuencias del


gasto semanal de la muestra de 25 hogares, como en el caso anterior presenta

23
también leve sesgo positivo y es mucho más aplanada que la distribución normal;
por lo que, tiene mayor dispersión los valores de la variable gasto semanal (Y).

4.6 Ejercicios

4.6.1 En una distribución de frecuencias se multiplican los valores de la variable


por 3 y se obtiene una media aritmética de 54. Si se adiciona 5 a los valores de
la variable se obtiene una media cuadrática de 24. Calcular el coeficiente de
variación de la distribución de la variable X.
Solución
54
M(3X) = 54; 3𝑋̅ = 54; de donde se obtiene la 𝑋̅ = = 18. La media cuadrática
3

∑(𝑋𝑖 +5)2
por definición está dada por: √ = 24, elevando al cuadrado ambos lados:
𝑛

∑(𝑋𝑖 +5)2 ∑[𝑋𝑖2 +10𝑋𝑖 +25] ∑ 𝑋𝑖2 ∑ 𝑋𝑖2


= 576; = 576; + 180 + 25 = 576; = 371. La varianza
𝑛 𝑛 𝑛 𝑛
∑ 𝑋𝑖2
de X resulta: 𝑆 2 = - 𝑋̅ 2 = 371 – 182 = 371 - 324 = 47, y la desviación estándar
𝑛

es la raíz cuadrada de la varianza con el signo positivo: S = √47 = 6,86; luego el


6,86
Coeficiente de Variación es: CV(X) = = 0,38, multiplicando por 100, CV(X) =
18
6,86
∗ 100 = 0,38∗100 = 38%.
18

4.6.2 El coeficiente de variación de los haberes mensuales de los médicos de


un país es 0,29. Se incrementan los haberes mensuales en un 25%, más un
bono de Bs. 50.-. Con estos incrementos el coeficiente de variación disminuye a
0,21. Si el número de médicos de ese país es N = 150.000. Calcular: a) El haber
mensual medio antes y después de los señalados incrementos, b) El monto total
de dinero requerido para cubrir los incrementos señalados.
Solución
𝑆
a) El coeficiente de variación antes de los incrementos es: = 0,29; S = 0,29𝑋̅;
𝑋̅
utilizando las propiedades de la media aritmética y de la desviación estándar, el
1,25 𝑆
coeficiente de variación después de los incrementos resulta: = 0,21; el
1,25𝑋̅ +50

numerador resulta por la aplicación de dos propiedades de la varianza que son:


V(kX+Kʹ) = k2V(X)+0 = 1,252S2 y el denominador resulta también por la aplicación
de dos propiedades de la media aritmética que son: M(kX+kʹ)= kM(X)+Kʹ =
24
(1,25)M(X)+50; sustituyendo en el coeficiente de variación después de los
(1,25)(0,29𝑋̅ ) 0,3625𝑋̅
incrementos, se tiene: ( ) = 0,21; = 0,21; 0,3625𝑋̅ = 0,2625𝑋̅ +
1,25𝑋̅+50 1,25𝑋̅+50
10,5
10,5; continuando se tiene: 0,10𝑋̅ = 10,5; luego 𝑋̅ = = 105 Bs., este es el
0,10

salario medio antes de los incrementos.


El salario medio con los incrementos resulta: M(1,25X + 50) = (1,25)𝑋̅ + 50 =
(1,25)(105) + 50 = 181,25 Bs.
b) El monto total con los incrementos es: (150.000)(181,25) = 27.187.500 Bs; El
monto total antes de los incrementos es: (150.000)(105) = 15.750.000 Bs.
Calculando la diferencia de los dos montos se tiene: 27.187.500 – 15.750.000 =
11.437.500 Bs. Este es el monto requerido para cubrir los incrementos.

4.6.3 De una tabla de distribución de frecuencias simétrica con 7 intervalos de clase


de igual amplitud se conocen los siguientes datos: C = 10; n1 = 8; Y3∗n3 = 1.260; h3
= 0.24; H6 = 0.96, y n2+n5 = 62, a) Reconstruir la tabla de distribución de
frecuencias completa, b) Calcular la Media Aritmética, la Mediana, el Coeficiente
de Variación, el Coeficiente de Asimetría de Pearson y el Coeficiente de Curtosis
o de Apuntamiento.

Solución

a) Por la simetría de la distribución de frecuencias y 7 intervalos de clase, se


tiene: 𝑛1 = 𝑛7 = 8 ; 𝑛2 = 𝑛6 ; 𝑛3 = 𝑛5 y 𝑛4 queda sola.
i) Tomando en cuenta la siguiente igualdad 𝐻7 = 𝐻6 + ℎ7 y sustituyendo los datos
se tiene 1 = 0,96 + ℎ7 ; de donde se obtiene ℎ7 = 0,04 y por la simetría de la
distribución de frecuencias ℎ7 = ℎ1 = 0,04.
𝑛7 𝑛 8
ii) Tomando en cuenta que ℎ7 = se obtiene n = ℎ7 ; o sea n = 0,04 = 200; luego
𝑛 7

𝑛3 = 𝑛5 = nℎ3 = 200(0,21) = 42.


iii) Utilizando n2 + n5 = 62; o sea n2 + 42 = 62 se tiene que 𝑛2 = 20 = 𝑛6 ; luego
20
ℎ2 = ℎ6 = 200 = 0,10

iv) Como 𝐻6 = 𝐻5 +ℎ6 ; o sea, 𝐻5 = 0,96 – 0,10 = 0,86.


v) Tomando en cuenta 𝐻5 = 𝐻4 +ℎ5 se obtiene 𝐻4 = 0,86 – 0,21 = 0,65.
vi) Considerando 𝐻4 = 𝐻3 +ℎ4 se tiene ℎ4 = 0,65 – 0,35 = 0,30; por lo que, 𝑛4 =
nℎ4 = 200(0,30) = 60.

25
1.260
vii) Tomando en cuenta que 𝑌3 𝑛3 = 1.260, se obtiene 𝑌3 = = 30. Con este
42
𝑌2′ +𝑌3′ 𝑌0′ +2𝐶+𝑌0′ +3𝐶 2𝑌0′ +5𝐶
resultado se obtiene: 𝑌3 = = = Este resultado permite
2 2 2
2𝑌0′ +5𝐶 2(30)−5(10)
escribir la siguiente igualdad: = 30; de donde se tiene: 𝑌0′ = = 5.
2 2

Este es el limite inferior del primer intervalo de clase y tomando en cuenta la


amplitud de clase que es C = 10 se obtienen los 7 intervalos de clase y las
correspondientes marcas de clase. Todos los datos calculados se incluyen en la
siguiente distribución de frecuencias agrupada reconstruida:
Distribución de Frecuencias Reconstruida


𝑌𝑖−1 a 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 ℎ𝑖 𝑁𝑖 𝐻𝑖
5 a 15 10 8 0,04 8 0,04
15 a 25 20 20 0,10 28 0,14
25 a 35 30 42 0,21 70 0,35
35 a 45 40 60 0,30 130 0,65
45 a 55 50 42 0,21 172 0,86
55 a 65 60 20 0,10 192 0,96
65 a 75 70 8 0,04 200 1,00
TOTALES 200 1,00
b)

𝑌𝑖−1 a 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 𝑁𝑖 𝑌𝑖 𝑛𝑖 (𝑌𝑖 - 40)𝑛𝑖 (𝑌𝑖 − 40)2 𝑛𝑖 (𝑌𝑖 − 40)3 𝑛𝑖 (𝑌𝑖 − 40)4 𝑛𝑖
5 a 15 10 8 8 80 -240 7200 -216,000 6,480,000
15 a 25 20 20 28 400 -400 8000 -160,000 3,200,000
25 a 35 30 42 70 1,260 -420 4200 -42,000 420,000
J 35 a 45 40 60 130 2,400 0 0 0 0
45 a 55 50 42 172 2,100 420 4200 42,000 420,000
55 a 65 60 20 192 1,200 400 8000 160,000 3,200,000
65 a 75 70 8 200 560 240 7200 216,000 6,480,000
TOTALES - 200 - 8,000 0 38,800 0 20,200,000

8.000 100−70 18 38.800


𝑌̅ = 200 = 40; 𝑀𝑒 = 35 + 10( 60 ) = 35 + 5 = 40; 𝑀𝑜 = 35 + 10(18+18) = 35 + 5 = 40; 𝑆 2 = 200
6,633 40−40 20.200.000 101.000
= 44; S = 6,633; CV = *100 = 16,58%; 𝐶𝐴𝑃 = = 0; 𝑀4 = = 101.000; CC =
40 6,633 200 6,6334

= 52,2
Se verifica que la distribución es simétrica; además, es una distribución
LEPTOCURTICA (mas puntiaguda que la distribución normal), razón por la cual
tiene dispersión baja.
4.6.3 La tabla adjunta presenta la distribución de frecuencias referidas al
número de trabajadores de 100 empresas:

26
Nº Trab: 15–25 26–35 36–45 46–55 56–65 66–75 76-85 86–95 96-105
Frec. Relat: 0.05 0.10 0.23 0.29 0.10 0.08 0.07 0.05 0.03
Frec. Abs: 5 10 23 29 10 8 7 5 3
Representar gráficamente la distribución de frecuencias anterior, calcular el
Coeficiente de Variación, el Coeficiente de Asimetría de Pearson, el Coeficiente
de Asimetría de Fisher, y el Coeficiente de Curtosis. Interpretar los resultados
anteriores.

4.6.4 Las ventas realizadas por una ferretería en las últimas dos semanas
(de lunes a sábado), expresadas en bolivianos se presentan a continuación:
SEMANA 1: 2.970, 2.980, 2.010, 2.500, 2.890 y 2.250; SEMANA 2: 2.780, 2.540,
3.500, 2.890, 2.780 y 3.510, a) Calcular las ventas medias para cada una de las
dos semanas, b) La venta media para las dos semanas en su conjunto, c) ¿En
cuál de las dos semanas las ventas tienen mayor estabilidad?, d) Si se realiza
una rebaja del 10% en las ventas semanales ¿Cuál es la venta media y la
varianza de la primera semana?

4.6.5 En una empresa trabajan 30.000 obreros y 15.000 administrativos. La


empresa está estudiando conceder un aumento salarial a sus trabajadores y
encarga elaborar un estudio de los montos de variación. La comisión encargada
de este estudio toma una muestra de 150 obreros y 40 administrativos y luego
informa que los primeros ganan en promedio 8.000 bolivianos y los segundos
9.000 bolivianos por mes. En base a esta información la empresa decide
aumentar a los obreros 20% de su sueldo y a los administrativos el 30%, a)
Calcule el monto de dinero que debe disponer la empresa para hacer efectivo el
aumento mensual, b) Luego de los incrementos antes citados, por la Navidad los
trabajadores reclaman una gratificación y logran que la empresa le otorgue a
cada uno 2.000 bolivianos. ¿A cuánto asciende el monto pagado a los
trabajadores en el mes de diciembre?
Solucion
nO = 150 obreros; n𝐴 = 40 administrativos; 𝑋̅𝑂 = 8 miles de Bs.; 𝑋̅𝐴 = 9 miles de
Bs.; M(1,2XO) = (1,2)𝑋̅𝑂 = (1,2)(8) = 9,6 miles de Bs.; M(1,3XA ) = (1,3)𝑋̅𝐴 = (1,3)(9)
= 11,7 miles de Bs.
a) Monto requerido para efectivizar el incremento mensual:
27
Montos después del incremento:
(30.000)(9,6) = 288.000 miles de Bs.; (15.000)(11,7) = 175.500 miles de Bs.
Montos antes del incremento:
(30.000)(8) = 240.000 miles de Bs.; (15.000)(9) = 135.000 miles de Bs.
Monto requerido:
(288.000 + 175.500) – (240.000 +135.000) = 463.500 – 375.000 = 88.500 miles
de Bs.
b) Monto total pagado en diciembre:
M(1,2X O+2) = (1,2)𝑋̅𝑂 +2 = (1,2)(8)+2 = 9,6+2 = 11,6 miles de Bs.
M(1,3X A +2) = (1,3)𝑋̅𝐴 +2 = (1,3)(9)+2 = 11,7+2 = 13,7 miles de Bs.
(30.000)(11,6) = 348.000 miles de Bs.
(15.000)(13,7) = 205.500 miles de Bs.
Monto total requerido para el pago de haberes de diciembre: 348.000 +
205.500 = 553.500.- miles de Bs.

28

También podría gustarte