Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 4 - Estadigrafos de Dispersion, Asimetria y Curtosis
Capitulo 4 - Estadigrafos de Dispersion, Asimetria y Curtosis
PRÓLOGO
1
Es innegable que una de las herramientas principales para la elaboración de todo
trabajo de investigación, donde los factores que intervienen sufren cambios
constantes que implican incertidumbre y que frente a ellos hay necesidad de
hacer predicciones para tomar la acción adecuada en una política de decisiones,
es la Estadística.
El presente trabajo fue realizado tomando como base las notas de las clases que
me correspondió dictar en la Universidad Mayor de San Andrés, Universidad
Católica Boliviana y en el primer Curso de Preparación y Evaluación de
Proyectos (Programa BID-ISAP-CONEPLAN-OEA - Ciudad de La Paz, 1973).
Se han incluido los temas que se consideraron más importantes, tratando de
dejar claras las ideas centrales y sus aplicaciones, sin entrar a muchas
demostraciones matemáticas, de acuerdo al objetivo perseguido. Se recomienda
a los estudiantes ampliar la lectura de cada Capítulo, al menos con uno de los
textos mencionados en la bibliografía.
Deseo resaltar la persona de Don Hugo Javier Ochoa G., Director del Curso de
Preparación y Evaluación de Proyectos, citado anteriormente, de quién surgió la
idea de realizar el presente documento. Para él, mis mejores palabras de elogio
y agradecimiento por su colaboración desinteresada, tolerancia y estímulo
constante de que fui objeto durante el tiempo que duró mi labor.
La Paz - Bolivia 1974
PRÓLOGO
A LA TERCERA EDICIÓN
La aceptación que tuvo el texto y el actual interés manifestado por contar con él,
sobre todo por estudiantes de carrera y muchos egresados, han constituido
2
motivos suficientes para haber emprendido la tarea de hacer las correcciones
que eran necesarias y de añadir las soluciones de ejercicios seleccionados.
La Paz - Bolivia
Agosto, 1990
3
CAPITULO 4
ESTADIGRAFOS DE DISPERSIÓN
En el presente capítulo estudiaremos una característica importante de las
distribuciones de frecuencias que es el grado de variación o de variabilidad, que
algunas veces se llama dispersión de los valores observados. Una medida de
dispersión es importante desde dos puntos de vista: en primer término, puede
ser usada para mostrar el grado de variación entre los valores de los datos
observados. Por ejemplo, una pequeña dispersión de los salarios mensuales de
un grupo de trabajadores en una fábrica, indicará que a los trabajadores se les
paga salarios aproximadamente iguales; por otro lado, una dispersión alta, dará
la idea de que los salarios son muy diferentes. En segundo lugar, puede ser
usada para complemento de un promedio, para describir un conjunto de datos o
para comparar una serie de información con otra. Cuando la dispersión es baja,
el valor del promedio se vuelve altamente significativo, o sea que la media es un
valor realmente representativo; en cambio, si la dispersión es alta, la media se
vuelve poco o nada representativa.
Por ejemplo, si se tuvieran los números 10, 20, 30, 40 y 900, la media de ellos
es 200; mientras que la media de los números 180, 200, 240, 200 y 180, también
es 200. En el primer caso, el valor de la media no está próximo a ningún número
del grupo, por tanto, se espera una alta dispersión; en cambio en el segundo
caso, la media está próxima a cada número del grupo, por lo que se espera una
menor dispersión. El hecho de que la medida de dispersión del primer grupo de
datos es más alta que el de la segunda, da una mejor comprensión en la
comparación de las medidas de dispersión de los dos conjuntos de datos.
Cuando se habla de dispersión, es natural que se trate de medir las diferencias
o comparaciones respecto de algún valor, tal que nos indique en promedio las
variaciones que existen entre los valores observados comparados con ese valor.
Generalmente para medir las variaciones se toma como referencia un punto
central de los valores observados, tal como la media. Una de las medidas de
dispersión más importantes es la desviación estándar, que es una medida que
considera qué tan lejos de la media están localizados cada uno de los valores de
la serie estadística en observación. De esta manera, parece lógico pensar que
mientras menor sea la desviación estándar de una distribución de frecuencias,
más significativo será generalmente un promedio como medida de la tendencia
4
central para dicha distribución. El uso de esta medida es grande debido a que
nos permite tomar en cuenta los elementos de variación para extraer
conclusiones sólidas y tomar decisiones apropiadas de la información disponible.
En los capítulos subsiguientes, se verán muchas aplicaciones de esta medida.
Veremos a continuación con cierto detalle, cada una de las distintas medidas de
dispersión y sus propiedades.
4.1
Recorrido
La Desviación Cuartilica
5
Definición.- La Desviación Cuartillita denotada por DQ se define como el
𝑄3 −𝑄1
4 4
cociente del Recorrido Intercuartílico entre dos (2); o sea, DQ = .
2
4.2
Desviación Media
Una primera medida basada en todos los elementos observados y diseñada
para medir la dispersión alrededor de un promedio, es la llamada desviación
media o desviación promedio. La medida de referencia puede ser la media o la
mediana. Por ser de mayor aplicación, veremos la desviación media (DM)
respecto de la media.
x x
DM M d
i
i 1
(4.2)
n
y para distribución de frecuencias,
∑𝑚 ̅ |𝑛𝑖
1 |𝑋𝑖 −𝑋
DM = M(|𝑑 |) = = ∑𝑚 ̅
1 |𝑋𝑖 − 𝑋 |ℎ𝑖 (4.3)
𝑛
6
En ambos casos, se supone que se está trabajando con observaciones. Como
puede apreciarse por (4.2), el cálculo de la DM es muy simple. Primero se calcula
la media aritmética de los valores observados; luego los desvíos de las
observaciones respecto de la media y, finalmente se determina la media
aritmética de los valores absolutos de los desvíos. Ilustraremos este proceso con
los siguientes ejemplos:
Ejemplo 4.2 Sea la información del ejemplo 3.1 del capítulo anterior (Ver Tabla
4.1). De manera que la desviación media es
DM
d
11
1,1
n 10
Desde el punto de vista práctico, puede obviarse la segunda columna. 3,6 y 5,8
Ejemplo 4.3 Sea ahora la información del Ejemplo 3.2 y la Tabla 3.2
7
media para datos agrupados
xi ni |di| |di| ni
3 2 1,7 3,4
4 3 0,7 2,1
5 2 0,3 0,6
6 2 1,3 2,6
7 1 2,3 2,3
∑ 10 11,0
1
Algunos autores denominan también desviación típica o tipificada.
8
Cuando se toman a todos los elementos de una población finita en estudio, se
∑𝑁
1 (𝑋𝑖 −µ)
2 ∑𝑁
1 (𝑋𝑖 −µ)
2
usa el símbolo 𝛔2 = y 𝛔=√ , respectivamente, para indicar a la
𝑁 𝑁
x x ni
2
s
i
n
Los dos ejemplos siguientes nos muestran el procedimiento general de cálculo.
Ejemplo 4.4 Tomemos la información del ejemplo 4.2
16,1
De manera que V ( X ) M (d ) 1,61 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 2
2
10
y la desviación estándar será
s 1,61 1,2689 %
9
datos sin agrupar
xi d i xi x d i2 xi x
2
3 - 1,7 2,89
4 - 0,7 0,49
5 0,3 0,09
4 - 0,7 0,49
6 1,3 1,69
5 0,3 0,09
4 - 0,7 0,49
6 1,3 1,69
7 2,3 5,29
3 - 1,7 2,89
0 16,10
x x ni
2
16,1
i
Luego, V ( x) 1,61
n 10
y s V ( x) 1,61 1,2689 (4,7-1,3 = 3,4); (4,7+1,3 = 6)
(5 - 1 = 4); (5 + 1 = 6)
A continuación, veremos las propiedades más importantes de la varianza, que
obviamente implican las propiedades de la desviación estándar.
PROPIEDADES
10
En lo que sigue, supondremos que se tienen n valores observados x 1, x2, … ,xn
de una característica particular X de una muestra de tamaño n.
TEOREMA 4.1 V(x) ≥ 0; la varianza es una cantidad no negativa (4.7)
Demostración: Por definición, V(X) = M(d2), y como di2 xi x 0 cualquiera
2
M X K M ( X ) M (K )
2
M X M ( X ) V ( X )
2
M K ( X M X M K ( X M ( X )
2 2 2
K M X M X K V ( X )
2 2 2
2
La anterior igualdad se puede escribir como sigue: 𝑆𝑘𝑋 = k2∗ 𝑆𝑋2 ; aplicando la raíz
cuadrada a ambos lados de la igualdad se tiene: SKX = k*SX ; Por lo que, la
desviación estándar de k por X es igual al producto de k por la desviación
estándar de X.
TEOREMA 4.5 V ( X ) M ( X 2 ) ( M ( X ))2 (4.11)
11
∑(𝑥𝑖 − 𝑥̅ )2 ∑(𝑥𝑖2 −2𝑥̅ 𝑥𝑖 +𝑥̅ 2 )
Demostración: V(X) = =
𝑛 𝑛
x 2
i 2 x xi n( x ) 2
n
2 2
x x
i
2 xx ( x ) 2 i
( x )2
n n
M ( x 2 ) ( M ( X ))2
Esta última propiedad, que es una forma equivalente de escribir la varianza, es
muy útil para trabajos de computación. La gran ventaja, radica en que no es
necesario el cálculo de los desvíos. Entonces, para fines de cálculo
recomendamos usar las siguientes fórmulas:
Para datos sin agrupar
2
n
n
xi2 xi
V (X ) i 1
i 1 (4.12)
n n
y para datos tabulados.
∑𝑚 2 ∑𝑚 2
1 𝑥𝑖 𝑛𝑖 1 𝑥𝑖 𝑛𝑖
V(X) = -( ) (4.13)
𝑛 𝑛
∑ 𝑥𝑖2
Luego la desviación estándar para datos originales es: 𝑆𝑋 = √ − 𝑥̅ 2 ; y para
𝑛
∑ 𝑥𝑖2 𝑛𝑖 ∑ 𝑥𝑖 𝑛𝑖 2
datos tabulados es la siguiente: 𝑆𝑋 = √ −( )
𝑛 𝑛
Ejemplo 4.6.- La siguiente Tabla nos muestra ejemplos prácticos para éstas
últimas tres propiedades.
TABLA 4.5 Cálculos para la propiedad (4.11) aplicados a los teoremas 4.3 y 4.4.
Datos Originales Cada valor de X es Cada valor de X es
incrementado en 5 multiplicado por 3
Valor de X X2 X+5 (X+5)2 3X (3X)2
1 1 6 36 3 9
2 4 7 49 6 36
4 16 9 81 12 144
5 25 10 100 15 225
12 46 32 266 36 414
12 32 36
M (X ) 3 M(X+5) = =8 M (3 X ) 9
4 4 4
12
46 266 414
M (X 2 ) 11,5 M ( X 5) 2 66,5 M (3 X ) 2 103,5
4 4 4
V ( X ) 11,5 9 2,5 V ( X 5) 66,5 64 2,5 V(3X) = 103,5 - 81 =
22,5
𝑆𝑋 = √2,5 = 1,58 𝑆𝑋+5 = 1,58 𝑆3𝑋 = √22,5 = 4,74
Los resultados anteriores pueden obtenerse de forma más rápida utilizando las
propiedades de la media aritmética, la varianza y de la desviación estándar; es
decir, sin elaborar la tabla: a) Para el caso de la suma, la media M(X+5) = 𝑋̅ + 5
= 3 + 5 = 8, la varianza V(X+ 5) = V(X) = 2,5, la desviación estándar 𝑆𝑋+5 = 1,58.
b) Para el caso del producto: la media M(3X) = 3𝑋̅ = 3*3 = 9, la varianza V(3X) =
32 V(X) = 9*2,5 = 22,5, la desviación estándar 𝑆3𝑋 = 3𝑆𝑋 = 3*1,58 = 4,74.
Nota: En el caso de tener datos resumidos en una tabla de distribución de
frecuencias, los cálculos son idénticos, teniendo únicamente el cuidado de
multiplicar los valores de la variable por sus frecuencias (ni)
ESTADISTICA DESCRIPTIVA 12-10-2023
Ejemplo 4.7.- Los salarios percibidos por un grupo de 25 empleados en dos
empresas privadas se presentan en la siguiente Tabla;
13
527,50
xA 21,1
25
527,50
xB 21,1
25
12.156,25
S A2 (21,1) 2 486,25 445,21 41,04
25
S A 41,04 6,4063 640,63 $
12.906,25
S B2 445,21 516,25 445,21 71,04
25
S B 71,04 8,4285 842,85 $
La media aritmética menos una vez la desviación estándar y más una vez la
desviación estándar genera un intervalo que tiene el límite inferior y el superior
respectivamente; o sea:
EMPRESA A:
2.110 – 640,63 = $ 1.469,37
2.110 + 640,63 = $ 2.750.63
EMPRESA B:
2.110 - 842,85 = $ 1.267,15
2.110 + 842,85 = $ 2.952,85
Como puede apreciarse, si bien el ingreso medio de los empleados en ambas
empresas es igual, vemos que hay mayor dispersión en los salarios que perciben
en la empresa B.
La variación media de los salarios de la Empresa A es de $ 1.469,37 hasta $
2.750.63
En cambio, de la Empresa B varía en promedio desde $1.267,15 hasta $
2.952,85$
Es importante notar que la desviación estándar, como una medida descriptiva,
es esencialmente una media de dispersión; y como se trata de una media de
desviaciones, por lo que, una desviación estándar pequeña indica un alto grado
de uniformidad en los valores de las observaciones de la serie estadística; y si la
desviación estándar es un valor grande, nos indica poca uniformidad en los datos
observados. De esta manera, si se comparan dos o más series de valores, que
tienen aproximadamente la misma media, la media más representativa será
aquella que tenga menor desviación estándar.
Ejemplo 4.8
14
a) Los salarios de las empresas del ejemplo 4.7 se incrementan a cada uno de
los trabajadores 500 $ (Bs. 500.-), las nuevas medias, varianzas y desviaciones
estándar, utilizando sus propiedades son:
Para la empresa A se tiene: 𝑀𝐴 (X + 5) = 𝑋̅ + 5 = 21,1 + 5 = 26,1 cientos de Bs.;
𝑉𝐴 (X + 5) = 𝑉𝐴 (X) = 41,04 (cientos de Bs.)2; 𝑆𝐴 = 6,406 cientos de Bs.
Para la empresa B se tiene: 𝑀𝐵 (X + 5) = 𝑋̅ + 5 = 21,1 + 5 = 26,1 cientos de Bs.;
𝑉𝐵 (X + 5) = 𝑉𝐵 (X) = 71,04 (cientos de Bs.)2; 𝑆𝐵 = 8,428 cientos de Bs.
b) Los salarios de las empresas del ejemplo 4.7 se incrementan a cada uno de
los trabajadores en 10%, las nuevas medias, varianzas y desviaciones estándar
son:
Y = X + 0,1X = 1,1X
Para la empresa A se tiene: 𝑀𝐴 (kX) = k𝑋̅ = 1,1*21,1 = 23,21 cientos de Bs.; 𝑉𝐴 (kX)
= 𝑘 2 𝑉𝐴 (X) = (1,1)2 41,04 = 49,658 (cientos de Bs.)2; 𝑆𝑘𝑋 = (1,1)6,406 = 7,047
cientos de Bs.
15
sentido. Incluso cuando las unidades son las mismas, la comparación del grado
de dispersión basada en los valores absolutos de los diferentes conjuntos suele
ser aún difícil. Así por ejemplo, supongamos que se tiene la siguiente
información: El ingreso medio mensual de cierto grupo de trabajadores adultos
es 𝑋̅ = 1.875 $ con una desviación estándar s = 285 $; en tanto que el ingreso
medio mensual para un grupo de voceadores, es 315 $ con una desviación
estándar de 80 $. No se puede concluir que la desviación estándar más alta (285
$) indica más alto grado de dispersión (en los ingresos de los trabajadores
adultos). La desviación estándar es significativa solamente en relación a la
media, respecto a la cual se calcula la medida de dispersión relativa.
De esta manera es que se requiere de una medida de dispersión que exprese
en términos relativos, para comparaciones como los casos indicados
anteriormente. En general, una dispersión relativa es el cociente de una medida
de dispersión dividida por el promedio con respecto al cual las desviaciones
fueron medidas.
La medida de dispersión relativa más usada es el coeficiente de variación (CV)
𝑠
DEFINICIÓN 4.4,- El coeficiente de variación está dado por: CV =
𝑥̅
En donde s es la desviación estándar y x la media aritmética, de un mismo
𝑠
conjunto de observaciones. O también 𝑥̅ *100% (en términos de porcentaje).
16
Formas de las distribuciones de
frecuencias
Se considera conveniente mencionar algunos otros tipos de medidas, pero que
no son de dispersión propiamente dicha. Así, por ejemplo, tenemos el coeficiente
de Asimetría de Pearson (CAS).
M ( X ) Mo
CAS (4.16)
s
El cual, mide el grado de asimetría de una distribución de frecuencias. En general
se presentan los tres casos en la Figura 4.l.
Figura 4.1 Ejemplos de asimetría: El primer caso muestra simetría perfecta. El segundo caso se dice que
tiene asimetría negativa; y el tercer caso indica asimetría positiva.
17
M (d 4 )
C AP
V ( X )2
Que cumple las siguientes relaciones:
Si CAP = 3 indica distribución normal
Si CAP > 3 indica apuntamiento hacia arriba
Si CAP < 3 indica apuntamiento hacia abajo
18
Los momentos centrados respecto al origen suministran entonces medidas de
tendencia central. Es fácil ver que los primeros momentos respecto al origen son:
∑ 𝑋𝑖1 𝑛𝑖 ∑ 𝑋𝑖2 𝑛𝑖 ∑ 𝑋𝑖3 𝑛𝑖 ∑ 𝑋𝑖4 𝑛𝑖
𝑚1 = = M(X) = 𝑋̅; 𝑚2 = = M(X2); 𝑚3 = = M(X3); 𝑚4 = =
𝑛 𝑛 𝑛 𝑛
M(X4); etc.
Es decir, la media aritmética es el primer momento centrado respecto al origen
(c = 0).
Momentos centrados respecto a la media
De la misma manera, se pueden obtener los momentos centrados respecto a la
media sustituyendo la media aritmética por la c en la definición de momentos
centrados respecto a c. Se tiene así los momentos de orden r respecto a la
∑(𝑋𝑖 −𝑋̅)𝑟𝑛𝑖 ∑(𝑋𝑖 −𝑋̅)0 𝑛𝑖
media: 𝑀𝑟 = 𝑛
, en donde los primeros momentos son: 𝑀0 = 𝑛
= 1;
∑(𝑋𝑖 −𝑋̅ )1 𝑛𝑖
𝑀1 = 𝑛
= 0. El momento de orden 1 se anula por la propiedad de la media
∑(𝑋𝑖−𝑋̅ )2 𝑛𝑖
aritmética expresada en las propiedades de la media aritmética; 𝑀2 = 𝑛
= 𝑆 2 ; etc.,
Puede observarse que el momento de orden 2 respecto a la media es igual a la
varianza.
Asimetría y curtosis
La descripción estadística de una muestra de datos no concluye con el cálculo
de su tendencia central y de su dispersión. Para dar una descripción completa
es necesario estudiar también el grado de asimetría o simetría de las
distribuciones de frecuencias respecto a su medida central y la concentración de
los valores de la variable alrededor de esa medida de tendencia central.
Coeficientes de asimetría
Se dice que una distribución de frecuencias es simétrica cuando los valores de
la variable equidistantes, a uno y otro lado, del valor central tienen la misma
frecuencia absoluta (𝑛𝑖 ) o relativa (ℎ𝑖 ). Es decir, en este caso tendremos simetría
en el histograma (o en el diagrama de barras) alrededor de una vertical trazada
por el punto central. En el caso de una distribución perfectamente simétrica los
valores de la media aritmética, mediana y moda coinciden (𝑋̅ = Me = Mo).
En el caso de no tener simetría, diremos que tenemos asimetría a la derecha (o
positiva) o a la izquierda (o negativa) dependiendo de que el histograma muestre
19
una cola de medidas hacia valores altos o bajos de la variable respectivamente.
También se puede decir que la distribución está sesgada a la derecha (sesgo
positivo) o a la izquierda (sesgo negativo).
En el caso de una distribución asimétrica, la media, mediana y moda no
coinciden, siendo 𝑋̅ > Me > Mo para una asimetría positiva y 𝑋̅ < Me < Mo para
una asimetría negativa, ver el grafico presentado anteriormente.
Con el fin de cuantificar el grado de asimetría de una distribución de frecuencias
se pueden definir los coeficientes de asimetría. Aunque no son los únicos,
existen dos coeficientes principales:
20
distribución de frecuencias es aproximadamente normal es posible utilizar
cualquiera de los dos indicadores de tendencia central, inclusive es posible
utilizar la moda.
Coeficiente de curtosis
Además de la simetría, otra característica importante de la forma en que se
distribuyen los datos de la muestra es cómo el agrupamiento en torno al valor
central. Como se observa en la figura presentada anteriormente, los datos se
pueden distribuir de forma que tengamos un gran apuntamiento (o pico en el
histograma) alrededor del valor central, en cuyo caso diremos que tenemos una
distribución leptocúrtica, o en el extremo contrario, el histograma puede ser muy
aplanado, lo que corresponde a una distribución platicúrtica. En el caso
intermedio, diremos que la distribución es mesocúrtica y el agrupamiento
corresponde al de una distribución denominada normal, o en forma de campana
de Gauss.
Esta característica del apuntamiento de la distribución de frecuencias se
denomina curtosis y para cuantificarla se define el coeficiente de curtosis como
el cociente entre el momento de cuarto orden centrado respecto a la media y la
𝑀4 ∑(𝑋𝑖 −𝑋̅)4 𝑛𝑖
cuarta potencia de la desviación estándar: C𝐶4 = , donde 𝑀4 = . Se
𝑆4 𝑛
21
El objetivo de establecer si una distribución de frecuencias es más puntiaguda o
más aplanada que la distribución normal, es básicamente para cualificar la
representatividad de un estadígrafo de tendencia central (la media aritmética).
Cuando la distribución de frecuencias es más puntiaguda que de la normal, la
dispersión es pequeña; por lo que, la media es altamente representativa como
indicador de tendencia central; en cambio, las distribuciones de frecuencias más
aplanadas que de la normal tienen alta dispersión; por lo que, la media es poco
representativa como indicador de tendencia central.
En Inferencia Estadística es extremadamente importante que la distribución de
probabilidad del estimador de un parámetro sea más puntiaguda que la
distribución de la Normal, ello significa que el estimador tiene menor varianza
(menor variabilidad de sus valores respecto al valor del parámetro); esto
significa, que el valor del estimador obtenido de una muestra aleatoria tiene alta
probabilidad de estar cerca del valor del parámetro.
Ingreso
𝒏𝒊 𝑿𝒊 𝑿𝒊 𝒏𝒊 (𝑿𝒊 − 𝟏𝟐𝟕)𝟐𝒏𝒊 (𝑿𝒊 − 𝟏𝟐𝟕)𝟑 𝒏𝒊 (𝑿𝒊 − 𝟏𝟐𝟕)𝟒 𝒏𝒊
𝑿′𝒊−𝟏 − 𝑿′𝒊
22
∑ 𝑋𝑖 𝑛𝑖 3.175 50,400
La media aritmética: 𝑋̅ = = = 127$; la varianza: 𝑆𝑋2 = = 2.016 $2 ;
𝑛 25 25
Gasto 𝟐 𝟑 𝟒
𝒏𝒋 𝒀𝒋 𝒀𝒋 𝒏𝒋 ̅ ) 𝒏𝒋
(𝒀𝒋 − 𝒀 ̅ ) 𝒏𝒋
(𝒀𝒋 − 𝒀 ̅ ) 𝒏𝒋
(𝒀𝒋 − 𝒀
𝒀′𝒋−𝟏 − 𝒀′𝒋
60 – 78 10 69 690 7.096,9 -189.061,3 5.036.593,3
78 – 96 4 87 348 298,6 -2.579,9 22.290,3
96 – 114 4 105 420 350,4 3.280,1 30.701,8
114 – 132 3 123 369 2.245,7 61.442,6 1.681.069,3
132 – 150 4 141 564 8.230,1 373.318,2 16.933.712,2
TOTAL 25 2.391 18.221,8 246.399,7 23.704.366,9
2.391 18.221,8
La media aritmética es: 𝑌̅ = = 95,64$; la varianza: 𝑆𝑌2 = = 728,87$2 ; la
25 25
23
también leve sesgo positivo y es mucho más aplanada que la distribución normal;
por lo que, tiene mayor dispersión los valores de la variable gasto semanal (Y).
4.6 Ejercicios
∑(𝑋𝑖 +5)2
por definición está dada por: √ = 24, elevando al cuadrado ambos lados:
𝑛
Solución
25
1.260
vii) Tomando en cuenta que 𝑌3 𝑛3 = 1.260, se obtiene 𝑌3 = = 30. Con este
42
𝑌2′ +𝑌3′ 𝑌0′ +2𝐶+𝑌0′ +3𝐶 2𝑌0′ +5𝐶
resultado se obtiene: 𝑌3 = = = Este resultado permite
2 2 2
2𝑌0′ +5𝐶 2(30)−5(10)
escribir la siguiente igualdad: = 30; de donde se tiene: 𝑌0′ = = 5.
2 2
′
𝑌𝑖−1 a 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 ℎ𝑖 𝑁𝑖 𝐻𝑖
5 a 15 10 8 0,04 8 0,04
15 a 25 20 20 0,10 28 0,14
25 a 35 30 42 0,21 70 0,35
35 a 45 40 60 0,30 130 0,65
45 a 55 50 42 0,21 172 0,86
55 a 65 60 20 0,10 192 0,96
65 a 75 70 8 0,04 200 1,00
TOTALES 200 1,00
b)
′
𝑌𝑖−1 a 𝑌𝑖′ 𝑌𝑖 𝑛𝑖 𝑁𝑖 𝑌𝑖 𝑛𝑖 (𝑌𝑖 - 40)𝑛𝑖 (𝑌𝑖 − 40)2 𝑛𝑖 (𝑌𝑖 − 40)3 𝑛𝑖 (𝑌𝑖 − 40)4 𝑛𝑖
5 a 15 10 8 8 80 -240 7200 -216,000 6,480,000
15 a 25 20 20 28 400 -400 8000 -160,000 3,200,000
25 a 35 30 42 70 1,260 -420 4200 -42,000 420,000
J 35 a 45 40 60 130 2,400 0 0 0 0
45 a 55 50 42 172 2,100 420 4200 42,000 420,000
55 a 65 60 20 192 1,200 400 8000 160,000 3,200,000
65 a 75 70 8 200 560 240 7200 216,000 6,480,000
TOTALES - 200 - 8,000 0 38,800 0 20,200,000
= 52,2
Se verifica que la distribución es simétrica; además, es una distribución
LEPTOCURTICA (mas puntiaguda que la distribución normal), razón por la cual
tiene dispersión baja.
4.6.3 La tabla adjunta presenta la distribución de frecuencias referidas al
número de trabajadores de 100 empresas:
26
Nº Trab: 15–25 26–35 36–45 46–55 56–65 66–75 76-85 86–95 96-105
Frec. Relat: 0.05 0.10 0.23 0.29 0.10 0.08 0.07 0.05 0.03
Frec. Abs: 5 10 23 29 10 8 7 5 3
Representar gráficamente la distribución de frecuencias anterior, calcular el
Coeficiente de Variación, el Coeficiente de Asimetría de Pearson, el Coeficiente
de Asimetría de Fisher, y el Coeficiente de Curtosis. Interpretar los resultados
anteriores.
4.6.4 Las ventas realizadas por una ferretería en las últimas dos semanas
(de lunes a sábado), expresadas en bolivianos se presentan a continuación:
SEMANA 1: 2.970, 2.980, 2.010, 2.500, 2.890 y 2.250; SEMANA 2: 2.780, 2.540,
3.500, 2.890, 2.780 y 3.510, a) Calcular las ventas medias para cada una de las
dos semanas, b) La venta media para las dos semanas en su conjunto, c) ¿En
cuál de las dos semanas las ventas tienen mayor estabilidad?, d) Si se realiza
una rebaja del 10% en las ventas semanales ¿Cuál es la venta media y la
varianza de la primera semana?
28