UNIDAD 3
COMPONENTE DESARROLLO
Curso Estadística Económica I
Unidad Unidad 3: Medidas de variabilidad, coeficientes de asimetría y de concentración
Carga horaria 20 horas
Introducción
¡Bienvenidos¡ Hoy daremos inicio a la tercera Unidad de la clase de Estadística Económica I, la cual será
interesante compartir su contenido a través del proceso enseñanza-aprendizaje, donde su dedicación y
aplicación juega un rol fundamental en la culminación de cada contenido. Esta unidad, se vuelve importante
por sus temas, que explican la importancia y uso de las medidas de variabilidad, así como de los
coeficientes de asimetría y de concentración, todas esas medidas muy útiles para el análisis estadístico.
Por otra parte, el propósito de esta unidad, lo constituye brindar los conocimientos necesarios a los
estudiantes de tal forma que obtengan una clara comprensión de la aplicación de dichas medidas
estudiadas en esta unidad.
Conceptos básicos
Principales medidas de dispersión y sus usos
Aplicación
Estas medidas son llamadas también medidas de dispersión. Empezaremos explicando porque es
importante el estudio de estas medidas las medidas de tendencia central si bien describen el centro
de jun conjunto de datos lo que es importante, pero no dicen nada sobre la dispersión de los datos.
Un resultado pequeño de una medida de dispersión indica que los datos se acumulan con
proximidad alrededor de la media y viceversa. Cuando ocurre lo primero es decir una medida de
dispersión con resultado pequeño la media o promedio se considera representativa, confiable o
significativa de los datos. En tanto una mediada grande de dispersión indica que la media no es
confiable para ese conjunto de datos. Por ejemplo: si la edad promedio de la clase de estadística
resulta de 20 años, y la medida de dispersión aplicada es de 60, indicará que ese promedio no es
confiable porque existe mucha dispersión entre las edades y se alejan de ese promedio de edad.
Rango ; Se representará por una R y se calcula entre la diferencia del dato mayor y dato menor de
un conjunto de datos. Es la medida más simple de dispersión, sus fórmula es la siguiente:
R= Dmax-Dmin
Ejemplo:
Si un hospital recibe como máximo 300 pacientes y como mínimo 100, determine su rango:
R=Dmax-Dmin= 300-100= 200
Varianza= S²
Se entiende como la media aritmética de las desviaciones de la media elevadas al cuadrado.
El valor de la varianza siempre será un valor no negativo y serpa igual a cero cuando el valor de las
desviaciones sea la misma.
Es importante definir que es Desviación: Es la diferencia entre un dato y un valor de referencia que en el
caso de la varianza es la media aritmética o promedio.
Formula de la Varianza:
__
S²= Σ (yi-Y)² ni/n
Interpretación:
Si el valor de la Varianza es grande o alto el promedio se volverá poco, significativo, representativo o
confiable de ese conjunto de datos.
Si el valor de la Varianza es pequeño el promedio se volverá más representativo, significativo o
confiable de ese conjunto de datos de una determinada variable.
La Varianza se puede calcular por 2 métodos:
1. Método directo
2. métodos abreviados
Cálculo de la varianza por el primer método abreviado que se refiere a las desviaciones con respecto
a la media aritmética o sea Zi:
Como referimos antes la desviación es una diferencia entre un dato y el valor del Zi:
Zi= Yi-Y
S²= ∑ (Z-Z2)/n- ∑ (Zi-Zi)2/n
Se relaciona con las desviaciones con respecto a la media o promedio o sea con Z’i= Yi-OT
SUELDOS DE PERSONAL ni Yi
20-30 100 25
40-50 120 45
60-70 95 65
71-90 65 80.5
EL VALOR DEL OT SERA DE 45 PORQUE ES EL VALOR DE Yi QUE ESTA ACOMPAÑADO DE
UNA MAYOR FRECUENCIA ABSOLUTA
La Desviación estándar representa a dispersión de los datos scon respecto al promedio, esta medida viene
a superar el problema de interpretación que presenta la varianza ya que esta última arroja datos en
términos cuadrados y su interpretación no se vuelve económica, en tanto al sacar su raíz cuadrada
mediante la desviación estándar expresará sus resultados de dispersión en términos de unidades.
Coeficiente de Variabilidad:
Expresa la dispersión en términos porcentuales, donde a mayor porcentaje de dispersión la distribución
será menos homogénea y por tanto más heterogénea y viceversa. Se cálculo así:
CV= s/Y*100
También se considera como parámetro para determinar si los datos son heterogéneos o homogéneos
comparándolo si el resultado es mayor o menor al 25%, lo que resulta si el resultado del CV es mayor al
25% indicará que la distribución es heterogénea, en cambio si es menor a dicho porcentaje indicará que la
distribución será homogénea.
Para ilustrar los cálculos de los estadígrafos anteriores se recomienda ver el siguiente video:
https://www.youtube.com/watch?v=1myBo87lYyU
C: Coeficiente de Asimetría
Este coeficiente determina si la asimetría positiva o negativa de una distribución es marcada o moderada,
para eso toma como referencia el parámetro de 0.30 si el resultado de Skq es mayor o igual a 0.30 la
asimetría de la distribución será marcada, y si este resulta menor a 0.30 la asimetría será moderada.
Ahora los cuartiles se utilizan como vimos para calcular este coeficiente, por lo que tendremos que abordar
el tema de medidas de fraccionamiento.
MEDIDAS DE FRACCIONAMIENTO:
Son las medidas que dividen a la distribución en partes iguales, las que tenemos:
Cuartiles= Qr
Deciles =Dr
Percentiles=Pr
Cuartiles (Qr): Dividen a la distribución en 4 partes iguales donde cada una de ellas representa el
25% de la muestra por lo tanto hablamos de 4 cuartiles (Q1…….Q4), el subíndice “r” indica el orden
el cuartil.
Su fórmula General : Li+(r(n/4)-faaaacc)c/facc
Donde:
Li= límite inferior de la clase cuartílica
Deciles= Dr
Dividen a la distribución en 10 partes iguales donde cada una de ellos representa el 10% de la muestra, por
lo tanto encontraremos desde D1, D2……………D10, su formúla general será:
Dr= Li+(r(n/10)-faaaacd)c/facd
Donde :
Percentiles (Pr): Medidas que dividen a la distribución en 100 partes iguales por lo tanto tendremos
P1, P2……..P100, sus fórmula general :
Pr= Li+(r(n/100)-faaaacp)c/facp
Donde :
Li= límite inferior de la clase percentílica
r(n/100)= determina la clase percentílica
faaaap= frecuencia absoluta acumulada anterior a la clase percentílica
Regla Empírica:
Cualquier distribución estándar simétrica con forma de campana aproximadamente el 68% de las
observaciones se encontrará entre más y menos una desviación estándar de la media, cerca del 95% de
las observaciones se encontrarán más y menos dos desviaciones estándares de la media y, de hecho todas
el 99.7% de las observaciones se encontraran entre más y menos tres desviaciones estándar de la media,
como se observa a continuación: Su aplicación es la siguiente
Ejemplo:
Se tienen datos sobre el consumo en factura mensual de energía eléctrica de una zona residencial de
nuestro país, se conoce que el consumo promedio del 80% de los residentes de dicha zona es de L1700.0
con una variación de L340.0, la EEH, desea determinar si se presentan consumos ilegales de dicha zona, y
ha establecido como parámetro que si existen pagos menores a L800.0 deberá proceder a realizar una
revisión en dicha zona. Comente y analice su respuesta?. Suponga que la distribución es normal.
Solución:
Datos:
_
Y= 1,700.0
S= 340.0
80% de la muestra equivale a la aplicación del Y más o menos 2(s)
De los resultados: El consumo mensual de los residentes de dicha zona residencial esta entre L2,380 y
L1,020.0 por lo que la revisión de la EEH no es necesario realizarla, debido a que los montos facturados se
encuentran por encima del parámetro establecido por la empresa de L800.0
Estos coeficientes indican si hay concentración o no en la distribución de una variable, el coeficiente que
aplicaremos se base en unas medidas llamadas momentos, que definiremos más adelante, este coeficiente
se denomina A sub 4 el que se determina: por ;
A4=M4/S4
Donde:
M4= momento de orden 4 con respecto a la media
S4= desviación estándar a la 4ta.
A4= A sub 4 (donde el 4 es un subíndice)
Distribución apuntada= Existe alta concentración (En la gráfica es la curva pintada en rojo)
Y c) Curva achatada = amplia variación los valores de la variable tienden hacia ambos extremos, (gráfica
curva color verde)
Momentos:
Los momentos de una distribución son medidas obtenidas a partir de todos sus datos y
de sus frecuencias absolutas. Existen diferentes tipos de momentos :
Momentos con respecto al Origen = Ar
Momentos con respecto a la Media = Mr
Momentos con respecto a un Origen de Trabajo= M’r
Momentos con respecto al Origen: Indican Elevar al valor del subíndice (la potencia) la variable o sea el
valor de los puntos medios o Yi, lo que se cálcula así:
Donde:
Yi= punto medio o marca de clase
r= potencia a la cual se eleva los valores de Yi
n= tamaño de la muestra
ni= valor de cada frecuencia absoluta
Z’i= Yi-OT
Donde Z’i= desviaciones con respecto a un OT
Yi= punto medio
OT =Orígen de Trabajo
Aplicación:
111-200 40 60
201-300 60 65
301-500 80 45
501-800 50 40
Se pide:
_
Ingreso en No.Empresas Yi ∑Yini Yi-Y (Yi-Y)2ni
miles de Lps. sector
calzado
100-110 20 20 -246.66 1,216,823.11
105
111-200 40 60 155.5 -196.16
201-300 60 120 250.5 -101,16
301-500 80 200 400.5 48.84
501-800 50 250 650.5 298.84.
250 ∑87915/250= ∑8,026,068.5
8/250=32,104
.27 miles de
lempiras al
Ingreso en No.Empresa Yi ∑Yini Yi-Y (Yi-Y)2ni
cuadrado.
miles de Lps. Sector
alimentos
100-110 40
105
111-200 60 155.5
201-300 65 250.5
201-500 45 400.5
500-800 40 650.5
∑73,8555/25 ∑8,296,358.4
0=295.42 0/250=33,185
.43
s= 182.17
CV= s/Y*100= 61.66%
_
Se conoce que la tendencia de la distribución de los ingresos de las empresas del sector
calzado es negativa compruebe su respuesta?
R= Falso: Porque la tendencia que presenta la distribución de generación de ingresos del sector
calzado resulta positiva, porque el resultado del coeficiente de asimetría Sk=0.64.
Adicionalmente, se conoce que la distribución de los ingresos del sector calzado es marcada
comente y analice su respuesta
R= aplicando el coeficiente de Asimetría Skq=
Se conoce que la distribución mensual de los ingresos del sector calzado presenta una alta
concentración comente y analice su respuesta?
R= Para determinar la concentración o no de una distribución se calculara el coeficiente de
concentración A4= M4/S4
s= 179.17 elevado a la 4ta potencia= 1,030,531,271.00
M4= Zi4ni/n= 2,155,072,752.28
A4= M4/S4= 2,155,072,752.28/1,030,531,271.00= 2.09
A4= 2.09
Bibliografía complementaria