Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clasificación
Cuantitativa Cuantitativa
(El dato es una (El dato es un
característica) número)
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de
valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia
central más utilizadas son: media, mediana y moda.
Media aritmética (en serie sin agrupar) Media aritmética (en serie agrupada)
∑𝑋 ∑ 𝑋𝑖 𝑓 𝑖
𝑋̅ = 𝑖 ; donde: 𝑋̅ = ; donde:
𝑛 𝑛
𝑋𝑖 : 𝑐𝑎𝑑𝑎 𝑑𝑎𝑡𝑜 𝑋𝑖 : 𝑐𝑎𝑑𝑎 𝑑𝑎𝑡𝑜 𝑦 𝑓𝑖 , 𝑒𝑠 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 y
∑𝑋𝑖 : Es la suma de los valores de los datos. ∑ 𝑋𝑖 𝑓𝑖 : Es la suma de los valores de los datos.
n: Número de observaciones n: Número de observaciones
M0 : es la moda
𝐿𝑖 : límite inferior del renglón que contiene a la moda
𝑓𝑖 : frecuencia absoluta del reglón modal
𝑓𝑖−1 : frecuencia absoluta anterior al reglón modal
𝑓𝑖+1 : frecuencia absoluta posterior al reglón modal
C: amplitud del reglón que contiene a la moda.
La suma de las desviaciones con respecto a la media aritmética es cero. ( ∑ (𝑋𝑖 − 𝑋̅) = 0)
La suma de desvíos al cuadrado entre los Xi y el promedio, 𝑋̅ ,es mínima, en relación a otro número diferente de la media.
( ∑(𝑋𝑖 − 𝑋̅ )2 < ∑(𝑋𝑖 − 𝑎)2 ); siendo “a” un valor cualquiera diferente de la 𝑋̅ .
Si a todos los valores de la variable se le suma o resta, una misma cantidad, la media aritmética queda aumentada o disminuida en dicha
cantidad.
Si todos los valores de la variable se multiplican por una misma constante la media aritmética queda multiplicada por dicha constante.
Propiedades de la mediana
No está afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden.
Es ventajosa utilizarla en distribuciones asimétricas.
Es de cálculo rápido y de interpretación sencilla.
Es posible obtenerla en variables cualitativas ordinales.
Propiedades de la moda
Cálculo sencillo.
Interpretación muy clara.
Al depender sólo de las frecuencias, puede calcularse para variables cualitativas y cuantitativas.
En una zona rural se cuenta con información muestral Una pregunta de encuesta indaga sobre los gastos
relativa al consumo de electricidad en KW-hora. La mensuales alimenticios en que incurre un grupo de
información se muestra en la tabla siguiente: familias del departamento de San Miguel. Los
resultados están resumidos en la siguiente tabla:
Consumo en Número de
Kw - hora familias Gastos en Número de
0 - 40 30 alimentos ($) familias
40 - 80 50
80 - 120 40 $125 20
120 – 200 25
$200 45
200 – 500 10
500 – 800 5 $250 50
800 - 1000 2
$300 70
$325 60
$350 35
$400 10
Se pide:
Se pide:
a) ¿Cuántas familias se estudiaron en la muestra?
a) Obtenga las frecuencias porcentuales y b) Si la población tiene un total de 75,000 familias,
acumuladas (absolutas y porcentuales) en ¿cuánto se estima el gasto total de alimentos?
b) ¿Cuántas familias se estudiaron en la muestra? c) Si la población de familias es 4150, en ¿cuánto se
c) Si la población de familias es 4150, en ¿cuánto se estima su consumo total en el área?
estima su consumo total en el área? d) ¿Cuánto es el gasto límite para el 50% de los que
d) Obtenga el valor, promedio, mediano y moda del más consumen y 50% de los que menos
consumo de electricidad. consumen.?
e) ¿Qué porcentaje de familias consumen más de 80 e) Obtenga el valor, promedio y moda del consumo
kw-h? a qué percentil equivalen los 80 kw-h de de electricidad.
consumo? f) ¿Cuánto es el promedio de desvíos (𝑋𝑖 − 𝑋̅)?
f) ¿Cuánto es el promedio de desvíos (errores,
diferencias) entre cada consumo familiar y el
promedio obtenido en d)?
g) La municipalidad de esa zona propondrá a la
compañía de electricidad una medida que incluya
un subsidio al 20% de las familias que posean el
menor consumo. Asimismo, se debe cobrar la
tarifa establecida para los que estén entre el 20% y
85% de los consumos centrales; y, aplicar un
cobro adicional de $20 al 15% de las familias de
mayor consumo. Detalle los límites del consumo
para la medida.
Frecuencias acumuladas
Suma 640
Me d i d a s d e u b i c a c i ó n (p e r c e n t i l e s)
Los centiles son medidas de posición o de ubicación. Los deciles dividen a la distribución de datos en 10 partes; los cuartiles dividen a la
distribución de datos en 4 partes y los percentiles en 100 partes. Son útiles para estimar un dato que divida a la distribución en dos partes
(quedando un porcentaje p% de datos menores al límite; a la vez el porcentaje de datos (100-p%) mayores al límite).
Por ejemplo, se hace uso con frecuencia de los deciles de ingresos para propósitos de conveniencia en mercados. Si el decil 1 es $550, se interpreta
que el 10% de la población tiene ingresos debajo de $550; a su vez, el 90% de la población tendrá ingresos de $550 o más. Los deciles y cuartiles
podrán expresarse en términos del percentiles; así el decil 1, equivale al percentil 10; el cuartil 3, equivale al percentil 75.
C u a r t i l es :
Q1 Q2 Q3 Q4
D e c i l e s:
D1 D2 D3 D4 D5 D6 D7 D8 D9
Percentiles:
P 1P 2P 3P 4P 5P 6P 7P 8P 9P 10
P 11
P 12
P 13
P 14
P 15
P 16
P 17
P 18
P 19
P 20
P 21
P 22
P 23
P 24
P 25
P 26
P 27
P 28
P 29
P 30
P 31
P 32
P 33
P 34
P 35
P 36
P 37
P 38
P 39
P 40
P 41
P 42
P 43
P 44
P 45
P 46
P 47
P 48
P 49
P 50
P 51
P 52
P 53
P 54
P 55
P 56
P 57
P 58
P 59
P 60
P 61
P 62
P 63
P 64
P 65
P 66
P 67
P 68
P 69
P 70
P 71
P 72
P 73
P 74
P 75
P 76
P 77
P 78
P 79
P 80
P 81
P 82
P 83
P 84
P 85
P 86
P 87
P 88
P 89
P 90
P 91
P 92
P 93
P 94
P 95
P 96
P 97
P 98
P 99
P 100
Cálculo de percentiles
La media geométrica de un grupo de “n “ observaciones es la raíz n-ésima del producto del valor de los datos.
La media geométrica es un promedio de igual interpretación que la media aritmética, es decir, un dato que representa al grupo de
observaciones. En sentido estricto, debe utilizarse la media geométrica, cuando los datos conlleven comportamiento geométrico.
En el primer caso conviene el cálculo de media geométrica y en el segundo de media aritmética, sin embargo; en la práctica, los datos
sólo pueden aproximarse a un comportamiento aritmético, geométrico u otro tipo.
De manera puntual, la media geométrica la aplicaremos en los casos siguientes: tasas de interés, tasas de rendimientos, tasas de
crecimiento, porcentajes, en general, crecimiento poblacional, crecimiento de la economía. Aunque se debe valorar los casos donde
conviene la media geométrica o la media aritmética, los anteriores representan un campo de aplicación para las ciencias económicas.
5 5
𝑀𝑔 = √(2 ∗ 5 ∗ 18 ∗ 32 ∗ 75) = √432,000 = 13.40
Ventajas:
Desventajas:
Sólo es relevante la media geométrica si todos los números son positivos. Como hemos visto, si uno de ellos es 0, entonces el
resultado es 0. Si hubiera un número negativo (o una cantidad impar de ellos) entonces la media geométrica sería o bien negativa, o
bien inexistente en los números reales.
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con distribución no normal. La media
geométrica es relevante cuando varias cantidades son multiplicadas para producir un total.
El crecimiento geométrico de una serie de tiempo, se deduce del modelo de crecimiento geométrico:
Df = Do (1+ r) n
r: Tasa de crecimiento promedio por período ( anual, mensual, semanal, diario, etc.).
Ejemplo:
Si la población de un país fue de 3.5 millones de habitantes en el 2001; luego en 2010 la población fue de 4.7 millones de habitantes .
a) Cuánto fue el crecimiento total de la población en el período de 2001 a 2010. R/ 1.2 millones de habitantes
b) Cuánto fue el crecimiento total porcentual de la población en el período de 2001 a 2010. R/ 34.3%
c) Cuánto fue el crecimiento promedio de la población en el período de 2001 a 2010.
𝑛 𝐷 9 4.7
𝑟 = √ 𝐹−1 𝑟=√ −1 3.33% . Por cada 100 habitantes, la población cre 3.3 personas cada año
𝐷 𝑜 3.5
d) Cuánto se estima la población para 2018, si se supone un ritmo de crecimiento poblacional similar al del período 2001
a 2010.?
Df = Do (1+ r)n
Df = Dato final = Dato de 2018 = ¿? ; Tasa de crecimiento, r = 3.33%, para efectos de cálculo usamos
r= 0.03329787164; n = 17 años (desde 2001 a 2018)
Sustituyendo:
Df = Do (1+ r)n Población 2018 = 3.5 (1+ 0.03329787164)17 = 6.11 millones de habitantes
Ejercicios a resolver:
1. La población mundial estimada para este año, 2019, es de este día es de registrada en el año 2015 fue de 7 665 000 000
habitantes; en el año 2000, la población era de 6 070 581 000.
3. Se tienen datos del Producto Interno Bruto en dólares constantes de 1990, para el período 2009-2017.
Estadística Descriptiva
Trata de la descripción de datos a partir del uso de medidas de tendencia central, medidas de posición y de medidas de dispersión o variabilidad, que son
complementarias entre sí para el análisis estadístico. Aquí se estudiarán las medidas de dispersión, también llamadas medidas de variabilidad.
Medidas de Dispersión.
En los histogramas anteriores se puede apreciar una dispersión mayor en el primero, en relación al segundo, En el segundo
histograma se evidencia una concentración de los datos alrededor de la media aritmética.
Existe información en la distribución de datos, que no es aportada por las medidas de tendencia central.
Un valor pequeño en una medida de dispersión indica que los datos están estrechamente agrupados alrededor de la media, entonces la media se considera
representativa de los datos.
La base de información para tipificar a los mercados como más volátiles o menos volátiles está en el cálculo de la desviación estándar.
La base de información para tipificar a el mayor o menor riesgo financiero en los títulos valores comercializados en el mercado de valores está en calcular
y analizar la desviación estándar.
1. Rango: es la diferencia entre el valor mayor observado y el valor menor observado. También se le suele llamar “recorrido” de la variable. En un conjunto
de datos, mientras mayor sea el rango, mayor será su dispersión y, a la inversa, mientras menor sea su rango, menor su dispersión.
2. Desviación media: es una medición promedio de cuánto se alejó cada valor Xi respecto de la media.
Para un grupo de datos sin agrupar Para un grupo de datos agrupado por frecuencias
∑|𝑥𝑖 − 𝑥̅ | ∑|𝑥𝑖 − 𝑥̅ | ∗ 𝑓𝑖
𝐷𝑀 = 𝐷𝑀 =
𝑛 𝑛
Varianza: La varianza es una medida de las desviaciones respecto a la media. Es decir, su cálculo está basado en la diferencia entre el valor de cada
observación (Xi) y la media. Para calcular la varianza, las desviaciones con respecto a la media se elevan al cuadrado, por lo que la varianza queda
expresada en unidades al cuadrado (esto presenta algunas dificultades para la comprensión práctica del significado del indicador)
Generalmente, para una serie de datos sin agrupar se usa la siguiente notación:
Para un grupo de datos sin agrupar Para un grupo de datos agrupado por frecuencias
∑ (𝑥𝑖 − 𝑥̅ )2 ∑ (𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑉(𝑥) = 𝑉(𝑥) =
𝑛−1 𝑛−1
Donde 𝑥𝑖 : es el valor del dato Donde 𝑥𝑖 : es el valor del dato
𝑥̅ : es el promedio aritmético del grupo de datos 𝑥̅ : es el promedio aritmético del grupo de datos
n: número de observaciones
3. Desviación estándar:
Se define como la raíz cuadrada positiva de la varianza. La desviación estándar es más fácil de interpretar que la varianza debido a que la desviación
estándar se mide en las mismas unidades que los datos.
Generalmente, para una serie de datos sin agrupar se usa la siguiente notación:
∑(𝑥𝑖 − 𝜇 )2 ∑(𝑥𝑖 − 𝑥̅ )2
𝜎= √ 𝑆= √
𝑁 𝑛−1
O bien, se expresa simplemente como S(x). Así, para la desviación muestral se tiene:
Para un grupo de datos sin agrupar Para un grupo de datos agrupado por frecuencias 4. Coeficiente de
variación:
∑ (𝑥𝑖 − 𝑥̅ )2 ∑ (𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆(𝑥) = √ 𝑆(𝑥) = √ El coeficiente de variación es
𝑛−1 𝑛−1 una medida relativa de la
variabilidad; mide la relación
Donde 𝑥𝑖 : es el valor del dato Donde 𝑥𝑖 : es el valor del dato entre la desviación estándar y
la media, y expresa dicha
𝑥̅ : es el promedio aritmético del grupo de datos 𝑥̅ : es el promedio aritmético del grupo de datos relación como un porcentaje.
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
n: número de observaciones 𝐶𝑉 = 𝑓𝑖 :𝑥es100
la frecuencia del dato
𝑀𝑒𝑑𝑖𝑎
n: número de observaciones
Esta es una medida muy útil para comparar conjuntos de datos cuando se presentan las siguientes situaciones:
El coeficiente de variación se utiliza para medir el grado de representatividad de la media aritmética de un conjunto de datos, de acuerdo a los criterios
siguientes: (que son sólo una referencia para el análisis)
Ejercicios:
Usted es un asesor de inversiones en la Bolsa de Valores de El Salvador, un inversionista lo ha contratado para que le asesore en su próxima decisión de
inversión. El inversionista planea invertir 5 millones de dólares en la empresa “Transportes marítimos”. Las rentabilidades mensuales observadas para las
acciones de la empresa en referencia a los últimos 10 trimestres son las siguientes (en porcentajes): 20,22,18,35,17,14,24,28,34, y 8. Si la rentabilidad de
las acciones permite una variabilidad relativa máxima del 10%, ¿Qué le recomendará al inversionista?
Se tienen dos grupos de mujeres de 11 y 25 años con media y desviación estándar dadas por la tabla siguiente:
Grupos Peso promedio Varianza
Se podría afirmar acerca del nivel de dispersión en ambos grupos de mujeres es igual?? Si__ No___ Por qué?________________________________
1. Si a un grupo de datos se le suma o resta un valor constante, la varianza y desviación estándar no se afecta.
En el ejercicio # 3
Al aumentar $125 a ambos sectores, de acuerdo a la propiedad anterior, la media aritmética, se afecta en el respectivo aumento y las medidas de dispersión
se mantiene igual.
2. Si a un grupo de datos se le multiplica por un valor constante, la varianza se multiplica por el cuadrado de la constante y desviación estándar se multiplica
por la constante.
La nueva varianza, V’(x) queda afectada en el cuadrado de la constante: 𝑉 ′ (𝑥) = 𝑘 2 ∗ 𝑉(𝑥) ; 𝑉(𝑥), 𝑒𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑜𝑟𝑖𝑔𝑖𝑛𝑎𝑙.
La nueva desviación estándar, S’(x) queda multiplicada por la constante: 𝑆(𝑥) = k ∗ 𝑆(𝑥) ; 𝑆(𝑥), 𝑒𝑠 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑜𝑟𝑖𝑔𝑖𝑛𝑎𝑙.
En el ejercicio # 3
Al incrementar en 20% cada salario, de acuerdo a la propiedad segunda, las medidas de dispersión quedan así:
Promedio $521.4286
Sector profesional
Sueldos Empleados xifi (xi -x) (xi -x)*fi (xi -x)2*fi (xi -x)3*fi (xi -x)4*fi
$1,100 45 49500 -$150.000 -$6,750.000 $1,012,500.000 -$151,875,000.000 $22,781,250,000.000
$1,450 10 14500 $200.000 $2,000.000 $400,000.000 $80,000,000.000 $16,000,000,000.000
$1,750 5 8750 $500.000 $2,500.000 $1,250,000.000 $625,000,000.000 $312,500,000,000.000
$2,000 3 6000 $750.000 $2,250.000 $1,687,500.000 $1,265,625,000.000 $949,218,750,000.000
$6,300 63 $78,750 1300 0 $4,350,000.000 $1,818,750,000.000 $1,300,500,000,000.000
Promedio $1,250.00
Medidas de asimetría
Son indicadores de la forma de una distribución que permite identificar y describir la manera cómo los datos tiende a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el
gráfico.
TIPOS DE ASIMETRÍA
3. Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. También se dice
que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la
mediana a su vez es menor que la moda, en símbolos 𝑋̅ < Md < Mo.
4. Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. Se
representa por una curva normal en forma de campana. En esta forma simética coinciden que 𝑋̅ = Md = Mo.
5. Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. También se
dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando: 𝑋̅ > Md > Mo.
Para medir la simetría o asimetría, se utiliza el Índice de simetría de Fisher:
Medidas de curtosis
El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
∑(𝑋𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝑔2 = − 3 Si g2 < 0 la distribución será platicúrtica o menos apuntada que lo
𝑛 𝑆4
normal.
Regla empírica
Es una regla práctica que determina el porcentaje de observaciones o datos concentrados alrededor de la media aritmética limitada por el número de
desviaciones estándar. Esta regla se utiliza si los datos tienen un comportamiento simétrico (normal, campana). Mediante el usos de la regla es posible detectar
valores atípicos, al sobrepasar el los límites de las 3 desviaciones estándar.
El 68.26% de las observaciones estará entre los límites generados por el distanciamiento de una desviación estándar, respecto de la media aritmética: 𝐿𝑖 =
𝑋̅ − 1𝜎; 𝐿𝑠 = 𝑋̅ + 1𝜎.
El 95.45% de las observaciones estará entre los límites generados por el distanciamiento de dos desviaciones estándar, respecto de la media aritmética:
𝐿𝑖 = 𝑋̅ − 2𝜎; 𝐿𝑠 = 𝑋̅ + 2𝜎.
El 99.74% de las observaciones estará entre los límites generados por el distanciamiento de tres desviaciones estándar, respecto de la media aritmética:
𝐿𝑖 = 𝑋̅ − 3𝜎; 𝐿𝑠 = 𝑋̅ + 3𝜎.
Por ejemplo, si un grupo de 250 observaciones reporta un promedio de 𝑋̅ = 30 y una desviación estándar de 𝜎 = 3.
Según la regla empírica se tiene que un 68% de las observaciones tendrán valor de entre 27 y 33.
Según la regla empírica se tiene que un 95% de las observaciones tendrán valor de entre 24 y 36.
Según la regla empírica se tiene que un 99% de las observaciones tendrán valor de entre 21 y 39.
Teorema de Chebyshev
El teorema de Chebyshev (también se escribe Tehebysheff) fue formulado por el matemático ruso P.L.Chebyshev (1821-1894): Establece que para cualquier
1
conjunto de datos, por lo menos 1 − % de las observaciones están dentro de k desviaciones estándar de la media, en donde K, es cualquier número mayor a
𝐾2
1.
1
𝑇𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝐶ℎ𝑒𝑏𝑦𝑠ℎ𝑒𝑣 ∶ 1 − ( 2 )
𝐾
Ejemplos a resolver:
Solución:
Objetivo: Comparar la solución enviada y la solución propuesta por el docente.
Corregir los desaciertos de la solución enviada, a fin de dominar el tema de dispersión de datos.
Ejercicios:
Usted es un asesor de inversiones en la Bolsa de Valores de El Salvador, un inversionista lo ha contratado para que le asesore en su próxima
decisión de inversión. El inversionista planea invertir 5 millones de dólares en la empresa “Transportes marítimos”. Las rentabilidades
mensuales observadas para las acciones de la empresa en referencia a los últimos 10 trimestres son las siguientes
(en porcentajes): 20,22,18,35,17,14,24,28,34, y 8. Si la rentabilidad de las acciones permite una variabilidad relativa máxima del 10%, ¿Qué
le recomendará al inversionista?
Recomendación: Evidencie el cálculo de la media aritmética, varianza, desviación estándar y el coeficiente de variación (en base al
coeficiente de variación establezca la recomendación)
20 -2 4
22 0 0
Coeficiente de variación:
18 -4 16
35 13 169 𝑥 8.5505
17 -5 25 𝐶𝑉 = ∗ 100 = ∗ 100 = 38.87%
𝑠(𝑥 ) 22
14 -8 64 ¿Qué le recomendará al inversionista? R/
24 2 4 En base al coeficiente de variación del 39%, es
mayor a la variabilidad relativa (CV) dada en la
28 6 36
condición del problema de 10%. No se
34 12 144
recomienda invertir, ya que la rentabilidad al
8 -14 196 tener una mayor dispersión del 10%, muestra
una volatidad que presenta mucho riesgo.
Total 220 0 658
Se tienen dos grupos de mujeres de 11 y 25 años con media y desviación estándar dadas por la tabla siguiente:
Grupos Peso Varianza Desviación Coef de variación
promedio
Mujeres de 15 95 libras 25 libras 5 5/95*100 = 5.26%
años 2 libras
Mujeres de 45 145 libras 25 libras 5 5/145*100 =
años 2 libras 3.44%
¿Se podría afirmar acerca del nivel de dispersión en ambos grupos de mujeres es igual?? Si__ No_X__
¿Por qué? R/ Aunque la desviación estándar es igual, el CV muestra mayor dispersión relativa en el grupo de 15 años.
Recomendación: Evidencie el cálculo de la desviación estándar y el coeficiente de variación (en base al coeficiente de variación establezca si
la dispersión es igual o no lo es)
Sector Sector profesional a. Establezca el nivel promedio de salario en cada sector y su desviación estándar
administrativo b. ¿Cuál sector muestra una mayor desigualdad salarial? ¿por qué?
Sueldos Empleados Sueldos Empleados c. Muestre gráficamente el tipo de sesgo en cada sector.
$450 10 $1100 45 d. Establezca la simetría y la curtosis
$500 40 $1450 10 e. Ante dos opciones de aumento:
$550 15 $1750 5 1) Incrementar a todos $125 ó
2) Incrementar a todos el 20%; cuál de las opciones agravaría las diferencias salariales en
$750 5 $2000 3
cada sector?
f. ¿Entre qué sueldos tiene el 95% de los asalariados en cada sector?
La respuesta requiere calcular las medidas de dispersión: varianza, desviación estándar y coeficiente de variación. Para ello debe hacer los
cálculos en tabla Excel y posterior sustituir en las respectivas fórmulas:
Como los datos se refieren a población de empleados: Como los datos se refieren a población de empleados:
Varianza Varianza
poblacional poblacional
∑(𝑥𝑖 − 𝜇 )2 ∗ 𝑓𝑖 342857.143 ∑(𝑥𝑖 − 𝜇 )2 ∗ 𝑓𝑖 4350000
𝜎2 = = = 4897.959 𝜎2 = = = 69,047.619
𝑁 70 𝑁 63
R/ Luego de haber calculado las medidas de dispersión se concluye que el sector profesional posee los salarios con
mayor desigualdad al reportar un CV de 21.02%, frente al sector administrativo que reporta un CV de 13.42%.
c. Muestre gráficamente el tipo de sesgo en cada sector.
En la forma gráfica se observa una forma de asimetría positiva o hacia la derecha en ambas distribuciones. Lo que significa
que una minoría de datos están a la derecha de la media aritmética.
Sector administrativo Sector profesional
¿Cuántos datos hay a la derecha, o mayores de ¿Cuántos datos hay a la derecha, o mayores de
$521.43? $1250?
Equivale a preguntar:
Equivale a preguntar:
¿Cuántos profesionales tienen un salario mayor
¿Cuántos administrativos tienen un salario mayor que la media aritmética ($1250)?
que la media aritmética ($521.43)?
Al contarlos en la tabla, los datos mayores de la
Al contarlos en la tabla, los datos mayores de la media son 28.6%. En forma analítica, la
media son 28.5%. En forma a nalítica, la proporción de profesionales con salarios mayores
proporción de administrativos con salarios a la media es de 28.6%, si la distribución fuera
mayores a la media es de 28.5%, si la simétrica, esa proporción debería ser 50%.
distribución fuera simétrica, esa proporción
debería ser 50%.
Índice de asimetría:
Si g1 > 0 la distribución
será asimétrica positiva o a
Sustituyendo datos del sector profesional, obtenidos en tabla 2 derechas (desplazada hacia la
derecha). Si g1 < 0 la
∑(𝑋𝑖 − 𝑥̅)3 ∗ 𝑓𝑖 = 1,818,750,000.0 , 𝑛 𝑆3 = 63 (262.769)3 ; 𝑆3 = 𝜎3 distribución será asimétrica
negativa o a izquierdas
(desplazada hacia la
Coeficiente de Si g2 > 0 la
curtosis
distribución
será
leptocúrtica o
Sustituyendo datos del sector profesional, obtenidos en tabla 2 apuntada
Si g2 = 0 la
∑(𝑋𝑖 − 𝑥̅)4 ∗ 𝑓𝑖 = 1,300,500,000,000, 𝑛 𝑆4 = 63 (262.769)4 ; 𝑆4 = 𝜎4
distribución será
mesocúrtica o
normal
Corresponde a una curtosis o apuntamiento leptocúrtico. Si g2 < 0 la
distribución será
platicúrtica o
menos apuntada
que lo normal.
R/ la opción de aumentar en $125 de manera global, hace disminuir las diferencias salariales, mostrado por el
CV.(recuerde, mientras más pequeño es el CV, menor es el nivel de dispersión relativa)
2) Incrementar a todos el 20%; cuál de las opciones agravaría las diferencias salariales en cada sector?
En conclusión la propuesta 1, de aumentar los salarios en $125, hace disminuir la desigualdad salarial en ambas
distribuciones; mientras que la propuesta 2, de aumentar en 20% los salarios no provoca diferencia en la
dispersión relativa (CV).
¿Entre qué sueldos tiene el 95% de los asalariados del sector administrativo?
El intervalo, queda limitado al aplicar la siguiente fórmula de la regla empírica: 𝜇 ± 2𝜎
En sector administrativo:
En sector profesional:
En sector administrativo:
En sector profesional:
Teorema de Chebyshev
El teorema de Chebyshev (también se escribe Tehebysheff) fue formulado por el matemático ruso P.L.Chebyshev (1821-1894): Establece que
para cualquier conjunto de datos, por lo menos % de las observaciones están dentro de k desviaciones estándar de la media, en donde K,
es cualquier número mayor a 1.
El valor de k es 2.5, lo que significa que 3.9 tiene un distanciamiento de -2.5 desvíos estándar respecto de la
media aritmética. De igual manera, el valor de 9.9, tiene un distanciamiento de 2.5 desvíos estándar
respecto de la media aritmética.
Ahora que se dispone del valor de k=2.5, se aplica directamente la fórmula:
( ) ( )
𝐾 2.5
3.9 horas y 9.9 horas.