Clase 1 Introducción y Conceptos Básicos. Deysi Renderos PDF

Variables estadísticas:
Es el conjunto de valores que puede tomar cierta característica de

la población sobre la que se realiza el estudio estadístico y sobre la que es
posible su medición.
Clasificación
Cuantitativa Cuantitativa
(El dato es una (El dato es un
característica) número)
Cualitativa Cualitativa Cuantitativa Cuantitativa

Nominal Ordinal Continua Discontinua
Variables Son las La variable puede La variable solo

cualitativas cuyas variables adquirir cualquier puede tomar
categorías no categóricas con valor dentro de un valores
intervalo de específicos a una
siguen ningún orden o
valores misma distancia.
orden. jerarquía determinado Por lo general, son
números enteros
Ejemplo: Ejemplo: Ejemplo: Ejemplo:

Medidas de tendencia central:
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de
valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia
central más utilizadas son: media, mediana y moda.
Media aritmética: Mediana: Moda:

Es la medida resumen más Es la medida resumen que se Es la medida resumen que
usada y se define como un ubica en el centro de los resulta de verificar el dato
valor representativo de un datos, al ordenarlos de menor más repetido de un grupo de
𝑛+1
𝑀𝑑grupo
= 𝐿de observaciones.
𝑖 + ( 2 − 𝐹𝑎𝑎) ∗ 𝐶
Se a mayor o viceversa. Se observaciones. La moda tiene
calcula como la suma de los obtiene por simple ubicación. sentido en variables
datos cuantitativos dividido Es posible obtener la mediana cuantitativas y variables
por el número de datos en datos cuantitativos y en cualitativas
datos cualitativos ordinales.
Fórmulas para obtener las medidas de tendencia central en variables cuantitativas
Series sin agrupar Series agrupadas
 Media aritmética (en serie sin agrupar)  Media aritmética (en serie agrupada)
∑𝑋 ∑ 𝑋𝑖 𝑓 𝑖
𝑋̅ = 𝑖 ; donde: 𝑋̅ = ; donde:
𝑛 𝑛
𝑋𝑖 : 𝑐𝑎𝑑𝑎 𝑑𝑎𝑡𝑜 𝑋𝑖 : 𝑐𝑎𝑑𝑎 𝑑𝑎𝑡𝑜 𝑦 𝑓𝑖 , 𝑒𝑠 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 y
∑𝑋𝑖 : Es la suma de los valores de los datos. ∑ 𝑋𝑖 𝑓𝑖 : Es la suma de los valores de los datos.
n: Número de observaciones n: Número de observaciones
 Mediana (en serie agrupada por intervalo)

 Mediana (en serie sin agrupar)
𝑛+1
Sólo ordena de menor a mayor los datos. La − 𝐹𝑎𝑎
mediana es el dato que se ubica en el centro. 𝑀𝑑 = 𝐿𝑖 + ( 2 )∗𝐶
𝑓𝑖
 Moda (en serie sin agrupar)
La moda es el dato que más se repita en una
serie.  Moda (en serie agrupada por intervalo)
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ( )∗𝐶
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
El renglón modal es el de mayor frecuencia absoluta
M0 : es la moda
𝐿𝑖 : límite inferior del renglón que contiene a la moda
𝑓𝑖 : frecuencia absoluta del reglón modal
𝑓𝑖−1 : frecuencia absoluta anterior al reglón modal
𝑓𝑖+1 : frecuencia absoluta posterior al reglón modal
C: amplitud del reglón que contiene a la moda.
Propiedades de las medidas de tendencia central
Propiedades de la media aritmética
 La suma de las desviaciones con respecto a la media aritmética es cero. ( ∑ (𝑋𝑖 − 𝑋̅) = 0)
 La suma de desvíos al cuadrado entre los Xi y el promedio, 𝑋̅ ,es mínima, en relación a otro número diferente de la media.
( ∑(𝑋𝑖 − 𝑋̅ )2 < ∑(𝑋𝑖 − 𝑎)2 ); siendo “a” un valor cualquiera diferente de la 𝑋̅ .
 Si a todos los valores de la variable se le suma o resta, una misma cantidad, la media aritmética queda aumentada o disminuida en dicha
cantidad.
 Si todos los valores de la variable se multiplican por una misma constante la media aritmética queda multiplicada por dicha constante.
Propiedades de la mediana
 No está afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden.
 Es ventajosa utilizarla en distribuciones asimétricas.
 Es de cálculo rápido y de interpretación sencilla.
 Es posible obtenerla en variables cualitativas ordinales.
Propiedades de la moda
 Cálculo sencillo.
 Interpretación muy clara.
 Al depender sólo de las frecuencias, puede calcularse para variables cualitativas y cuantitativas.
Ejercicios a resolver en clase:
En una zona rural se cuenta con información muestral Una pregunta de encuesta indaga sobre los gastos
relativa al consumo de electricidad en KW-hora. La mensuales alimenticios en que incurre un grupo de
información se muestra en la tabla siguiente: familias del departamento de San Miguel. Los
resultados están resumidos en la siguiente tabla:
Consumo en Número de
Kw - hora familias Gastos en Número de
0 - 40 30 alimentos ($) familias
40 - 80 50
80 - 120 40 $125 20
120 – 200 25
$200 45
200 – 500 10
500 – 800 5 $250 50
800 - 1000 2
$300 70
$325 60
$350 35
$400 10
Se pide:
Se pide:
a) ¿Cuántas familias se estudiaron en la muestra?
a) Obtenga las frecuencias porcentuales y b) Si la población tiene un total de 75,000 familias,
acumuladas (absolutas y porcentuales) en ¿cuánto se estima el gasto total de alimentos?
b) ¿Cuántas familias se estudiaron en la muestra? c) Si la población de familias es 4150, en ¿cuánto se
c) Si la población de familias es 4150, en ¿cuánto se estima su consumo total en el área?
estima su consumo total en el área? d) ¿Cuánto es el gasto límite para el 50% de los que
d) Obtenga el valor, promedio, mediano y moda del más consumen y 50% de los que menos
consumo de electricidad. consumen.?
e) ¿Qué porcentaje de familias consumen más de 80 e) Obtenga el valor, promedio y moda del consumo
kw-h? a qué percentil equivalen los 80 kw-h de de electricidad.
consumo? f) ¿Cuánto es el promedio de desvíos (𝑋𝑖 − 𝑋̅)?
f) ¿Cuánto es el promedio de desvíos (errores,
diferencias) entre cada consumo familiar y el
promedio obtenido en d)?
g) La municipalidad de esa zona propondrá a la
compañía de electricidad una medida que incluya
un subsidio al 20% de las familias que posean el
menor consumo. Asimismo, se debe cobrar la
tarifa establecida para los que estén entre el 20% y
85% de los consumos centrales; y, aplicar un
cobro adicional de $20 al 15% de las familias de
mayor consumo. Detalle los límites del consumo
para la medida.
Cálculos de medidas de tendencia central en series agrupadas.
Series agrupadas en intervalos:

1. Se presentan datos sobre el consumo de agua en una colonia de Ilopango.
Frecuencias acumuladas
Frecuencias … Frecuencias acumuladas

porcentuales
Consumo en metros Punto # de

cúbicos medio viviendas
X i* fi (Fa↓) (Far↑)
(X i) (X i) (fi)
0 a < de 10 5 50 250 50 640 7.81 100.00

10 a < de 20 15 120 170 590 92.19
20 a < de 30 25 260 430 67.19 73.44
30 a < de 60 8325 210 96.09
60 a < de 120 25
90 2250 640 25 100.00 3.91
Suma 640
Responda las siguientes preguntas:

a. Complete el cuadro
b. ¿Cuántas viviendas hay en las observaciones estadísticas?_____
c. ¿Cuánto es el consumo total de las viviendas en metros cúbicos?____________
d. ¿Cuántas viviendas consumen menos de 30 metros cúbicos? _____________
e. ¿Qué porcentaje de viviendas consumen más de 20 metros cúbicos? ____________
f. ¿Cuántas familias consumen entre 20 a menos de 30 metros cúbicos? ______ ¿cuántos m3 se consumen en ese
intervalo?______
g. ¿Qué porcentaje de viviendas consumen entre 60 m3 y 120 m3 ? _______________
h. Obtenga la media aritmética, mediana y moda del consumo de agua.
Me d i d a s d e u b i c a c i ó n (p e r c e n t i l e s)
Los centiles son medidas de posición o de ubicación. Los deciles dividen a la distribución de datos en 10 partes; los cuartiles dividen a la
distribución de datos en 4 partes y los percentiles en 100 partes. Son útiles para estimar un dato que divida a la distribución en dos partes
(quedando un porcentaje p% de datos menores al límite; a la vez el porcentaje de datos (100-p%) mayores al límite).
Por ejemplo, se hace uso con frecuencia de los deciles de ingresos para propósitos de conveniencia en mercados. Si el decil 1 es $550, se interpreta
que el 10% de la población tiene ingresos debajo de $550; a su vez, el 90% de la población tendrá ingresos de $550 o más. Los deciles y cuartiles
podrán expresarse en términos del percentiles; así el decil 1, equivale al percentil 10; el cuartil 3, equivale al percentil 75.
C u a r t i l es :
Q1 Q2 Q3 Q4
D e c i l e s:
D1 D2 D3 D4 D5 D6 D7 D8 D9
Percentiles:
P 1P 2P 3P 4P 5P 6P 7P 8P 9P 10
P 11
P 12
P 13
P 14
P 15
P 16
P 17
P 18
P 19
P 20
P 21
P 22
P 23
P 24
P 25
P 26
P 27
P 28
P 29
P 30
P 31
P 32
P 33
P 34
P 35
P 36
P 37
P 38
P 39
P 40
P 41
P 42
P 43
P 44
P 45
P 46
P 47
P 48
P 49
P 50
P 51
P 52
P 53
P 54
P 55
P 56
P 57
P 58
P 59
P 60
P 61
P 62
P 63
P 64
P 65
P 66
P 67
P 68
P 69
P 70
P 71
P 72
P 73
P 74
P 75
P 76
P 77
P 78
P 79
P 80
P 81
P 82
P 83
P 84
P 85
P 86
P 87
P 88
P 89
P 90
P 91
P 92
P 93
P 94
P 95
P 96
P 97
P 98
P 99
P 100
Cuartil2 = Decil5 = Percentil50 = Mediana
Cálculo de percentiles
Datos están sin agrupar:

Datos agrupados en intervalos
El percentil de orden j, se obtiene
Los percentiles se obtienen siguiendo con el procedimiento
siguiendo los siguientes pasos:
siguiente:
Paso1: Ordenar los datos de menor a 1. Usando el cociente,
𝑛
. 𝑗, se define el renglón del percentil
100
mayor. buscado en la frecuencias acumulada mínima que contiene al
referido cociente.
Paso2: Calcular el índice i. i= (j/100)*n
2. En el renglón, identificado, se aplica la siguiente fórmula:
Paso3: Definir el percentil buscado de
acuerdo a lo siguiente:
a) Si “i” no es número entero, debe

Li = Límite real inferior del renglón identificado
redondearlo a la posición inmediata
J= 1,2,3,... 99, es el orden del percentil
superior. En esa posición se definirá
n = Número de datos
el percentil buscado.
Faa = Frecuencia acumulada anterior al intervalo que contiene al
b) Si “i” es número entero, el percentil
percentil buscado.
j es el promedio de las posiciones i e
fi = Frecuencia absoluta del intervalo en el renglón del percentil
i+1.
buscado
c = Longitud del intervalo en el renglón de interés.
Media Geométrica
La media geométrica de un grupo de “n “ observaciones es la raíz n-ésima del producto del valor de los datos.
La media geométrica es un promedio de igual interpretación que la media aritmética, es decir, un dato que representa al grupo de
observaciones. En sentido estricto, debe utilizarse la media geométrica, cuando los datos conlleven comportamiento geométrico.
Series de comportamiento geométrico: Series de comportamiento aritmético:

 2, 4, 8, 16, 32…  3, 6, 9, 12, 15…
 5, 25, 125, 1125….  5, 10, 15, 20….
Conviene el cálculo Conviene el cálculo

de una media de una media
geométrica aritmética
En el primer caso conviene el cálculo de media geométrica y en el segundo de media aritmética, sin embargo; en la práctica, los datos
sólo pueden aproximarse a un comportamiento aritmético, geométrico u otro tipo.
De manera puntual, la media geométrica la aplicaremos en los casos siguientes: tasas de interés, tasas de rendimientos, tasas de
crecimiento, porcentajes, en general, crecimiento poblacional, crecimiento de la economía. Aunque se debe valorar los casos donde
conviene la media geométrica o la media aritmética, los anteriores representan un campo de aplicación para las ciencias económicas.
Fórmula: Mg= 𝑛√𝑥1 ∗ 𝑥2 ∗ 𝑥3 … . .∗ 𝑥𝑛
Por ejemplo, la media geométrica de los datos, 2, 5, 18, 32 y 75 es …
5 5
𝑀𝑔 = √(2 ∗ 5 ∗ 18 ∗ 32 ∗ 75) = √432,000 = 13.40
Otro ejemplo, la media de 1, 3 y 9 seria
Ventajas:
 considera todos los valores de la distribución.

 es menos sensible que la media aritmética a los valores extremos.
 Cuando los datos tienen comportamiento geométrico, la Mg es idónea.
Desventajas:
 su cálculo es más difícil

 en ocasiones no queda determinada; por ejemplo, si un valor xi=0 entonces la media geométrica se anula.
Sólo es relevante la media geométrica si todos los números son positivos. Como hemos visto, si uno de ellos es 0, entonces el
resultado es 0. Si hubiera un número negativo (o una cantidad impar de ellos) entonces la media geométrica sería o bien negativa, o
bien inexistente en los números reales.
El modelo de crecimiento geométrico
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con distribución no normal. La media
geométrica es relevante cuando varias cantidades son multiplicadas para producir un total.
El crecimiento geométrico de una serie de tiempo, se deduce del modelo de crecimiento geométrico:
Df = Do (1+ r) n
Df , es el dato final del que se dispone en una serie de tiempo.
Do, es el dato inicial del que se dispone en una serie de tiempo.
r: Tasa de crecimiento promedio por período ( anual, mensual, semanal, diario, etc.).
n: Tiempo (años, meses, semanas, días, etc.)
Ejemplo:
Si la población de un país fue de 3.5 millones de habitantes en el 2001; luego en 2010 la población fue de 4.7 millones de habitantes .
a) Cuánto fue el crecimiento total de la población en el período de 2001 a 2010. R/ 1.2 millones de habitantes
b) Cuánto fue el crecimiento total porcentual de la población en el período de 2001 a 2010. R/ 34.3%
c) Cuánto fue el crecimiento promedio de la población en el período de 2001 a 2010.
r, es la tasa de crecimiento promedio, se despeja de la fórmula general: Df = Do (1+ r)n
𝑛 𝐷 9 4.7
𝑟 = √ 𝐹−1 𝑟=√ −1 3.33% . Por cada 100 habitantes, la población cre 3.3 personas cada año
𝐷 𝑜 3.5
d) Cuánto se estima la población para 2018, si se supone un ritmo de crecimiento poblacional similar al del período 2001
a 2010.?
Df = Do (1+ r)n
Df = Dato final = Dato de 2018 = ¿? ; Tasa de crecimiento, r = 3.33%, para efectos de cálculo usamos
r= 0.03329787164; n = 17 años (desde 2001 a 2018)
Do = Dato Inicial = Dato de 2001 = 3.5 millones de habitantes
Sustituyendo:
Df = Do (1+ r)n Población 2018 = 3.5 (1+ 0.03329787164)17 = 6.11 millones de habitantes
Ejercicios a resolver:
1. La población mundial estimada para este año, 2019, es de este día es de registrada en el año 2015 fue de 7 665 000 000
habitantes; en el año 2000, la población era de 6 070 581 000.
a. ¿Cuánto es la media de la población para el período?

b. ¿Cuánto es el crecimiento total para la población en ese período? (en valor absoluto y en porcentaje)
c. ¿A qué tasa creció la población como promedio en el período 2000-2019?
d. Establezca una proyección para la población en el año 2020. ¿qué hay que suponer para tal proyección?
e. ¿A cada cuántos años la población se duplica?
2. El PIB del sector Agricultura, caza, silvicultura y pesca, de El salvador, fue de $ 912.5 millones en el año 2003. Si el
crecimiento económico se estima en 2.756% cada año, en cuánto puede establecerse una proyección para el PIB del sector
Agricultura, caza, silvicultura y pesca, del año 2019?
3. Se tienen datos del Producto Interno Bruto en dólares constantes de 1990, para el período 2009-2017.
Producto Interno Bruto

Años (Millones de Dólares
constantes de 1990)
2009 8953.8
2010 9076
2011 9277.21
2012 9451.72
2013 9626.26
2014 9763.48
2015 9987.92
2016 10224.28
2017 10459.44
Fuente: Banco central de Reserva de El Salvador
a. Obtenga la tasa de crecimiento para cada año.

b. ¿Qué porcentaje creció la economía de El salvador como promedio en el período 2009-2017?
c. ¿En cuánto se estima el monto del PIB en 2020?, ¿qué debe suponerse para la proyección anterior?
d. ¿Cuánto es lo mínimo que considera debería crecer la economía? Por qué?
Estadística I, Ciclo I 2019, Grupos: 04, 06, 09 y 23 (Apuntes para usar en clase)
Estadística Descriptiva
Trata de la descripción de datos a partir del uso de medidas de tendencia central, medidas de posición y de medidas de dispersión o variabilidad, que son
complementarias entre sí para el análisis estadístico. Aquí se estudiarán las medidas de dispersión, también llamadas medidas de variabilidad.
 Medidas de Dispersión.
Medidas de Dispersión: Estudian la variación o diseminación de los datos.
En los histogramas anteriores se puede apreciar una dispersión mayor en el primero, en relación al segundo, En el segundo
histograma se evidencia una concentración de los datos alrededor de la media aritmética.
 A más dispersión, menor representatividad de la media aritmética

 A menos dispersión, mayor representatividad de la media aritmética
¿Por qué es importante estudiar la dispersión?
 Existe información en la distribución de datos, que no es aportada por las medidas de tendencia central.
 Un valor pequeño en una medida de dispersión indica que los datos están estrechamente agrupados alrededor de la media, entonces la media se considera
representativa de los datos.
 Un valor grande en una medida de dispersión significa que la media no es confiable.
 La base de información para tipificar a los mercados como más volátiles o menos volátiles está en el cálculo de la desviación estándar.
 La base de información para tipificar a el mayor o menor riesgo financiero en los títulos valores comercializados en el mercado de valores está en calcular
y analizar la desviación estándar.
Cálculo de medidas de dispersión.
1. Rango: es la diferencia entre el valor mayor observado y el valor menor observado. También se le suele llamar “recorrido” de la variable. En un conjunto
de datos, mientras mayor sea el rango, mayor será su dispersión y, a la inversa, mientras menor sea su rango, menor su dispersión.
2. Desviación media: es una medición promedio de cuánto se alejó cada valor Xi respecto de la media.
Para un grupo de datos sin agrupar Para un grupo de datos agrupado por frecuencias
∑|𝑥𝑖 − 𝑥̅ | ∑|𝑥𝑖 − 𝑥̅ | ∗ 𝑓𝑖
𝐷𝑀 = 𝐷𝑀 =
𝑛 𝑛
Donde 𝑥𝑖 : es el valor del dato Donde 𝑥𝑖 : es el valor del dato
𝑥̅ : es el promedio aritmético del grupo de 𝑥̅ : es el promedio aritmético del grupo de datos

datos
𝑓𝑖 : es la frecuencia del dato
n: número de observaciones
 Varianza: La varianza es una medida de las desviaciones respecto a la media. Es decir, su cálculo está basado en la diferencia entre el valor de cada
observación (Xi) y la media. Para calcular la varianza, las desviaciones con respecto a la media se elevan al cuadrado, por lo que la varianza queda
expresada en unidades al cuadrado (esto presenta algunas dificultades para la comprensión práctica del significado del indicador)
Generalmente, para una serie de datos sin agrupar se usa la siguiente notación:
Varianza poblacional Varianza muestral
∑(𝑥𝑖 − 𝜇)2 ∑(𝑥𝑖 − 𝑥̅ )2

𝜎2 = 𝑠2 =
𝑁 𝑛−1
O bien, se expresa simplemente como V(x). Así, para la varianza muestral se tiene:
Para un grupo de datos sin agrupar Para un grupo de datos agrupado por frecuencias
∑ (𝑥𝑖 − 𝑥̅ )2 ∑ (𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑉(𝑥) = 𝑉(𝑥) =
𝑛−1 𝑛−1
Donde 𝑥𝑖 : es el valor del dato Donde 𝑥𝑖 : es el valor del dato
𝑥̅ : es el promedio aritmético del grupo de datos 𝑥̅ : es el promedio aritmético del grupo de datos
n: número de observaciones 𝑓𝑖 : es la frecuencia del dato
3. Desviación estándar:
Se define como la raíz cuadrada positiva de la varianza. La desviación estándar es más fácil de interpretar que la varianza debido a que la desviación
estándar se mide en las mismas unidades que los datos.
Generalmente, para una serie de datos sin agrupar se usa la siguiente notación:
Desviación estándar poblacional Desviación estándar muestral
∑(𝑥𝑖 − 𝜇 )2 ∑(𝑥𝑖 − 𝑥̅ )2
𝜎= √ 𝑆= √
𝑁 𝑛−1
O bien, se expresa simplemente como S(x). Así, para la desviación muestral se tiene:
Para un grupo de datos sin agrupar Para un grupo de datos agrupado por frecuencias 4. Coeficiente de
variación:
∑ (𝑥𝑖 − 𝑥̅ )2 ∑ (𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑆(𝑥) = √ 𝑆(𝑥) = √ El coeficiente de variación es
𝑛−1 𝑛−1 una medida relativa de la
variabilidad; mide la relación
Donde 𝑥𝑖 : es el valor del dato Donde 𝑥𝑖 : es el valor del dato entre la desviación estándar y
la media, y expresa dicha
𝑥̅ : es el promedio aritmético del grupo de datos 𝑥̅ : es el promedio aritmético del grupo de datos relación como un porcentaje.
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
n: número de observaciones 𝐶𝑉 = 𝑓𝑖 :𝑥es100
la frecuencia del dato
𝑀𝑒𝑑𝑖𝑎
Esta es una medida muy útil para comparar conjuntos de datos cuando se presentan las siguientes situaciones:
a) Los datos están en unidades diferentes (análisis de variables distintas)

b) Los datos están en las mismas unidades, pero las medias son muy distintas. (Se analiza la misma variable, pero en muestras o poblaciones
distintas.)
Criterio de interpretación del coeficiente de variación.
El coeficiente de variación se utiliza para medir el grado de representatividad de la media aritmética de un conjunto de datos, de acuerdo a los criterios
siguientes: (que son sólo una referencia para el análisis)
Valor del coeficiente de variación Grado en que la media representa a la serie
De 0% a menos de 10% Media altamente representativa
De 10% a menos de 20% Media bastante representativa
De 20% a menos de 30% Media Representativa
De 30% a menos de 40% La representatividad de la media es dudosa
De 40% o más Media carente de representatividad
Ejercicios:
 Usted es un asesor de inversiones en la Bolsa de Valores de El Salvador, un inversionista lo ha contratado para que le asesore en su próxima decisión de
inversión. El inversionista planea invertir 5 millones de dólares en la empresa “Transportes marítimos”. Las rentabilidades mensuales observadas para las
acciones de la empresa en referencia a los últimos 10 trimestres son las siguientes (en porcentajes): 20,22,18,35,17,14,24,28,34, y 8. Si la rentabilidad de
las acciones permite una variabilidad relativa máxima del 10%, ¿Qué le recomendará al inversionista?
 Se tienen dos grupos de mujeres de 11 y 25 años con media y desviación estándar dadas por la tabla siguiente:
Grupos Peso promedio Varianza
Mujeres de 15 años 95 libras 25 libras 2
Mujeres de 45 años 145 libras 25 libras 2
Se podría afirmar acerca del nivel de dispersión en ambos grupos de mujeres es igual?? Si__ No___ Por qué?________________________________
 Se tienen los sueldos de dos poblaciones de empleados de una institución:
Sector administrativo Sector profesional

Sueldos Empleados Sueldos Empleados a. Establezca el nivel promedio de salario en cada sector y su
desviación estándar
$450 10 $1100 45 b. Cuál sector muestra una mayor desigualdad salarial? ¿por qué?
c. Muestre gráficamente el tipo de sesgo en cada sector.
$500 40 $1450 10
d. Establezca la simetría y la curtosis
$550 15 $1750 5 e. Ante dos opciones de aumento:
1) Incrementar a todos $125 ó
$750 5 $2000 3
2) Incrementar a todos el 20%; cuál de las opciones agravaría las
diferencias salariales en cada sector?
f. Entre qué sueldos tiene el 95% de los asalariados en cada sector?. el

99%?
 Propiedades matemáticas de la varianza y desviación estándar.
1. Si a un grupo de datos se le suma o resta un valor constante, la varianza y desviación estándar no se afecta.
En el ejercicio # 3
Al aumentar $125 a ambos sectores, de acuerdo a la propiedad anterior, la media aritmética, se afecta en el respectivo aumento y las medidas de dispersión
se mantiene igual.
Medidas resumen Sector administrativo Sector profesional

Promedio original más $125 $521.40+$125.00 $1,250.00+$125.00
Promedio al aumentar $125 $646.43 $1,375.00
Varianza (no se modifica) 4897.96 dólares2 69047.62 dólares2
Desviación estándar ( no se modifica) 69.99 dólares 262.77 dólares
Coeficiente de variación (no se modifica) 13.42% 21.02%
2. Si a un grupo de datos se le multiplica por un valor constante, la varianza se multiplica por el cuadrado de la constante y desviación estándar se multiplica
por la constante.
Sea k, la constante a multiplicar para cada dato xi.
La nueva varianza, V’(x) queda afectada en el cuadrado de la constante: 𝑉 ′ (𝑥) = 𝑘 2 ∗ 𝑉(𝑥) ; 𝑉(𝑥), 𝑒𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑜𝑟𝑖𝑔𝑖𝑛𝑎𝑙.
La nueva desviación estándar, S’(x) queda multiplicada por la constante: 𝑆(𝑥) = k ∗ 𝑆(𝑥) ; 𝑆(𝑥), 𝑒𝑠 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑜𝑟𝑖𝑔𝑖𝑛𝑎𝑙.
En el ejercicio # 3
Al incrementar en 20% cada salario, de acuerdo a la propiedad segunda, las medidas de dispersión quedan así:

Promedio original $521.40 X1.20 $1,250.00 X 1.20
multiplicada por k =1.20
(100%+20%)
Promedio al aumentar 20% $625.71 $1,500.00
cada salario.
Varianza (se modifica, en 𝑉 ′ (𝑥) = 𝑘 2 ∗ 𝑉(𝑥) 𝑉 ′ (𝑥) = 𝑘 2 ∗ 𝑉(𝑥)
base a la segunda propiedad)
𝑉 ′ (𝑥) = 1.202 𝑋 4897.96 𝑑ó𝑙𝑎𝑟𝑒𝑠 2 𝑉 ′ (𝑥) = 1.202 𝑋 69047.62 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
𝑉 ′ (𝑥) = 7053.06 𝑑ó𝑙𝑎𝑟𝑒𝑠 2 𝑉 ′ (𝑥) = 99428.57 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
Desviación estándar (se 𝑆(𝑥) = k ∗ 𝑆(𝑥) 𝑆(𝑥) = k ∗ 𝑆(𝑥)

modifica, en base a la
segunda propiedad) 𝑆(𝑥) = 1.20 ∗ (69.99) 𝑆(𝑥) = 1.20 ∗ (262.77)
𝑆(𝑥) = 83.98 𝑑ó𝑙𝑎𝑟𝑒𝑠 2 𝑆(𝑥) = 315.32 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
Coeficiente de variación (no 13.42% 21.02%

se modifica)
Cálculos de los desvíos del ejercicio #3

Sector administrativo
Sueldos Empleados xifi (xi -x) (xi -x)*fi (xi -x)2*fi (xi -x)3*fi (xi -x)4*fi
$450 10 4500 -$71.429 -$714.286 $51,020.408 -$3,644,314.869 $260,308,204.915
$500 40 20000 -$21.429 -$857.143 $18,367.347 -$393,586.006 $8,433,985.839
$550 15 8250 $28.571 $428.571 $12,244.898 $349,854.227 $9,995,835.069
$750 5 3750 $228.571 $1,142.857 $261,224.490 $59,708,454.810 $13,647,646,813.828
$2,250 70 $36,500 164.285714 0 $342,857.143 $56,020,408.163 $13,926,384,839.650
Promedio $521.4286
Sector profesional
Sueldos Empleados xifi (xi -x) (xi -x)*fi (xi -x)2*fi (xi -x)3*fi (xi -x)4*fi
$1,100 45 49500 -$150.000 -$6,750.000 $1,012,500.000 -$151,875,000.000 $22,781,250,000.000
$1,450 10 14500 $200.000 $2,000.000 $400,000.000 $80,000,000.000 $16,000,000,000.000
$1,750 5 8750 $500.000 $2,500.000 $1,250,000.000 $625,000,000.000 $312,500,000,000.000
$2,000 3 6000 $750.000 $2,250.000 $1,687,500.000 $1,265,625,000.000 $949,218,750,000.000
$6,300 63 $78,750 1300 0 $4,350,000.000 $1,818,750,000.000 $1,300,500,000,000.000
Promedio $1,250.00
 Medidas de asimetría
Son indicadores de la forma de una distribución que permite identificar y describir la manera cómo los datos tiende a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el
gráfico.
TIPOS DE ASIMETRÍA
3. Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. También se dice
que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la
mediana a su vez es menor que la moda, en símbolos 𝑋̅ < Md < Mo.
4. Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. Se
representa por una curva normal en forma de campana. En esta forma simética coinciden que 𝑋̅ = Md = Mo.
5. Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. También se
dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando: 𝑋̅ > Md > Mo.
Para medir la simetría o asimetría, se utiliza el Índice de simetría de Fisher:
Si g1 > 0  la distribución será asimétrica positiva o a derechas
∑(𝑋𝑖 − 𝑥̅ )3 ∗ 𝑓𝑖 (desplazada hacia la derecha).

𝑔1 =
𝑛 𝑆3 Si g1 < 0  la distribución será asimétrica negativa o a izquierdas
(desplazada hacia la izquierda).
Si g1 = 0  la distribución será simétrica.
 Medidas de curtosis
El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de

curtosis:
1. Distribución mesocúrtica: presenta un grado de

concentración medio alrededor de los valores centrales de
la variable (el mismo que presenta una distribución
normal).
2. Distribución leptocúrtica: presenta un elevado grado de

concentración alrededor de los valores centrales de la
variable.
3. Distribución platicúrtica: presenta un reducido grado de

concentración alrededor de los valores centrales de la
variable.
Para medir la simetría la curtosis, se utiliza el Índice de curtosis de Fisher:

Si g2 > 0 la distribución será leptocúrtica o apuntada
Si g2 = 0 la distribución será mesocúrtica o normal
∑(𝑋𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝑔2 = − 3 Si g2 < 0 la distribución será platicúrtica o menos apuntada que lo
𝑛 𝑆4
normal.
 Regla empírica
Es una regla práctica que determina el porcentaje de observaciones o datos concentrados alrededor de la media aritmética limitada por el número de
desviaciones estándar. Esta regla se utiliza si los datos tienen un comportamiento simétrico (normal, campana). Mediante el usos de la regla es posible detectar
valores atípicos, al sobrepasar el los límites de las 3 desviaciones estándar.
Los porcentajes de la regla empírica se detallan a continuación:
 El 68.26% de las observaciones estará entre los límites generados por el distanciamiento de una desviación estándar, respecto de la media aritmética: 𝐿𝑖 =
𝑋̅ − 1𝜎; 𝐿𝑠 = 𝑋̅ + 1𝜎.
 El 95.45% de las observaciones estará entre los límites generados por el distanciamiento de dos desviaciones estándar, respecto de la media aritmética:
𝐿𝑖 = 𝑋̅ − 2𝜎; 𝐿𝑠 = 𝑋̅ + 2𝜎.
 El 99.74% de las observaciones estará entre los límites generados por el distanciamiento de tres desviaciones estándar, respecto de la media aritmética:
𝐿𝑖 = 𝑋̅ − 3𝜎; 𝐿𝑠 = 𝑋̅ + 3𝜎.
Por ejemplo, si un grupo de 250 observaciones reporta un promedio de 𝑋̅ = 30 y una desviación estándar de 𝜎 = 3.
Según la regla empírica se tiene que un 68% de las observaciones tendrán valor de entre 27 y 33.
Cualquier valor fuera del intervalo entre 21 y 39, se considera atípico.
 Teorema de Chebyshev
El teorema de Chebyshev (también se escribe Tehebysheff) fue formulado por el matemático ruso P.L.Chebyshev (1821-1894): Establece que para cualquier
1
conjunto de datos, por lo menos 1 − % de las observaciones están dentro de k desviaciones estándar de la media, en donde K, es cualquier número mayor a
𝐾2
1.
1
𝑇𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝐶ℎ𝑒𝑏𝑦𝑠ℎ𝑒𝑣 ∶ 1 − ( 2 )
𝐾
Ejemplos a resolver:
Solución:
Objetivo: Comparar la solución enviada y la solución propuesta por el docente.
Corregir los desaciertos de la solución enviada, a fin de dominar el tema de dispersión de datos.
Ejercicios:
 Usted es un asesor de inversiones en la Bolsa de Valores de El Salvador, un inversionista lo ha contratado para que le asesore en su próxima
decisión de inversión. El inversionista planea invertir 5 millones de dólares en la empresa “Transportes marítimos”. Las rentabilidades
mensuales observadas para las acciones de la empresa en referencia a los últimos 10 trimestres son las siguientes
(en porcentajes): 20,22,18,35,17,14,24,28,34, y 8. Si la rentabilidad de las acciones permite una variabilidad relativa máxima del 10%, ¿Qué
le recomendará al inversionista?
Recomendación: Evidencie el cálculo de la media aritmética, varianza, desviación estándar y el coeficiente de variación (en base al
coeficiente de variación establezca la recomendación)
Rentabilidad en % 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅)2

(Xi)
20 -2 4
22 0 0
Coeficiente de variación:
18 -4 16
35 13 169 𝑥 8.5505
17 -5 25 𝐶𝑉 = ∗ 100 = ∗ 100 = 38.87%
𝑠(𝑥 ) 22
14 -8 64 ¿Qué le recomendará al inversionista? R/
24 2 4 En base al coeficiente de variación del 39%, es
mayor a la variabilidad relativa (CV) dada en la
28 6 36
condición del problema de 10%. No se
34 12 144
recomienda invertir, ya que la rentabilidad al
8 -14 196 tener una mayor dispersión del 10%, muestra
una volatidad que presenta mucho riesgo.
Total 220 0 658
 Se tienen dos grupos de mujeres de 11 y 25 años con media y desviación estándar dadas por la tabla siguiente:
Grupos Peso Varianza Desviación Coef de variación
promedio
Mujeres de 15 95 libras 25 libras 5 5/95*100 = 5.26%
años 2 libras
Mujeres de 45 145 libras 25 libras 5 5/145*100 =
años 2 libras 3.44%
¿Se podría afirmar acerca del nivel de dispersión en ambos grupos de mujeres es igual?? Si__ No_X__
¿Por qué? R/ Aunque la desviación estándar es igual, el CV muestra mayor dispersión relativa en el grupo de 15 años.
Recomendación: Evidencie el cálculo de la desviación estándar y el coeficiente de variación (en base al coeficiente de variación establezca si
la dispersión es igual o no lo es)
 Se tienen los sueldos de dos poblaciones de empleados de una institución:
Sector Sector profesional a. Establezca el nivel promedio de salario en cada sector y su desviación estándar
administrativo b. ¿Cuál sector muestra una mayor desigualdad salarial? ¿por qué?
Sueldos Empleados Sueldos Empleados c. Muestre gráficamente el tipo de sesgo en cada sector.
$450 10 $1100 45 d. Establezca la simetría y la curtosis
$500 40 $1450 10 e. Ante dos opciones de aumento:
$550 15 $1750 5 1) Incrementar a todos $125 ó
2) Incrementar a todos el 20%; cuál de las opciones agravaría las diferencias salariales en
$750 5 $2000 3
cada sector?
f. ¿Entre qué sueldos tiene el 95% de los asalariados en cada sector?
¿Entre qué sueldos tiene el 99% de los asalariados en cada sector?,

a. Establezca el nivel promedio de salario en cada sector y su desviación estándar
Promedio del sector administrativo:
Fórmula de media aritmética en datos agrupados por frecuencias, en datos poblacionales:
Promedio del sector profesional:
Fórmula de media aritmética en datos agrupados por frecuencias, en datos poblacionales:
b. ¿Cuál sector muestra una mayor desigualdad salarial? ¿por qué?
La respuesta requiere calcular las medidas de dispersión: varianza, desviación estándar y coeficiente de variación. Para ello debe hacer los
cálculos en tabla Excel y posterior sustituir en las respectivas fórmulas:
Tabla 1: Cálculos del sector administrativo
Tabla 2: Cálculos del sector profesional

Medidas de dispersión, para los datos agrupados del Medidas de dispersión, para los datos agrupados del
sector administrativo. sector profesional.
Como los datos se refieren a población de empleados: Como los datos se refieren a población de empleados:
Varianza Varianza
poblacional poblacional
∑(𝑥𝑖 − 𝜇 )2 ∗ 𝑓𝑖 342857.143 ∑(𝑥𝑖 − 𝜇 )2 ∗ 𝑓𝑖 4350000
𝜎2 = = = 4897.959 𝜎2 = = = 69,047.619
𝑁 70 𝑁 63
Desviación estándar poblacional Desviación estándar poblacional
Coeficiente de variación Coeficiente de variación
R/ Luego de haber calculado las medidas de dispersión se concluye que el sector profesional posee los salarios con
mayor desigualdad al reportar un CV de 21.02%, frente al sector administrativo que reporta un CV de 13.42%.
c. Muestre gráficamente el tipo de sesgo en cada sector.
En la forma gráfica se observa una forma de asimetría positiva o hacia la derecha en ambas distribuciones. Lo que significa
que una minoría de datos están a la derecha de la media aritmética.
Sector administrativo Sector profesional
Promedio: 𝜇 = $521.43 Promedio: 𝜇 = $1250.
¿Cuántos datos hay a la derecha, o mayores de ¿Cuántos datos hay a la derecha, o mayores de
$521.43? $1250?
Equivale a preguntar:
Equivale a preguntar:
¿Cuántos profesionales tienen un salario mayor
¿Cuántos administrativos tienen un salario mayor que la media aritmética ($1250)?
que la media aritmética ($521.43)?
Al contarlos en la tabla, los datos mayores de la
Al contarlos en la tabla, los datos mayores de la media son 28.6%. En forma analítica, la
media son 28.5%. En forma a nalítica, la proporción de profesionales con salarios mayores
proporción de administrativos con salarios a la media es de 28.6%, si la distribución fuera
mayores a la media es de 28.5%, si la simétrica, esa proporción debería ser 50%.
distribución fuera simétrica, esa proporción
debería ser 50%.
Por casualidad, la proporción es muy idéntica.
d. Establezca la simetría (g1) y la curtosis (g2)

Índice de asimetría:
Si g1 > 0  la distribución
será asimétrica positiva o a
Sustituyendo datos del sector administrativo, obtenidos en tabla 1 derechas (desplazada hacia la
derecha). Si g1 < 0  la
∑(𝑋𝑖 − 𝑥̅)3 ∗ 𝑓𝑖 = 56,020,408.193 , 𝑛 𝑆3 = 70 (69.985)3 ; 𝑆3 = 𝜎3
distribución será asimétrica
negativa o a izquierdas
(desplazada hacia la
Corresponde a una asimetría positiva y el análisis del literal e). izquierda). Si g1 = 0  la
distribución será simétrica.
Índice de asimetría:
Si g1 > 0  la distribución
será asimétrica positiva o a
Sustituyendo datos del sector profesional, obtenidos en tabla 2 derechas (desplazada hacia la
derecha). Si g1 < 0  la
∑(𝑋𝑖 − 𝑥̅)3 ∗ 𝑓𝑖 = 1,818,750,000.0 , 𝑛 𝑆3 = 63 (262.769)3 ; 𝑆3 = 𝜎3 distribución será asimétrica
negativa o a izquierdas
(desplazada hacia la
Corresponde a una asimetría positiva y el análisis del literal e). izquierda). Si g1 = 0  la

distribución será simétrica.
Coeficiente de Si g2 > 0 la
curtosis
distribución
será
leptocúrtica o
Sustituyendo datos del sector administrativo, obtenidos en tabla 1 apuntada
Si g2 = 0 la
∑(𝑋𝑖 − 𝑥̅)4 ∗ 𝑓𝑖 =13,926,384,846.053, 𝑛 𝑆4 = 70 (69.985)4 ; 𝑆4 = 𝜎4
distribución será
mesocúrtica o
normal
Corresponde a una curtosis o apuntamiento leptocúrtico. Si g2 < 0 la
distribución será
platicúrtica o
menos apuntada
que lo normal.
Coeficiente de Si g2 > 0 la
curtosis
distribución
será
leptocúrtica o
Sustituyendo datos del sector profesional, obtenidos en tabla 2 apuntada
Si g2 = 0 la
∑(𝑋𝑖 − 𝑥̅)4 ∗ 𝑓𝑖 = 1,300,500,000,000, 𝑛 𝑆4 = 63 (262.769)4 ; 𝑆4 = 𝜎4
distribución será
mesocúrtica o
normal
Corresponde a una curtosis o apuntamiento leptocúrtico. Si g2 < 0 la
distribución será
platicúrtica o
menos apuntada
que lo normal.
e. Ante dos opciones de aumento:

1) Incrementar a todos $125 ó

Promedio original más $125 $521.40+$125.00 $1,250.00+$125.00
Promedio al aumentar $646.43 $1,375.00
$125 (nuevo promedio)
Varianza (no se modifica), por propiedad 4897.96 dólares2 69047.62 dólares2
1.
Desviación estándar ( no se modifica) 69.99 dólares 262.77 dólares
Coeficiente de variación (sin aumento) 69.985 262.769
𝐶𝑉 = ∗ 100 = 13.42% 𝐶𝑉 = ∗ 100 = 21.02%
521.429 1250.0
Coeficiente de variación (con aumento) 𝟔𝟗. 𝟗𝟖𝟓 𝟐𝟔𝟐. 𝟕𝟔𝟗

𝑪𝑽 = ∗ 𝟏𝟎𝟎 = 𝟏𝟎. 𝟖𝟐% 𝑪𝑽 = ∗ 𝟏𝟎𝟎 = 𝟏𝟗. 𝟏𝟏%
𝟔𝟒𝟔. 𝟒𝟑 𝟏𝟑𝟕𝟓
R/ la opción de aumentar en $125 de manera global, hace disminuir las diferencias salariales, mostrado por el
CV.(recuerde, mientras más pequeño es el CV, menor es el nivel de dispersión relativa)
2) Incrementar a todos el 20%; cuál de las opciones agravaría las diferencias salariales en cada sector?

Promedio original 𝜇 = $521.43 𝜇 = $1250.
Promedio original $521.40 X1.20 $1,250.00 X 1.20
multiplicada por k =1.20
(100%+20%). Según
propiedad 2
Promedio al aumentar 𝜇 = $625.71 𝜇 = $1,500.0
20% cada salario.
Varianza (se modifica, en 𝑉′(𝑥) = 𝑘2 ∗ 𝑉(𝑥) 𝑉′(𝑥) = 𝑘2 ∗ 𝑉(𝑥)
base a la segunda 𝑉 (𝑥) = 1.202 𝑋 4897.96 𝑑ó𝑙𝑎𝑟𝑒𝑠2
′ 𝑉′(𝑥) = 1.202 𝑋 69047.62 𝑑ó𝑙𝑎𝑟𝑒𝑠2
propiedad) 𝑉′(𝑥) = 7053.06 𝑑ó𝑙𝑎𝑟𝑒𝑠2 𝑉′(𝑥) = 99428.57 𝑑ó𝑙𝑎𝑟𝑒𝑠2
Desviación estándar (se 𝑆(𝑥) = k ∗ 𝑆(𝑥) 𝑆(𝑥) = k ∗ 𝑆(𝑥)

modifica, en base a la 𝑆(𝑥) = 1.20 ∗ (69.99) 𝑆(𝑥) = 1.20 ∗ (262.77)
segunda propiedad) 𝑆(𝑥) = 83.98 𝑑ó𝑙𝑎𝑟𝑒𝑠 𝑆(𝑥) = 315.32 𝑑ó𝑙𝑎𝑟𝑒𝑠
Coeficiente de variación 69.985 262.769
𝐶𝑉 = ∗ 100 = 13.42% 𝐶𝑉 = ∗ 100 = 21.02%
(no se modifica) 521.429 1250.0
Coeficiente de variación 83.98 315.32

𝐶𝑉 = ∗ 100 = 13.42% 𝐶𝑉 = ∗ 100 = 21.02%
(no se modifica) 625.71 1500
R/ la opción de aumentar en 20% los salarios, provoca una mayor desviación estándar, pero se mantiene el
coeficiente de variación.
En conclusión la propuesta 1, de aumentar los salarios en $125, hace disminuir la desigualdad salarial en ambas
distribuciones; mientras que la propuesta 2, de aumentar en 20% los salarios no provoca diferencia en la
dispersión relativa (CV).
f. ¿Entre qué sueldos tiene el 95% de los asalariados en cada sector?
¿Entre qué sueldos tiene el 95% de los asalariados del sector administrativo?
El intervalo, queda limitado al aplicar la siguiente fórmula de la regla empírica: 𝜇 ± 2𝜎
En sector administrativo:
𝜇 = $521.43 𝜎 = 𝟔𝟗. 𝟗𝟖𝟓

𝜇 − 2𝜎 = $521.43 − 2 ∗ $69.985 = $381.43; 𝜇 + 2𝜎 = $521.43 + 2 ∗ $69.985 = $661.40
El 95% de los administrativos tienen un salario de entre $381.43 y $661.40.
¿Entre qué sueldos tiene el 95% de los asalariados del sector profesional?
En sector profesional:
𝜇 = $1250.0 𝜎 = 𝟐𝟔𝟐. 𝟕𝟔𝟗
𝜇 − 2𝜎 = $1250.0 − 2 ∗ $262.769 = $724.46
𝜇 + 2𝜎 = $1250.0 + 2 ∗ $262.769 = $1775.54
El 95% de los profesionales tienen un salario de entre $724.46 y $ 1775.54

¿Entre qué sueldos tiene el 99% de los asalariados del sector administrativo?
En sector administrativo:
𝜇 = $521.43 𝜎 = 𝟔𝟗. 𝟗𝟖𝟓

𝜇 − 3𝜎 = $521.43 − 3 ∗ $69.985 = $311.48
𝜇 + 3𝜎 = $521.43 + 3 ∗ $69.985 = $731.39
El 99% de los administrativos tienen un salario de entre $311.48 y $731.39.

¿Entre qué sueldos tiene el 99% de los asalariados del sector profesional?
En sector profesional:
𝜇 = $1250.0 𝜎 = 𝟐𝟔𝟐. 𝟕𝟔𝟗
𝜇 − 3𝜎 = $1250.0 − 3 ∗ $262.769 = $461.69
𝜇 + 3𝜎 = $1250.0 + 3 ∗ $262.769 = $2038.31
El 9 9% de los administrativos tienen un salario de entre $461.69 y $ 2038.31
 Teorema de Chebyshev
El teorema de Chebyshev (también se escribe Tehebysheff) fue formulado por el matemático ruso P.L.Chebyshev (1821-1894): Establece que
para cualquier conjunto de datos, por lo menos % de las observaciones están dentro de k desviaciones estándar de la media, en donde K,
es cualquier número mayor a 1.
El valor de k es 2.5, lo que significa que 3.9 tiene un distanciamiento de -2.5 desvíos estándar respecto de la
media aritmética. De igual manera, el valor de 9.9, tiene un distanciamiento de 2.5 desvíos estándar
respecto de la media aritmética.
Ahora que se dispone del valor de k=2.5, se aplica directamente la fórmula:
( ) ( )
𝐾 2.5
3.9 horas y 9.9 horas.

Clase 1 Introducción y Conceptos Básicos. Deysi Renderos PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 1 Introducción y Conceptos Básicos. Deysi Renderos PDF

Cargado por

Copyright:

Formatos disponibles

Variables estadísticas:

Es el conjunto de valores que puede tomar cierta característica de

Cualitativa Cualitativa Cuantitativa Cuantitativa

Variables Son las La variable puede La variable solo

Ejemplo: Ejemplo: Ejemplo: Ejemplo:

Media aritmética: Mediana: Moda:

Fórmulas para obtener las medidas de tendencia central en variables cuantitativas

Series sin agrupar Series agrupadas

 Mediana (en serie agrupada por intervalo)

Propiedades de las medidas de tendencia central

Propiedades de la media aritmética

Ejercicios a resolver en clase:

Cálculos de medidas de tendencia central en series agrupadas.

Series agrupadas en intervalos:

Frecuencias … Frecuencias acumuladas

Consumo en metros Punto # de

0 a < de 10 5 50 250 50 640 7.81 100.00

Responda las siguientes preguntas:

Cuartil2 = Decil5 = Percentil50 = Mediana

Datos están sin agrupar:

a) Si “i” no es número entero, debe

Series de comportamiento geométrico: Series de comportamiento aritmético:

Conviene el cálculo Conviene el cálculo

Fórmula: Mg= 𝑛√𝑥1 ∗ 𝑥2 ∗ 𝑥3 … . .∗ 𝑥𝑛

Por ejemplo, la media geométrica de los datos, 2, 5, 18, 32 y 75 es …

Otro ejemplo, la media de 1, 3 y 9 seria

 considera todos los valores de la distribución.

 su cálculo es más difícil

El modelo de crecimiento geométrico

Df , es el dato final del que se dispone en una serie de tiempo.

Do, es el dato inicial del que se dispone en una serie de tiempo.

n: Tiempo (años, meses, semanas, días, etc.)

r, es la tasa de crecimiento promedio, se despeja de la fórmula general: Df = Do (1+ r)n

Do = Dato Inicial = Dato de 2001 = 3.5 millones de habitantes

a. ¿Cuánto es la media de la población para el período?

Producto Interno Bruto

a. Obtenga la tasa de crecimiento para cada año.

Medidas de Dispersión: Estudian la variación o diseminación de los datos.

 A más dispersión, menor representatividad de la media aritmética

¿Por qué es importante estudiar la dispersión?

 Un valor grande en una medida de dispersión significa que la media no es confiable.

Cálculo de medidas de dispersión.

Donde 𝑥𝑖 : es el valor del dato Donde 𝑥𝑖 : es el valor del dato

𝑥̅ : es el promedio aritmético del grupo de 𝑥̅ : es el promedio aritmético del grupo de datos

Varianza poblacional Varianza muestral

∑(𝑥𝑖 − 𝜇)2 ∑(𝑥𝑖 − 𝑥̅ )2

n: número de observaciones 𝑓𝑖 : es la frecuencia del dato

Desviación estándar poblacional Desviación estándar muestral

a) Los datos están en unidades diferentes (análisis de variables distintas)

Valor del coeficiente de variación Grado en que la media representa a la serie

De 0% a menos de 10% Media altamente representativa

De 10% a menos de 20% Media bastante representativa

De 20% a menos de 30% Media Representativa

De 30% a menos de 40% La representatividad de la media es dudosa

De 40% o más Media carente de representatividad

Mujeres de 15 años 95 libras 25 libras 2

Mujeres de 45 años 145 libras 25 libras 2

 Se tienen los sueldos de dos poblaciones de empleados de una institución:

Sector administrativo Sector profesional

f. Entre qué sueldos tiene el 95% de los asalariados en cada sector?. el

 Propiedades matemáticas de la varianza y desviación estándar.

Medidas resumen Sector administrativo Sector profesional

Desviación estándar ( no se modifica) 69.99 dólares 262.77 dólares