Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTENCIONALIDAD
La fórmula nos indica que debemos multiplicar cada peso w por el valor x correspondiente,
luego sumar los productos y, finalmente, dividir el total entre la suma de los pesos w.
Media Geométrica
Es una medida de tendencia central que es importante en las empresas y en economı́a. Los
analistas de empresas y los economistas que tienen interés en saber cuál es el crecimiento en
una serie de periodos de tiempo utilizan la media geométrica. Entre las aplicaciones en las
finanzas se encuentran las tasas de interés compuesto a lo largo de varios años, el crecimiento
de las ventas totales y el crecimiento de la población. La media geométrica es la n-esima
raı́z del producto de n observaciones.
√
M g = n x1 ∗ x2 ∗ x3 ∗ ... ∗ xn
Forma de la Distribución
La media y la mediana de una distribución simétrica son iguales, ya que las observaciones
están distribuidas uniformemente en torno al centro. La media de una distribución sesgada
positivamente es mayor que su mediana. La media de una distribución sesgada negativamente
es menor que su mediana.
MEDIDAS DE VARIABILIDAD
El conjunto de datos puede tener el mismo centro pero parecer distintos como resultado de
la forma en que se dispersa del centro. La variabilidad o dispersión es una caracterı́stica
importante de los datos. Por ejemplo si usted fabricara tornillos, la variación extrema en los
diámetros le causarı́a un alto de porcentaje de productos defectuosos. Por otro lado, si tratara
de discriminar entre administradores buenos y malos, tendrı́a problemas si el examen produjera
siempre calificaciones de prueba con poca variación, lo que harı́a muy difı́cil la discriminación.
Rango El rango de un conjunto de datos es la diferencia entre el valor máximo y el valor mı́nimo
Varianza
La varianza poblacional, σ 2 , es la suma de los cuadrados de las diferencias entre cada observación
y la media poblacional dividida por el tamaño de la población.
N
(xi − µ)2
P
2 i=1
σ =
N
La varianza muestral, S 2 , es la suma de los cuadrados de las diferencias entre cada observación y
la media muestral dividida por el tamaño de la muestra, n menos 1.
n
(xi − x̄)2
P
2 i=1
S =
n−1
Para calcular la varianza hay que elevar al cuadrado las distancias, lo que altera la unidad de
medición, que ahora son unidades al cuadrado. La desviación tı́pica que es la raı́z cuadrada de la
varianza, hacen que los datos vuelvan a su unidad original de medición. Si las mediciones originales
estuvieran en gramos, la varianza estarı́a en gramos cuadrados, pero la desviación estándar estarı́a
en gramos. La desviación estándar mide la dispersión media entorno a la media. Desviación
Estándar
La desviación estándar poblacional, σ, es la raı́z cuadrada (positiva) de la varianza poblacional y
se define de la siguiente forma: v
uN
u (xi − µ)2
uP
σ = i=1
t
N
La desviación estándar muestral, s es
v
u n
uP
u (xi − x̄)2
S = i=1
t
n−1
Coeficiente de Variación
Es una medida relativa usada para comparar la variabilidad de dos o mas conjuntos de datos.
Se define como la desviación estándar sobre el valor absoluto de la media (siempre que esta sea
diferente de cero)
S
C.V = ∗ 100
x̄
Como la desviación estándar y la media tienen las mismas unidades que los datos, estas se
cancelan y por lo tanto no tiene unidades.
Teorema de Chebychev
Dado un numero k mayor o igual que uno y un conjunto de n mediciones, por lo menos (1 − (1/k)2 )
de las mediciones estarán dentro de k desviaciones estándar de la media. Independientemente de
la forma de la distribución del conjunto de las mediciones, se tanto para describir una muestra
como una población.
Esta desigualdad establece frecuencias mı́nimas para cada intervalo como se muestra
k 1 − 1/k 2
1 1-1=0
2 1-1/4=0.75
3 1-1/9=0.89
Regla Empı́rica
Dada una distribución de mediciones que tiene una forma acampanada. La regla empı́rica
da una estimación del porcentaje aproximado de observaciones que están contenidas en una, dos
o tres desviaciones estándar de la media
Por lo menos 68 % de las mediciones está en el intervalo x̄ − s a x̄ + s
Por lo menos 95 % de las mediciones está en el intervalo x̄ − 2s a x̄ + 2s
Por lo menos 99.7 % de las mediciones está en el intervalo x̄ − 3s a x̄ + 3s
MEDIDAS DE POSICIÓN RELATIVA
Puntuación Z
Es una medida de posición relativa definida por
xi − x̄
Puntuación Z =
s
Mide la distancia entre una observación y la media, medida en unidades de desviación estándar.
Interesa conocer la ubicación relativa de los valores de un conjunto de datos. A partir de la media
y la desviación estándar, se puede determinar la localización relativa de cualquier observación.
Por ejemplo suponga que la media y la desviación estándar de las calificaciones de un examen de
estadı́stica so 25 y 4 respectivamente. La puntuación Z para la calificación de 30 se calcula
30 − 25
Puntuación Z = = 1,25
4
La calificación 30 está a 1.25 desviaciones estándar de la media 25.
La puntuación Z es una medida para determinar si una observación es posible que ocurra con
bastante frecuencia o pueda ser considerada un valor inusual.
Percentiles
Son medidas de posición relativa usada con frecuencia para grandes conjuntos de datos. Los Per-
centiles son medidas que divide a un conjunto de datos ordenado en 100 partes iguales con el 1 %
de los valores en cada grupo.
El percentil pα de un conjunto de datos ordenado es un valor tal que α por ciento de las mediciones
son menores que pα y el 1 − α por ciento de los valores son mayores que o iguales pα . Para calcular
el percentil α se sigue los siguientes pasos
1. Ordenar los datos de menor a mayor.
2. Calcular la posición del percentil α, usando la siguiente forma
α
Posición del percentil α = (n + 1)
100
donde α es el percentil deseado y n e numero de observaciones
3. Si la posición es un número entero el percentil α es el valor del dato la posición.
4. Si la posición no es un numero entero, se toma el valor del dato de la posición de la parte
entera y le sumamos el producto de la parte decimal a la diferencia entre el valor de la posición
siguiente y valor de la posición de la parte entera.
Diagrama de Caja
Es un resumen gráfico de los datos con base en el resumen de cinco números: el menor, el mayor,
y los cuartiles uno (percentil 25) y tres (percentil 75), y la mediana (Percentil 50).
EJEMPLOS
Ejemplo 1.
Los tiempos (en semanas) que han requerido 12 personas para conseguir un nuevo empleo son:
12, 15, 5, 12, 18, 3, 17, 8, 1, 9, 8, 2
1. ¿Cuál es la el tiempo medio para conseguir un nuevo empleo?
2. ¿Cuál tiempo mediano?
3. ¿Cuál la varianza?
4. ¿Cuál es la desviación estándar?
5. ¿Cual el coeficiente de variación?
Solución:
El tiempo de que gasta una persona para encontrar un nuevo empleo se desvı́a con respecto
a su media en promedio 5.77 semanas.
5. Su coeficiente de varaiacion es
S 5,77
C.V. = ∗ 100 = ∗ 100 = 62,7 %
x̄ 9,2
Esta medida nos indica que el tiempo para encontrar un nuevo empleo es heterogéneo es decir
que es muy disperso.
Ejemplo 2.
Suponga que un investigador desea determinar cómo varı́an las estaturas de las persona activas
laboralmente al tomar una muestra de 40 empleados del total de personas en la ciudad, registrando
sus estatura en pulgadas. Los datos obtenidos son:
64, 62, 62 60, 62, 57, 61, 55, 59, 66, 57, 68, 66, 72, 67, 64, 70, 65, 63, 64, 65, 63, 65, 63, 64, 69, 65,
71, 67, 63, 68, 66, 69, 66, 58, 67, 56, 60, 53, 59.
3. ¡Cuál es la media, mediana? ¿Son similares estos valores? ¿Qué relación se presenta con la
forma de la distribucion?
Solución:
2. Se observa en el diagrama de tallos y hojas que la estatura de los empleados tiene un sesgo
leve a la izquierda
Para calcular la mediana tomamos los dos datos centrales del grupo de medidas que están en
las posiciones 20 y 21, en este caso la mediana es 64.
Esta medida indica que el 50 % de los empleados tiene una estatura menor de 64 Pulgadas.
Ademas se observa que la media y la mediana son medidas similares. por tanto podemos
decir que las distribucion de las estaturas tiene una forma normal (simétrica). Aunque
numéricamente la media es menor que la mediana.
4. Para calcular la desviación estándar primero evaluamos la varianza, para ello evaluamos
primero las desviaciones de cada valor con respecto a su media, enseguida cada desviación se
eleva al cuadrado y por ultimo tomamos el promedio de las desviaciones al cuadrado.
n
(xi − x̄)2
P
i=1
S2 = =
n−1
(64 − 63,53)2 + (62 − 63,53)2 + (62 − 63,53)2 + ... + (59 − 63,53)2
=
40 − 1
775,97
=
39
= 19,89
Ahora obtenemos la raı́z cuadrada de este resultado para calcular la desviación estándar.
v
u n
uP
u (xi − x̄)2
S = i=1
t p
= 19,89 = 4,46
n−1
El coeficiente de variación es
S 4,46
C.V. = ∗ 100 = ∗ 100 = 7,02 %
x̄ 63,53
Esta medida nos indica que la estatura de los empleados es medianamente homogéneo.
Ejemplo 3.
En una muestra aleatoria de 50 pólizas de seguro de propiedades personales se encontró el siguiente
numero de reclamaciones en los dos últimos años.
Numero de reclamaciones 0 1 2 3 4 5 6
Numero de polizas 21 13 5 4 2 3 2
1. Hallar el numero medio de reclamaciones
2. Halle la desviación estándar
Solución:
Ejemplo 4.
A continuación se presentan los salarios iniciales de los 12 recién egresados de la carrera de Admi-
nistración
3450, 3550, 3650, 3480, 3355, 3310, 3490, 3730, 3540, 3925, 3520, 3480.
Elabore una gráfica de caja para los datos y identifique valores extremos.
Solución:
Primero las 12 mediciones se clasifican de menor a mayor:
3310, 3355, 3450, 3480, 3480, 3490, 3520, 3540, 3550, 3650, 3730, 3925.
La posiciones de la mediana, cuartil inferior y cuartil superior son:
de modo que
Un salario inicial 3925 para la carrera de Administración es un valor inusual que esta más allá del
limite superior.
La grafica de caja para los datos es como sigue:
Observe que el valor extremo se marca con un (*). como la mediana está má cerca del cuartil infe-
rior que del cuartil superior podemos concluir que los salarios iniciales son sesgado hacia la derecha.
EJERCICIOS PROPUESTOS
1. La tabla adjunta muestra la cantidad de tiempo (en horas) dedicada para estudiar por una
muestra aleatoria de 25 estudiantes de una clase numerosa.
2. Suponga que un investigador desea determinar cómo varı́an las estaturas de las persona
activas laboralmente al tomar una muestra de 40 empleados del total de personas en la
ciudad, registrando sus estatura en pulgadas. Los datos obtenidos están registrados en la
tabla de frecuencias
Distribución de frecuencias ESTATURA
Clase Limite Limite Punto Medio Frecuencia Frecuencia Frecuencia
Inferior Superior Relativa Acumulada
1 53 56 54.5 2 0.050 2
2 56 59 57.5 4 0.100 6
3 59 62 60.5 5 0.125 10
4 62 65 63.5 11 0.275 22
5 65 68 66.5 11 0.275 33
6 68 71 69.5 5 0.125 37
7 71 74 72.5 2 0.05 40
Total 40 1
3. Los datos siguientes muestran los salarios anuales más bonos pagados a los altos ejecutivos
de 16 empresas de servicios financieros. Los datos se dan en millones:
PROBLEMAS DE APLICACIÓN
1. Halle la renta personal media per capita ponderada de la siguiente muestra aleatoria de siete
ciudades de un pais.
Transporte público 28 29 32 37 33 25 29 32 41 34
Automióvil 29 31 33 32 34 30 31 32 35 33
a) Calcule la media muestral en el tiempo que se necesita con cada transporte
b) Calcule la desviación estándar para cada transporte
c) De acuerdo con los resultados en los incisos a) y b) ¿cuál será el método de transporte
preferido? Explique.
d ) Para cada medio de transporte elabore un diagrama de caja. ¿Se confirma la conclusión
que dio en el inciso c) mediante una comparación de los diagramas de caja.
BIBLIOGRAFÍA