Estadistica Aplicada A La Adm. I Clase-04

ESTADISTICA
APLICADA A LA
ADMINISTRACION I
ESCUELA ACADEMICO PROFESIONAL

DE ADMIISTRACION
Lic. Walter J. Castañeda Guzmán

Medidas de Resumen Estadístico
Posición o Dispersión o Kurtosis o

Asimetría
Tendencia Central de Variabilidad Apuntamiento
- Media Aritmética - Rango o Recorrido

COEFICIENTES
- Mediana - Varianza
- Cuartiles - Desviación Estándar
- Deciles - Coeficiente de
- Percentiles Variación
- Moda
CUANTILES
Medidas de Posición o de Tendencia Central
Estas medidas que se caracterizan porque tratan de representar a un conjunto de
datos en una posición Central.
MEDIA ARITMÉTICA:
Es el estadígrafo de posición más importante, se le denomina
simplemente MEDIA y comúnmente se le conoce como PROMEDIO. La Media
Aritmética se define y calcula dividiendo la suma de los valores de la variable
entre el número de observaciones o valores.
suma.de.valores.de.la var iable

MEDIA 
numero.de.observaciones.o.valores
Notación:
Si la variable es Xi entonces la media Aritmética se simboliza por:
X M (X ) x
Si la variable es Yi, entonces la media aritmética se simboliza por:
Y M (Y ) y
Y así sucesivamente.
Cálculo de la media aritmética: La media Aritmética tal como se define se

puede Calcular a partir de:
a) Datos no agrupados o datos originales: La media para datos no

agrupados u originales es el cociente de la suma de los valores de la variable
(Xi) dividido entre el numero de observaciones o valores ´´n´´ o ´´N´´. (donde n
es el número de datos u observaciones de una muestra y N: es en una
población). n
X
n
X i i
M (X )  X  i 1 x  i 1
n N
Media Aritmética Muestral Media Aritmética Poblacional
b) Datos Agrupados en tablas de frecuencias.- Los datos se pueden presentar
o agrupar en tablas sin intervalos o en tablas con intervalos; en ambos casos se
usa la media aritmética ponderada.
m m
Y n i i m Y n i i m
M (Y )  Y  i 1
  Yi hi y  i 1
  Yi hi
n i 1 N i 1
Media Aritmética ponderada Muestral Media Aritmética ponderada Poblacional
Nota: En las tablas con intervalos la variable Yi es la marca de clase o

punto medio.
Propiedades de la media Aritmética:
a) “La media aritmética de una constante es igual a la misma constante”.
M(K) = K K: constante
b) “La media aritmética del producto de una constante por una variable es igual
al producto de la constante por la media la media aritmética de la variable”.
M(K.Y) = K M(Y) K: constante
c) “La Media de la suma de dos o más variables, es igual a la suma de las

medias de cada una de dichas variables”.
M(X+Y+Z+.......) = M(X )+ M(Y) + M(Z) +.........
d) “La Media de una variable mas una constante, es igual a la media de la

variable más la constante”.
M(X+K) = M(X) + K K: constante

e) “Si una muestra se divide en “r” sub-muestras, entonces la media total de la
muestra, es igual a la suma de las sub-muestras ponderadas por sus respectivos
tamaños, dividido entre el tamaño de la muestra total”.
n→ӯ m
n   ni  n1  n2  n3  n4  ......  n
n2 n3 i 1
n1 ӯ2
ӯ3 m
ӯ1
ӯ5 n4
ӯ4
yn i i
n5 Y i 1
…… n
f) “La suma de las desviaciones con respecto a la media aritmética es igual a

cero, cualquiera que sea la distribución”.
m
y
i 1
i  Y  ni  0
LA MEDIANA
Es el valor que divide al total de las observaciones, ordenados en forma
ascendente o descendente, en dos partes de igual tamaño. Esto significa que a
uno y otro lado de este valor mediano se encuentre no mas del 50% del total de
las observaciones.
Notación: Generalmente a la mediana se le denota como: Med o Me.
Calculo de la Mediana: En general, si “n” es él numero total de observaciones,

entonces para calcular la mediana se toma como referencia el valor de n/2. La
mediana se puede calcular a partir de:
a) Datos no Agrupados o Datos Originales.- Los datos se ordenan en forma

ascendente o descendente y la formula útil para determinar la posición de la
mediana es:
Me  X  n 1
  
2 2
b) Para datos agrupados en tablas de frecuencia: se debe tener en cuenta
cuando se tiene:
b.1.- Datos agrupados en tablas sin intervalos: Se tienen dos casos:
1º) Sí n/2  Ni  Me = Yi
2º) Sí n/2 = Ni  Me = ½ (Yi + Yi+1)

b.2.- Datos agrupados en tablas con intervalos: Lo primero que se hace es
ubicar n/2 dentro de las frecuencias absolutas acumuladas Ni, luego se
determina el Intervalo mediano (Ime), que corresponde a la posición Ni; también
para encontrar la mediana se tienen dos casos:
1º) Si n/2 NO COINCIDE con algún Ni, se tiene que:
n/2  Ni  Ime esta en la posición i, luego la mediana es:
n 
2  N i 1 
Me  Yi 1  ci 
,

 ni 
 
Donde:
Y’i-1: Limite inferior del intervalo mediano.
Ci : Amplitud del intervalo Mediano.
Ni-1 : frecuencia absoluta acumulada hasta el intervalo anterior al Ime
ni : Frecuencia absoluta simple del intervalo mediano.

n : Numero total de observaciones.
Me : Mediana.
2º) Si n/2 COINCIDE con algún Ni, se tiene que:

n
Ni  Me  Yi '
2
Donde el intervalo mediano IMe=Y’i-1-Y’i es el intervalo que corresponde a Ni.

 Ventajas de la Mediana:
Como estadígrafo de posición, la mediana es más recomendable que la
media aritmética, cuando:
a) Existan valores extremos excepcionalmente grandes o muy pequeños,

puesto que la mediana no esta afectada por los valores extremos como
sucede con la media aritmética.
b) Se trabaja con tablas de frecuencias con intervalos en donde no se indica el

extremo inferior del primer intervalo o no se indica el extremo superior del
último intervalo o ambos casos.
c) Se tiene datos cualitativos, susceptibles de ordenarse de acuerdo a rangos,

calificaciones o categorías.
CUANTILES
LOS CUARTILES Se denotan por la letra Qr, y son estadigrafos de posición

que dividen al total de las observaciones, debidamente ordenados, en cuatro
partes de igual tamaño. Esto significa que entre dos cuartiles consecutivos se
encuentren no más del 25% del total de las observaciones.
Cálculo de los cuartiles: El procedimiento que se emplea es similar al seguido

para la mediana, con la diferencia que en vez de considerar n/2 se reemplaza
por rn/4; es decir:
 rn 
  N i 1  r=1 se calcula el cuartil primero: Q1
Qr  Yi 1  Ci  4
'
 r=2 se calcula el cuartil segundo: Q2
 ni 
  r=3 se calcula el cuartil tercero Q3
LOS DECILES Se denotan por Dr, y son estadigrafos de posición que
dividen al total de las observaciones en diez partes iguales, tal que entre dos
deciles consecutivos se encuentre no mas del 10% del total de las
observaciones.
Cálculo de los deciles: El procedimiento que se emplea es en forma similar al

seguido para la mediana y los cuartiles, con la diferencia que en vez de
considerar n/2 o rn/4 se reemplaza por rn/10. Es decir
r=1 se calcula el decil primero: D1

 rn 
  N i 1  r=2 se calcula el decil segundo: D2
Dr  Y 'i 1 Ci  10 
r=3 se calcula el decil tercero: D3
 ni 
 
  …
r=9 se calcula el decil nueve: D9
LOS PERCENTILES
Se denotan por la letra Pr, y son estadigrafos de
posición que dividen al total de las observaciones en cien (100) partes de igual
tamaño. Se aplican cuando existen numerosos valores de la variable, con una
alta frecuencia total.
Cálculo de los Percentiles: su calculo se realiza de igual manera que la

mediana, los cuartiles, los deciles, etc. Es decir
 rn  Si r=5 se calcula el percentil cinco: P5

  N i 1 
Pr  Yi 1  Ci  100
'
 Si r=15 se calcula el percentil quince P15
 ni 
  Si r=30 se calcula el percentil treinta P30
 
Si r=99 se calcula el percentil noventinueve P99
LA MODA
Denotada por la letra Mo, también se llama Modo, Valor Modal o Promedio Típico,
y simplemente es el valor de la variable que se presenta con mas frecuencia en la
distribución. Mejor dicho es el valor de la variable que le corresponde la mayor
frecuencia absoluta.
Cálculo de la Moda.- La moda se puede calcular a partir de:
Datos no agrupados o datos originales.- Se utiliza la definición de moda.

Ejemplo: Calcular la moda en las siguientes distribuciones de datos:
1°) 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13,  la moda es Mo=9

(Distribución Unimodal)
2º) 1, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9, tiene dos modas Mo=4 y Mo=7
(Distribución Bimodal)
3º) 3, 5, 8, 10, 12, 16, 18, 23, no tiene moda (Distribución Amodal)
Nota: Las distribuciones con mas de dos modas se llama Multimodal o

Plurimodal.
Para datos agrupados en tablas de frecuencia:
 Datos agrupados en tablas sin
El valor intervalos:
modal será el valor de la variable que mas se
repite o que tiene la mayor frecuencia. Es decir:
Max ni  Mo= Yi
 Datos agrupados en tablas

Se con intervalos:
determina el intervalo modal (Imo), que es el
intervalo que le corresponde a la mayor frecuencia; y luego la moda se calcula
así:
 d1 
Mo  Yi ' 1  C i  
 d1  d 2 
Donde: d1= Max ni – ni-1
d2= Max ni – ni+1

Medidas o Estadígrafos de Dispersión o de Variación
Existen distribuciones que siendo diferentes tienen valores iguales para algunos
de sus estadigrafos de posición; asi por ejemplo en los siguientes datos hallar la
Media, Mediana y la Moda:
a) 3, 7, 46, 67, 81,  la Media = 40.8, Me = 46, y la Mo = Amodal (no tiene)

b) 15, 38, 46, 52, 53,  la Media = 40.8, Me = 46, y la Mo = Amodal (no tiene)
Luego tienen igual media, mediana y moda; estos resultados pueden conducir a
conclusiones equivocadas cuando se esta comparando distribuciones o
poblaciones. Para superar esta limitación se propone construir otros que
permitan analizar otras características; como son los ESTADIGRAFOS DE
DISPERSION, que tratan de analizar la desviación o dispersión de los datos
respecto a un valor central.
Entre las medidas de dispersión o variación de mayor uso tenemos:
Recorrido o Rango Desviación media

Recorrido Semi Intercuartil Varianza
Desviación estándar o típica Coeficiente de Variación
Analizando cada uno de estos Estadígrafos de uso más frecuente tenemos:
Recorrido o Rango
El recorrido o rango se le denota por la letra (R) , y simplemente es la diferencia

entre el Mayor y Menor valor de la variable. Su cálculo se puede encontrar de la
siguiente manera:
R  X max  X min R  Ym'  Y0'

Para datos no agrupados Para datos agrupados en intervalos
El Recorrido o Rango como estadígrafo de dispersión su uso es muy limitado,
pues solo considera los valores extremos de la distribución, y no dice nada como
se dispersan los valores intermedios, es decir no expresa la dispersión de los (n-
2) valores de la variable.
DESVIACION MEDIA O PROMEDIO
Denotado por (DM) o (DP), expresan el promedio de las desviaciones respecto a

la media aritmética. Se calculan a partir de:
Datos no Agrupados.- La desviación media o desviación promedio de un

conjunto de observaciones: x1, x2, x3, ....xn se define por:
n
X i X
DM  i 1
n
Donde:
Para datos Agrupados.- Un conjunto de valores de la variable : y1, y2, y3, ....ym
que ocurren con frecuencias: n1, n2, n3, ....nm respectivamente, la desviación
m
media se obtiene así:
y i  Y ni
DM  i 1
n
RECORRIDO SEMI INTERCUARTIL
La desviación cuartil de un conjunto de datos esta denotado por la letra (Q) y
definido por:
Q  Q1
Q 3
2
Donde Q1 y Q3 son el primer y tercer cuartil de los datos. Téngase en cuenta que
a veces se usa el “Recorrido Intercuartil Q3-Q1”.

El Recorrido Semi-Intercuartil o desviación cuartil, da una idea de la dispersión
del 50% de los datos centrales
NOTA: También se puede considerar ½ (Q1+Q3) como una medida de tendencia
central, que permitiría obtener un valor aproximado de la media o valor de la
variable promedio.
LA VARIANZA
Es el estadígrafo de dispersión más importante, y expresa el grado de dispersión

de las observaciones respecto a la media aritmética.
La notación de la varianza generalmente es:
2 para la varianza poblacional

S2 para la varianza muestral
Además se puede denotar así:
V(X) si la variable es Xi (sea una muestra o población)
V(Y) si la variable es Yi (sea una muestra o población)

Calculo de la Varianza.- Para calcular la Varianza se debe tener en cuenta a
partir de:
a) Para Datos no agrupados o Datos originales:
La Varianza Poblacional es:

n n n
 X i  
2
X i
2
X i
2  i 1
2  i 1
 2 donde :   i 1
N N N
Expresión por definición Fórmula práctica
La Varianza Muestral es:

2
n
 n 2  n 
X  X
n
X n  X i     X i 
2 2
i i
2
 nX
S2  i 1
S2  i 1
S 2   i 1   i 1 
n 1 n 1 n( n  1)
b) Para Datos Agrupados en tablas de frecuencias: La varianza se puede
calcular:
La Varianza Poblacional es:

m m m
X i    ni
2
X 2
n
i i X n i i
2  i 1
2  i 1
 2 donde ..  i 1
N N N
La Varianza Muestral es:

2
n m 2
 m
  m

X i  X  ni
2
X n  nX
2
i i
n  X i2 ni     X i ni 
S2  i 1
S2  i 1 S 2   i 1   i 1 
n 1 n 1 n( n  1)

Propiedades que cumple la Varianza:
a) “Para cualquier distribución la Varianza es siempre una cantidad no

negativa”. S 2
0
b) “Si el valor de las observaciones son todas iguales, entonces la varianza es

cero”.
V(K)=0 donde
c) “La varianza de una constante es cero”.
K=constante
d) “La varianza del producto de una constante por una variable es igual al
cuadrado de la constante por la varianza de la variable”.
V(KX) = K2V(X) donde K = constante.
d) “La varianza de la suma de una variable mas una constante, es igual a la

varianza de la variable”.
V(X + K) = V(X) donde K = constante.
LA DESVIACIÓN ESTÁNDAR O TÍPICA
La desviación estándar o típica, se define como la raíz cuadrada positiva de la

Varianza.
La Notación:
s: Desviación estándar poblacional

S: Desviación estándar muestral
Calculo de la desviación estándar:
Según la definición se tendría que tanto para datos no Agrupados o datos

agrupados en tablas de frecuencias él calculo de la desviación estándar seria
de la siguiente manera:
  2 S   S2
Desviación estándar Poblacional Desviación estándar muestral

COEFICIENTE DE VARIACIÓN
Indica la magnitud relativa de la desviación estándar comparada con la media

aritmética de la distribución; es decir:
Desviacion Es tan dar
Coeficiente de Variacion
Media Aritmetica
Notación y Cálculo del Coeficiente de Variación:
 S
CV  CV 
 X
Coeficiente de variación Poblacional Coeficiente de variación Muestral
CV  30% Se dice que los datos son homogéneos.
30% < CV  50% Los datos son heterogéneos.
CV > 50% No es recomendable los datos para

análisis. Muestrear nuevamente.
Alcances del Coeficiente de Variación:
- El valor del CV se puede expresar en términos porcentuales
- Es un estadígrafo que se utiliza para comparar dos o más distribuciones, aun

cuando las unidades o escalas de medida de las variables están expresadas
en forma diferente. Por ejemplo soles y dólares, centímetros y metros,
gramos y kilogramos, etc.
- Cuando se comparan dos o más distribuciones, es más homogénea o

presenta menos discrepancia, aquella distribución que tiene el menor
coeficiente de variación. En otras palabras, los datos son más heterogéneos
cuando tienen mayor coeficiente de variación.
COEFICIENTE DE ASIMETRÍA
El objetivo de la medida de la asimetría es, sin necesidad de dibujar la

distribución de frecuencias, estudiar la deformación horizontal de los valores
de la variable respecto al valor central de la media. Las medidas de forma
pretenden estudiar la concentración de la variable hacia uno de sus extremos.
Una distribución es simétrica cuando a la derecha y a la izquierda de la media

existe el mismo número de valores, equidistantes dos a dos de la media, y
además con la misma frecuencia.
Una distribución es Simétrica si:
En caso contrario, decimos que la distribución es Asimétrica, y entonces

puede ser de dos tipos:
GRÁFICOS
Curva de As (+) Curva de As (-)
Mo ≤ Me ≤ X
X ≤ Me ≤ Mo
Curva de As simétrica
Mo
X
Me
COEFICIENTE DE ASIMETRIA DE FISHER:
En una distribución simétrica los valores se sitúan en torno a la media

aritmética de forma simétrica. El coeficiente de asimetría de Fisher se basa en
la relación entre las distancias a la media y la desviación típica.
En una distribución simétrica: Por eso se define como:
- Si g1 > 0, la distribución es asimétrica positiva o a la derecha.
- Si g1 = 0, la distribución es simétrica.
- Si g1 < 0, la distribución es asimétrica negativa o a la izquierda.

COEFICIENTE DE ASIMETRIA DE PEARSON:
Se basa en el hecho de que en una distribución simétrica, la media coincide

con la moda. A partir de este dato se define el coeficiente de asimetría de
Pearson como:
- Si As > 0, la distribución es asimétrica positiva o a la derecha.
- Si As = 0, la distribución es simétrica.
- Si As < 0, la distribución es asimétrica negativa o a la izquierda.

COEFICIENTE DE ASIMETRIA DE BOWLEY:
Varía entre ±1 y es 0 en la distribución normal.
- Si As > 0, la distribución es asimétrica positiva o a la derecha.
- Si As = 0, la distribución es simétrica.
- Si As < 0, la distribución es asimétrica negativa o a la izquierda.

COEFICIENTE DE CURTOSIS O APUNTAMIENTO
El concepto de curtosis o apuntamiento de una distribución surge al comparar

la forma de dicha distribución con la forma de la distribución Normal. De esta
forma, clasificaremos las distribuciones según sean más o menos apuntadas
que la distribución Normal.
Coeficiente de Curtosis de Fischer:
El Coeficiente de Curtosis o Apuntamiento de Fischer pretende comparar la

curva de una distribución con la curva de la variable Normal, en función de la
cantidad de valores extremos e la distribución. Basándose en el dato de que
en una distribución normal se verifica que:
Se define el Coeficiente de Curtosis de Fisher como:
Una distribución es Mesocúrtica si la distribución de sus datos es la

misma que la de la variable Normal. En ese caso, su coeficiente de curtosis
es cero.
g2 = 0 Distribución Mesocúrtica.
La distribución es Leptocúrtica si está más apuntada que la Normal. En
ese caso, su coeficiente de curtosis es positivo.
g2 > 0 Distribución Leptocúrtica.
Si la distribución está menos apuntada que la Normal, entonces es

Platicúrtica, y su coeficiente de Fisher es negativo.
g2 < 0 Distribución Platicúrtica.

COEFICIENTE DE CURTOSIS PERCENTÍLICO
P75  P25
K
2 P90  P10 
K>0 K=0 K<0
Mayor concentración Una concentración Baja Concentración

de Datos normal

Estadistica Aplicada A La Adm. I Clase-04

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Aplicada A La Adm. I Clase-04

Cargado por

Copyright:

Formatos disponibles

ESTADISTICA

ESCUELA ACADEMICO PROFESIONAL

Lic. Walter J. Castañeda Guzmán

Posición o Dispersión o Kurtosis o

- Media Aritmética - Rango o Recorrido

suma.de.valores.de.la var iable

Cálculo de la media aritmética: La media Aritmética tal como se define se

a) Datos no agrupados o datos originales: La media para datos no

Media Aritmética ponderada Muestral Media Aritmética ponderada Poblacional

Nota: En las tablas con intervalos la variable Yi es la marca de clase o

Propiedades de la media Aritmética:

a) “La media aritmética de una constante es igual a la misma constante”.

M(K.Y) = K M(Y) K: constante

c) “La Media de la suma de dos o más variables, es igual a la suma de las

M(X+Y+Z+.......) = M(X )+ M(Y) + M(Z) +.........

d) “La Media de una variable mas una constante, es igual a la media de la

M(X+K) = M(X) + K K: constante

f) “La suma de las desviaciones con respecto a la media aritmética es igual a

Notación: Generalmente a la mediana se le denota como: Med o Me.

Calculo de la Mediana: En general, si “n” es él numero total de observaciones,

a) Datos no Agrupados o Datos Originales.- Los datos se ordenan en forma

2º) Sí n/2 = Ni  Me = ½ (Yi + Yi+1)

Y’i-1: Limite inferior del intervalo mediano.

Ci : Amplitud del intervalo Mediano.

Ni-1 : frecuencia absoluta acumulada hasta el intervalo anterior al Ime

ni : Frecuencia absoluta simple del intervalo mediano.

2º) Si n/2 COINCIDE con algún Ni, se tiene que:

Donde el intervalo mediano IMe=Y’i-1-Y’i es el intervalo que corresponde a Ni.

a) Existan valores extremos excepcionalmente grandes o muy pequeños,

b) Se trabaja con tablas de frecuencias con intervalos en donde no se indica el

c) Se tiene datos cualitativos, susceptibles de ordenarse de acuerdo a rangos,

LOS CUARTILES Se denotan por la letra Qr, y son estadigrafos de posición

Cálculo de los cuartiles: El procedimiento que se emplea es similar al seguido

Cálculo de los deciles: El procedimiento que se emplea es en forma similar al

r=1 se calcula el decil primero: D1

Cálculo de los Percentiles: su calculo se realiza de igual manera que la

 rn  Si r=5 se calcula el percentil cinco: P5

Datos no agrupados o datos originales.- Se utiliza la definición de moda.

1°) 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13,  la moda es Mo=9

Nota: Las distribuciones con mas de dos modas se llama Multimodal o

 Datos agrupados en tablas

Donde: d1= Max ni – ni-1

d2= Max ni – ni+1

a) 3, 7, 46, 67, 81,  la Media = 40.8, Me = 46, y la Mo = Amodal (no tiene)

Recorrido o Rango Desviación media

Analizando cada uno de estos Estadígrafos de uso más frecuente tenemos:

El recorrido o rango se le denota por la letra (R) , y simplemente es la diferencia

R  X max  X min R  Ym'  Y0'

DESVIACION MEDIA O PROMEDIO

Denotado por (DM) o (DP), expresan el promedio de las desviaciones respecto a

Datos no Agrupados.- La desviación media o desviación promedio de un

a veces se usa el “Recorrido Intercuartil Q3-Q1”.

Es el estadígrafo de dispersión más importante, y expresa el grado de dispersión

La notación de la varianza generalmente es:

2 para la varianza poblacional

Además se puede denotar así:

V(X) si la variable es Xi (sea una muestra o población)

V(Y) si la variable es Yi (sea una muestra o población)

a) Para Datos no agrupados o Datos originales:

La Varianza Poblacional es:

Expresión por definición Fórmula práctica

La Varianza Muestral es:

La Varianza Poblacional es: