Está en la página 1de 36

ESTADISTICA

APLICADA A LA
ADMINISTRACION I

ESCUELA ACADEMICO PROFESIONAL


DE ADMIISTRACION

Lic. Walter J. Castañeda Guzmán


Medidas de Resumen Estadístico

Posición o Dispersión o Kurtosis o


Asimetría
Tendencia Central de Variabilidad Apuntamiento

- Media Aritmética - Rango o Recorrido


COEFICIENTES
- Mediana - Varianza
- Cuartiles - Desviación Estándar
- Deciles - Coeficiente de
- Percentiles Variación
- Moda

CUANTILES
Medidas de Posición o de Tendencia Central
Estas medidas que se caracterizan porque tratan de representar a un conjunto de
datos en una posición Central.

MEDIA ARITMÉTICA:
Es el estadígrafo de posición más importante, se le denomina
simplemente MEDIA y comúnmente se le conoce como PROMEDIO. La Media
Aritmética se define y calcula dividiendo la suma de los valores de la variable
entre el número de observaciones o valores.

suma.de.valores.de.la var iable


MEDIA 
numero.de.observaciones.o.valores
Notación:
Si la variable es Xi entonces la media Aritmética se simboliza por:

X M (X ) x
Si la variable es Yi, entonces la media aritmética se simboliza por:
Y M (Y ) y
Y así sucesivamente.

Cálculo de la media aritmética: La media Aritmética tal como se define se


puede Calcular a partir de:

a) Datos no agrupados o datos originales: La media para datos no


agrupados u originales es el cociente de la suma de los valores de la variable
(Xi) dividido entre el numero de observaciones o valores ´´n´´ o ´´N´´. (donde n
es el número de datos u observaciones de una muestra y N: es en una
población). n

X
n

X i i

M (X )  X  i 1 x  i 1

n N
Media Aritmética Muestral Media Aritmética Poblacional
b) Datos Agrupados en tablas de frecuencias.- Los datos se pueden presentar
o agrupar en tablas sin intervalos o en tablas con intervalos; en ambos casos se
usa la media aritmética ponderada.
m m

Y n i i m Y n i i m
M (Y )  Y  i 1
  Yi hi y  i 1
  Yi hi
n i 1 N i 1

Media Aritmética ponderada Muestral Media Aritmética ponderada Poblacional

Nota: En las tablas con intervalos la variable Yi es la marca de clase o


punto medio.

Propiedades de la media Aritmética:

a) “La media aritmética de una constante es igual a la misma constante”.

M(K) = K K: constante
b) “La media aritmética del producto de una constante por una variable es igual
al producto de la constante por la media la media aritmética de la variable”.

M(K.Y) = K M(Y) K: constante

c) “La Media de la suma de dos o más variables, es igual a la suma de las


medias de cada una de dichas variables”.

M(X+Y+Z+.......) = M(X )+ M(Y) + M(Z) +.........

d) “La Media de una variable mas una constante, es igual a la media de la


variable más la constante”.

M(X+K) = M(X) + K K: constante


e) “Si una muestra se divide en “r” sub-muestras, entonces la media total de la
muestra, es igual a la suma de las sub-muestras ponderadas por sus respectivos
tamaños, dividido entre el tamaño de la muestra total”.

n→ӯ m
n   ni  n1  n2  n3  n4  ......  n
n2 n3 i 1
n1 ӯ2
ӯ3 m
ӯ1
ӯ5 n4
ӯ4
yn i i
n5 Y i 1

…… n

f) “La suma de las desviaciones con respecto a la media aritmética es igual a


cero, cualquiera que sea la distribución”.
m

y
i 1
i  Y  ni  0
LA MEDIANA
Es el valor que divide al total de las observaciones, ordenados en forma
ascendente o descendente, en dos partes de igual tamaño. Esto significa que a
uno y otro lado de este valor mediano se encuentre no mas del 50% del total de
las observaciones.

Notación: Generalmente a la mediana se le denota como: Med o Me.

Calculo de la Mediana: En general, si “n” es él numero total de observaciones,


entonces para calcular la mediana se toma como referencia el valor de n/2. La
mediana se puede calcular a partir de:

a) Datos no Agrupados o Datos Originales.- Los datos se ordenan en forma


ascendente o descendente y la formula útil para determinar la posición de la
mediana es:
Me  X  n 1
  
2 2
b) Para datos agrupados en tablas de frecuencia: se debe tener en cuenta
cuando se tiene:
b.1.- Datos agrupados en tablas sin intervalos: Se tienen dos casos:

1º) Sí n/2  Ni  Me = Yi

2º) Sí n/2 = Ni  Me = ½ (Yi + Yi+1)


b.2.- Datos agrupados en tablas con intervalos: Lo primero que se hace es
ubicar n/2 dentro de las frecuencias absolutas acumuladas Ni, luego se
determina el Intervalo mediano (Ime), que corresponde a la posición Ni; también
para encontrar la mediana se tienen dos casos:
1º) Si n/2 NO COINCIDE con algún Ni, se tiene que:
n/2  Ni  Ime esta en la posición i, luego la mediana es:

n 
2  N i 1 
Me  Yi 1  ci 
,

 ni 
 
Donde:

Y’i-1: Limite inferior del intervalo mediano.

Ci : Amplitud del intervalo Mediano.

Ni-1 : frecuencia absoluta acumulada hasta el intervalo anterior al Ime

ni : Frecuencia absoluta simple del intervalo mediano.


n : Numero total de observaciones.
Me : Mediana.

2º) Si n/2 COINCIDE con algún Ni, se tiene que:


n
Ni  Me  Yi '
2

Donde el intervalo mediano IMe=Y’i-1-Y’i es el intervalo que corresponde a Ni.


 Ventajas de la Mediana:
Como estadígrafo de posición, la mediana es más recomendable que la
media aritmética, cuando:

a) Existan valores extremos excepcionalmente grandes o muy pequeños,


puesto que la mediana no esta afectada por los valores extremos como
sucede con la media aritmética.

b) Se trabaja con tablas de frecuencias con intervalos en donde no se indica el


extremo inferior del primer intervalo o no se indica el extremo superior del
último intervalo o ambos casos.

c) Se tiene datos cualitativos, susceptibles de ordenarse de acuerdo a rangos,


calificaciones o categorías.
CUANTILES

LOS CUARTILES Se denotan por la letra Qr, y son estadigrafos de posición


que dividen al total de las observaciones, debidamente ordenados, en cuatro
partes de igual tamaño. Esto significa que entre dos cuartiles consecutivos se
encuentren no más del 25% del total de las observaciones.

Cálculo de los cuartiles: El procedimiento que se emplea es similar al seguido


para la mediana, con la diferencia que en vez de considerar n/2 se reemplaza
por rn/4; es decir:

 rn 
  N i 1  r=1 se calcula el cuartil primero: Q1
Qr  Yi 1  Ci  4
'
 r=2 se calcula el cuartil segundo: Q2
 ni 
  r=3 se calcula el cuartil tercero Q3
LOS DECILES Se denotan por Dr, y son estadigrafos de posición que
dividen al total de las observaciones en diez partes iguales, tal que entre dos
deciles consecutivos se encuentre no mas del 10% del total de las
observaciones.

Cálculo de los deciles: El procedimiento que se emplea es en forma similar al


seguido para la mediana y los cuartiles, con la diferencia que en vez de
considerar n/2 o rn/4 se reemplaza por rn/10. Es decir

r=1 se calcula el decil primero: D1


 rn 
  N i 1  r=2 se calcula el decil segundo: D2
Dr  Y 'i 1 Ci  10 
r=3 se calcula el decil tercero: D3
 ni 
 
  …
r=9 se calcula el decil nueve: D9
LOS PERCENTILES
Se denotan por la letra Pr, y son estadigrafos de
posición que dividen al total de las observaciones en cien (100) partes de igual
tamaño. Se aplican cuando existen numerosos valores de la variable, con una
alta frecuencia total.

Cálculo de los Percentiles: su calculo se realiza de igual manera que la


mediana, los cuartiles, los deciles, etc. Es decir

 rn  Si r=5 se calcula el percentil cinco: P5


  N i 1 
Pr  Yi 1  Ci  100
'
 Si r=15 se calcula el percentil quince P15
 ni 
  Si r=30 se calcula el percentil treinta P30
 
Si r=99 se calcula el percentil noventinueve P99
LA MODA

Denotada por la letra Mo, también se llama Modo, Valor Modal o Promedio Típico,
y simplemente es el valor de la variable que se presenta con mas frecuencia en la
distribución. Mejor dicho es el valor de la variable que le corresponde la mayor
frecuencia absoluta.
Cálculo de la Moda.- La moda se puede calcular a partir de:

Datos no agrupados o datos originales.- Se utiliza la definición de moda.


Ejemplo: Calcular la moda en las siguientes distribuciones de datos:

1°) 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13,  la moda es Mo=9


(Distribución Unimodal)
2º) 1, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9, tiene dos modas Mo=4 y Mo=7
(Distribución Bimodal)
3º) 3, 5, 8, 10, 12, 16, 18, 23, no tiene moda (Distribución Amodal)

Nota: Las distribuciones con mas de dos modas se llama Multimodal o


Plurimodal.
Para datos agrupados en tablas de frecuencia:
 Datos agrupados en tablas sin
El valor intervalos:
modal será el valor de la variable que mas se
repite o que tiene la mayor frecuencia. Es decir:

Max ni  Mo= Yi

 Datos agrupados en tablas


Se con intervalos:
determina el intervalo modal (Imo), que es el
intervalo que le corresponde a la mayor frecuencia; y luego la moda se calcula
así:

 d1 
Mo  Yi ' 1  C i  
 d1  d 2 

Donde: d1= Max ni – ni-1

d2= Max ni – ni+1


Medidas o Estadígrafos de Dispersión o de Variación

Existen distribuciones que siendo diferentes tienen valores iguales para algunos
de sus estadigrafos de posición; asi por ejemplo en los siguientes datos hallar la
Media, Mediana y la Moda:

a) 3, 7, 46, 67, 81,  la Media = 40.8, Me = 46, y la Mo = Amodal (no tiene)


b) 15, 38, 46, 52, 53,  la Media = 40.8, Me = 46, y la Mo = Amodal (no tiene)

Luego tienen igual media, mediana y moda; estos resultados pueden conducir a
conclusiones equivocadas cuando se esta comparando distribuciones o
poblaciones. Para superar esta limitación se propone construir otros que
permitan analizar otras características; como son los ESTADIGRAFOS DE
DISPERSION, que tratan de analizar la desviación o dispersión de los datos
respecto a un valor central.
Entre las medidas de dispersión o variación de mayor uso tenemos:

Recorrido o Rango Desviación media


Recorrido Semi Intercuartil Varianza
Desviación estándar o típica Coeficiente de Variación

Analizando cada uno de estos Estadígrafos de uso más frecuente tenemos:

Recorrido o Rango

El recorrido o rango se le denota por la letra (R) , y simplemente es la diferencia


entre el Mayor y Menor valor de la variable. Su cálculo se puede encontrar de la
siguiente manera:

R  X max  X min R  Ym'  Y0'


Para datos no agrupados Para datos agrupados en intervalos
El Recorrido o Rango como estadígrafo de dispersión su uso es muy limitado,
pues solo considera los valores extremos de la distribución, y no dice nada como
se dispersan los valores intermedios, es decir no expresa la dispersión de los (n-
2) valores de la variable.

DESVIACION MEDIA O PROMEDIO

Denotado por (DM) o (DP), expresan el promedio de las desviaciones respecto a


la media aritmética. Se calculan a partir de:

Datos no Agrupados.- La desviación media o desviación promedio de un


conjunto de observaciones: x1, x2, x3, ....xn se define por:
n

X i X
DM  i 1
n
Donde:
Para datos Agrupados.- Un conjunto de valores de la variable : y1, y2, y3, ....ym

que ocurren con frecuencias: n1, n2, n3, ....nm respectivamente, la desviación
m
media se obtiene así:
y i  Y ni
DM  i 1
n
RECORRIDO SEMI INTERCUARTIL
La desviación cuartil de un conjunto de datos esta denotado por la letra (Q) y
definido por:
Q  Q1
Q 3
2

Donde Q1 y Q3 son el primer y tercer cuartil de los datos. Téngase en cuenta que

a veces se usa el “Recorrido Intercuartil Q3-Q1”.


El Recorrido Semi-Intercuartil o desviación cuartil, da una idea de la dispersión
del 50% de los datos centrales
NOTA: También se puede considerar ½ (Q1+Q3) como una medida de tendencia
central, que permitiría obtener un valor aproximado de la media o valor de la
variable promedio.
LA VARIANZA

Es el estadígrafo de dispersión más importante, y expresa el grado de dispersión


de las observaciones respecto a la media aritmética.

La notación de la varianza generalmente es:

2 para la varianza poblacional


S2 para la varianza muestral

Además se puede denotar así:

V(X) si la variable es Xi (sea una muestra o población)

V(Y) si la variable es Yi (sea una muestra o población)


Calculo de la Varianza.- Para calcular la Varianza se debe tener en cuenta a
partir de:

a) Para Datos no agrupados o Datos originales:

La Varianza Poblacional es:


n n n

 X i  
2
X i
2
X i

2  i 1
2  i 1
 2 donde :   i 1

N N N

Expresión por definición Fórmula práctica

La Varianza Muestral es:


2
n
 n 2  n 
X  X
n

X n  X i     X i 
2 2
i i
2
 nX
S2  i 1
S2  i 1
S 2   i 1   i 1 
n 1 n 1 n( n  1)
Expresión por definición Fórmula práctica
b) Para Datos Agrupados en tablas de frecuencias: La varianza se puede
calcular:

La Varianza Poblacional es:


m m m

X i    ni
2
X 2
n
i i X n i i
2  i 1
2  i 1
 2 donde ..  i 1
N N N
Expresión por definición Fórmula práctica

La Varianza Muestral es:


2
n m 2
 m
  m

X i  X  ni
2
X n  nX
2
i i
n  X i2 ni     X i ni 
S2  i 1
S2  i 1 S 2   i 1   i 1 
n 1 n 1 n( n  1)

Expresión por definición Fórmula práctica


Propiedades que cumple la Varianza:

a) “Para cualquier distribución la Varianza es siempre una cantidad no


negativa”. S 2
0

b) “Si el valor de las observaciones son todas iguales, entonces la varianza es


cero”.
V(K)=0 donde
c) “La varianza de una constante es cero”.
K=constante
d) “La varianza del producto de una constante por una variable es igual al
cuadrado de la constante por la varianza de la variable”.

V(KX) = K2V(X) donde K = constante.

d) “La varianza de la suma de una variable mas una constante, es igual a la


varianza de la variable”.
V(X + K) = V(X) donde K = constante.
LA DESVIACIÓN ESTÁNDAR O TÍPICA

La desviación estándar o típica, se define como la raíz cuadrada positiva de la


Varianza.
La Notación:

s: Desviación estándar poblacional


S: Desviación estándar muestral

Calculo de la desviación estándar:

Según la definición se tendría que tanto para datos no Agrupados o datos


agrupados en tablas de frecuencias él calculo de la desviación estándar seria
de la siguiente manera:

  2 S   S2

Desviación estándar Poblacional Desviación estándar muestral


COEFICIENTE DE VARIACIÓN

Indica la magnitud relativa de la desviación estándar comparada con la media


aritmética de la distribución; es decir:
Desviacion Es tan dar
Coeficiente de Variacion
Media Aritmetica

Notación y Cálculo del Coeficiente de Variación:

 S
CV  CV 
 X

Coeficiente de variación Poblacional Coeficiente de variación Muestral

CV  30% Se dice que los datos son homogéneos.

30% < CV  50% Los datos son heterogéneos.

CV > 50% No es recomendable los datos para


análisis. Muestrear nuevamente.
Alcances del Coeficiente de Variación:

- El valor del CV se puede expresar en términos porcentuales

- Es un estadígrafo que se utiliza para comparar dos o más distribuciones, aun


cuando las unidades o escalas de medida de las variables están expresadas
en forma diferente. Por ejemplo soles y dólares, centímetros y metros,
gramos y kilogramos, etc.

- Cuando se comparan dos o más distribuciones, es más homogénea o


presenta menos discrepancia, aquella distribución que tiene el menor
coeficiente de variación. En otras palabras, los datos son más heterogéneos
cuando tienen mayor coeficiente de variación.
COEFICIENTE DE ASIMETRÍA

El objetivo de la medida de la asimetría es, sin necesidad de dibujar la


distribución de frecuencias, estudiar la deformación horizontal de los valores
de la variable respecto al valor central de la media. Las medidas de forma
pretenden estudiar la concentración de la variable hacia uno de sus extremos.

Una distribución es simétrica cuando a la derecha y a la izquierda de la media


existe el mismo número de valores, equidistantes dos a dos de la media, y
además con la misma frecuencia.

Una distribución es Simétrica si:

En caso contrario, decimos que la distribución es Asimétrica, y entonces


puede ser de dos tipos:
GRÁFICOS

Curva de As (+) Curva de As (-)

Mo ≤ Me ≤ X
X ≤ Me ≤ Mo

Curva de As simétrica

Mo
X
Me
COEFICIENTE DE ASIMETRIA DE FISHER:

En una distribución simétrica los valores se sitúan en torno a la media


aritmética de forma simétrica. El coeficiente de asimetría de Fisher se basa en
la relación entre las distancias a la media y la desviación típica.

En una distribución simétrica: Por eso se define como:

- Si g1 > 0, la distribución es asimétrica positiva o a la derecha.

- Si g1 = 0, la distribución es simétrica.

- Si g1 < 0, la distribución es asimétrica negativa o a la izquierda.


COEFICIENTE DE ASIMETRIA DE PEARSON:

Se basa en el hecho de que en una distribución simétrica, la media coincide


con la moda. A partir de este dato se define el coeficiente de asimetría de
Pearson como:

- Si As > 0, la distribución es asimétrica positiva o a la derecha.

- Si As = 0, la distribución es simétrica.

- Si As < 0, la distribución es asimétrica negativa o a la izquierda.


COEFICIENTE DE ASIMETRIA DE BOWLEY:

Varía entre ±1 y es 0 en la distribución normal.

- Si As > 0, la distribución es asimétrica positiva o a la derecha.

- Si As = 0, la distribución es simétrica.

- Si As < 0, la distribución es asimétrica negativa o a la izquierda.


COEFICIENTE DE CURTOSIS O APUNTAMIENTO

El concepto de curtosis o apuntamiento de una distribución surge al comparar


la forma de dicha distribución con la forma de la distribución Normal. De esta
forma, clasificaremos las distribuciones según sean más o menos apuntadas
que la distribución Normal.

Coeficiente de Curtosis de Fischer:

El Coeficiente de Curtosis o Apuntamiento de Fischer pretende comparar la


curva de una distribución con la curva de la variable Normal, en función de la
cantidad de valores extremos e la distribución. Basándose en el dato de que
en una distribución normal se verifica que:
Se define el Coeficiente de Curtosis de Fisher como:

Una distribución es Mesocúrtica si la distribución de sus datos es la


misma que la de la variable Normal. En ese caso, su coeficiente de curtosis
es cero.

g2 = 0 Distribución Mesocúrtica.
La distribución es Leptocúrtica si está más apuntada que la Normal. En
ese caso, su coeficiente de curtosis es positivo.

g2 > 0 Distribución Leptocúrtica.

Si la distribución está menos apuntada que la Normal, entonces es


Platicúrtica, y su coeficiente de Fisher es negativo.

g2 < 0 Distribución Platicúrtica.


COEFICIENTE DE CURTOSIS PERCENTÍLICO

P75  P25
K
2 P90  P10 

K>0 K=0 K<0

Mayor concentración Una concentración Baja Concentración


de Datos normal

También podría gustarte