Está en la página 1de 75

Medidas estadísticas.

Unidad 1: Organización de Datos y medidas de


resumen
Estadística 1
Mgtr. Randy Fernández
Ciencias Económicas y
Empresariales
Medidas de tendencia central y de
posición

Objetivo: Identificar la ubicación de aquellos valores


alrededor de los cuales tienden a agruparse
las observaciones.

Universidad de Piura
Medidas de tendencia central

• Media Aritmética Simple


• Media Aritmética Ponderada
• Mediana
• Moda

Universidad de Piura
Media Aritmética Simple
La media o promedio aritmético simple se define como el cociente entre
la suma de los datos u observaciones y el número de datos que
intervienen en dicha suma.

POBLACION MUESTRA

N n
∑X i
∑ Xi
µX = i =1
N X= i =1
n
Xi : Valor del i-ésimo dato u observación.
N : Tamaño de la población.
n : Tamaño de la muestra.

Universidad de Piura
Propiedades de la Media Aritmética
1. Es un valor representativo, debido a que es el centro de
gravedad o punto de equilibrio de un conjunto de
observaciones.

2. La suma de las desviaciones de las observaciones respecto a


la media aritmética es igual a cero.

∑ (X − µ )= 0
N

i X
i =1

∑ (X − X ) = 0
n

i
i =1

Universidad de Piura
Propiedades de la Media Aritmética
3. Si se sustituye el valor de cada observación por el valor del
promedio aritmético, la suma de todas las observaciones no
cambia.
4. La suma de los cuadrados de las desviaciones de las
observaciones con respecto a la media aritmética es un valor
mínimo.

∑ (X − µ ) es un valor mínimo
N 2

i X
i =1

∑ (X − X )
n 2

i =1
i
es un valor mínimo
Universidad de Piura
Propiedades de la Media Aritmética
5. Si un conjunto de datos se divide en “K” subconjuntos, la media
aritmética del conjunto es igual a la media ponderada de las
medias de los “K” subconjuntos, considerándose como
ponderaciones pesos a las cantidades de datos de los “K”
subconjuntos.
N1 , µ 1

N1µ1 + N 2µ 2 + N 3µ3
N2 , µ 2 µ=
N, µ N1 + N 2 + N 3
N3 , µ 3

N=N1+N2+N3
Universidad de Piura
Propiedades de la Media Aritmética
6. Si a cada observación de un conjunto inicial de datos se le
suma una constante, la media aritmética del nuevo conjunto de
datos será igual a la media aritmética del conjunto inicial más
la constante.
Población inicial Población nueva

X1 , Y1 = X1 +K,
...
X2 , Yi=Xi+K
...
Y2 = X2 +K,

XN Y = X +K
N N

N N
µ Y = ∑ (Xi + k ) = µ X + K
1 1
µ X = ∑ Xi N i =1
N i=1
Universidad de Piura
Propiedades de la Media Aritmética
7. Si a cada observación de un conjunto inicial de datos se le
multiplica una constante, la media aritmética del nuevo
conjunto de datos será igual a la media aritmética del conjunto
inicial por la constante.
Población inicial Población nueva

X1 ,
...
X2 ,
Yi= K Xi
Y1 = K X1,
...
Y2 = K X2,
XN
Y =K X
N N

N
1
µ X = ∑ Xi µY = K µX
N i=1
Universidad de Piura
Propiedades de la Media Aritmética
8. El promedio aritmético de la suma o diferencia de dos o más
variables es igual a la suma o diferencia de las medias
aritméticas de dichas variables.
Población inicial
Población nueva

X1 ,
...
Y1 = X1 + W1 - Z1 ,
...
X2 , Yi= Xi + Wi -Zi
Y2 = X2 + W2 - Z2,

XN
Y =X +W -Z
N N N N

1 N 1 N
µ Y = ∑ Yi = ∑ (X i + Wi − Z i ) = µ X + µ W − µ Z
N i =1 N i =1
Universidad de Piura
Propiedades de la Media Aritmética
9. Si Yi = a + bXi ; entonces, µY = a + b µX

Población inicial Población nueva

X1 , Y1 = a + b X1,
...
X2 , Yi= a + b Xi
...
Y2 = a + b X2,

XN Y =a+bX
N N

N
1
µ X = ∑ Xi µY = a + b µX
N i=1
Universidad de Piura
Desventaja de la Media Aritmética

• La media aritmética está afectada por los


llamados valores extremos.

• Solamente se puede aplicar si todos los


datos u observaciones tienen la misma
importancia relativa

Universidad de Piura
Ejemplo: Cálculo de promedio para datos no
organizados en cuadros de frecuencias
Ingreso familiar mensual en el distrito de San Juan de
Lurigancho (miles de nuevos soles)
Familia
1 2 3 4 5 6 7
Encuestada

Ingreso
0.9 1.1 1.5 0.4 1.9 0.8 2.5
mensual

7
∑ Xi
X= i =1
7
0.9 + 1.1 + 1.5 + 0.4 + 1.9 + 0.8 + 2.5 9.1
= = = 1.3
7 7
Universidad de Piura
Ejemplo: Cálculo de promedio para datos discretos
organizados en cuadros de frecuencias

Distribución de microcomputadoras
en pequeñas empresas

Número de Número de 5
PCs empresas ∑ Xifi
X= i =1

3 6 36
4 13 (3)(6) + (4)(13) +  + (8)(5)
5 4 =
6 8 36
8 5
178
= = 4.94
TOTAL 36 36

Universidad de Piura
Ejemplo: Cálculo del promedio para datos continuos
organizados en cuadros de frecuencias

Número de % de
Montos Negociados Mi fri Fi Fri Pi
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33 22 0.6111 61.11
De 54 a menos de 66 60 6 0.1668 16.68 28 0.7778 77.78
De 66 a menos de 78 72 5 0.1389 13.89 33 0.9167 91.67
De 78 a menos de 90 84 2 0.0555 5.55 35 0.9722 97.22
De 90 hasta 102 96 1 0.0277 2.77 36 1 100.00

6
∑ Mifi (36)(10) + ... + (96)(1)
X≅ i =1
≅ ≅ 53.3333
36 36

Universidad de Piura
Media Aritmética Ponderada
Este indicador se utiliza para promediar observaciones Xi que
tienen diferente importancia relativa

POBLACIÓN MUESTRA

⇓ ⇓
N N
∑ Wi X i ∑ Wi X i
µp = i =1
N X p = i =1N
∑ Wi ∑ Wi
i =1 i =1

Xi : Observación i-ésima
Wi : Ponderación o importancia relativa de la observación i-ésima
Universidad de Piura
Ejemplo: Media Aritmética Ponderada

Una empresa importadora coloca en las tiendas minoristas todas las


unidades importadas de cierto producto. El precio de venta por
unidad, depende del volumen de compra de la tienda. Con la
siguiente información, determine el precio promedio por unidad
vendida.

Tienda Precio (en soles) Nº unidades

A (1) 30 300
B (2) 28 500
C (3) 26 1000
D (4) 29 200
E (5) 32 100

Universidad de Piura
Ejemplo: Media Aritmética Ponderada

Tienda Xi Precio (en soles) Wi Nº unidades


A (1) 30 300
B (2) 28 500
C (3) 26 1000
D (4) 29 200
E (5) 32 100
5

∑WX i i
µp = i =1
5

∑W
i =1
i

(300)(30) + (500)(28) + (1000)(26) + (200)(29) + (100)(32)


=
300 + 500 + 1000 + 200 + 100
58000
= = 27.62 Soles
2100
Universidad de Piura
Mediana

Es el valor que ocupa la posición central dentro


de un conjunto de datos, ordenados según su
magnitud.

POBLACIÓN ⇒ Me

MUESTRA ⇒ me

Universidad de Piura
Mediana
Dato central

12, 13, 15, 20,....., 55, 62, 65, 68, 74,......,93

50% de datos 50% de datos

Mediana

Universidad de Piura
Características de la mediana
1. Divide a un conjunto de datos en dos partes iguales en
cantidad de observaciones; 50% de ellas son mayores que la
mediana y el otro 50% son menores que la mediana.
2. La mediana está influenciada por el número de observaciones
y no por los valores de las observaciones.
3. No le afectan los valores extremos.
N N N

4. � Xi − M𝑒𝑒 ≤ � Xi − 𝑘𝑘 , para todo 𝑘𝑘 ∈ R ∑X


i =1
i − Me es un valor mínimo
𝑖𝑖=1 𝑖𝑖=1

5. Si a cada observación de un conjunto inicial de datos se le


suma una constante, la mediana del nuevo conjunto de datos
será igual a la mediana del conjunto inicial más la constante.
6. Si a cada observación de un conjunto inicial de datos se le
multiplica una constante, la mediana del nuevo conjunto de
datos será igual a la mediana del conjunto inicial por la
constante.
Universidad de Piura
Cálculo de la mediana para “n” datos no
agrupados
Dato central

12, 13, 15, 20,....., 55, 62, 65, 68, 74,......,93

50% de datos 50% de datos

Mediana

“n” es impar “n” es par


Yn + Y(n+1)
me= Yn+1 me = 2 2
2 2
Universidad de Piura
Cálculo de la mediana para datos continuos
agrupados en cuadros de frecuencias
n
− F(me−1)
Me ≅ LIme + 2 TIC
fme

LIme : Límite Inferior del intervalo que contiene a la mediana

F(me-1) : Frecuencia acumulativa absoluta del intervalo anterior a


aquel que contiene a la mediana

fme: frecuencia absoluta del intervalo que contiene a la mediana

TIC: tamaño del intervalo de clase que contiene a la mediana

n: número de datos

Universidad de Piura
Ejemplo: Cálculo de mediana para datos continuos
organizados en cuadros de frecuencias

Número de % de
Montos Negociados Mi fri Fi Fri Pi
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33 22 0.6111 61.11
De 54 a menos de 66 60 6 0.1668 16.68 28 0.7778 77.78
De 66 a menos de 78 72 5 0.1389 13.89 33 0.9167 91.67
De 78 a menos de 90 84 2 0.0555 5.55 35 0.9722 97.22
De 90 hasta 102 96 1 0.0277 2.77 36 1 100.00

n
− F(me−1) 18 − 10 
Me ≅ LIme + 2
fme
TIC ≅ 42 +   [12] ⇒ 50
 12 

Universidad de Piura
Moda

Valor, clase o categoría que ocurre con mayor


frecuencia en un conjunto de datos.

POBLACIÓN ⇒ Mo

MUESTRA ⇒ mo

Universidad de Piura
Características de la moda
1. Un conjunto de datos puede no tener moda o tener una o más
modas.

2. No está afectada por los llamados valores extremos.


3. Se aplica a conjuntos de datos cualitativos o cuantitativos.
4. La moda muestral es inestable.
5. Si a cada observación de un conjunto inicial de datos se le
suma una constante, la moda del nuevo conjunto de datos
será igual a la moda del conjunto inicial más la constante.
6. Si a cada observación de un conjunto inicial de datos se le
multiplica una constante, la moda del nuevo conjunto de datos
será igual a la moda del conjunto inicial por la constante.

Universidad de Piura
Determinación de la moda
Datos: 55, 62,...., 55, 12, 62, 13, 62, 65,93,....., 66

Paso 1: Ordenar los datos

12, 13,...., 55, 62, 62, 62, 62, 65,66,......,93

Paso 2: Determinar con mayor frecuencia

12, 13,...., 55, 62, 62, 62, 62, 65,66,......,93

Moda

Universidad de Piura
Cálculo de moda para datos continuos organizados
en cuadros de frecuencias

d1
Mo ≅ LImo + (TIC)
d1 + d2
d1 = fmo - f(mo-1)
d2 = fmo - f(mo+1)
TIC : tamaño de intervalo de clase

Universidad de Piura
Ejemplo: Cálculo de la moda para datos continuos
organizados en cuadros de frecuencias.

Número de % de
Montos Negociados Mi fri Fi Fri Pi
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33 22 0.6111 61.11
De 54 a menos de 66 60 6 0.1668 16.68 28 0.7778 77.78
De 66 a menos de 78 72 5 0.1389 13.89 33 0.9167 91.67
De 78 a menos de 90 84 2 0.0555 5.55 35 0.9722 97.22
De 90 hasta 102 96 1 0.0277 2.77 36 1 100.00

d1
Mo ≅ LImo + (TIC)
d1 + d2
 
≅ 42 + 
12 - 10
 [12] = 45
 (12 - 10) + (12 - 6) 
Universidad de Piura
Cuantiles
A cada uno de los valores o puntos que permiten dividir
una distribución en varias partes iguales lo llamamos
cuantil (o cuantilo). Según la distribución queda dividida en:
• Dos partes, el punto se llama mediana.
• Tres partes, los 2 puntos se llaman tercil (1, 2).
• Cuatro partes, los 3 puntos se llaman cuartil (1, 2, 3).
• Cinco partes, los 4 puntos se llaman quintil (1, 2, 3, 4).
• Seis partes, los 5 puntos se llaman sextil (1, 2, 3, 4, 5).
• Diez partes, los 9 puntos se llaman decil (1, 2, 3, …, 9).
• Veinte partes, los 19 puntos se llaman vigintil (1, 2, 3, …, 19).
• Cien partes, los 99 puntos se llaman centil (1, 2, 3, …, 99).

Universidad de Piura
Percentiles

Un percentil Pp, es el valor de la variable que tiene


100p% de obsv. hacia su izquierda y 100(1-p)% de obsv.
hacia su derecha.
Percentil Pp

12, 13, 15, 20,....., 55, 62, 65, 68, 74,......,93

100p% de datos 100(1-p)% de datos

Pp =62

Universidad de Piura
Percentiles

Percentil P0.7

12, 13, 15, 20,....., 55, 62, 65, 68, 74,......,93

70% de datos 30% de datos

P0.7 =62

Universidad de Piura
Cálculo de un percentil
n p−F(p−1)
Pp ≅ LIp + TIC
fp
n: Número de datos
p : intervalo que contiene a percentil “p”

p: 0.01, 0.02, 0.03, 0.04, 0.05,...,0.1,...,0.2, ..., 0.3, ..., 0.4, ...,0.5, ..., 0.99

LIp: Límite Inferior del intervalo que contiene al percentil “p”

F(p-1): Frecuencia acumulada absoluta del intervalo anterior al que contiene al percentil “p”

fp : Frecuencia absoluta del intervalo que contiene al percentil “p”

TIC: Tamaño del intervalo de clase

Universidad de Piura
Ejemplo: Cálculo de percentiles

Número de % de
Montos Negociados Mi fri Fi Fri Pi
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33 22 0.6111 61.11
De 54 a menos de 66 60 6 0.1668 16.68 28 0.7778 77.78
De 66 a menos de 78 72 5 0.1389 13.89 33 0.9167 91.67
De 78 a menos de 90 84 2 0.0555 5.55 35 0.9722 97.22
De 90 hasta 102 96 1 0.0277 2.77 36 1 100.00

n (0.75)−F(p−1)
P0.75 ≅ LIp + TIC
fp

 (36)(0.75) - 22 
P0.75 ≅ 54 +   (12 ) ⇒ 64.0
 6
Universidad de Piura
Cálculo de los cuantiles mediante
los percentiles
Son casos particulares de los percentiles.
Cuantil 1 2 3 4 5 … 9 … 19
Mediana P0.50
Tercil P0.33 P0.66
Cuartil P0.25 P0.50 P0.75
Quintil P0.20 P0.40 P0.60 P0.80
Sextil P0.16 P0.33 P0.50 P0.66 P0.83
Decil P0.10 P0.20 P0.30 P0.40 P0.50 … P0.90
Vigintil P0.05 P0.10 P0.15 P0.20 P0.25 … P0.45 … P0.95

Universidad de Piura
Medidas de variabilidad o de
dispersión

Objetivo:Cuantificar el grado de heterogeneidad que


existe en un conjunto de datos.

Universidad de Piura
Medidas de variabilidad o de
dispersión
ABSOLUTAS
1. Rango, Amplitud o Recorrido
2. Variancia o Varianza.
3. Desviación estándar

RELATIVAS
Coeficiente de Variabilidad.

Universidad de Piura
Rango, Amplitud o Recorrido

Diferencia entre la observación de mayor valor y la observación


de menor valor.

POBLACIÓN ⇒ R (A)=Xmáx- Xmín

MUESTRA ⇒ r (a)=Xmáx- Xmín

Universidad de Piura
Características del rango
1. Tiene la misma unidad de medida que las observaciones.
2. Se utiliza para tener una idea rápida del grado de dispersión
de un conjunto de datos.
3. Es poco confiable.
4. El rango muestral es muy inestable.
5. El valor del rango no varía cuando se suma una constante “K”
a cada observación de un conjunto de datos.
6. El valor del rango si varía cuando se multiplica por constante
“K” a cada observación de un conjunto de datos

Universidad de Piura
Cálculo de rango o amplitud
Rango = r = Xmax – Xmin

Datos → 12, 13, 15, 20,....., 55, 65, 68, 74,......,93

Identificar: Xmin Xmax

r = Xmax – Xmin = 93 – 12 = 81

Universidad de Piura
Variancia o Varianza
La variancia de un conjunto de observaciones se define:
N
∑(
Xi − µ X
2
)
POBLACIÓN ⇒σ 2
=
i =1
N
n
∑ (Xi − X ) 2

MUESTRA ⇒ s =
2 i =1
n -1

Universidad de Piura
Características de la variancia
1. Es confiable.

2. Su valor numérico está expresada en unidades


cuadráticas.
3. No cambia de valor cuando se suma una constante a
cada observación de un conjunto de datos.
4. Cambia de valor si se multiplica por una constante K,
a cada observación de un conjunto de datos. Es
decir, si se define: Y= K X; luego,

σY =σX K
2 2 2
SY = SX K
2 2 2

Universidad de Piura
Cálculo de la variancia para datos no organizados
en cuadros de frecuencias.

POBLACIÓN

N N
∑ (Xi − µ ) 2
∑ i
X 2
− Nµ 2
1  N
1 N

2

σ = 2 i =1
= i =1
= ∑ X i −  ∑ X i  
2
N N N  i=1 N  i=1  

MUESTRA

n n
∑ (Xi − X ) 2
∑ 2
Xi − nX 2
1  n
 n

2

S =
2 i =1
= i =1
= ∑ Xi − n  ∑ Xi  
2 1
n -1 n -1 n - 1  i=1   

i =1

Universidad de Piura
Cálculo de la variancia para datos no organizados
en cuadros de frecuencias.
Las edades de los alumnos inscritos en un curso de
idiomas son: 14, 21, 16, 17, 25, 32, 18

1  N
1 N

2

σ = ∑ X i −  ∑ X i  
2 2
N  i=1 N  i=1  
N

∑X
i =1
i = 14 + 21 + 16 + 17 + 25 + 32 + 18 = 143

∑X
i =1
i
2
= 14 2 + 212 + 16 2 + 17 2 + 252 + 32 2 + 182 = 3155

1 2
σ = 3155 − (143)  = 33.387755
2 1 2
(años)
7 7 
Universidad de Piura
Cálculo de la variancia para datos continuos
organizados en cuadros de frecuencias.

POBLACIÓN
K
∑ 2
fi Mi − Nµ 2
1  K
1  K

2

σ2 ≅ i =1
= ∑ fi M i2 −  ∑ fi M i  
N N  i=1 N  i=1  

MUESTRA
K
∑ 2
fi Mi − nX 2
1  K
1  K

2

S2 ≅ i =1
== ∑ fi M i2 −  ∑ fi M i  
n -1 n - 1  i=1 n  i=1  

Universidad de Piura
Ejemplo: Cálculo de la variancia para datos
continuos organizados en cuadros de frecuencias
Montos Negociados Número de % de
Dec. de miles de soles Mi fri
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33
De 54 a menos de 66 60 6 0.1668 16.68
De 66 a menos de 78 72 5 0.1389 13.89
De 78 a menos de 90 84 2 0.0555 5.55
De 90 hasta 102 96 1 0.0277 2.77
k
∑ i f i = (36)(12) + (48)(12) +  + (96)(1) = 1920
M '

i =1
k
∑ i i
M '2
f = (36 ) 2
(12 ) + ( 48) 2
(12 ) +  + (96 ) 2
(1) = 111456
i =1
6
∑ M i2fi − 36µ 2 111456 - (36)(1920 / 36) 2
σ ≅
2 i =1
= = 251.555556
36 36
Universidad de Piura
Variancia ponderada poblacional
Subpoblaciones
¿La variabilidad interna de los grupos es
semejante?
Grupo 1: µ1 , σ1 , N1
2

SI
Grupo 2: µ 2 , σ 2 , N2
2

Grupo 3: µ 3 , σ3 , N3
2
Variancia ponderada

N σ 2
+ N σ 2
+ N σ 2 ∑ i i
N σ 2

σ 2p = 1 1 2 2 3 3
= i =1
N1 + N 2 + N 3 N
Universidad de Piura
Variancia ponderada muestral
Submuestra
¿La variabilidad interna de los grupos es
semejante?
Grupo 1: X1 , S12 , n1

2 SI
Grupo 2: X 2 , S2 , n2

2
Grupo 3: X 3 , S3 , n3 Variancia ponderada

(n − 1)S 2
+ (n − 1)S 2
+ (n − 1)S 2 ∑ i i
(n - 1)S 2

S2p = 1 1 2 2 2 3
= i =1
n1 + n 2 + n 3 − 3 n -3

Universidad de Piura
Desviación Estándar
Es la raíz cuadrada positiva de la variancias

∑ (X i − µ )
N


2

POBLACIÓN σ= i =1

MUESTRA ⇒

Universidad de Piura
Características de la desviación
estándar
1. Confiable.

2. Tiene la misma unidad de medida que los datos originales.

3. No cambia de valor cuando se suma una constante a cada


observación de un conjunto de datos.

4. Cuando se multiplica a los datos por una constante K, el valor


de la desviación estándar cambia según la relación siguiente:

σY =σX K SY = SX K

Universidad de Piura
Ejemplo: Cálculo de la variancia y desv. Estándar para
datos continuos organizados en cuadros de frecuencias
Montos Negociados Número de % de
Dec. de miles de soles Mi fri
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33
De 54 a menos de 66 60 6 0.1668 16.68
De 66 a menos de 78 72 5 0.1389 13.89
De 78 a menos de 90 84 2 0.0555 5.55
De 90 hasta 102 96 1 0.0277 2.77

k k
∑ if i = 1920
M '
∑ i f i = 111456
M '2

i =1 i =1
6
∑ ii
M 2
f − 36µ 2
111456 - (36)(1920 / 36) 2
σ ≅ 2 i =1
= = 251.555556
36 36
σ ≅ σ 2 = 251.555556 = 15.860503 decenas de miles de soles
Universidad de Piura
Teorema de Chebyshev
El matemático ruso Pafnuti Chebyshev.
Determina la proporción mínima de los valores que se
encuentran en un número específico de desviaciones
estándares (k) respecto a la media.
Cuando k > 1 proporciona información útil.

P ( X − µ < kσ ) ≥ 1 − 2
1
k

Universidad de Piura
Ejemplo: Aplicación del Teorema de Chebyshev
Una arrendadora de automóviles alquila un promedio de 5000
unidades al mes, con una desviación estándar de 400
automóviles. ¿Por lo menos en qué porcentaje de los meses
alquilará la compañía entre 4000 y 6000 unidades?
Primero calculamos el valor de k:
4000 − 5000
=k = 2.5
400
Esto nos indica que tanto 4000 como 6000 están a 2.5
desviaciones estándares de la media.
Por Chebyshev tenemos:
1
1− =
0.84
( 2.5)
2

Cuando menos el 84% de los meses la empresa ha alquilado


entre 4000 y 6000 unidades.
Universidad de Piura
Coeficiente de variabilidad
Medida de variabilidad relativa que indica la cantidad de veces
que la desviación estándar contiene a la media aritmética.

σ σ
POBLACIÓN
⇒ CV =
µ
CV =
µ
100


S S
MUESTRA cv = cv = 100
X X

Universidad de Piura
Características del coeficiente de
variabilidad
1. No tiene unidad de medida.

2. No aplicable cuando la distribución tiene media


cero.
3. Se afecta su valor cuando se suma una constante
“K” a cada observación de un conjunto de datos.

4. No cambia de valor cuando se multiplica por una


constante “K” a cada una de las observaciones.

Universidad de Piura
Calificación de una distribución de
datos, según el grado de dispersión

Coef de variabilidad
Calificación
(en %)

0 Completamente homogénea

0 < cv < 10 Muy homogénea

10 ≤ cv < 15 Regularmente homogénea

15 ≤ cv < 20 Regularmente variable

20 ≤ cv < 25 variable

cv ≥ 25 muy variable

Universidad de Piura
Ejemplo: Cálculo del coeficiente de variabilidad
Montos Negociados Número de % de
Dec. de miles de soles Mi fri
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33
De 54 a menos de 66 60 6 0.1668 16.68
De 66 a menos de 78 72 5 0.1389 13.89
De 78 a menos de 90 84 2 0.0555 5.55
De 90 hasta 102 96 1 0.0277 2.77

µ≅
1920
= 53.333333 111456 - (36)(1920 / 36) 2
σ ≅
2
= 251.555556
36 36

𝜎𝜎 ≅ 𝜎𝜎 2 = 251.555556 = 15.860503 decenas de miles de soles


σ 15.860503
CV ≅ x100 = x100 = 29.738%
µ 53.333333
Universidad de Piura
Comparación de la dispersión de
dos o más conjuntos de datos

Los conjuntos de datos tienen


Iguales unidades de medida y
Medias aritméticas iguales o ⇒ Utilizar las Variancias o
Desviaciones Estándares
similares

Los conjuntos de datos tienen


diferentes unidades de medida
y/o Medias aritméticas
⇒ Utilizar los Coeficientes
De Variabilidades
diferentes

Universidad de Piura
Medidas de asimetría
Medidas estadísticas que tienen como objetivo evaluar la
presencia de valores extremos dentro de una distribución de
datos.
COEFICIENTE DE ASIMETRÍA DE PEARSON

3(µ − Me)
POBLACIÓN sKp =
σ

3( X - me)
MUESTRA ŝ K p =
S
Universidad de Piura
Características del Coeficiente de
Asimetría de Pearson
1. No tiene unidad de medida.
2. Se aplica a distribuciones unimodales.
3. Su valor debe encontrarse en el intervalo de –3 a 3.

(+) Asimétrica Positiva o Asimétrica a la derecha

(-) Asimétrica Negativa o Asimétrica a la izquierda

(0) Simétrica

Universidad de Piura
Características del Coeficiente de
Asimetría de Pearson
Distribución simétrica

Skp = 0

µ = Me = Mo

Universidad de Piura
Características del Coeficiente de
Asimetría de Pearson
Distribución asimétrica positiva,
dist. con asimetría a la derecha,
dist. con sesgo a la derecha.

Skp > 0

Mo Me µ

Universidad de Piura
Características del Coeficiente de
Asimetría de Pearson
Distribución asimétrica negativa,
dist. con asimetría a la izquierda,
dist. con sesgo a la izquierda.

Skp < 0

µ Me M
o

Universidad de Piura
Características del coeficiente de
asimetría de Pearson
Valor del Coef Asimetría Calificación

-0.05<SKp≤0.05 Casi simétrica

-0.3≤SKp< -0.05 ó 0.05<SKp≤ 0.3 Ligeramente asimétrica

-0.6≤SKp < -0.3 ó 0.3 < SKp ≤ 0.6 Moderadamente asimétrica

SKp< -0.6 ó SKp>0.6 Muy asimétrica

4. No le afecta las operaciones de suma y producto de


c/observación por una constante “K”.
Universidad de Piura
Coeficiente de Asimetría de
Fisher o tercer momento central
COEFICIENTE DE ASIMETRÍA DE FISHER
Datos no agrupados Datos agrupados
∑𝑁𝑁 (𝑋𝑋
𝑖𝑖=1 𝑖𝑖 − 𝜇𝜇) 3 ∑𝑁𝑁
𝑖𝑖=1 𝑓𝑓𝑖𝑖 (𝑀𝑀𝑀𝑀𝑖𝑖 − 𝜇𝜇)
3
POBLACIÓN γ= γ=
𝑁𝑁𝜎𝜎 3 𝑁𝑁𝜎𝜎 3
Datos no agrupados Datos agrupados

∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥)̅ 3 ∑𝑛𝑛𝑖𝑖=1 𝑓𝑓𝑖𝑖 (𝑚𝑚𝑚𝑚𝑖𝑖 − 𝑥𝑥)̅ 3


𝛾𝛾� =
MUESTRA 𝛾𝛾� = 𝑛𝑛𝑠𝑠 3
𝑛𝑛𝑠𝑠 3
𝑛𝑛 𝑛𝑛 𝑥𝑥𝑖𝑖 −𝑥𝑥̅ 3
Excel: 𝛾𝛾� = ∑𝑖𝑖=1
𝑛𝑛−1 𝑛𝑛−2 𝑠𝑠

Si el valor del coeficiente es cero, la distribución es simétrica.


Si su valor es positivo es asimétrica hacia la derecha.
Si su valor es negativo es asimétrica hacia la izquierda.
Universidad de Piura
Ejemplo: Cálculo de medida de asimetría

Número de % de
Montos Negociados Mi fri
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33
De 54 a menos de 66 60 6 0.1668 16.68
De 66 a menos de 78 72 5 0.1389 13.89
De 78 a menos de 90 84 2 0.0555 5.55
De 90 hasta 102 96 1 0.0277 2.77

Coeficiente de asimetría de Pearson Coeficiente de asimetría de Fisher

3( µ − Me) ∑𝑁𝑁 𝑓𝑓 (𝑀𝑀𝑀𝑀 − 𝜇𝜇) 3


SKp = γ=
𝑖𝑖=1 𝑖𝑖 𝑖𝑖
σ 𝑁𝑁𝜎𝜎 3
3(53.3333 − 50) γ = 0.8059
SKp ≅ ⇒ 0.6305
15.8606
Universidad de Piura
Medidas de curtosis
Medidas estadísticas que tienen como objetivo evaluar el grado
de concentración de los datos alrededor de las medidas de
tendencia.
COEFICIENTE DE CURTOSIS PERCENTÍLICO
1 Q −Q 
K =  3
 1

2D −D 
POBLACIÓN u
9 1

1 Q −Q 
MUESTRA K̂ =   3 1

2D −D 
u
9 1

Universidad de Piura
Características del Coeficiente de Curtosis

1. No tiene unidad de medida.

2. Se aplica a distribuciones unimodales, que sean simétricas o


ligeramente asimétricas.

3. Su valor debe encontrarse en el intervalo 0 á 0.5.


Ku <0.235 PLATICÚRTICA

0.235 ≤ Ku ≤ 0.265 MESOCÚRTICA

Ku > 0.265 LEPTOCÚRTICA

4. No le afecta las operaciones de suma y producto por una


constante “K” aplicada a cada observación.
Universidad de Piura
Características del Coeficiente de Curtosis

Distribución platicúrtica

ku < 0.25

µ = Me = Mo

Universidad de Piura
Características del Coeficiente de Curtosis

Distribución mesocúrtica

ku = 0.25

µ = Me = Mo

Universidad de Piura
Características del Coeficiente de Curtosis

Distribución leptocúrtica

ku > 0.25

µ = Me = Mo

Universidad de Piura
Coeficiente de Curtosis o cuarto momento central
COEFICIENTE DE CURTOSIS DE FISHER
Datos no agrupados Datos agrupados
∑𝑁𝑁 (𝑋𝑋
𝑖𝑖=1 𝑖𝑖 − 𝜇𝜇) 4 ∑𝑁𝑁
𝑖𝑖=1 𝑓𝑓
𝑖𝑖 (𝑀𝑀𝑀𝑀 𝑖𝑖 − 𝜇𝜇) 4
POBLACIÓN 𝛽𝛽 = 𝛽𝛽 =
𝑁𝑁𝜎𝜎 4 𝑔𝑔� = 𝛽𝛽 − 3 𝑁𝑁𝜎𝜎 4
𝑔𝑔 = 𝛽𝛽 − 3 𝑔𝑔 = 𝛽𝛽 − 3
Datos no agrupados Datos agrupados
∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥)̅ 4 ∑𝑛𝑛𝑖𝑖=1 𝑓𝑓𝑖𝑖 (𝑚𝑚𝑚𝑚𝑖𝑖 − 𝑥𝑥)̅ 4
𝛽𝛽̂ = 𝛽𝛽̂=
MUESTRA 𝑛𝑛𝑠𝑠 4 𝑛𝑛𝑠𝑠 4
𝑔𝑔� = 𝛽𝛽 − 3 𝑔𝑔� = 𝛽𝛽 − 3
𝑛𝑛
𝑛𝑛 𝑛𝑛 + 1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 4 3 𝑛𝑛 − 1 2
𝐄𝐄𝐄𝐄𝐄𝐄𝐄𝐄𝐄𝐄: 𝑔𝑔� = � −
𝑛𝑛 − 1 𝑛𝑛 − 2 𝑛𝑛 − 3 𝑠𝑠 𝑛𝑛 − 2 𝑛𝑛 − 3
𝑖𝑖=1
Si el valor es 𝛽𝛽 = 3 (o 𝑔𝑔 = 0), la distribución es mesocúrtica.
Si su valor es 𝛽𝛽 > 3 (o 𝑔𝑔 > 0), la distribución es leptocúrtica.
Si su valor es 𝛽𝛽 < 3 (o 𝑔𝑔 < 0), la distribución es platicúrtica.
Universidad de Piura
Ejemplo: Cálculo del coeficiente de curtosis percentílico

Número de % de
Montos Negociados Mi fri Fi Fri Pi
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33 22 0.6111 61.11
De 54 a menos de 66 60 6 0.1668 16.68 28 0.7778 77.78
De 66 a menos de 78 72 5 0.1389 13.89 33 0.9167 91.67
De 78 a menos de 90 84 2 0.0555 5.55 35 0.9722 97.22
De 90 hasta 102 96 1 0.0277 2.77 36 1 100.00

D1 = P0.10 ≅ 34.32 1 Q − Q 
K =   3 1

2 D − D 
u
D9 = P0.90 ≅ 76.56 9 1

Q1 = P0.25 ≅ 40.80 1  64 − 40.80 


Ku =  
2  76.56 − 34.32 
Q3 = P0.75 ≅ 64 = 0.2746
Universidad de Piura
Ejemplo: Cálculo del coeficiente de curtosis de Fisher

Número de % de
Montos Negociados Mi fri Fi Fri Pi
lotes lotes

De 30 a menos de 42 36 10 0.2778 27.78 10 0.2778 27.78


De 42 a menos de 54 48 12 0.3333 33.33 22 0.6111 61.11
De 54 a menos de 66 60 6 0.1668 16.68 28 0.7778 77.78
De 66 a menos de 78 72 5 0.1389 13.89 33 0.9167 91.67
De 78 a menos de 90 84 2 0.0555 5.55 35 0.9722 97.22
De 90 hasta 102 96 1 0.0277 2.77 36 1 100.00

∑𝑁𝑁 𝑓𝑓
𝑖𝑖=1 𝑖𝑖 (𝑀𝑀𝑀𝑀 𝑖𝑖 − 𝜇𝜇) 4
𝛽𝛽 =
𝑁𝑁𝜎𝜎 4
𝛽𝛽 = 2.9033

Universidad de Piura
Ciencias Económicas y
Empresariales

También podría gustarte