Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Profesor
Luis Guerra Jordán
Introducción
Las medidas estadísticas descriptivas calculadas de tendencia central, que permiten identificar
valores de referencia de referencia, y las de dispersión para cuantificar la variabilidad de ellos,
es necesario conocer como se distribuyen los datos.
Por ejemplo:
“Hay mayor proporción de trabajadores
que ganan menos del promedio con
respecto a los trabajadores que ganan
más del promedio de lo normal”.
Sueldo (soles)
Asimetría Curtosis
Cuantifican el grado de asimetría de La curtosis de una distribución es la
la distribución en torno a una medida medida del grado de apuntamiento
de tendencia central. Es decir mide si de ella. Es decir, mide la
la muestra se distribuye de igual concentración de la muestra
manera a ambos lados de la media. alrededor de la media.
Medidas de Asimetría (A)
𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎 𝑀𝑜𝑑𝑎 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑀𝑒𝑑𝑖𝑎 𝑀𝑜𝑑𝑎 > 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 > 𝑀𝑒𝑑𝑖𝑎
Asimetría Curtosis
Simetría
Distribución bimodal Distribución unimodal
Características
• La media tiende a
desplazarse hacia las valores
extremos (colas).
La fuerza de la asimetría 𝐴𝑓 :
𝑨𝒇 > 𝟎 𝑨𝒇 = 𝟎 𝑨𝒇 < 𝟎
Datos sin agrupar
𝑁 𝑛
1 3
1 3
POBLACIÓN 𝑨𝒇 = 3
𝑥𝑖 − 𝜇 MUESTRA 𝑨𝒇 = 3 𝑥𝑖 − 𝑥ҧ
𝑁𝜎 𝑛𝑠
𝑖=1 𝑖=1
4 4 5 5 5 5 5 5 6 6
6 7 8 9 10
n
1 4 + 4 + ⋯ + 9 + 10 90
ഥ=
𝒙 𝑥𝑖 = = =𝟔 Media muestral
𝑛 15 15
𝑖=1
𝒏
ഥ 𝟐
𝒙𝒊 − 𝒙
.𝒊=𝟏 4−6 2 + 4−6 2 +⋯+ 9 − 6 2 + 10 − 6 2 44 44 Desviación
𝒔= = = = = 1.7728 estándar muestral
𝒏−𝟏 14 14 14
𝑛 3
1 4−6 + 4 − 6 3 +⋯+ 9 − 6 3
+ 10 − 6 3
78
𝑨𝒇 = 3 𝑥𝑖 − 𝑥ҧ 3 𝑨𝒇 = =
𝑛𝑠 (15) 1.7728 3 83.574
𝑖=1
𝑨𝒇 = 0.93
El coeficiente de asimetría de Fisher es
𝑛 3
1 4−6 + 4 − 6 3 +⋯+ 9 − 6 3
+ 10 − 6 3
78
𝑨𝒇 = 3 𝑥𝑖 − 𝑥ҧ 3 𝑨𝒇 = =
𝑛𝑠 (15) 1.7728 3 83.574
𝑖=1 𝑨𝒇 = 0.93
90
ഥ=
𝒙 =𝟔 Media muestral
15
𝒔= 44
14
= 1.7728 Desviación estándar muestral
15
𝑛 = 15 𝑨𝒇 = 3
× 78 = 1.1538
(15 − 1)(15 − 2) 1.7728
Datos agrupados
𝑘 𝑘
1 3 1 3
POBLACIÓN 𝑨𝒇 = 3
𝑛𝑖 𝑥𝑖 − 𝜇 MUESTRA 𝑨𝒇 = 3 𝑛𝑖 𝑥𝑖 − 𝑥ҧ
𝑁𝜎 𝑛𝑠
𝑖=1 𝑖=1
4 4 5 5 5 5 5 5 6 6
6 7 8 9 10
ഥ 𝟐
𝑛𝑖 𝒙𝒊 − 𝒙
.𝒊=𝟏 44
𝒔= = = 1.7728 Desviación estándar muestral
𝒏−𝟏 14
𝑘
1 3
El coeficiente de asimetría de Fisher es 𝑨𝒇 = 3 𝑛𝑖 𝑥𝑖 − 𝑥ҧ
𝑛𝑠
𝑖=1
78 78
𝑨𝒇 = 3
= = 0.93
(15) 1.7728 83.574
Hay una mayor cantidad (porcentaje o proporción) de estudiantes con puntuaciones
Interpretación bajas por debajo de la media.
COEFICIENTE DE ASIMETRIA DE FISHER
𝒔= 44
14
= 1.7728 Desviación estándar muestral
15
𝑛 = 15 𝑨𝒇 = 3
× 78 = 1.1538
(15 − 1)(15 − 2) 1.7728
Ejemplo
Se ha realizado un estudio de las rentas de alquiler de
390 viviendas (donde la renta viene dada en cientos de
soles), en una población de tamaño medio, obteniéndose:
Número de
alquiler
viviendas
5 - 10 4
10 - 15 6
15 - 20 15
20 - 25 18
25 - 30 20
ഥ 𝟐
𝑛𝑖 𝒙𝒊 − 𝒙
.𝒊=𝟏 2243.75
𝒔= = = 5.968 Desviación estándar muestral
𝒏−𝟏 63
𝑘
1 3
El coeficiente de asimetría de Fisher es 𝑨𝒇 = 3 𝑛𝑖 𝑥𝑖 − 𝑥ҧ
𝑛𝑠
𝑖=1
−8238.28
𝑨𝒇 = 3
= −0.61
(64) 5.958
Hay una mayor cantidad (porcentaje o proporción) de viviendas con rentas de alquiler
Interpretación por encima de la media.
COEFICIENTE DE ASIMETRIA DE FISHER
64
𝑛 = 15 𝑨𝒇 = 3
× −8238.28 = −0.635
(64 − 1)(64 − 2) 5.968
El coeficiente de asimetría de Pearson sirve para
Coeficiente de encontrar la asimetría en una distribución de
asimetría de Pearson datos utilizando la media y la moda.
3 𝜇 − 𝑀𝑒 ഥ − 𝑀𝑒
3 𝒙
POBLACIÓN 𝑨𝒑 = MUESTRA 𝑨𝒑 =
𝜎 𝑠
El coeficiente de asimetría de Bowley sirve para
Coeficiente de encontrar la asimetría en una distribución de
asimetría de Bowley datos utilizando los cuartiles y la mediana.
El Dr. A. L. Bowley propuso otra medida de asimetría basada en las posiciones relativas de la
mediana y los dos cuartiles. Si las distribuciones son simétricas, Q1 y Q3 estarán a la misma
distancia de la mediana del otro lado. En otras palabras, en tal distribución la diferencia entre el
cuartil tercero y la mediana será igual a la diferencia entre la mediana y el cuartil uno.
El coeficiente de asimetría de Bowley sirve para
Coeficiente de encontrar la asimetría en una distribución de
asimetría de Bowley datos utilizando los cuartiles y la mediana.
4 4 5 5 5 5 5 5 6 6
6 7 8 9 10
n
1 4 + 4 + ⋯ + 9 + 10 90
ഥ=
𝒙 𝑥𝑖 = = =6 Media muestral 𝑴𝒐 = 5 Moda
𝑛 15 15
𝑖=1
𝒏
𝒙𝒊 − 𝒙ഥ 𝟐
.𝒊=𝟏 4−6 2 + 4−6 2 +⋯+ 9 − 6 2 + 10 − 6 2 44 Desviación
𝒔= = = = 1.7728
𝒏−𝟏 14 14 estándar muestral
ഥ − 𝑀𝑜
𝒙 6−5
𝑨𝒑 = 𝑨𝒑 = = 0.564
𝑠 1.7728
4 4 5 5 5 5 5 5 6 6
6 7 8 9 10
𝑴𝒆 = 5 Mediana 𝒙𝒊 𝒏𝒊 𝑵𝒊
𝑸𝟏 = 5 Primer cuartil 4 2 2
5 6 8
𝑸 = 7 Tercer cuartil 6 3 11
7 1 12
8 1 13
𝑄3 + 𝑄1 − 2𝑀𝑒 7 + 5 − 2(5) 9 1 14
𝑨𝒃 = 𝑨𝒃 = =1 10 1 15
𝑄3 − 𝑄1 7−5 Total 15
𝑛
2
𝑛(𝑛 + 1) 4−3
(𝑛 − 1)
𝑲𝒇 = 4
𝑥𝑖 − 𝑥ҧ
(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) 𝑠 (𝑛 − 2)(𝑛 − 3)
𝑖=1
𝑘
𝑛(𝑛 + 1) (𝑛 − 1) 2
𝑲𝒇 = 𝑛𝑖 𝑥𝑖 − 𝑥ҧ 4−3
(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) 𝑠 4 (𝑛 − 2)(𝑛 − 3)
𝑖=1
Ejemplo
Las siguientes puntuaciones pertenecen a un grupo de estudiantes, en una prueba de ingles
donde la máxima calificación posible es diez (10):
4 4 5 5 5 5 5 5 6 6
6 7 8 9 10
4 2 2 8 8 32
5 6 8 30 6 6
Elaboramos la tabla de distribución de frecuencias: 6 3 11 18 0 0
7 1 12 7 1 1
k 8 1 13 8 4 16
1 90 9 1 14 9 9 81
ഥ=
𝒙 𝑛𝑖 𝑥𝑖 = =𝟔 Media muestral 10 1 15 10 16 256
𝑛 15 Total 15 90 44 392
𝑖=1
ഥ 𝟐
𝑛𝑖 𝒙𝒊 − 𝒙
.𝒊=𝟏 44
𝒔= = = 1.7728 Desviación estándar muestral
𝒏−𝟏 14
𝑘
1 4
El coeficiente de kurtosis de Fisher es 𝑲𝒇 = 4 𝑛𝑖 𝑥𝑖 − 𝑥ҧ −3
𝑛𝑠
𝑖=1
392 392
𝑲𝒇 = 4
−3= − 3 = −0.35
(15) 1.7728 148.1598
Hay una mayor cantidad (porcentaje o proporción) de estudiantes con puntuaciones
Interpretación bajas por debajo de la media.
Ejemplo
Se ha realizado un estudio de las rentas de alquiler de
390 viviendas (donde la renta viene dada en cientos de
soles), en una población de tamaño medio, obteniéndose:
Número de
alquiler
viviendas
5 - 10 4
10 - 15 6
15 - 20 15
20 - 25 18
25 - 30 20
ഥ 𝟐
𝑛𝑖 𝒙𝒊 − 𝒙
.𝒊=𝟏 2243.75
𝒔= = = 5.968 Desviación estándar muestral
𝒏−𝟏 63
𝑘
1 4
El coeficiente de kurtosis de Fisher es 𝑲𝒇 = 𝑛𝑖 𝑥𝑖 − 𝑥ҧ −3
𝑛𝑠 4
𝑖=1
200261.84
𝑲𝒇 = − 3 = −0.53
(64) 5.968 4
Hay una mayor cantidad (porcentaje o proporción) de viviendas con rentas de alquiler
Interpretación por encima de la media.
El coeficiente de curtosis percentílico sirve para
Coeficiente de encontrar la curtosis en una distribución de
curtosis percentílico datos utilizando el rango semintercuartílico y los
percentiles 90 y 10.
𝑄3 − 𝑄1
La fórmula para datos no agrupados es: 𝑲𝒑 =
2 𝑃90 − 𝑃10
Valores Valores
1,5 RI 1,5 RI
Atípicos Atípicos
RI= Q3 - Q1 (Rango Intercuartílico)
Calculo de Cuartiles:
Q1=(24 + 25) / 2 = 24,5
Me= Q2 = (33 + 34)/ 2 =33,5
Q3=(39 + 39) / 2 = 39
Características:
• El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)
• La primera parte de la caja(Q1,Q2),la segunda parte de la caja (Q2,Q3)
• El bigote de la derecha viene dado por (Q3, Xmáx).
Interpretación:
• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre
el 50% y el 75%.
• El bigote de la izquierda (Xmín, Q1) es más corto que el de la derecha; por ello el 25% de
los más jóvenes están más concentrados que el 25% de los mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está
comprendido en 14,5 años.
Ejemplo
Comparar distribuciones de edades de dos grupos de colectivo de 20 personas.
GRUPO 1 GRUPO 2