Está en la página 1de 44

Fundamentos de Estadística

Primer Semestre 2021

Unidad 2. Estadística Descriptiva (Parte IV)

Diego Alejandro Castro


Asignatura: Fundamentos de Estadística
Facultad de Ingeniería
Universidad del Valle, Palmira
Estadística Descriptiva
Herramientas gráficas
Para apreciar la magnitud o posición de las variables, se suele efectuar una representación
gráfica. Las herramientas gráficas más usuales son:

• Diagrama de tortas o de pastel

• Diagrama de barras

• Histograma

• Ojiva

• Diagrama de cajas y alambres

• Diagrama de dispersión
Estadística Descriptiva
Diagrama de pastel o torta

Consiste en un circulo en el que se representan sectores o porciones con áreas proporcionales a


las frecuencias de cada una de las clases. Solo se considera en la representación de variables
cualitativas. El gráfico no debe tener más de cinco categorías o modalidades.
Diagrama de Pastel
Se consideró una muestra aleatoria de 2.100
estudiantes de la Universidad del Valle, para
que opinará sobre la calidad del servicio que Excelente 71.43(%)
presta la Biblioteca, cuyos resultados son:

Percepción Cantidad Porcentaje


Excelente 1.500 71,43%
Malo 4.76(%)
Bueno 320 15,24% 1500
𝑓1 = = 71,43%
Regular 180 8,57% 2100 Regular 8.57(%)

Malo 100 4,76%


Bueno 15.24(%)
Estadística Descriptiva
Diagrama de barras
En el eje horizontal se representan los valores que asume la variable y en el eje vertical su
frecuencia absoluta o relativa. Se utiliza cuando la variable analizada es cuantitativa
discreta o cualitativa (independientemente del número de categorías).
Distribución de la calificación

Para el mismo ejemplo realizar el

1500
diagrama de barras.

Percepción Cantidad

1000
Excelente 1.500
Bueno 320
Regular 180

500
Malo 100
0

Excelente Bueno Regular Malo

Calificación del servicio


Estadística Descriptiva
Diagrama de barras

Otra manera de realizar el gráfico. Distribución de la calificación

100
Percepción Porcentaje
Excelente 71,43%

80
Bueno 15,24%

Frecuencia relativa(%)
Regular 8,57%

60
Malo 4,76%

40
En un diagrama de barras es mejor

20
realizar el gráfico con la frecuencia
relativa, puesto que se sabe que
porcentaje abarca cada categoría con 0 Excelente Bueno Regular Malo
respecto a la población o muestra. Calificación del servicio
Estadística Descriptiva
Histograma
Se considera cuando la variable analizada es cuantitativa-continua ó esta agrupada por
intervalos de clase o rangos. Las clases se indican en el eje horizontal y sus frecuencias relativas
o absolutas en el eje vertical.
Histogram of rnorm(100, 3, 0.01)

Una fábrica que produce tornillos de acero,

30
desea analizar la variabilidad de los tornillos

25
con una especificación de 3 milímetros

Frecuencia absoluta
(mm). Para ello, se consideró una muestra

20
aleatoria de 100 tornillos producidos por

15
una de las maquinas en un día.

10
La gran mayoría de los tornillos

5
seleccionados presentan un diámetro entre

0
2,99 mm y 3,01 mm. 2.97 2.98 2.99 3.00 3.01 3.02 3.03

Diametro de los tornillos (mm)


Estadística Descriptiva
Ejemplo de aplicación

Realizar el histograma para el ejemplo del costo semanal de mantenimiento de la fábrica.

( Li −1 − Li ] Xi ni fi Ni Fi
(3,2 - 3,7] 3,45 3 0,075 3 0,075
(3,7 - 4,2] 3,95 7 0,175 10 0,25
(4,2 - 4,7] 4,45 15 0,375 25 0,625
(4,7 - 5,2] 4,95 6 0,15 31 0,775
(5,2 - 5,7] 5,45 4 0,10 35 0,875
(5,7 - 6,2] 5,95 5 0,125 40 1,0
Total 40 1,0
Estadística Descriptiva
Ejemplo de aplicación

Realizar el histograma para el ejemplo del grosor de los discos, considerando todas las
amplitudes iguales. Histograma del grosor de los discos

i ( Li −1 − Li ] Xi ni fi Ni Fi

12 16 20 24 28 32 36 40 44 48 52 56
1 (1,05 - 1,10] 1,075 17 0,085 17 0,085
2 (1,10 - 1,15] 1,125 19 0,095 36 0,18
3 (1,15 - 1,20] 1,175 49 0,245 85 0,425

Grosor de los discos (mm)


4 (1,20 - 1,25] 1,225 55 0,275 140 0,7
5 (1,25 - 1,30] 1,275 42 0,21 182 0,91
6 (1,25 - 1,35] 1,325 18 0,09 200 1,0
Total 200

8
4
0
1.05 1.10 1.15 1.20 1.25 1.30 1.35

Intervalos de clase
Estadística Descriptiva
Ojiva en variables discretas
Los intervalos de clase o valores que asume la variable se representan en el eje horizontal y
sobre el eje vertical se consideran sus frecuencias acumuladas (relativas o absolutas). Es útil
para representar el porcentaje de valores que se encuentran por debajo de un valor en
particular.
Retomemos el ejemplo del número de créditos que Ojiva para el número de créditos

matriculó los estudiantes en el semestre.

1.00
0.90
i 𝑋𝑖 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖

0.80
1 15 2 0,1 2 0,1

0.70
Frecuencia Relativa
2 16 4 0,2 6 0,3

0.60
3 17 5 0,25 11 0,55

0.50
4 18 4 0,2 15 0,75

0.40
5 19 2 0,1 17 0,85

0.30
6 20 2 0,1 19 0,95

0.20
7 21 1 0,05 20 1,00

0.10
Total 20
15 16 17 18 19 20 21

Créditos matriculados
Estadística Descriptiva
Ojiva en variables continuas
Retomemos el ejemplo del costo semanal de mantenimiento de la fábrica. Obtener la ojiva.
Ojiva para Costo semanal de mantenimiento

( Li −1 − Li ] Xi ni fi Ni Fi

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00
(3,2 - 3,7] 3,45 3 0,075 3 0,075
(3,7 - 4,2] 3,95 7 0,175 10 0,25
(4,2 - 4,7] 4,45 15 0,375 25 0,625
(4,7 - 5,2] 4,95 6 0,15 31 0,775

Frecuencia Relativa
(5,2 - 5,7] 5,45 4 0,10 35 0,875
(5,7 - 6,2] 5,95 5 0,125 40 1,0
Total 40 1,0

3.20 3.70 4.20 4.70 5.20 5.70 6.20

Intervalos de clase
Estadística Descriptiva
Ojiva en variables continuas
Retomemos el ejemplo del grosor de los discos con amplitudes iguales. Obtener la ojiva.
Ojiva para Grosor de los discos
i ( Li −1 − Li ] Xi ni fi Ni Fi

0.90 1.00
1 (1,05 - 1,10] 1,075 17 0,085 17 0,085
2 (1,10 - 1,15] 1,125 19 0,095 36 0,18

0.60 0.70 0.80


3 (1,15 - 1,20] 1,175 49 0,245 85 0,425
4 (1,20 - 1,25] 1,225 55 0,275 140 0,7

Frecuencia Relativa
5 (1,25 - 1,30] 1,275 42 0,21 182 0,91

0.40 0.50
6 (1,30 - 1,35] 1,325 18 0,09 200 1,0
Total 200

0.20 0.30
0.00 0.10
1.05 1.10 1.15 1.20 1.25 1.30 1.35

Intervalos de clase
Estadística Descriptiva
Ejemplo de aplicación Ojiva

Se registran los tiempos de duración de las llamadas (en minutos) recibidas en un Call Center en
una muestra de 200 llamadas. El gráfico de Ojiva con la frecuencia relativa acumulada resultó ser:
Ojiva para la duración de las llamadas

¿Qué porcentaje de llamadas duran máximo


0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00

50 minutos?
a) 30%
Frecuencia relativa acumulada

b) 70%
c) 25%

𝑃 𝑋 ≤ 50 = 0,70 = 70%

0 10 20 30 40 50 60

Tiempo (minutos)
Estadística Descriptiva
Ejemplo de aplicación Ojiva

Se registran los tiempos de duración de las llamadas (en minutos) recibidas en un Call Center en
una muestra de 200 llamadas. El gráfico de Ojiva resultó ser:
Ojiva para la duración de las llamadas
¿Qué porcentaje de llamadas duran entre 30 y 40
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00

minutos?
a) 25%
b) 10%
Frecuencia relativa acumulada

c) 20%

Recordemos que:
𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = 𝑃 𝑋 ≤ 𝑏 − 𝑃(𝑋 ≤ 𝑎)

𝑃 30 ≤ 𝑋 ≤ 40 = 𝑃 𝑋 ≤ 40 − 𝑃 𝑋 ≤ 30 = 0,50 − 0,25

0 10 20 30 40 50 60 𝑃 30 ≤ 𝑋 ≤ 40 = 0,25 = 25%
Tiempo (minutos)
Estadística Descriptiva
Ejemplo de aplicación Ojiva
Se registran los tiempos de duración de las llamadas (en minutos) recibidas en un Call Center en
una muestra de 200 llamadas.
Ojiva para la duración de las llamadas

¿Cuál es la mediana e interprete este indicador según el


0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00

contexto del problema?


a) Med = 40. El 50% de las llamadas al Call-Center
presentaron una duración menor o igual a 40 minutos.
Frecuencia relativa acumulada

b) Med = 40. El 50% de las llamadas al Call-Center


presentaron una duración igual a 40 minutos.
c) Med = 30. El 50% de las llamadas al Call-Center
presentaron una duración mínima de 30 minutos.
d) Med = 30. El 50% de las llamadas al Call-Center
presentaron una duración igual a 30 minutos.

0 10 20 30 40 50 60

Tiempo (minutos)
Estadística Descriptiva
Diagrama de Cajas y Alambres

Este diagrama constituye una síntesis muy buena de la distribución de frecuencias y su sencillez
la hace más útil, sobre todo en aquellas situaciones donde se hace necesario comparar dos o
mas distribuciones o poblaciones.

1. Da una idea de la dispersión del conjunto de datos.

2. Da una idea sobre el grado de asimetría de la distribución de los datos.

3. Identifica posibles puntos atípicos (observaciones que son numéricamente distintas al resto
del conjunto de datos).

4. Comparación de varias poblaciones, a través de sus distribuciones.


Estadística Descriptiva
Diagrama de Cajas y Alambres

Para la construcción del diagrama de cajas y alambres se debe calcular.

• 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 1

• 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 2

• 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 3

• 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡í𝑙𝑖𝑐𝑜 = 𝑅𝐼𝐶 = 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 3 – 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 1

• 𝐿í𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 1 − 1,5 ∗ 𝑅𝐼𝐶

• 𝐿í𝑚𝑖𝑡𝑒 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 3 + 1,5 ∗ 𝑅𝐼𝐶


Estadística Descriptiva
Ejemplo de aplicación diagrama de cajas y alambres
El cuartil 1, 2 y 3 para las calificaciones de los estudiantes en el primer parcial de Fundamentos
de Estadística resultó ser:
P25% = Q1 = 2,875 Q2 = 3,95 P75% = Q3 = 4,475

Se obtiene el rango intercuartílico:


RIC = Q3 − Q1 = 4,475 − 2,875 = 1,60

Se obtiene el límite inferior y superior:


Linferior = Q1 − 1,5 * RIC = 2,875 − 1,5 *1,6 = 0,475

Lsuperior = Q3 + 1,5 * RIC = 4,475 + 1,5 *1,6 = 6,875

El límite superior se acota a 5,0 puesto que


corresponde a la calificación máxima que un
estudiante puede obtener.
Estadística Descriptiva
Ejemplo de aplicación en Ingeniería Ambiental
En el siguiente gráfico se observa el comportamiento de los niveles de monóxido de carbono
(CO) en partículas por millón (ppm) para cada uno de los días de la semana entre el año 2003 y
2006 en el centro de la ciudad de Cali.

Se considera como posibles


puntos atípicos, es decir,
aquellos que se encuentran
por fuera del límite inferior
y superior del diagrama.
Estadística Descriptiva
Ejemplo de aplicación en Ingeniería Ambiental
En el siguiente gráfico se observa el comportamiento de los niveles de monóxido de carbono
(CO) en partículas por millón (ppm) para cada uno de los días de la semana entre el año 2003 y
2006 en el centro de la ciudad de Cali dependiendo del día.
Para el día miércoles:
¿Cuál de los años presenta una
mayor dispersión?
Respuesta: 2003

¿Cuál de los años presenta una


menor dispersión?
Respuesta: 2006

¿Cuál de los años no presenta


posibles puntos atípicos?
Respuesta: 2003 y 2006
Estadística Descriptiva
Indicadores de forma
Para determinar la forma de la distribución del conjunto de datos se debe calcular la media,
mediana y moda. Una manera fácil para determinar si la variable presenta sesgo positivo, sesgo
negativo o si es simétrica es la siguiente:
• Si 𝑴𝒆𝒅𝒊𝒂 = 𝑴𝒆𝒅𝒊𝒂𝒏𝒂 𝑴𝒐𝒅𝒂, la distribución es Simétrica
= rnorm(1e+06) No deben existir posibles
Histogram of
puntos atípicos
200000
150000

El lado izquierdo es
Frecuencia absoluta

el espejo del lado


100000

derecho
50000
0

-4 -2 0 2 4
Estadística Descriptiva
Indicadores de forma
• Si Media < Mediana < Moda, la distribución es asimétrica negativa.
Ejemplo de las calificaciones del primer parcial de Fundamentos
de Estadística

𝑄3 − 𝑄2 < 𝑄2 − 𝑄1

𝐿𝑆 − 𝑄3 < 𝑄1 − 𝐿𝐼

Se concluye que la mayoría


de las observaciones se
encuentran por encima de
la media.
Una manera más práctica: es asimétrica positiva
cuando el ovalo rojo es menor al ovalo azul.
Estadística Descriptiva
Indicadores de forma

• Si Moda < Mediana < Media, la distribución es asimétrica positiva

𝑄3 − 𝑄2 > 𝑄2 − 𝑄1

𝐿𝑆 − 𝑄3 > 𝑄1 − 𝐿𝑆

Se concluye que la mayoría de


las observaciones se encuentran
por debajo de la media. Una más práctica: es asimétrica positiva cuando el
ovalo rojo es mayor al ovalo azul.

Para analizar la asimetría, no se deben considerar los posibles puntos atípicos.


Estadística Descriptiva
Ejercicio en clase
A continuación, se muestra la distribución de los promedios de las calificaciones las Pruebas
SABER de los municipios del Valle en las aéreas de Matemáticas, Lenguaje y Ciencias
Sociales, por medio de un Diagramas de Cajas y Alambres

Responda verdadero o falso cada una de las


siguientes afirmaciones:

Todas las calificaciones de la prueba de


matemáticas fueron inferiores a los
resultados de la prueba de Lenguaje.
a) Verdadero
b) Falso
Estadística Descriptiva
Ejercicio en clase

La prueba de Matemáticas presenta una


distribución simétrica.
a) Verdadero
b) Falso

La prueba de Lenguaje presenta una


distribución asimétrica positiva.
a) Verdadero
b) Falso

Las pruebas de Ciencias sociales, lenguaje y matemáticas presentan posibles puntos atípicos.
a) Verdadero
b) Falso
Estadística Descriptiva
Asimetría de manera gráfica
Retomando el ejemplo del costo semanal de mantenimiento, ¿Como es su distribución de
manera gráfica?
Asimétrica Simétrica Asimétrica
Negativa Positiva

Es asimétrica positiva, puesto que la mayoría de los


datos se encuentran hacia el lado izquierdo, en otros
En el rectángulo rojo hay una mayor cantidad de datos en relación al rectángulo negro.
Estadística Descriptiva
Asimetría de manera gráfica
Retomando el ejemplo del grosor de los discos con amplitudes iguales, ¿Como es su
distribución de manera gráfica? Histograma del grosor de los discos

Asimétrica Simétrica Asimétrica

12 16 20 24 28 32 36 40 44 48 52 56
Negativa Positiva

Grosor de los discos (mm)

8
4
Es asimétrica negativa, puesto que la mayoría de los

0
datos se encuentran hacia el lado derecho, en otros 1.05 1.10 1.15 1.20 1.25 1.30 1.35

Intervalos de clase

En el rectángulo negro hay una mayor cantidad de datos en relación al rectángulo rojo.
Estadística Descriptiva
Ejemplo aplicado

Otra manera para analizar la distribución de un conjunto de datos es estimando el coeficiente


de asimetría de Pearson, siempre y cuando la distribución presente solo una moda. Retomando
el ejemplo del costo semanal de mantenimiento se tiene:

x = 4,65
Asimétrica
Me = 4,5333
Positiva
Mo = 4,435

Como la Moda < Mediana < Media entonces la distribución del costo semanal de
mantenimiento de la fabrica es asimétrica positiva.

De esta manera, la mayoría de los costos semanales de mantenimiento son menores que $ 4,65
millones.
Estadística Descriptiva
Coeficiente de asimetría de Pearson

Solo se puede utilizar en distribuciones en forma de campana y unimodales. El


coeficiente de asimetría de Pearson viene dado por:
x − Mo
Ap =
S

• Si el coeficiente es igual a cero, la distribución es simétrica.

• Si el coeficiente es mayor que cero, la distribución es asimétrica positiva.

• Si el coeficiente de menor que cero, la distribución es asimétrica negativa.


Estadística Descriptiva
Ejemplo de aplicación del coeficiente de asimetría de Pearson

Retomando el ejemplo de los costos semanales de mantenimiento en la fábrica. Estimar el


coeficiente de asimetría de Pearson.
x = 4,65
Me = 4,5333
Mo = 4,435
S = 0,71432
x − Mo 4,65 − 4,435
Ap = = = 0,30
S 0,71432

Como el coeficiente de asimetría de Pearson es mayor que cero, entonces la distribución es


asimétrica positiva.

El coeficiente se puede calcular, puesto que solo presenta una sola moda.
Estadística Descriptiva
Ejemplo de aplicación coeficiente de asimetría de Pearson
Consideremos el ejemplo del grosor de los discos con amplitudes iguales, obtener el coeficiente
de asimetría de Pearson.
i ( Li −1 − Li ] Xi ni fi Ni Fi Primero se obtiene la media
1 (1,05 - 1,10] 1,075 17 0,085 17 0,085
σ𝑚
𝑖=1 𝑥𝑖 𝑛𝑖
2 (1,10 - 1,15] 1,125 19 0,095 36 0,18 𝑥lj =
3 (1,15 - 1,20] 1,175 49 0,245 85 0,425
𝑛
4 (1,20 - 1,25] 1,225 55 0,275 140 0,7 1,075∗17 + 1,125 ∗ 19 + ⋯ + 1,325 ∗ 18
𝑥lj =
5 (1,25 - 1,30] 1,275 42 0,21 182 0,91 200
6 (1,25 - 1,35] 1,325 18 0,09 200 1,0
𝑥lj = 1,21
Total 200

σ𝑚 2 2 + 19 ∗ (1,125 − 1,21)2 + ⋯ + 18 ∗ (1,325 − 1,21)2


𝑖=1 𝑛 𝑖 (𝑥𝑖 − 𝑥)
lj 17 ∗ (1,075 − 1,21)
𝑆2 = =
𝑛−1 200 − 1

𝑆 2 = 0,00469849 𝑆= 0,00469849 = 0,068545


Estadística Descriptiva
Ejemplo de aplicación coeficiente de asimetría de Pearson

i ( Li −1 − Li ] Xi ni fi Ni Fi Finalmente se calcula la moda


1 (1,05 - 1,10] 1,075 17 0,085 17 0,085
𝑓𝑖 − 𝑓𝑖−1
2 (1,10 - 1,15] 1,125 19 0,095 36 0,18 𝑀𝑜 = 𝐿𝑖−1 + ∗ 𝐶𝑖
2 ∗ 𝑓𝑖 − 𝑓𝑖−1 − 𝑓𝑖+1
3 (1,15 - 1,20] 1,175 49 0,245 85 0,425
4 (1,20 - 1,25] 1,225 55 0,275 140 0,7 0,275 − 0,245
5 (1,25 - 1,30] 1,275 42 0,21 182 0,91 𝑀𝑜 = 1,20 + ∗ 0,05
2 ∗ 0,275 − 0,245 − 0,21
6 (1,25 - 1,35] 1,325 18 0,09 200 1,0
Total 200 𝑀𝑜 = 1,215780

𝑥lj − 𝑀𝑜 1,21 − 1,215780
𝐴𝑝 = = = −0,0843
𝑆 0,068545
Como el coeficiente de asimetría de Pearson es menor que cero, entonces la distribución es
asimétrica negativa.
La mayoría de las observaciones se encuentran por encima del promedio.
Estadística Descriptiva
Coeficiente de asimetría de Fischer
Tiene la ventaja de que se puede hallar para cualquier tipo de distribución, aunque su calculo
requiere de más tiempo. La expresión matemática para una muestra aleatoria es:
n

 i
( x − x ) 3

AF = i =1 Para datos no agrupados


3
nS
m

 i i
n ( x − x ) 3

AF = i =1
3
Para datos agrupados en intervalos de clase
nS

• Si el coeficiente es igual a cero, la distribución es simétrica.

• Si el coeficiente es mayor que cero, la distribución es asimétrica positiva.

• Si el coeficiente es menor que cero, la distribución es asimétrica negativa.


Estadística Descriptiva
Ejemplo de aplicación coeficiente de asimetría de Fischer
Retomando el ejemplo de los costos semanales de mantenimiento en la fábrica. Estimar el
coeficiente de asimetría de Fisher.
( Li −1 − Li ] Xi ni fi Ni Fi Sabemos que:
(3,2 - 3,7] 3,45 3 0,075 3 0,075 x = 4,65
(3,7 - 4,2] 3,95 7 0,175 10 0,25 S = 0,71432
(4,2 - 4,7] 4,45 15 0,375 25 0,625
(4,7 - 5,2] 4,95 6 0,15 31 0,775 Ambos indicadores son diferentes, sin
(5,2 - 5,7] 5,45 4 0,10 35 0,875 embargo, la conclusión siempre será la
(5,7 - 6,2] 5,95 5 0,125 40 1,0 misma, siempre y cuando la distribución solo
Total 40 1,0
presente una moda. Si se presenta dos o más
m
modas, solo se puede usar Fischer.
 n (x − x)
i i
3
3 * (3,45 − 4,65)3 + 7 * (3,95 − 4,65)3 + ... + 5 * (5,95 − 4,65)3
AF = i =1
=
nS 3 40 * (0,71432 )3
Como el coeficiente de asimetría de Fisher es mayor que cero, entonces la
AF = 0,37656  0
distribución del costo semanal de mantenimiento es asimétrica positiva.
Estadística Descriptiva
Ejemplo de aplicación coeficiente de asimetría de Fischer
Retomando el ejemplo del grosor de los discos con amplitudes iguales. Estimar el coeficiente de
asimetría de Fisher.
i ( Li −1 − Li ] Xi ni fi Ni Fi Sabemos que:
1 (1,05 - 1,10] 1,075 17 0,085 17 0,085 𝑥lj = 1,21
2 (1,10 - 1,15] 1,125 19 0,095 36 0,18 𝑆 = 0,0151195
3 (1,15 - 1,20] 1,175 49 0,245 85 0,425
4 (1,20 - 1,25] 1,225 55 0,275 140 0,7
5 (1,25 - 1,30] 1,275 42 0,21 182 0,91
6 (1,25 - 1,35] 1,325 18 0,09 200 1,0
Total 200

σ𝑚 lj 3 17 ∗ (1,075 − 1,21)3 + 19 ∗ (1,125 − 1,21)3 +. . . +18 ∗ (1,325 − 1,21)3


𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥)
𝐴𝐹 = 3
=
𝑛𝑆 200 ∗ (0,0151195)3

𝐴𝐹 = −256,2 < 0 Como el coeficiente de asimetría de Fisher es menor que cero, entonces la
distribución del costo semanal de mantenimiento es asimétrica negativa.
Estadística Descriptiva
Curtosis
Hace referencia al mayor o menor apuntamiento que tiene una distribución de frecuencias
respecto a una distribución en forma de campana (también conocida como distribución
normal). Sólo se estudia en distribuciones en forma de campana y evalúa el grado de
apuntamiento de la distribución. La expresión matemática para una muestra viene dada por:
n

 i
( x − x ) 4

CAp = i =1
−3 Para datos no agrupados
n( S 2 ) 2
m

 i i
n ( x − x ) 4

CAp = i =1
2 2
−3 Para datos agrupados en intervalos de clase
n( S )

• Si CAp = 0, la curva es igual a la normal y se llama Mesocúrtica.


• Si CAp > 0, la curva es más puntiaguda que la normal y se llama Leptocúrtica.
• Si Cap < 0, la curva es más aplastada que la normal y se llama Platicúrtica.
Estadística Descriptiva
Curtosis
Gráficamente: Retomando el ejemplo de los costos semanales de
mantenimiento en la fábrica. ¿Cómo la curtosis?

Primero se analiza el histograma, para tener una idea.

A través del histograma, se puede mencionar que la


curtosis es:
a) Leptocúrtica
b) Mesocúrtica
c) Platicúrtica
Estadística Descriptiva
Ejemplo de aplicación

Estimar la curtosis para el ejemplo del costo semanal de mantenimiento.


( Li −1 − Li ] Xi ni fi Ni Fi Sabemos que:
(3,2 - 3,7] 3,45 3 0,075 3 0,075 x = 4,65
(3,7 - 4,2] 3,95 7 0,175 10 0,25
S = 0,71432
(4,2 - 4,7] 4,45 15 0,375 25 0,625
(4,7 - 5,2] 4,95 6 0,15 31 0,775
(5,2 - 5,7] 5,45 4 0,10 35 0,875
(5,7 - 6,2] 5,95 5 0,125 40 1,0
Total 40 1,0
m

 n (x − x)
i i
4
3 * (3,45 − 4,65) 4 + 7 * (3,95 − 4,65) 4 + ... + 5 * (5,95 − 4,65) 4
CAp = i =1
−3 = −3
n( S 2 ) 2 40 * (0,71432 )2 2

CAp = 4,58854 − 3 = 1,58854  0 Como la curtosis es mayor que cero, entonces la curva del
histograma es leptocúrtica.
Estadística Descriptiva
Curtosis
Sabemos que: Retomando el ejemplo del grosor de los discos de la
fábrica. ¿Cómo la curtosis?

Primero se analiza el histograma, para tener una idea.


Histograma del grosor de los discos

12 16 20 24 28 32 36 40 44 48 52 56
Grosor de los discos (mm)
A través del histograma, se puede mencionar que la
curtosis es:

8
a) Leptocúrtica

4
Es mesocúrtica, cuando

0
b) Mesocúrtica
Media = Mediana = Moda
1.05 1.10 1.15 1.20 1.25 1.30 1.35

c) Platicúrtica Intervalos de clase


Estadística Descriptiva
Ejemplo de aplicación

Estimar la curtosis para el ejemplo del grosor de los discos.


i ( Li −1 − Li ] Xi ni fi Ni Fi Sabemos que:
1 (1,05 - 1,10] 1,075 17 0,085 17 0,085 𝑥lj = 1,21
2 (1,10 - 1,15] 1,125 19 0,095 36 0,18
𝑆 = 0,068545
3 (1,15 - 1,20] 1,175 49 0,245 85 0,425
4 (1,20 - 1,25] 1,225 55 0,275 140 0,7
5 (1,25 - 1,30] 1,275 42 0,21 182 0,91
6 (1,25 - 1,35] 1,325 18 0,09 200 1,0
Total 200

σ𝑚 lj 4
𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥) 17 ∗ (1,075 − 1,21)4 + 19 ∗ (1,125 − 1,21)4 +. . . +18 ∗ (1,325 − 1,21)4
𝐶𝐴𝑝 = −3= −3
𝑛(𝑆 2 )2 200 ∗ (0,0685452 )2

𝐶𝐴𝑝 = 2,40375 − 3 = −0,59625 < 0 Como la curtosis es menor que cero, entonces la curva del
histograma es platicúrtica.
Estadística Descriptiva
Regla empírica

La regla empírica se considera en distribuciones con forma de campana o montículo


(distribución simétrica).

Matemáticamente se tiene: P( − 1*  X   + 1* ) = 0,68 = 68%


P( − 2 *  X   + 2 * ) = 0,95 = 95%
P( − 3 *  X   + 3 * ) = 0,997 = 99,7%
Estadística Descriptiva
Ejemplo de aplicación Regla empírica

Los costos semanales de mantenimiento para una fabrica, registrados en un largo periodo de
tiempo y ajustados a la inflación, tienden a tener una distribución en forma de campana, con un
promedio de $4,2 millones y una desviación estándar de $0,5 millones.

¿Entre que valores estarán los costos semanales con una probabilidad (confiabilidad) del 95%?

Por la regla empírica sabemos: P( − 2 *  X   + 2 * ) = 0,95 = 95%

 = 4,2 ; 𝜎 = 0,5
P(4,2 − 2 * 0,50  X  4,2 + 2 * 0,50) = 95%

P(3,2  X  5,2) = 95%

Con una probabilidad del 95%, los costos semanales de mantenimiento en la fábrica se
encontrarán entre $3,2 y $5,2 millones.
Estadística Descriptiva
Ejemplo de aplicación Regla empírica

Los costos semanales de mantenimiento para una fabrica, registrados en un largo periodo de
tiempo y ajustados a la inflación, tienden a tener una distribución en forma de campana, con un
promedio de $4,2 millones y una desviación estándar de $0,5 millones.

¿Entre que valores estarán los costos semanales con una probabilidad (confiabilidad) del 99,7%?

Por la regla empírica sabemos: 𝑃(𝜇 − 3 ∗ 𝜎 ≤ 𝑋 ≤ 𝜇 + 3 ∗ 𝜎) = 99,7%


 = 4,2 ; 𝜎 = 0,5
𝑃(4,2 − 3 ∗ 0,50 ≤ 𝑋 ≤ 4,2 + 3 ∗ 0,50) = 99,7%

𝑃(2,7 ≤ 𝑋 ≤ 5,7) = 99,7%

Con una probabilidad del 99,7%, los costos semanales de mantenimiento en la fábrica se
encontrarán entre $2,7 y $5,7 millones.
Estadística Descriptiva
Ejemplo de aplicación Regla empírica

Responda verdadero o falso cada una de las siguientes afirmaciones.

Si una variable se asemeja en forma de campana, se puede concluir que a mayor probabilidad
(confiabilidad), el intervalo se hace más grande.

a) Verdadero P(3,2  X  5,2) = 95%


b) Falso 𝑃(2,7 ≤ 𝑋 ≤ 5,7) = 99,7%

El coeficiente de asimetría de Pearson se puede considerar para cualquier tipo de distribución.

a) Verdadero El único indicador que se puede considerar para cualquier tipo de


b) Falso distribución es el coeficiente de asimetría de Fischer.
Estadística Descriptiva
Ejemplo de aplicación Regla empírica

Se consideró una muestra aleatoria de 4.732 Histograma del Salario

funcionarios de un banco. Se obtuvo el salario

2000
mensual, cuyo histograma resultó ser: Es asimétrica positiva, puesto
que la cola de la distribución
Dada la distribución del conjunto de datos, se se encuentra hacia el lado

1500
puede aplicar la regla empírica. derecho.

Frecuencia absoluta

1000
a) Verdadero
b) Falso

500
No se puede considerar la regla empírica,
puesto que la distribución no tiene forma de
campana, que equivale a una distribución no

0
simétrica.
0 5 10 15 20 25 30 35

Salario mensual (millones)

También podría gustarte