Está en la página 1de 19

Ajuste de

distribuciones con
MINITAB
Ajuste de distribuciones
con MINITAB

1. Tiempo de vuelo de un avión de papel


2. Duración de una transmisión telemática

2
1.Tiempo de vuelo de un avión de papel

El fichero EDB_2015_II_depurado.xlsx contiene datos recogidos de un


grupo de estudiantes. Una de las variables ‘Tiempo de ejecución’ tiene
el tiempo, en segundos, que permaneció volando un avión de papel
construido por ellos mismos.

Se quiere hallar un modelo de probabilidad para esta variable. Además,


a partir de este modelo, se quiere calcular la probabilidad de que un
avión de estas características vuele más de 3 segundos.

En primer lugar hacemos una descripción


estadística de esta variable.
Estadísticas/Estadística básica /Resumen
gráfico

La variable presenta una fuerte asimetría


positiva. No presenta atípicos. El test de
normalidad de Anderson-Darling (AD) tiene un
p-valor muy pequeño, La distribución es
claramente no normal

3
1.Tiempo de vuelo de un avión de papel

A continuación vamos a realizar histogramas con menos clases, para ver si eso suaviza el
histograma o, por el contrario, revela multimodalidad. El histograma lo haremos dibujando de forma
superpuesta la función de densidad de algunas distribuciones que son asimétricas positivas, por si
son buenas candidatas para modelizar estos datos. Probaremos la función Lognormal y la Weibull,
ambas estimando los parámetros con los datos de la muestra. La secuencia de instrucciones que
tenemos que seleccionar es:
Gráfica/Histograma/con ajuste/mostrar datos/distribución/Lognormal y Weibull
Además, una vez que aparezca el histograma seleccionaremos (botón derecho del ratón)
Editar barras/ Seccionamiento/ intervalos=13

Estas gráficas nos muestran también las estimaciones de sus parámetros

De estas dos opciones, la Lognormal parece ajustarse mejor al patrón de los datos.
4
1.Tiempo de vuelo de un avión de papel

Para valorar mejor el ajuste de estas dos distribuciones realizamos un gráfico


de probabilidad y contrastes de bondad de ajuste
Estadísticas>Herramientas de calidad>Identificación de la distribución individual

Elegimos analizar las


observaciones
individuales

(para ciertos análisis -control


estadístico de procesos- suele
ser habitual trabajar con
medias de subgrupos, en lugar
de con los datos individiduales)

5
1.Tiempo de vuelo de un avión de papel

El test de bondad de ajuste de Anderson-Darling muestra en los tres casos p-valores


muy bajos. El más alto es el del ajuste de la Lognormal. Con 𝛼 = 1% de nivel de
significación se podría aceptar. El gráfico de probabilidad es el que está más alineado.

6
1.Tiempo de vuelo de un avión de papel

Si adoptamos el modelo Lognormal, estimado con la muestra, podemos calcular la


probabilidad de que 𝑋 > 3.
Calc/Distribuciones de probabilidad/Lognormal

𝑃 𝑋 > 3 = 1 − 0.58 = 0.42

7
1.Tiempo de vuelo de un avión de papel

Al ser la distribución unimodal y asimétrica, otra opción para ajustar un modelo es realizar
una transformación tipo Box-Cox y ajustar una normal a los datos transformados.
Estadísticas>Herramientas de calidad>Identificación de la distribución individual

Minitab encuentra el lambda óptimo en la transformación 𝑊 = 𝑋 𝜆

8
1.Tiempo de vuelo de un avión de papel

La transformación óptima es
1
𝑊=
𝑋
El ajuste tiene un p-valor
muy elevado

Con 9 clases.

El ajuste parece mejor que


con la lognormal.

𝜇Ƹ 𝑊 = 0.60; 𝜎ො𝑊 = 0.084

9
1.Tiempo de vuelo de un avión de papel

1
Calculamos ahora la probabilidad de que 𝑋 > 3 usando que X −2 ∼ 𝑁(0.60; 0.084)

1
𝑃 𝑋>3 =𝑃 𝑋> 3 =𝑃 𝑋 > 1.732 = 𝑃 < 0.577 = 0.39
𝑋

10
Ajuste de distribuciones
con MINITAB

1. Tiempo de vuelo de un avión de papel


2. Duración de una transmisión telemática

11
2. Duración de una transmisión telemática

El centro de computación de una agencia meteorológica envía de forma telemática a sus clientes información
en tiempo real sobre un conjunto de variables procedente de su red de estaciones. Se tiene una muestra de
la duración de dichas transmisiones recogidas de forma consecutiva. El objetivo de calidad es que la duración
media sea inferior a 10 segundos.

Gráfica de series de tiempo de Duration


13

12

11

10

Duration
9

1 10 20 30 40 50 60 70 80 90 100
Índice

¿Cómo es la población de la que proceden estos datos?

12
2. Duración de una transmisión telemática
En primer lugar vamos a eliminar el dato anómalo, que tiene un valor inferior a 5. Lo
hacemos creando una nueva hoja con los datos ‘buenos’.

13
2. Duración de una transmisión telemática
Hacemos un resumen estadístico

Resumen para Duration


P rueba de normalidad de A nderson-Darling
A -cuadrado 0,26
V alor P 0,692

M edia 10,013

La distribución es unimodal y muy Desv .E st.


V arianza
1,200
1,439

simétrica, con un coeficiente de A simetría


Kurtosis
0,0748536
-0,0423816

asimetría muy pequeño, y una N

M ínimo
99

7,087
kurtosis muy similar a la de la 1er cuartil
M ediana
9,251
9,970
normal. Además, el test de AD 7 8 9 10 11 12 13
3er cuartil
M áximo
10,721
12,751
muestra un p-valor muy elevado. Interv alo de confianza de 95% para la media

Parece entonces muy razonable 9,773 10,252


Interv alo de confianza de 95% para la mediana

asumir que esta muestra procede 9,685 10,293


Interv alo de confianza de 95% para la desv iación estándar
de una población normal Intervalos de confianza de 95%
1,053 1,395
Media

Mediana

9,60 9,75 9,90 10,05 10,20

14
2. Duración de una transmisión telemática
Vamos a ver un gráfico de probabilidad de la normal, y a hacer otros tests de normalidad

Estadísticas>Estadística Básica>Prueba de normalidad

Hacemos el test KS y el RJ (el


AD ya lo tenemos en la
transparencia anterior)

Estos dos tests también


permiten asumir la
normalidad

15
2. Duración de una transmisión telemática
Vamos a ver ahora si alguna otra distribución presenta un ajuste mejor. Podemos probar con
la transformación Box-Cox por si podemos mejorar la simetría. Probaremos también Weibull
(tiende a ser simétrica positiva)

Estadísticas>Herramientas de calidad>Identificación de la distribución individual

Como son datos reales,


obtenidos
secuencialmente
ponemos que son
subgrupos de tamaño 1

16
2. Duración de una transmisión telemática
Vamos a ver ahora si alguna otra distribución presenta un ajuste mejor. Podemos probar con
la transformación Box-Cox por si podemos mejorar la simetría. Probaremos también Weibull
(tiende a ser simétrica positiva)

Estadísticas>Herramientas de calidad>Identificación de la distribución individual

Como son datos


obtenidos
secuencialmente
ponemos que
son subgrupos
de tamaño 1

17
2. Duración de una transmisión telemática

Gráfica de probabilidad para Duration


P rueba de bondad del ajuste
Normal - 95% de IC Weibull - 95% de IC
99,9 99,9 Transformación Box-C ox
99 90
A D = 0,217
90 50 V alor P = 0,839
Porcentaje

Porcentaje
50 10 Weibull
A D = 1,072
10 1 V alor P < 0,010
1
N ormal
0,1 0,1
2,5 3,0 3,5 4,0 5 7,5 10 12,5 A D = 0,264
Duration Duration V alor P = 0,692
Después de la transformación de Box-Cox (lambda = 0,5)

Normal - 95% de IC
99,9
99

90
Porcentaje

50

10

1
0,1
5,0 7,5 10,0 12,5
Duration

La transformación Box-Cox parece mejorar la normalidad (aún más). La transformación es

Y X

18
2. Duración de una transmisión telemática
Vamos a ver cómo es la distribución transformada
Resumen para BCDuration
Resumen para Duration
P rueba de normalidad de A nderson-Darling
P rueba de normalidad de A nderson-Darling
A -cuadrado 0,22
A -cuadrado 0,26
V alor P 0,839
V alor P 0,692
M edia 3,1586
M edia 10,013
D esv .E st. 0,1903
Desv .E st. 1,200
V arianza 0,0362
V arianza 1,439
A simetría -0,104043
A simetría 0,0748536
Kurtosis 0,050403
Kurtosis -0,0423816
N 99
N 99
M ínimo 2,6621
M ínimo 7,087
1er cuartil 3,0415
1er cuartil 9,251
M ediana 3,1575
M ediana 9,970
3er cuartil 10,721 3er cuartil 3,2743
2,8 3,0 3,2 3,4 3,6 M áximo 3,5708
7,2 8,4 9,6 10,8 12,0 13,2 M áximo 12,751
Interv alo de confianza de 95% para la media Interv alo de confianza de 95% para la media

9,773 10,252 3,1207 3,1966


Interv alo de confianza de 95% para la mediana Interv alo de confianza de 95% para la mediana
9,685 10,293 3,1121 3,2082
Interv alo de confianza de 95% para la desv iación estándar Interv alo de confianza de 95% para la desv iación estándar
Intervalos de confianza de 95% Intervalos de confianza de 95%
1,053 1,395 0,1670 0,2213
Media Media

Mediana Mediana

9,60 9,75 9,90 10,05 10,20 3,100 3,125 3,150 3,175 3,200

Ambos se han hecho con 10 clases. La transformación parece mejorar algo la parte de la
cola de la derecha. En cualquier caso, ambas distribuciones son muy parecidas, y el
ajuste es muy satisfactorio en ambas.

El mejor modelo es: Y  X ~ N (3.16;0.19)

19

También podría gustarte