Está en la página 1de 7

TRANSFORMACION POR EL METODO LOGARITMICO Y METODO BOX-COX

APLICADO CON R - STUDIO

JHON EMIRO ARENAS BUENDIA

CONTROL ESTADISTICO DE CALIDAD

FUNDACION UNVERSITARIA COLOMBO INTERNACIONAL


UNICOLOMBO

CARTAGENA DE INDIAS D. T. y C.

2020
PROBLEMA #4

Imagen 13: Enunciado del problema #4 Fuente: Autor.

En primer lugar y antes de empezar a resolver el ejercicio se aplicará las pruebas para evaluar
la normalidad de los datos y así poder estar seguros de que se cumple con esta condición para los
índices de capacidad.

> lillie.test(tiempo)
Lilliefors (Kolmogorov-Smirnov) normality test
data: tiempo
D = 0.15246, p-value = 8.87e-05
> ks.test(tiempo, pnorm, mean(tiempo), sd(tiempo))
One-sample Kolmogorov-Smirnov test
data: tiempo
D = 0.15246, p-value = 0.0485
alternative hypothesis: two-sided
Para ese ejercicio los datos no siguen distribución normal, por lo tanto, su aplicación con los
índices de capacidad debe ser visto de manera reservada.

A. Usando un paquete estadístico encuentre una distribución que se ajuste razonablemente a


los datos. Luego estime los índices Pp, Ppi, Pps y Ppk con el método de percentiles de
Clements.

Solucion pasó a paso:


Paso 1: Realizando una investigación en web de R – Studio llamada Rpubs https://rstudio-
pubs-static.s3.amazonaws.com/74285_d1a6a97a4c2c4576a3e6ac92bb480499.html se encontró
que “Cuando se trabaja con datos que presentan mucha asimetría, muchas veces es conveniente
transformarlos para que sea más fácil modelarlos. Existen distintas técnicas que pueden utilizarse
cuando muchos de los datos se concentran en un extremo de la distribución y todos los valores
son positivos. Una de estas técnicas comúnmente utilizadas es la transformación logarítmica”.
Para hacer uso de esta transformación logarítmica y aprovechando que todos los datos son
positivos como lo dice el párrafo, se usa la siguiente forma:

> logtiempo<-log(tiempo)
> lillie.test(logtiempo)
Lilliefors (Kolmogorov-Smirnov) normality test
data: logtiempo
D = 0.059607, p-value = 0.6885

Lo que hemos realizado con el comando logtiempo<-log(tiempo) es almacenar los datos que
están en el vector tiempo dentro de un nuevo vector llamado logtiempo pero con los datos en su
forma logarítmica. Comprobando posteriormente que la normalidad de estos si es verdadera debido
al que P – Value para este nuevo vector es mayor α=0.05.

Con los datos transformados podemos pasar a calcular los índices de capacidad con el método
del percentiles de Clements, el cual depende de los percentiles 𝑃0.50 , 𝑃0.00135 , 𝑃0.99865 y que
podemos obtener en R – Studio de la siguiente forma:

> quantile(logtiempo, c(0.99865, 0.00135, 0.5))


99.865% 0.135% 50%
3.7586906 0.7908696 2.7725887
> log(50)
[1] 3.912023

𝐸𝑆 − 𝑃0.5 3.912023 − 2.7725887


𝑃𝑝𝑠 = = = 1.155
𝑃0.99865 − 𝑃0.5 3.7586906 − 2.7725887

Tomando la ecuación proporcionada por Humberto Gutiérrez en su libro, obtenemos un índice


de capacidad igual a 1.155 el cual se puede ubicar en la categoría 2 Parcialmente adecuado,
requiere controles estrictos según la tabla 5.1 del libro de Humberto Gutiérrez.

B. Estime los índices del inciso anterior transformando previamente los datos a normalidad
con el método de Box-Cox.
Solucion pasó a paso:

Paso 1: Para realizar la transformación por el método de Box-Cox es necesario observar en


primer lugar el comportamiento de normalidad de los datos, el cual ya se realizó con anterioridad
obteniéndose que los datos originales no siguen distribución normal, en segundo lugar, para
inspección visual obtenemos el diagrama dispersión de los datos. Para esto, se usó el comando
qqnrom(x), donde x representa el vector que tiene los datos.

Imagen 15: Diagrama de dispersión de tiempo Fuente: Autor.

Se observa claramente la curvatura de los datos, lo cual confirma la normalidad de los mismos.
Procedemos a transformarlos en R – Studio, obteniendo los siguientes datos:

> library(fpp)
> lambda <- BoxCox.lambda(tiempo, method = c("loglik"), lower =-2, upper =2)
> lambda
[1] 0.35
> boxtiempo<-BoxCox(tiempo, lambda)
> as.matrix(boxtiempo)

[,1] [14,] 4.1543764 [28,] 6.9591968


[1,] 6.5384545 [15,] 6.8571644 [29,] 4.1543764
[2,] 3.9606750 [16,] 4.1543764 [30,] 5.5719317
[3,] 5.5719317 [17,] 4.1543764 [31,] 4.1543764
[4,] 3.3076265 [18,] 7.5337521 [32,] 2.1613286
[5,] 5.0002295 [19,] 3.0586567 [33,] 4.6829023
[6,] 3.0586567 [20,] 3.5392033 [34,] 6.5384545
[7,] 7.7127165 [21,] 4.3386188 [35,] 2.4920086
[8,] 0.7844589 [22,] 5.5719317 [36,] 5.2953881
[9,] 5.1503344 [23,] 6.1982912 [37,] 6.9591968
[10,] 6.0794635 [24,] 7.4420827 [38,] 4.8446011
[11,] 6.3142916 [25,] 3.9606750 [39,] 6.3142916
[12,] 4.5144934 [26,] 4.6829023 [40,] 3.5392033
[13,] 3.5392033 [27,] 4.6829023 [41,] 4.6829023
[42,] 5.7040977 [55,] 6.8571644 [68,] 5.7040977
[43,] 7.4420827 [56,] 5.7040977 [69,] 5.5719317
[44,] 3.0586567 [57,] 4.5144934 [70,] 5.9576266
[45,] 4.3386188 [58,] 5.2953881 [71,] 6.5384545
[46,] 3.0586567 [59,] 5.2953881 [72,] 3.3076265
[47,] 7.1575545 [60,] 4.5144934 [73,] 4.5144934
[48,] 3.5392033 [61,] 3.7561750 [74,] 5.1503344
[49,] 7.3488724 [62,] 3.9606750 [75,] 2.1613286
[50,] 2.7885373 [63,] 4.1543764 [76,] 6.9591968
[51,] 7.8001258 [64,] 4.3386188 [77,] 4.6829023
[52,] 4.5144934 [65,] 3.9606750 [78,] 3.0586567
[53,] 4.5144934 [66,] 5.1503344 [79,] 5.7040977
[54,] 3.3076265 [67,] 3.5392033 [80,] 5.4358007
Posteriormente al transformar los datos, realizamos prueba de normalidad para comprobar si
estos cumplen con la condición y miramos su distribución el diagrama de dispersión.

> lillie.test(boxtiempo)
Lilliefors (Kolmogorov-Smirnov) normality test
data: boxtiempo
D = 0.090676, p-value = 0.1073

Imagen 16: Diagrama de dispersión datos transformados con Box-Cox Fuente: Autor

Efectivamente, los datos cumplen la condición de seguir normalidad y podemos proceder a


calcular los índices capacidad por medio del diagrama de capacidad del proceso.

> BoxCox(50,lambda)
[1] 8.377815
attr(,"lambda")
[1] 0.35
> quantile(boxtiempo, c(0.99865, 0.00135, 0.5))
99.865% 0.135% 50%
7.7908036 0.9313021 4.6829023

𝐸𝑆 − 𝑃0.5 8.377815 − 4.6829023


𝑃𝑝𝑠 = = = 1.188
𝑃0.99865 − 𝑃0.5 7.7908036 − 4.6829023
Tomando la ecuación proporcionada por Humberto Gutiérrez en su libro, obtenemos un índice
de capacidad igual a 1.188 el cual se puede ubicar en la categoría 2 Parcialmente adecuado,
requiere controles estrictos según la tabla 5.1.

C. Compare los resultados obtenidos. ¿Cuál será la mejor estimación? Argumente

Los índices calculados con ambas transformaciones, están ubicando la capacidad del proceso
en la misma categoría, solo con un pequeño aumento en su capacidad cuando la transformación
fue hecha por Box-Cox. Por esta razón, ambos índices son estimaciones certeras del proceso.

También podría gustarte