Está en la página 1de 14

INDICE

Introducción ---------------------------------------------------------------------------------------------------------2

Contenido. ----------------------------------------------------------------------------------------------------------3

Conclusión----------------------------------------------------------------------------------------------------------- 14

Bibliografía-----------------------------------------------------------------------------------------------------------14
Introducción

El Análisis Estadístico e inferencial de un caso donde apliquemos la metodología seis sigma desde sus conceptos
básicos son muy importantes para adquirir el conocimiento necesario de como todas las herramientas
estadísticas y de probabilidad nos ayudaran en la toma de decisiones correctas y mas aun a entender el
comportamiento de un proceso en su variación y poder corregir para tenerlo en control.

Conceptos importantes se listan a continuación:

Media muestral X .- Se suman todos los valores de los datos de una muestra y el resultado de la suma
se divide entre el número de datos (n).

Mediana o percentil 50 o segundo cuartil.- Valor que divide a la mitad los datos cuando son ordenados
de menor a mayor. Así, para calcular la mediana, cuando el número de datos es impar, estos se ordenan
de manera creciente y el que quede en medio de dicho ordenamiento será la mediana. Pero si el
número de datos es par, entonces la mediana se calcula dividiendo entre dos la suma de los números
que están en el centro del ordenamiento.

Moda.- Dato que se repite más veces. Si varios datos tienen la frecuencia más grande, entonces cada
uno de ellos es una moda, y se dice que el conjunto de datos es multimodal.

Rango, R.- Representa la diferencia entre el dato mayor y el dato menor de un conjunto de datos.

Varianza.- Es la Medida de la dispersión que proporciona el promedio de desviación de un conjunto de datos


con respecto a un valor central.

Desviación estándar muestral.- Medida de la variabilidad más usual que indica qué tan esparcido están

los datos con respecto a la media de una muestra. Es la raíz cuadrada de la Varianza.

1
Contenido.

Aplicar de manera sumamente práctica las herramientas de estadística para el análisis de datos en un caso
práctico de proyecto de mejora. En una fábrica de remolques se quiere realizar un proyecto de optimización para
reducir el consumo de pintura utilizada por remolque. Después de un análisis de proceso se llegó a la conclusión
que las variables que pueden afectar el consumo son:

Cantidad de Tiempo de secado calidad de Aplicación total


recubrimiento gr/ l Pintura min. acabado remolque Kg

13.9 30.9 buena 180


14.2 31.2 buena 180.3
14.1 31.1 buena 180.5
13.5 30.5 buena 180.1
14 31 buena 180.2
14.1 31.1 buena 180.4
13.9 30.9 buena 180.4
13.6 30.6 buena 180.1
14.3 31.3 buena 180.5
13 30 buena 179.6
14.9 31.9 buena 180.6
15.1 32.1 buena 181.8
14.8 31.8 buena 182.7
14.7 31.7 buena 183.5
14.3 31.3 buena 183.9
14.5 31.5 buena 184.5
14.6 31.6 regular 185.2
14.2 31.2 regular 185.5
14.1 31.1 regular 185.7
13.8 30.8 regular 185.6
13.9 30.9 regular 185.6
13.9 30.9 regular 185.6
14.5 31.5 regular 186.2
15.3 32.3 regular 187.6
15.5 32.5 regular 189.2
19.5 36.5 regular 194.8
19.5 36.5 regular 200.4
19.8 36.8 regular 206.3
21.3 38.3 regular 213.7
22.5 39.5 regular 222.3
21.9 38.9 regular 230.3
22 39 regular 238.4

2
Realiza un análisis estadístico determinando:

1. La estadística descriptiva de las variables continúas y establece conclusiones de sus tendencias


centrales, rango, intervalos de confianza.
2. Realiza una identificación de la distribución de probabilidad y determina a qué tipo de distribuciones
se ajusta cada una de las variables continuas.

Solución Punto 1 y 2:

a) Ordenar los valores en una tabla para facilitar la obtención de las medidas de tendencia central, como
se lista abajo, hacer sumatorias y calcular la Media, Mediana, Rango, Moda, Varianza y Desviación
Estándar. Ver abajo en color verde.

Tiempo de
Cantidad de calidad de Aplicación total
# dato secado Pintura
recubrimiento gr/ l acabado remolque Kg
min.
1 13 30 buena 179.6
2 13.5 30.5 buena 180
3 13.6 30.6 buena 180.1
4 13.8 30.8 buena 180.1
5 13.9 30.9 buena 180.2
6 13.9 30.9 buena 180.3
7 13.9 30.9 buena 180.4
8 13.9 30.9 buena 180.4
9 14 31 buena 180.5
10 14.1 31.1 buena 180.5
11 14.1 31.1 buena 180.6
12 14.1 31.1 buena 181.8
13 14.2 31.2 buena 182.7
14 14.2 31.2 buena 183.5
15 14.3 31.3 buena 183.9
16 14.3 31.3 buena 184.5
17 14.5 31.5 regular 185.2
18 14.5 31.5 regular 185.5
19 14.6 31.6 regular 185.6
20 14.7 31.7 regular 185.6
21 14.8 31.8 regular 185.6
22 14.9 31.9 regular 185.7
23 15.1 32.1 regular 186.2
24 15.3 32.3 regular 187.6
25 15.5 32.5 regular 189.2
26 19.5 36.5 regular 194.8
27 19.5 36.5 regular 200.4
28 19.8 36.8 regular 206.3
29 21.3 38.3 regular 213.7
30 21.9 38.9 regular 222.3
31 22 39 regular 230.3
32 22.5 39.5 regular 238.4
Sumatoria 503.20 1047.20 N/A 6081.50
Qty datos = n 32 32 N/A 32
Media x 15.73 32.73 N/A 190.05
Mediana X 14.40 31.40 N/A 184.85
3
Moda 13.9 30.9 N/A 185.6
Rango 9.5 9.5 N/A 58.8
Varianza 8.406 8.406 N/A 238.286
Desviación
2.899 2.899 N/A 15.437
Estándar

Además de hacerlo en Excel, usando el Software Minitab versión 18 obtuvimos los mismos valores, como se
listan en las fotos a continuación.

Para determinar si una grafica de Probabilidad tiende a NORMAL el valor de P debe ser > 0.05.

En este caso es ANORMAL para la cantidad de recubrimiento.

Así mismo para el tiempo de Secado de la Pintura las gráficas se muestran a continuación, la gráfica de
Probabilidad porque el valor de P no cumple para una condición NORMAL.

4
Y para la Aplicación total al remolque, serian:

Haciendo un Resumen grafico para determinar la prueba de Normalidad de Anderson-Darling.

El histograma indica que es del tipo acantilado, quizás hay oportunidad con el equipo de medición.

5
Con la grafica de caja observamos valores atípicos (outliers) que nos indican anormalidades, la mediana esta
cargada al Q1.

Solución punto 3: Mediante una gráfica de corridas determina cuál de las variables se encuentra en descontrol
y cuáles son los comportamientos de descontrol que presentaría cada variable si es que esta en descontrol.

Graficas de control considerando los valores de la Media Desviación Estándar de la tabla de arriba.

En todas las graficas de corridas de control se visualiza como la tendencia es a fallar hacia el limite superior de
control, es necesario tomar medidas para controlar la variación del proceso en ese sentido.
6
Solución Punto 4. Realiza un ANOVA entre calidad de acabado y consumo de pintura por remolque y establece
si la primera es significativa con respecto a la segunda.

Análisis de varianza “ANOVA”

Es un instrumento estadístico inferencial que determina la significancia estadística de una o más variables
independientes a través de la diferencia de sus promedios considerando una variable de respuesta llamada
“variable dependiente”

Promedios VS Rangos. Within (Rangos) + Between (Promedios) = Variación total

Si el residual es pequeño, entonces existe más variación dentro de los rangos, por lo tanto, NO existe
significancia estadística.

Si el residual es grande, entonces existe más variación entre los promedios, por lo tanto, SI existe significancia
estadística.

Graficas de ANOVA con Minitab para determinar si existe significancia estadística entre estos factores.

Si el valor de p es menor que el nivel de confianza (0.05) quiere decir que hay variación entre los grupos que
dentro de ellos, es decir si hay significancia estadística en el factor analizado. Si p < α (0.05), entonces, si hay
significancia estadística. Por lo anterior y los resultados de Minitab listados a continuación, concluimos que la
calidad de acabado si es significativa con respecto al consumo de pintura por remolque.

7
Solución Punto 5. Realiza análisis de regresión lineal para las demás variables y el consumo de pintura y
determina cuales son significativas, el valor del r 2 para cada una de las regresiones y en que valores es
conveniente trabajar para optimizar o en este caso disminuir el consumo de pintura.
Inferencia estadística. Regresión lineal simple. Modelos de Regresión.
Una vez que sabemos que dos variables están relacionadas… ¿Cómo averiguar qué tipo de relación tienen?
Para esto utilizamos los modelos de regresión.
Regresión lineal simple: La regresión como técnica estadística analiza la relación de dos o más variables
continuas.
La regresión se utiliza para inferir datos a partir de otros y hallar una respuesta a lo que pueda suceder
DIFERENCIA ENTRE CORRELACIÓN Y REGRESIÓN:

La correlación es independiente de la escala, pero no la regresión. Ejemplo: La correlación entre estatura y peso
es la misma sin importar que la estatura se mida en metros o centímetros. Sin embargo, La ecuación de regresión
entre el peso y la estatura depende de las unidades que utilicemos.

m es la pendiente de la recta

b es el punto en que la recta corta el eje vertical

Conociendo los valores de estos dos coeficientes podríamos reproducir la recta y describir con ella la relación
entre las variables.

8
FORMULAS:

En base a eso calculamos la regresión lineal para el Consumo de pintura y las demás variables.

Regresión lineal para el Consumo de pintura y Cantidad de Recubrimiento seria así:

Consumo de Pintura
=X Y1
Cantidad de X*Y1 X²
Aplicación total
# dato recubrimiento
remolque Kg
gr/ l
1 179.6 13 2334.8 32256.16
2 180 13.5 2430 32400
3 180.1 13.6 2449.36 32436.01
4 180.1 13.8 2485.38 32436.01
5 180.2 13.9 2504.78 32472.04
6 180.3 13.9 2506.17 32508.09
7 180.4 13.9 2507.56 32544.16
8 180.4 13.9 2507.56 32544.16
9 180.5 14 2527 32580.25
10 180.5 14.1 2545.05 32580.25
11 180.6 14.1 2546.46 32616.36
12 181.8 14.1 2563.38 33051.24
13 182.7 14.2 2594.34 33379.29
14 183.5 14.2 2605.7 33672.25
15 183.9 14.3 2629.77 33819.21
16 184.5 14.3 2638.35 34040.25
17 185.2 14.5 2685.4 34299.04
18 185.5 14.5 2689.75 34410.25
19 185.6 14.6 2709.76 34447.36
20 185.6 14.7 2728.32 34447.36
21 185.6 14.8 2746.88 34447.36
22 185.7 14.9 2766.93 34484.49
23 186.2 15.1 2811.62 34670.44
24 187.6 15.3 2870.28 35193.76
25 189.2 15.5 2932.6 35796.64
26 194.8 19.5 3798.6 37947.04
27 200.4 19.5 3907.8 40160.16
28 206.3 19.8 4084.74 42559.69
29 213.7 21.3 4551.81 45667.69
30 222.3 21.9 4868.37 49417.29
31 230.3 22 5066.6 53038.09
32 238.4 22.5 5364 56834.56
6081.5 503.2 96959.12 1163156.95

9
m=0.00117814

b= 15.5010991

Y = b+mX = 15.5023 X

En Minitab serían las graficas con valor de R² =99.6%

10
Para la Regresión lineal para el Consumo de pintura y Tiempo de Secado seria así:

Consumo de
Pintura =X Y2
Tiempo de X*Y2 X²
Aplicación total
# dato secado Pintura
remolque Kg
min.
1 179.6 30 5388 32256.16
2 180 30.5 5490 32400
3 180.1 30.6 5511.06 32436.01
4 180.1 30.8 5547.08 32436.01
5 180.2 30.9 5568.18 32472.04
6 180.3 30.9 5571.27 32508.09
7 180.4 30.9 5574.36 32544.16
8 180.4 30.9 5574.36 32544.16
9 180.5 31 5595.5 32580.25
10 180.5 31.1 5613.55 32580.25
11 180.6 31.1 5616.66 32616.36
12 181.8 31.1 5653.98 33051.24
13 182.7 31.2 5700.24 33379.29
14 183.5 31.2 5725.2 33672.25
15 183.9 31.3 5756.07 33819.21
16 184.5 31.3 5774.85 34040.25
17 185.2 31.5 5833.8 34299.04
18 185.5 31.5 5843.25 34410.25
19 185.6 31.6 5864.96 34447.36
20 185.6 31.7 5883.52 34447.36
21 185.6 31.8 5902.08 34447.36
22 185.7 31.9 5923.83 34484.49
23 186.2 32.1 5977.02 34670.44
24 187.6 32.3 6059.48 35193.76
25 189.2 32.5 6149 35796.64
26 194.8 36.5 7110.2 37947.04
27 200.4 36.5 7314.6 40160.16
28 206.3 36.8 7591.84 42559.69
29 213.7 38.3 8184.71 45667.69
30 222.3 38.9 8647.47 49417.29
31 230.3 39 8981.7 53038.09
32 238.4 39.5 9416.8 56834.56
6081.5 1047.2 200344.62 1163156.95

m= 0.00117814

b= 32.5010991

Y = b+mX = 32.5023 X

11
En Minitab serían las graficas con valor de R² =99.6%.

12
Conclusión

La estadística descriptiva e inferencial son herramientas muy importantes para analizar y tomar decisiones en
base a la tendencia central y dispersión así como del comportamiento de la muestra de una población. Ha sido
una gran experiencia en lo personal para profundizar en el análisis teórico en base a las fórmulas básicas hasta
el uso del software Minitab que nos ayuda y facilita el análisis de los datos.

Bibliografía

Gutierrez Pulido, H. Vara Salazar, R. de la (2013).Control estadístico de la calidad y Seis Sigma (3a. ed.)
Editorial: McGraw-Hill Interamericana.

13

También podría gustarte