Está en la página 1de 12

GUÍA DE TRABAJO

APLICATIVO SESIÓN N° 7

Estadística para Six Sigma


Green Belt

Luis Salazar
» Problema N° 1

» Debemos evaluar 4 marcas de automóviles de


una misma cilindrada de motor (1500cc)
» Se debe elegir cuál de las marcas tiene mejor
consumo de combustible.
1) Iniciaremos con nuestras suposiciones estadísticas :
» Normalidad
» Independencia
» Homogeneidad de varianza
Iniciaremos evaluando la
normalidad de las
muestras .Según la
gráfica de probabilidad
encontramos que todos
los valores P son
mayores que 0.05 , por
lo tanto tienen un
comportamiento normal.
2) Luego evaluaremos la independencia de las muestras.

Con valores mayores a 0.05 (p)


corroboramos que son
independientes.

3) Revisamos la homogeneidad de la varianza.


La varianza al tener intervalos que
se solapan y valor p= 0.723 >0.05 ,
entonces s e cumple la suposición
de igualdad de varianza.
Una vez probada las tres suposiciones estadísticas plantearemos nuestra
hipótesis estadística , para encontrar una diferencia real en nuestras 4
muestras.
» Hipótesis nula:
˃ Ho: u1=u2=u3=u4
» Hipótesis alternativa(Ha) :
˃ Existe al menos una diferente.

Tenemos un P<0.05 , por lo que


podemos decir que la hipótesis
nula ya no rige y la alternativa se
encuentra vigente.
Existe al menos una media
diferente.
Rcuad >70 % , es aceptable.
Rcuadajd =75.38%
Verificamos que la ANOVA que
hemos realizado es
estadísticamente correcta
realizando una prueba de
normalidad a los residuales.

Buscaremos la repuesta en el cuadro de caja .

Conclusión :
Notamos que el automóvil de marca Chevrolet tiene un mayor rendimiento
» Problema N° 2

» Se hizo un estudio sobre el consumo de helados, durante la primavera y el


verano, el precio por Kg, el ingreso familiar de los consumidores y la
temperatura en grados F°.

» Debemos encontrar la mejor ecuación de predicción.

» Y la mejor línea de regresión de datos.


Podemos observar que el
factor temperatura (x3),
tiene P value < 0.05, de lo
que concluimos que este
factor tiene una condición
de causa raíz.
Eliminamos el factor de
INGRESO por tener mayor
valor P , y analizamos de
nuevo los factores .

Observamos que el factor


de temperatura sigue
siendo el factor
condicional causa-raiz.
Gráfica de probabilidad,
podemos concluir que la
distribución delos residuos es
una normal (P value > 0.121)

Histograma refleja la forma de


campana de la distribución, con
media en 0 y desviación
estándar 0.0089

El orden de observación, no evidencia existencia de ninguna tendencia; y los valores


ajustados evidencia que hay la misma cantidad de datos por encima y por debajo de la
media.
Sabiendo que el facto temperatura (x3) tiene la condición causa raíz, realizamos el
análisis de regresión, y obtenemos un R2> 70% que nos indica que tiene un buen nivel
de regresión, además nos indica que x3 interpreta en 96.0% los resultados en el
consumo.
R2 ajustado (95.4%), nos mide la bondad del ajuste de la regresión, y por estar muy
próximo a R2, decimos que hay un buen ajuste.
Probamos la opción
cuadrática y obtenemos una
mejor curva ajustada al
modelo .

Mayor R2 y menor
diferencia conR2adj .Por lo
que la elegimos como
nuestra ecuación ecuación
de predicción de consumo.

También podría gustarte