Está en la página 1de 4

Informe

La comparación de la producción de las 5 máquinas en se puede hacer a través


de un análisis de varianza puesto que encaja con la estructura para tal análisis.
Antes de entrar en materia para el análisis de varianza, podemos estudiar otro tipo
de aspectos para darnos una idea de lo que puede estar pasando en la producción
de las 5 máquinas.
Lo primero que podemos notar en las estadísticas descriptivas de la producción
diaria de las 5 máquinas es que la maquina 1 presenta la mejor media con
respecto a las otras cuatro, tiene la segunda mejor varianza y un rango de
producción bastante pequeño comparado con las maquinas 2 y 3, y cercano al de
las maquinas 4 y 5; por lo que en primer lugar podríamos suponer que esta
máquina es la de mejor rendimiento en los 10 días observados.
n mean sd median trimmed mad min max range
Maquina 1 10 1426.6 133.90 1413.0 1422.75 172.72 1254 1630 376
Maquina 2 10 1054.0 179.74 1086.0 1067.88 166.05 697 1300 603
Maquina 3 10 969.0 171.57 957.5 968.62 207.56 709 1232 523
Maquina 4 10 926.1 134.72 882.5 922.75 169.02 754 1125 371
Maquina 5 10 877.9 114.40 852.0 862.00 106.75 757 1126 369

Ahora, para ser más preciso con nuestro análisis, es necesario saber si podemos
estar seguros de que la media de producción observada es en realidad la media
que observaríamos si tomáramos otras muestras. Lo que nos dice la prueba t
student para las 5 máquinas es que con un nivel de 0.01 de significancia, todas las
medias de las maquinas son estadísticamente significativas, es decir, si
repitiéramos el proceso 100 veces, con 100 muestras diferentes, hallaríamos una
media igual para todas las máquinas.

El diagrama de cajas muestra lo que ya suponemos desde un principio con


respecto a la máquina 1 que muestra mejores estadísticas que el resto, al tener
una mediana más alta, unos cercos no tan grandes y una distribución más alta de
sus datos.
Con respecto a los intervalos de confianza para cada máquina, no es nada extraño
que el de la máquina 1 presente un intervalo de confianza, con un nivel de
significancia del 0.05, más corto y por ende estemos más seguros de la ubicación
de la media de productividad global de la máquina.

Por último la prueba ANOVA de una vía nos indica exactamente eso, puesto que a
un nivel de confianza del 99%, la media de la productividad entre las 5 máquinas
es diferente.
Df Sum Sq Mean Sq F value Pr(>F)
Maquina 4 1933716 483429 21.79 0.000000000469 ***
Residuals 45 998180 22182
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Por lo que hay evidencia suficiente, aun sin estar completamente seguros, de que
la máquina 1 presenta un mejor desempeño que las otras.

Supuestos ANOVA

Para estar completamente seguros de la fuerza de nuestra prueba debemos


chequear los supuestos de la misma prueba: de homocedasticidad y de
normalidad en los errores.
La gráfica de los residuales del modelo ANOVA nos indica que no hay ninguna
relación entre los residuales, por lo que podemos suponer que la varianza no
varía, valga la redundancia, de acuerdo a los datos. Aunque para estar más
seguros, llevamos a cabo los test de Levene, Bartlett y Fligner-Killeen, que nos
dicen exactamente eso, al tener los 3 test un valor p mayor a cualquier alfa
designado, no teniendo, por lo tanto, suficiente evidencia para rechazar la
hipótesis nula de homocedasticidad y aceptar la alternativa de heterocedasticidad.

Levene's Test for Homogeneity of Variance (center = median)


Df F value Pr(>F)
group 4 0.6662 0.6188
45
Bartlett test of homogeneity of variances

data: Produccion by Maquina


Bartlett's K-squared = 2.4313, df = 4, p-value = 0.657
Fligner-Killeen test of homogeneity of variances

data: Produccion by Maquina


Fligner-Killeen:med chi-squared = 2.4418, df = 4, p-value = 0.6551

Para la normalidad en los errores, el Q-Q plot nos indica que los valores
estandarizados para cada error se ajustan asintóticamente a la normalidad. Y,
corriendo la prueba de Shapiro para la normalidad en los errores, podemos
concluir que, gracias a un valor p mayor a cualquier alfa de signicancia, no hay
suficiente evidencia para rechazar la hipótesis nula de normalidad de los errores y
por ende podemos asumir normalidad en los mismos.

Shapiro-Wilk normality test

data: residuals
W = 0.97704, p-value = 0.435
Post ANOVA
Por último, para estar completamente seguros de la diferencia entre la
productividad de la máquina 1 con respecto a las otras, se pueden hacer test
pairwise para mostrar la diferencia de manera estadísticamente significativa. Los 3
test ajustados a diferentes valores p arrojaron que con un 99% de confianza casi
en todos los casos la máquina 1 es más productiva que las demás, por lo que se
debe adjudicar la licitación a la empresa que la ofreció.
Pairwise comparisons using t tests with pooled SD

data: Produccion and Maquina

Maquina1 Maquina2 Maquina3 Maquina4


Maquina2 0.0000087170 - - -
Maquina3 0.0000001270 0.713 - -
Maquina4 0.0000000159 0.306 0.946 -
Maquina5 0.0000000016 0.067 0.713 0.946

P value adjustment method: holm


Pairwise comparisons using t tests with pooled SD

data: Produccion and Maquina

Maquina1 Maquina2 Maquina3 Maquina4


Maquina2 0.0000124528 - - -
Maquina3 0.0000001587 1.00 - -
Maquina4 0.0000000177 0.61 1.00 -
Maquina5 0.0000000016 0.11 1.00 1.00

P value adjustment method: bonferroni

Pairwise comparisons using t tests with pooled SD

data: Produccion and Maquina

Maquina1 Maquina2 Maquina3 Maquina4


Maquina2 0.00000124528 - - -
Maquina3 0.00000001587 0.208 - -
Maquina4 0.00000000177 0.061 0.523 -
Maquina5 0.00000000016 0.011 0.178 0.473

P value adjustment method: none

También podría gustarte