Está en la página 1de 5

En un segundo estudio sobre 84 pizzas consumidas en el local, apuntamos el tipo de pizza, la edad del

cliente (a ojo, distinguiendo sólo entre joven y adulto) y la valoración (Valoración2).

8. ¿Dirías que hay relación entre el tipo de pizza que piden los clientes y su edad? ¿Por qué?

Sí, porque el test de independencia de la Chi Cuadrado arroja un p-valor de 0.0279 < 0.05.

Dentro de los clientes jóvenes, ¿qué % han pedido pizza Barbacoa? 36.96 % #

9. Aplica el test de Wilcoxon (rangos con signo) para decidir si la valoración mediana en la pizza
Margarita es superior a 6.5.

Diría que no porque se obtiene un pv de 0.408 (las hipótesis son H0: Me = 6.5, H1: Me > 6.5).

10. Aplica un test de ANOVA para ver si hay diferencias en la valoración según el tipo de pizza.
¿Dirías que las hay? ¿Por qué?

Sí porque sale un p-valor significativo: 0.0101.

¿Qué % de variabilidad explica este modelo? 15.28 % #

11. Calcula la desviación típica residual. 0.9356 # ¿Qué efecto produce la pizza
Napolitana sobre la valoración global? -0.0608 #

12. Utiliza intervalos de mínima diferencia significativa a un nivel del 95% para hacer
comparaciones dos a dos. ¿Qué grupos homogéneos se pueden establecer?

G1={Margarita, Atún, Napolitana}, G2={Atún, Napolitana, 4 quesos} y G3={Napolitana, 4


quesos, Barbacoa}.

Según esto, podemos asumir que las pizzas Atún, Napolitana y 4 quesos tienen una valoración
media común. ¿Qué estimación podríamos dar? 7.1924 #

13. Guarda los residuos de este modelo y contrasta su normalidad usando el test de Shapiro-Wilk.
¿Qué conclusión sacas?

Podemos aceptar la normalidad, ya que el p-valor es 0.2542 > 0.1.

14. Siguiendo con los residuos, si estudias su aleatoriedad comprobarás que hay una autocorrelación
significativa. ¿De qué orden? ¿Cuál es su valor? ¿Qué mide esta autocorrelación?

De orden 6. Es -0.2293. Mide la correlación existente entre residuos que se encuentran a


distancia 6 en la tabla de datos.

15. ¿Dirías que la valoración que hacen los clientes de los distintos tipos de pizza depende de la
edad? (Es decir, ¿existen interacción entre ambos factores?) ¿En qué te basas?

Diría que no. Me baso en que si ajusto un modelo con ambos factores y su interacción, esta
última no sale significativa (pv = 0.4912).
Estadística (2º parcial)
Fecha: 30-5-2022 Grado en Ingeniería en Tecnologías Industriales

1º Apellido 2º Apellido Nombre

En la elaboración de pasta de dientes se utilizan numerosos ingredientes; principalmente agua, diversos


agentes abrasivos, como carbonato cálcico o sílice, humectantes como el sorbitol, y otros productos no
menos importantes pero que aparecen en menores dosis, como aromas y edulcorantes que le otorgan un
sabor más agradable. Hemos querido combinar variaciones de estos ingredientes con diferentes
proporciones de agua y medir el grado de aceptación (de 0 a 10) en muestras de usuarios. Los datos
obtenidos se pueden encontrar en el fichero dentifrico.sgd. Utiliza el programa Statgraphics para
responder a las siguientes preguntas:

1. Empecemos por echar un vistazo a la variable aceptación. Mirando el test de los rangos
signados, ¿dirías que la aceptación mediana de estos productos es significativamente menor a 5?

Diría que no porque da un p-valor de 0.0849 > 0.05.

¿Se cumplen los requisitos para utilizar este test?

Sí porque los datos parecen indicar que la variable es simétrica (sesgo estandarizado=0.8083).

2. Haz un estudio de ANOVA simple para ver si el nivel de aceptación tiene que ver con el tipo de
humectante utilizado. ¿Qué % de variabilidad explica este modelo? 47.48% #
¿Qué varianza residual se obtiene? 2.2982 #

3. ¿Con cuál de los tres tipos de humectante se observa una mayor variabilidad de los datos?
Explica en qué te basas para dar tu respuesta.

Con el tipo 1, porque su coef de variación es el mayor: 48.45% frente a 30.53% y 25.92%
respectivamente.

4. ¿Calcula un intervalo LSD del 97% para la aceptación media obtenida con el humectante
número 3? (5.6154 , 6.6824) # ¿Qué significa LSD?

Least Significant Diference (mínima diferencia significativa).

5. Utilizando estos mismos intervalos para las comparaciones dos a dos, ¿qué grupos homogéneos
se pueden establecer?

G1={1} y G2={2,3}

¿Cómo se refleja esto en el gráfico de medias?

Los intervalos correspondientes a los niveles 2 y 3 se solapan, mientras que el correspondiente al


nivel 1 no se solapa con ninguno de los otros.

6. ¿Podemos aceptar que se satisface la hipótesis de homocedasticidad? ¿por qué?

Sí porque los tres tests disponibles arrojan p-valores muy altos. El menor lo da el test de Levene
y es 0.5994.
7. ¿Qué hipótesis contrasta el test de Kruskal-Wallis y cómo lo hace?

H0: todas las medianas son iguales contra H1: alguna es distinta.

Calcula rangos sobre la muestra completa y compara los rangos medios de las distintas
submuestras.

8. Incluye en el modelo los otros dos factores que tenemos: % de agua y agente abrasivo. De
manera individual (no consideres de momento la interacción), ¿tienen algún efecto sobre la
variable de respuesta? ¿Por qué lo dices?

No tienen un efecto significativo pues sus p-valores en la tabla de ANOVA son respectivamente
0.4687 y 0.2192, ambos muy altos.

9. Busca en el diagrama de dispersión el producto que ha despertado la mayor aceptación. ¿Qué


nivel de aceptación ha alcanzado? ¿Con qué combinaciones de los distintos factores se ha
obtenido?

El que tiene mayor aceptación (9.3423) es el de la fila 14; se consigue con un 20% de agua, el
abrasivo número 1 y el humectante número 3.

10. Para comprobar la validez del estudio, queremos asegurarnos de que los residuos producidos son
completamente aleatorios. Aplica los tests que corresponda y saca tus conclusiones.

Los tests de rachas salen bien pero el de Box-Pierce arroja un p-valor de 0.0419. Habría que
revisar la forma en que se ha realizado el muestreo.

Las columnas ventas1 y ventas2 recogen el número de unidades vendidas de distintos dentífricos
fabricados por nuestra compañía en distintas ciudades españolas, durante el año en que el producto salió
al mercado (ventas1) y el siguiente (ventas2).

11. Calcula el coeficiente de Spearman asociado a estas dos variables. 0. 9835 #


¿Cómo debemos interpretarlo?

Es muy alto, cercano a 1, lo que indica la existencia de una relación lineal muy fuerte y de signo
positivo entre las variables.

12. Calcula una recta de regresión que explique la variable ventas2 a partir de ventas1.
ventas2 = - 662147 + 116.214 ventas1 #
¿Qué desviación típica residual se obtiene?
# 37958.2 #

13. ¿Cuál es el máximo residuo estudentizado y con qué observación se corresponde?


2.41 -> observación 18 #
¿Cómo podemos interpretar este valor?

Significa que el valor de Y observado está 2.41 desviaciones típicas por encima del valor que
daría el modelo ajustado utilizando todos los datos salvo esa observación.

14. Trata de ajustar ahora un modelo parabólico, ¿cuál sería su ecuación?


ventas2 = -134777 + 23.5923 ventas1 + 0.004 ventas12 #
¿Dirías que mejora al anterior? ¿Por qué?

Porque el R2 ajustado ha aumentado, del 96.5591% a 97.0504%.


11. ¿Qué tasa de población activa podríamos esperar en el año 91 para un municipio que está a 20
Km de la capital y cuya tasa en el año 81 es del 40%? 43.4474 % # ¿calcula un IC
del 90% para este valor? (42.00041 , 44.8908) #

12. Probemos ahora a considerar como regresores potenciales todas las variables asociadas al año 81
(quitando DIST) y aplicar una regresión por etapas. ¿Con qué variables nos quedaríamos?
TACTIV81, ASAL81 y E1768A81 #
¿Qué % de variabilidad explica el modelo obtenido? 56.3148% #

Queremos comprobar el efecto de cuatro sustancias químicas diferentes en la resistencia de cierto tipo de
tela. Para ello, hemos llevado a cabo un diseño de bloques completos aleatorizados probando las 4
sustancias sobre 5 muestras de tela distintas (5 bloques). Los resultados del experimento los puedes
encontrar en el fichero P2-datos.sgd. Las tres primeras columnas recogen, respectivamente, la resistencia
conseguida en cada prueba, la sustancia utilizada y la muestra de tela sobre la que se ha probado.

13. Empecemos por hacer un ANOVA simple para ver si las distintas sustancias tienen efectos
significativamente distintos. ¿Qué opinas?

Que sí porque en la tabla de ANOVA sale un p-valor de 0.0002 < 005.

14. Estima el efecto de la 2ª sustancia y el error experimental.

EFECTO: - 0.2 # ERROR: 0.6912 #

15. Usando el método de Bonferroni, calcula un intervalo de confianza del 95% para la resistencia
media de una tela tratada con la sustancia 4. (2.9025 , 4.2176) #

16. Aplicando el test de Shapiro-Wilk a los residuos, ¿dirías que se satisface la hipótesis de
normalidad? Muy dudoso ya que pv=0.0113. #

17. ¿Cuál es el mayor residuo (en valor absoluto, claro) asociado a la sustancia 4? - 1.56 #
¿Qué observación lo produce? La número 18 #

18. En un modelo como este, ¿qué establece la hipótesis de homocedasticidad?

Que la varianza de la variable de respuesta es la misma para todos los niveles del factor.

19. Observa ahora el resultado que arroja el test de Kruskal-Wallis. ¿Qué podemos concluir?

Sale pv=0.0072<0.05, lo que indica que hay diferencias significaticas entre las medianas de los
grupos.

20. Prueba ahora a incluir en el modelo las distintas muestras de tela como bloques. ¿Se observa un
efecto debido a los tratamientos? ¿y a los bloques?

Sí en ambos casos, ya que los dos autovalores son menores que 0.0001.

21. Observa que este cambio ha afectado a la varianza residual. ¿En qué sentido?

Se ha reducido de 0.4778 a 0.0793.

22. ¿Podríamos plantearnos incluir un término de interacción? ¿Por qué?

No. En un diseño de bloques se asume que no hay interacción entre el factor y el bloque.
23. Calcula un intervalo LSD del 95% para la diferencia de medias entre las sustancias 1 y 3.
(- 0.24 ± 0.3879) # ¿Dirías que hay diferencias significativas? ¿Por qué?

No porque el intervalo obtenido contiene al cero.

24. A partir de este análisis (intervalos LSD al 95%), ¿qué grupos homogéneos se pueden establecer
entre las 4 sustancias?
G1= {1,3} G2={2,3} G3={4} #

Estamos utilizando una matriz de intrusión para producir varillas de aluminio. Las especificaciones dicen
que el diámetro de las varillas debe ser de 0.5035 ± 0.0010 pulgadas (trabajaremos con una precisión de
milésimas, luego será 35 ± 10). Para monitorizar el proceso estamos analizando muestras de 5 varillas
cada hora. En el fichero P2-datos.sgd puedes encontrar dos columnas que recogen respectivamente los
diámetros medios y los rangos de las primeras 20 muestras. Dibuja el correspondiente gráfico de medias
(en un estudio de Fase 1), y responde a las siguientes preguntas:

25. ¿Qué límites de control se obtienen?

Inferior: 31.0611 # Superior: 37.5789 #

26. En el análisis de rachas, encontramos que ha saltado una alarma de tipo D en el subgrupo 3. ¿A
qué se debe?

A que de 3 medias consecutivas (subgrupos 1, 2 y 3), dos se encuentran a una distancia mayor
que 2σ de la línea central.

27. Si observamos el formato de zona, ¿en qué muestras se obtienen valores anómalos?
En las muestras 3, 4, 10 y 11. #

28. En este gráfico (de medias con formato de zona) se observan rectas horizontales de distintos
colores. ¿Puedes decir qué representa cada una de ellas?

Marrón Azul claro Azul oscuro Rojo

Línea central (media Límites de Límites de Límites de control


global) advertencia internos advertencia externos

29. Vamos a repetir el estudio anterior pero dividiéndolo ahora en dos fases. Usaremos los 10
primeros datos para llevar a cabo un estudio de Fase 1 y, con los valores obtenidos, aplicaremos
un estudio de Fase 2 a la muestra completa. ¿Qué límites de control se obtienen ahora?

Inferior: 30.7906 # Superior: 36.7894 #

30. Observamos que en la muestra 15 ha saltado una alarma de tipo A. ¿A qué es debido?

A que las últimas 8 observaciones, incluida la 15, han quedado por encima de la línea central.

31. Como puedes ver, hay dos muestras que han quedado fuera de control. Elimínalas y estima la
“anchura” del proceso. 14.6172 #

32. Calcula el índice de capacidad real. 1.2208 # ¿Cómo debemos interpretar este dato?

Por ser mayor que 1, diríamos que el proceso es “capaz” (menos de 3 de cada mil unidades
producidas incumplirán las especificaciones).

También podría gustarte