Está en la página 1de 13

Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

Normativa: Duración: 2 horas y 45 minutos


1.- La puntuación del examen es sobre 10 Cada apartado puntúa 0.5 puntos.
2.- Cada problema se DEBE resolver en una hoja (escribiendo tanto por delante como por detrás)
3.- Las tablas y el formulario no deben tener nada escrito y han de estar grapadas.
4.- Trabajar siempre con cuatro decimales. Justificar convenientemente todas las respuestas
5.- Los móviles deben estar apagados completamente y guardados en la mochila o el bolso.

1.- Una empresa de instalación de placas solares dispone de un grupo de comerciales que visitan a potenciales
clientes interesados para hacerles un presupuesto del coste de la instalación. Los ingresos mensuales
obtenidos por comercial pueden considerarse como una variable aleatoria con distribución normal. El CEO de
la empresa ha iniciado una campaña para aumentar los ingresos doblando las bonificaciones por venta a los
comerciales, con el objetivo de obtener unos ingresos medios mensuales por comercial superiores a los
20000€. Con el fin de estudiar la eficacia de la campaña, se han seleccionado aleatoriamente 20 comerciales,
obteniéndose un promedio de ingresos de 20500€ y una desviación típica de 1200€. Con
a) ¿Ha conseguido el CEO su objetivo? Justificar la respuesta mediante el correspondiente análisis estadístico
b) Obtenga el intervalo de confianza al 98% para el ingreso mensual medio de un comercial
c) ¿Se puede considerar que la variabilidad poblacional de los ingresos mensuales es superior a 1000 €? a=2%
Además, el CEO quiere estudiar el porcentaje de ventas que consiguen los comerciales en función del número
de visitas que realizan. Para ello, se han seleccionado al azar 100 visitas a potenciales clientes, donde en 22 de
ellas se ha conseguido la venta, mientras que en el resto no se ha realizado la instalación.
d) Determinar un intervalo de confianza al 99% para la proporción de ventas por visitas.

2.- En el Servicio de Obstetricia de un hospital se pretende realizar un estudio con objeto de determinar si
existe o no relación entre la duración de los embarazos y otros factores que pudieran favorecer que estos
lleguen a término (39 semanas). Con este fin, se ha consultado a una muestra de 200 mujeres, que dieron a
luz recientemente, la duración de su embarazo (considerando si llegan o no a término) y si vieron o no durante
ese periodo K-dramas, las series de moda. Los resultados obtenidos se recogen en la siguiente tabla:
K-dramas No K-dramas
Llegaron a término 81 39
No llegaron a término 42 38

a) Indica qué tipo de test de hipótesis se aplicará, justificando la respuesta. ¿Cuál es el objetivo de este test?
b) ¿Cuáles son la hipótesis nula y alternativa del contraste y el valor del estadístico empleado para medir la
discrepancia entre la muestra y la hipótesis nula?
c) Con un nivel de significación de 5%, ¿cuál es la conclusión del estudio? ¿Aumentará el p-valor del contraste
anterior para un nivel de confianza del 90%? Razona la respuesta

3.- El difunto estadístico George E. P. Box, junto con Soren Bisgaard y Conrad Fung, utilizaba un helicóptero de
papel para enseñar estadística. Un buen helicóptero es aquel que permanece más tiempo en el aire, así que
la variable de respuesta sería el tiempo de vuelo, que se mide desde el momento en que el helicóptero se
suelta desde una altura de 2 metros hasta el momento en que toca el suelo.
Los factores que influyen a la hora de optimizar la variable de salida (tiempo) son:
• Tipo de papel (80 grs (-1) vs 100 gr (1))
• Varilla (corta (-1) o larga (1))
• Flecos (pequeños (-1) o grandes (1))
• Alerón doble (sin alerón (-1) o con alerón (1))
los cuales se han ensayado a dos niveles, dando lugar a un plan factorial completo 24.
Tras analizar los datos mediante el ANOVA, los resultados se presentan en las siguientes páginas:
a) ¿Cuántas poblaciones se están analizando? ¿Cuándo es necesario realizar el cálculo de los intervalos
LSD? ¿Con qué fin?
b) ¿Cuál es el objetivo de los dos ANOVAs realizados?

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

c) ¿Qué estima el Cuadrado Medio Residual bajo el cumplimiento de la hipótesis de homocedasticidad?


¿Y en ausencia de ella?
d) Realizar el contraste para el factor Tipo de Papel e indicar cuál es su nivel óptimo
e) Realizar el contraste para la interacción del Tipo de Papel con la Varilla e indicar cuál es su nivel óptimo
f) Determinar, realizando los cálculos necesarios y JUSTIFICANDO CADA UNO DE LOS PASOS SEGUIDOS,
las condiciones operativas óptimas del resto de factores.
g) Calcular la probabilidad de que el helicóptero dure más de 1,5 segundos en el aire trabajando en COO
ANOVA Multifactorial - Tiempo
Análisis de Varianza para Tiempo - Suma de Cuadrados Tipo III
Variable dependiente: Tiempo

Factores:
Fuente Suma de Cuadr. Gl Cuad. Medio Razón-F Valor-P Tipo de papel
EFECTOS PRINCIPALES Varilla
A:Tipo de papel 0,050625 Flecos
B:Varilla 0,105625 0,0581 Alerón doble
C:Flecos 0,005625 0,5965
D:Alerón doble 0,005625 0,5965 Número de casos
INTERACCIONES completos: 16
AB 0,225625
AC 0,005625 0,5965
AD 0,000625 0,8580
BC 0,030625 0,2446
BD 0,000625 0,8580
CD 0,180625 0,0240
Tabla de Medias por
RESIDUOS 0,088125
Mínimos Cuadrados
TOTAL 0,699375 para Tiempo con
intervalos de confianza del 95,0%
Nivel Tipo de papel por Varilla Casos Media
MEDIA GLOBAL 16 1,34375 -1;-1 4 1,6
Tipo de papel -1;1 4 1,2
-1 8 1,4 1;-1 4 1,25
1 8 1,2875 1;1 4 1,325
Varilla Tipo de papel por Flecos
-1 8 1,425 -1;-1 4 1,4
1 8 1,2625 -1;1 4 1,4
Flecos 1;-1 4 1,25
-1 8 1,325 1;1 4 1,325
1 8 1,3625 Tipo de papel por Alerón doble
Alerón doble -1;-1 4 1,375
-1 8 1,325 -1;1 4 1,425
1 8 1,3625 1;-1 4 1,275
1;1 4 1,3
Varilla por Flecos
-1;-1 4 1,45
-1;1 4 1,4
1;-1 4 1,2
1;1 4 1,325
Varilla por Alerón doble
-1;-1 4 1,4
-1;1 4 1,45
1;-1 4 1,25
1;1 4 1,275
Flecos por Alerón doble
-1;-1 4 1,2
-1;1 4 1,45
1;-1 4 1,45
1;1 4 1,275

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

ANOVA Multifactorial - RESIDUALS^2


Análisis de Varianza para RESIDUALS^2 - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS SIMPLES
A:Tipo de papel 8,78906E-7 0,5790
B:Varilla 0,00000351562 0,2890
C:Flecos 0,00000351562 0,2890
D:Alerón doble 0,00000976563 0,1051
INTERACCIONES
AB 0,00000976563 0,1051
AC 9,76562E-8 0,8511
AD 8,78906E-7 0,5790
BC 9,76562E-8 0,8511
BD 0,00000351562 0,2890
CD 8,78906E-7 0,5790
RESIDUOS 0,0000125
TOTAL 0,0000454102
Tabla de Medias por Mínimos Cuadrados para RESIDUALS^2
Nivel Casos Media Tipo de papel por Varilla Casos Media
MEDIA GLOBAL 16 0,00121094 -1;-1 4 0,00269531
Tipo de papel -1;1 4 0,000195312
-1 8 0,00144531 1;-1 4 0,000664062
1 8 0,000976563 1;1 4 0,00128906
Varilla Tipo de papel por Flecos
-1 8 0,00167969 -1;-1 4 0,00199219
1 8 0,000742188 -1;1 4 0,000898437
Flecos 1;-1 4 0,00136719
-1 8 0,00167969 1;1 4 0,000585938
1 8 0,000742188 Tipo de papel por Alerón doble
Alerón doble -1;-1 4 0,000429687
-1 8 0,000429687 -1;1 4 0,00246094
1 8 0,00199219 1;-1 4 0,000429687
1;1 4 0,00152344
Varilla por Flecos
-1;-1 4 0,00222656
-1;1 4 0,00113281
1;-1 4 0,00113281
1;1 4 0,000351562
Varilla por Alerón doble
-1;-1 4 0,000429687
-1;1 4 0,00292969
1;-1 4 0,000429687
1;1 4 0,00105469
Flecos por Alerón doble
-1;-1 4 0,000664062
-1;1 4 0,00269531
1;-1 4 0,000195312
1;1 4 0,00128906

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

4.- Al parecer, las escobas voladoras Nimbus 2022 fabricadas en Hogwarts tuvieron muchísimo éxito y situó a
Hogwarts en la élite. Sin embargo, con el precio del combustible, el negocio empezó a fallar. Por ello,
Dumbledore encomendó a Hermione Granger realizar un estudio para determinar qué variables podrían estar
relacionados con el consumo de combustible de las escobas y, de esta forma, fabricar un prototipo que
ahorrase más combustible. Hermione eligió 32 escobas de forma aleatoria, y midió las siguientes variables:
- l100km: litros que consume una escoba a los 100km.
- pesog1000: peso de la escoba en gramos menos 1000 gramos (pesog – 1000). Esta variable recoge los
gramos en que una escoba supera los 1000 gramos.
- motor: tipo de motor que la escoba utiliza (0 si usa un motor en forma de V, o 1 si usa un motor en
línea).
Ayuda a Hermione a interpretar los resultados y a tomar las decisiones oportunas.
a) Escribe la ecuación del modelo propuesto interpretando cada uno de los parámetros. Después, indica
los valores de los parámetros estimados.
b) Supongamos que el proceso es homocedástico. Indica la estimación de la varianza residual.
c) ¿Es el modelo globalmente significativo? Indica y resuelve el contraste de hipótesis que utilizas para
responder a esta pregunta.
d) Indica qué parámetros son significativos y cuáles no. Realiza los correspondientes contrastes de
hipótesis para ello.
e) ¿Cuál es la variabilidad explicada por el modelo? ¿Crees que es un buen ajuste?
f) Si el nuevo prototipo pesa 800 gramos y usa un motor en línea, ¿podrías decir cuál sería el consumo
esperado?

Regresión Múltiple - l100km


Variable dependiente: l100km
Variables independientes: pesog1000 motor
Número de observaciones: 32
Error Estadístico
Parámetro Estimación Estándar T Valor-P
CONSTANTE 8,37319 12,3422
pesog1000 0,00672633 0,00081801
motor -1,61802 0,720311

Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 380,642
Residuo
Total (Corr.) 462,646
R-cuadrada = R-cuadrado (ajustado para g.l.) =

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

RESOLUCIÓN

1.- Una empresa de instalación de placas solares dispone de un grupo de comerciales que visitan a potenciales
clientes interesados para hacerles un presupuesto del coste de la instalación. Los ingresos mensuales
obtenidos por comercial pueden considerarse como una variable aleatoria con distribución normal. El CEO de
la empresa ha iniciado una campaña para aumentar los ingresos doblando las bonificaciones por venta a los
comerciales, con el objetivo de obtener unos ingresos medios mensuales por comercial superiores a los
20000€. Con el fin de estudiar la eficacia de la campaña, se han seleccionado aleatoriamente 20 comerciales,
obteniéndose un promedio de ingresos de 20500€ y una desviación típica de 1200€. Con
a) ¿Ha conseguido el CEO su objetivo? Justificar la respuesta mediante el correspondiente análisis estadístico
b) Obtenga el intervalo de confianza al 98% para el ingreso mensual medio de un comercial
c) ¿Se puede considerar que la variabilidad poblacional de los ingresos mensuales es superior a 1000 €? a=2%
Además, el CEO quiere estudiar el porcentaje de ventas que consiguen los comerciales en función del número
de visitas que realizan. Para ello, se han seleccionado al azar 100 visitas a potenciales clientes, donde en 22 de
ellas se ha conseguido la venta, mientras que en el resto no se ha realizado la instalación.
d) Determinar un intervalo de confianza al 99% para la proporción de ventas por visitas.

RESOLUCIÓN:
a) Sea X: Ingresos mensuales obtenidos por comercial ~ N(µ ; σ)
Muestra: 𝑥̅ = 20500 €; s = 1200 €; n = 20; α = 0.05
Realizamos el contraste de hipótesis: H0: µ = 20000 €
H1: µ > 20000 €
$̅ % & +,-,, % +,,,, (:;,.8-)
Estadístico ' = ./00 = 1.863 𝑡78 = 1.729
√) √/0
Al ser un test unilateral por la derecha, la región de rechazo es el intervalo [1.729, ∞]. Puesto que 1.863 está
en la región de rechazo, se rechaza la hipótesis nula y se puede afirmar que µ > 20000 €, por lo que el CEO ha
conseguido su objetivo.

b) El intervalo de confianza queda definido como:


: ⁄+ F : ⁄+ F 7+,, 7+,,
@𝑋B + 𝑡D%7 , 𝑋B − 𝑡D%7 I = @20500 + 2.5395 , 20500 − 2.5395 I =
√D √D 7%: √+, √+, ,.8L
[19818.58, 21181.41],.8L

c) Realizamos el contraste de hipótesis: H0: σ = 1000 €


H1: σ > 1000 €
F/ 7+,,/
Estadístico (𝑛 − 1) Q/ = 19 7,,,/ = 27.36
Puesto que α = 0.02, vamos a trabajar con α = 0.025 por ser el inmediatamente superior.
+ (:;,.8S-)
𝜒D%7 =32.852
Al ser un test unilateral por la derecha, la región de rechazo es el intervalo [32.852, ∞]. Puesto que 27.36 está
en la región de aceptación, se acepta la hipótesis nula y no se puede afirmar que σ > 1000 €.
Dado que H0 no se rechaza para α = 0.025, tampoco se rechazará para α = 0.020, ya que la región de rechazo
será más pequeña.

d) Sea P: Proporción de ventas por visitas realizadas Muestra: 𝑝̅ = 0.22; n = 100


El intervalo de confianza queda definido como:
: ⁄+ VW̅ (7%W̅ ) : ⁄+ VW̅ (7%W̅ ) √,.++∗,.SL √,.++∗,.SL
U 𝑝̅ − 𝑡D%7 , 𝑝̅ + 𝑡D%7 X =@ 0.22 − 2.6259 , 0.22 + 2.6259 I =
√D √D 7%: √7,, √7,, ,.88
[ 0.111, 0.329],.88
Nota:
: ⁄+ ,.,,- ,.,,-
𝑡D%7 = 𝑡88 ≈ 𝑡7,, = 2.6259

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

2.- En el Servicio de Obstetricia de un hospital se pretende realizar un estudio con objeto de determinar si
existe o no relación entre la duración de los embarazos y otros factores que pudieran favorecer que estos
lleguen a término (39 semanas). Con este fin, se ha consultado a una muestra de 200 mujeres, que dieron a
luz recientemente, la duración de su embarazo (considerando si llegan o no a término) y si vieron o no durante
ese periodo K-dramas, las series de moda. Los resultados obtenidos se recogen en la siguiente tabla:

K-dramas No K-dramas
Llegaron a término 81 39
No llegaron a término 42 38

a ) Indica qué tipo de test de hipótesis se aplicará, justificando la respuesta. ¿Cuál es el objetivo de este test?
(2 puntos)
b ) ¿Cuáles son la hipótesis nula y alternativa del contraste y el valor del estadístico empleado para medir la
discrepancia entre la muestra y la hipótesis nula? (3 puntos)
c ) Con un nivel de significación de 5%, ¿cuál es la conclusión del estudio? (3 puntos)
d ) ¿Aumentará el p-valor del contraste anterior para un nivel de confianza del 90%? Razona la respuesta. (2
puntos)

RESOLUCIÓN
a) Se aplicará un Test de Independencia, ya que en el problema intervienen dos variables aleatorias cualitativas.
El objetivo de este test será comprobar si existe relación entre el hecho de ver K-dramas durante el embarazo
y la duración de este. O, dicho de otra manera, si es admisible que, poblacionalmente, la proporción de
embarazos que llegan a término y no lo hacen sea la misma para las mujeres que ven K-dramas y las que no lo
hacen.

b) Las hipótesis del problema son: H0: Las variables son independientes.
H1: Las variables son dependientes.
/ ia ib /
]$ %`Wa Wb c h$^_ % k
Estadístico del Test de Independencia: 𝑑 = ∑fg;7 ∑de;7 ^_ d
= ∑fg;7 ∑e;7 j
ia ib =
`W W a b
j
./0∙./m / ./0∙oo / q0∙./m / q0∙oo /
hL7% k hn8% k hp+% k hnL% k
/00 /00 /00 /00
= ./0∙./m + ./0∙oo + q0∙./m + q0∙oo = 4.561
/00 /00 /00 /00

+(:;,.,-)
c) 𝜒(+%7)(+%7);7 = 3.8415
+(:;,.,-)
Puesto que el Estadístico Chi2 = 4.56 > 𝜒(+%7)(+%7);7 , tenemos evidencia estadística para rechazar la hipótesis
de independencia para el nivel de significación de 5%. Por tanto, podemos afirmar que existe diferencia en la
duración de los embarazos entre las mujeres que ven K-dramas y las que no lo hacen.

d)El p-valor obtenido para el contraste indica la probabilidad de error al rechazar la hipótesis de independencia,
y no depende del nivel de significación fijado en el test. De este modo, reducir el nivel de confianza a 90% (y
aumentar el nivel de significación a 10%) no variará el p-valor.

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

3.- El difunto estadístico George E. P. Box, junto con Soren Bisgaard y Conrad Fung, utilizaba un helicóptero de
papel para enseñar estadística. Un buen helicóptero es aquel que permanece más tiempo en el aire, así que
la variable de respuesta sería el tiempo de vuelo, que se mide desde el momento en que el helicóptero se
suelta desde una altura de 2 metros hasta el momento en que toca el suelo.
Los factores que influyen a la hora de optimizar la variable de salida (tiempo) son:
• Tipo de papel (80 grs (-1) vs 100 gr (1))
• Varilla (corta (-1) o larga (1))
• Flecos (pequeños (-1) o grandes (1))
• Alerón doble (sin alerón (-1) o con alerón (1))
los cuales se han ensayado a dos niveles, dando lugar a un plan factorial completo 24.
Tras analizar los datos mediante el ANOVA, los resultados se presentan en las siguientes páginas:
a) ¿Cuántas poblaciones se están analizando? ¿Cuándo es necesario realizar el cálculo de los intervalos
LSD? ¿Con qué fin?
b) ¿Cuál es el objetivo de los dos ANOVAs realizados?
c) ¿Qué estima el Cuadrado Medio Residual bajo el cumplimiento de la hipótesis de homocedasticidad?
¿Y en ausencia de ella?
d) Realizar el contraste para el factor Tipo de Papel e indicar cuál es su nivel óptimo
e) Realizar el contraste para la interacción del Tipo de Papel con la Varilla e indicar cuál es su nivel óptimo
f) Determinar, realizando los cálculos necesarios y JUSTIFICANDO CADA UNO DE LOS PASOS SEGUIDOS,
las condiciones operativas óptimas del resto de factores.
g) Calcular la probabilidad de que el helicóptero dure más de 1,5 segundos en el aire trabajando en COO

ANOVA Multifactorial - Tiempo


Análisis de Varianza para Tiempo - Suma de Cuadrados Tipo III
Variable dependiente: Tiempo

Factores:
Tipo de papel
Fuente Suma de Cuadr. Gl Cuad. Medio Razón-F Valor-P Varilla
EFECTOS PRINCIPALES Flecos
A:Tipo de papel 0,050625 0,1509 Alerón doble
B:Varilla 0,105625 0,0581
C:Flecos 0,005625 0,5965 Número de casos
D:Alerón doble 0,005625 0,5965 completos: 16
INTERACCIONES
AB 0,225625 0,0159
AC 0,005625 0,5965
AD 0,000625 0,8580
BC 0,030625 0,2446
BD 0,000625 0,8580
CD 0,180625 0,0240
RESIDUOS 0,088125 Tabla de Medias por
TOTAL 0,699375 Mínimos Cuadrados
para Tiempo con intervalos de confianza del 95,0%
Nivel Tipo de papel por Varilla Casos Media
MEDIA GLOBAL 16 1,34375 -1;-1 4 1,6
Tipo de papel -1;1 4 1,2
-1 8 1,4 1;-1 4 1,25
1 8 1,2875 1;1 4 1,325
Varilla Tipo de papel por Flecos
-1 8 1,425 -1;-1 4 1,4
1 8 1,2625 -1;1 4 1,4
Flecos 1;-1 4 1,25
-1 8 1,325 1;1 4 1,325
1 8 1,3625 Tipo de papel por Alerón doble
Alerón doble -1;-1 4 1,375
-1 8 1,325 -1;1 4 1,425
1 8 1,3625 1;-1 4 1,275

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

1;1 4 1,3
Varilla por Flecos
-1;-1 4 1,45
-1;1 4 1,4
1;-1 4 1,2
1;1 4 1,325
Varilla por Alerón doble
-1;-1 4 1,4
-1;1 4 1,45
1;-1 4 1,25
1;1 4 1,275
Flecos por Alerón doble
-1;-1 4 1,2
-1;1 4 1,45
1;-1 4 1,45
1;1 4 1,275
ANOVA Multifactorial - RESIDUALS^2
Análisis de Varianza para RESIDUALS^2 - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS SIMPLES
A:Tipo de papel 8,78906E-7 0,5790
B:Varilla 0,00000351562 0,2890
C:Flecos 0,00000351562 0,2890
D:Alerón doble 0,00000976563 0,1051
INTERACCIONES
AB 0,00000976563 0,1051
AC 9,76562E-8 0,8511
AD 8,78906E-7 0,5790
BC 9,76562E-8 0,8511
BD 0,00000351562 0,2890
CD 8,78906E-7 0,5790
RESIDUOS 0,0000125
TOTAL 0,0000454102
Tabla de Medias por Mínimos Cuadrados para RESIDUALS^2
Nivel Casos Media Tipo de papel por Varilla Casos Media
MEDIA GLOBAL 16 0,00121094 -1;-1 4 0,00269531
Tipo de papel -1;1 4 0,000195312
-1 8 0,00144531 1;-1 4 0,000664062
1 8 0,000976563 1;1 4 0,00128906
Varilla Tipo de papel por Flecos
-1 8 0,00167969 -1;-1 4 0,00199219
1 8 0,000742188 -1;1 4 0,000898437
Flecos 1;-1 4 0,00136719
-1 8 0,00167969 1;1 4 0,000585938
1 8 0,000742188 Tipo de papel por Alerón doble
Alerón doble -1;-1 4 0,000429687
-1 8 0,000429687 -1;1 4 0,00246094
1 8 0,00199219 1;-1 4 0,000429687
1;1 4 0,00152344
Varilla por Flecos
-1;-1 4 0,00222656
-1;1 4 0,00113281
1;-1 4 0,00113281
1;1 4 0,000351562
Varilla por Alerón doble
-1;-1 4 0,000429687
-1;1 4 0,00292969
1;-1 4 0,000429687
1;1 4 0,00105469
Flecos por Alerón doble
-1;-1 4 0,000664062
-1;1 4 0,00269531

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

1;-1 4 0,000195312
1;1 4 0,00128906

Resolución:
a) Se trata de un Diseño Factorial completo 24, ya que estudiamos 4 factores a dos niveles. Por tanto,
estudiamos un total de 16 poblaciones, constituidas por cada uno de los 16 tratamientos que forman dicho
diseño.
Los intervalos LSD son necesarios cuando un factor A MÁS DE DOS NIVELES resulta estadísticamente
significativo, con el fin de determinar entre cuáles de ellos hay diferencias estadísticamente significativas
en cuanto a su media. O bien, cuando tenemos una interacción entre dos factores al menos a dos niveles
cada uno de ellos.
b) El objetivo del ANOVA es determinar si existen diferencias estadísticamente significativas en el valor medio
de una determinada variable de salida, entre al menos una población y el resto. A partir de aquí, es posible
determinar cuáles son las condiciones operativas óptimas (que puede ser más de una) que maximizan, en
este caso, el tiempo de vuelo del helicóptero.
En el caso del primer ANOVA, realizado sobre el tiempo de vuelo del helicóptero, se trata de determinar si
alguna de las 16 poblaciones analizadas correspondientes a cada uno de los 16 tratamientos probados
presenta diferencias respecto del resto. Dicho de otra manera, si alguno de los factores simples incluidos en
el estudio o sus interacciones tiene un efecto estadísticamente significativo sobre el tiempo medio de vuelo
de los helicópteros.
Mientras que el segundo ANOVA, realizado sobre el cuadrado de los residuos extraídos del primer ANOVA,
el objetivo es determinar si alguno de los factores simples incluidos en el estudio o sus interacciones tiene
un efecto estadísticamente significativo sobre el valor medio del cuadrado de los residuos y, por tanto, sobre
la varianza (sirviendo así para comprobar si se cumple la hipótesis de homocedasticidad).

c) El cuadrado medio residual (CMR) estima un promedio de las varianzas residuales de cada una de las
poblaciones incluidas en el estudio. Cuando se cumple la hipótesis de homocedasticidad, lo cual implica de
todas las varianzas de las distintas poblaciones son iguales, el CMR es un mejor estimador de la varianza
residual de cualquiera de ellas, y por eso se utiliza como estimador de dicha varianza. Caso de que no se
cumpla la hipótesis de homocedasticidad, el CMR estima, como ya se ha dicho, un promedio de las varianzas
residuales de cada una de las poblaciones incluidas en el estudio.

d) H0: m80=m100; H1: m80¹m100


Gdl =1
CMPapel = SCRPapel / gdlPapel = 0,050625 / 1 = 0,050625
Donde CMR = SCR / gdlr = 0,088125 / 5 = 0,017625
FPapel = CMPapel / CMR = 0,050625 / 0,017625 = 2,87 < F5%1,5 = 6,61
por lo que el factor papel no presenta un efecto estadísticamente significativo sobre el tiempo medio de vuelo
del helicóptero, es decir, que no podemos rechazar que el tiempo medio de vuelo de un helicóptero fabricado
con un papel de 80 grs. sea diferente al de uno fabricado con un papel de 100 grs. Por tanto, el nivel óptimo es
indiferente, SEGÚN EL EFECTO DEL FACTOR SIMPLE.

e) De manera análoga: H0: m80,corta - m80,larga = m100,corta - m100,larga


H1: m80,corta - m80,larga ¹ m100,corta - m100,larga
Gdl =1
CMPapel,Varilla=SCRPapel,Varilla/dglPapel,Varilla=0,225625/1=0,225625
Donde CMR=SCR/dglr=0,088125/5=0,017625
FPapel,Varilla=CMPapel,Varilla/CMR=0,225625/0,017625=12,80>F5%1,5=6,61,
por lo por lo que la interacción de Tipo de Papel con la Longitud de la Varilla sí presenta un efecto
estadísticamente significativo sobre el tiempo medio de vuelo del helicóptero. Es decir, que al menos una de
las combinaciones del Tipo de Papel con la Longitud de la Varilla presenta un tiempo medio de vuelo diferente
al resto.

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

Por tanto, es necesario ver qué combinación de Tipo de papel y de Longitud de la Varilla presentan un valor
más elevado.
A la vista de la tabla de medias, se puede observar que el valor medio más elevado para la interacción AB se
corresponde con los niveles bajos de ambos factores (-1,-1), observándose un valor medio de tiempo de vuelo
de 1,6 segundos.
Es posible comprobar para la interacción AB que este nivel no solapa su intervalo LSD con el resto, ya que
Int. LSD = 0,1206
1,6-0,1206>1,2325+0,1206, valor medio máximo del resto de niveles de la interacción.

f)
Análisis de Varianza para Tiempo - Suma de Cuadrados Tipo III
Fuente Suma de Cuadr. Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:Tipo de papel 0,050625 1 0,050625 2,87 0,1509
B:Varilla 0,105625 1 0,105625 5,99 0,0581
C:Flecos 0,005625 1 0,005625 0,32 0,5965
D:Alerón doble 0,005625 1 0,005625 0,32 0,5965
INTERACCIONES
AB 0,225625 1 0,225625 12,80 0,0159
AC 0,005625 1 0,005625 0,32 0,5965
AD 0,000625 1 0,000625 0,04 0,8580
BC 0,030625 1 0,030625 1,74 0,2446
BD 0,000625 1 0,000625 0,04 0,8580
CD 0,180625 1 0,180625 10,25 0,0240
RESIDUOS 0,088125 5 0,017625
TOTAL (CORREGIDO) 0,699375 15

A la vista de la tabla ANOVA del TIEMPO DE VUELO, no hay ningún efecto simple que resulte
estadísticamente significativo, si bien la varilla casi lo es. En cualquier caso, las interacciones del Tipo de
Papel con la Varilla, por una parte, y de los Flecos con el Alerón sí lo son, por lo que hemos de fijarnos en las
condiciones operativas óptimas (c.o.o.) que maximizan el tiempo de vuelo.
Dado que las interacciones no tienen factores en común, no es necesario mirar el módulo del efecto de cada
una de ellas para determinar las c.o.o., sino que basta con ver las mejores condiciones para AB y las mejores
condiciones de CD, por separado, en la Tabla de Medias (del TIEMPO DE VUELO).
Ya se ha determinado en el apartado e) cuáles son las condiciones que maximizan el vuelo para la interacción
AB.
Para la interacción CD, el valor medio de tiempo de vuelo más elevado se corresponde con 1,45 segundos,
que se da para dos condiciones posibles: (-1, 1) o (1, -1). Por tanto, las condiciones operativas óptimas son
dos, a la vista de estos resultados:
En este caso, el límite inferior del intervalo LSD sí se solapa ligeramente con el límite superior correspondiente
a los LSD del nivel (1,1)
1,45-0,1206=1,3694<1,3956=1,275+01206
Luego, aplicando el rigor estadístico, no podríamos afirmar que existen diferencias a nivel poblacional entre
los niveles (-1, 1) o (1, -1) y (1, 1). En cualquier caso, asumiendo que se eligen los niveles simplemente a partir
de los valores de la Tabla de medias, asumiremos como C.O.O.’s las siguientes:
C.O.O. 1: Papel de 80 gr, Varilla corta, Fleco pequeño y con Alerón.
C.O.O. 2: Papel de 80 gr, Varilla corta, Fleco grande y sin Alerón

Elegimos para la predicción media (por ejemplo), la C.O.O. 1 (elegir la C.O.O. 2 proporcionará el mismo
resultado).

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

A la hora de determinar la predicción media, hay que tener en cuanta el efecto de los factores simples
asociados a las interacciones dobles estadísticamente significativas, HAYAN RESULTADO O NO ESTOS
FACTORES SIMPLES ESTADÍSTICAMENTE SIGNIFICATIVOS.
De esta manera podemos determinar la predicción media como:

Pred. Media (C.O.O. 1)=𝑥̿ + [(𝑥̅L,,stuvw − 𝑥̿ ) − 𝐸𝑓L, − 𝐸𝑓stuvw ] + 𝐸𝑓L, + 𝐸𝑓stuvw + [(𝑥̅Wz{|zñt,stD − 𝑥̿ ) −
𝐸𝑓Wz{|zñt − 𝐸𝑓stD ] + 𝐸𝑓Wz{|zñt + 𝐸𝑓stD =
(𝑥̅L,,stuvw ) + (𝑥̅Wz{|zñt,stD − 𝑥̿ )=1,6+(1,45-1,34375)=1,70625 segundos.

Con el fin de poder calcular la probabilidad de que el helicóptero dure más de 1,5 segundos en el aire,
asumiendo que se cumple la hipótesis de normalidad en ANOVA, es necesario analizar previamente si se
cumple también la hipótesis de homocedasticidad. Para ello, es necesario realizar (por ejemplo) un ANOVA
sobre el cuadrado de los residuos. A la vista de la tabla ANOVA del CUADRADO DE LOS RESIDUOS, no hay
ningún factor que presente un efecto estadísticamente significativo sobre el cuadrado de los residuos y, por
tanto, sobre la varianza.
Por tanto, podemos asumir que se cumple la hipótesis de homocedasticidad, pudiendo calcular la varianza a
partir de Cuadrado Medio Residual de la TABLA ANOVA del TIEMPO DE VUELO.

𝜎 + ≈ 𝐶𝑀𝑅 =0,017625, de donde 𝜎=0,13276


Así, sea XCOO ~ N (1,70625 ; 0,13276)
7,-%7,S,…+-
P(X > 1,5] = 𝑃 @𝑁(0,1) > ,,7n+S…
I= 1 - P[N(0,1) £ - 1,55 ] = 1 - 0,06057 = 0,93043.

4.- Al parecer, las escobas voladoras Nimbus 2022 fabricadas en Hogwarts tuvieron muchísimo éxito y situó a
Hogwarts en la élite. Sin embargo, con el precio del combustible, el negocio empezó a fallar. Por ello,
Dumbledore encomendó a Hermione Granger realizar un estudio para determinar qué variables podrían estar
relacionados con el consumo de combustible de las escobas y, de esta forma, fabricar un prototipo que
ahorrase más combustible. Hermione eligió 32 escobas de forma aleatoria, y midió las siguientes variables:
- l100km: litros que consume una escoba a los 100km.
- pesog1000: peso de la escoba en gramos menos 1000 gramos (pesog – 1000). Esta variable recoge los
gramos en que una escoba supera los 1000 gramos.
- motor: tipo de motor que la escoba utiliza (0 si usa un motor en forma de V, o 1 si usa un motor en
línea).
Ayuda a Hermione a interpretar los resultados y a tomar las decisiones oportunas.
a) Escribe la ecuación del modelo propuesto interpretando cada uno de los parámetros. Después,
indica los valores de los parámetros estimados.
b) Supongamos que el proceso es homocedástico. Indica la estimación de la varianza residual.
c) ¿Es el modelo globalmente significativo? Indica y resuelve el contraste de hipótesis que utilizas para
responder a esta pregunta.
d) Indica qué parámetros son significativos y cuáles no. Realiza los correspondientes contrastes de
hipótesis para ello.
e) ¿Cuál es la variabilidad explicada por el modelo? ¿Crees que es un buen ajuste?
f) Si el nuevo prototipo pesa 800 gramos y usa un motor en línea, ¿podrías decir cuál sería el consumo
esperado?

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

Regresión Múltiple - l100km


Variable dependiente: l100km
Variables independientes: pesog1000 motor
Número de observaciones: 32
Error Estadístico
Parámetro Estimación Estándar T Valor-P
CONSTANTE 8,37319 12,3422
pesog1000 0,00672633 0,00081801
motor -1,61802 0,720311

Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 380,642
Residuo
Total (Corr.) 462,646
R-cuadrada = porciento R-cuadrado (ajustado para g.l.) = porciento

RESOLUCIÓN:
a) El modelo se puede expresar como:
𝑙100𝑘𝑚g = 𝛽, + 𝛽7 𝑝𝑒𝑠𝑜𝑔1000g + 𝛽+ 𝑚𝑜𝑡𝑜𝑟g + 𝑈g ,
Donde:
• 𝛽, : es el consumo medio expresado en litros a los 100 km cuando el peso de la escoba es 1000 gramos
y se usa un motor en forma de V.
• 𝛽7 : incremento medio del consumo por cada gramo que aumenta el peso de la escoba sea cual sea
el tipo de motor (siempre y cuando este sea el mismo).
• 𝛽+ : diferencia del consumo medio cuando los motores utilizados son en línea con respecto a los que
tienen forma de V, cuando el peso se mantiene constante.
Las estimaciones para cada uno de los parámetros son b0 = 8,37319, b1=0,00672633 y b2 = -1,61802.

Parámetro Estimación Error Estándar Estadístico T Valor-P


CONSTANTE 8,37319 0,678419 12,3422 0,0000
pesog1000 0,00672633 0,00081801 8,22279 0,0000
motor -1,61802 0,720311 -2,24628 0,0325

b) La estimación para la varianza residual es el cuadrado medio residual siempre y cuando el proceso sea
homocedástico, es decir s2 = 2,82774

c) El contraste de hipótesis utilizado es:


H0: 𝛽7 = 𝛽+ = 0;
H1: al menos hay un 𝛽g , 𝑖 = 1, 2 diferente de 0.
Para resolver el contraste, hemos de completar la tabla ANOVA anteriormente propuesta:
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 380,642 2 190,321 67,30
Residuo 82,0044 29 2,82774
Total (Corr.) 462,646 31

Notar que los gl del modelo son el número de variables que tenemos en el modelo.
El total son N-1, y el residual es solo la resta de ambos.
El cuadrado medio es el cociente entre las sumas de cuadrados y los grados de libertad.
Y por último, el Fratio o Razón-F se define como el cociente entre CMM y el CMR.
,.8-
Para su resolución hemos de encontrar el punto crítico𝐹+,+8 = 3,3277.
Como 67,30 > 3,3277, tenemos suficiente evidencia estadística para rechazar la H0, y por tanto, sabemos que
al menos una de las variables consideradas está relacionada con el consumo de combustible.

Nombre:_____________________________________________________________
Examen de Estadística – 2º parcial GITI-GIOI-GIQ Mayo 2022

d) En este caso hemos de contrastar cada uno de los parámetros de la tabla de coeficientes.
H0: 𝛽, = 0; H1: 𝛽, ≠ 0.
Mirando la tabla de coeficientes, observamos que tobs = 12,3422. Por otro lado, para el cálculo del punto crítico,
,.8S-
simplemente miramos en las tablas el valor 𝑡+8 = 2,0452. Como |12,3422| > 2,0452, tenemos suficiente
evidencia estadística para rechazar la H0, y asumiremos que el intercepto es diferente de 0.

H0: 𝛽7 = 0; H1: 𝛽7 ≠ 0.
Para el 𝛽7 no disponemos del p-valor, por tanto, usaremos el estadístico t. Basta con dividir la estimación entre
el error estándar y obtenemos que tobs = 8,2279. Por otro lado, para el cálculo del punto crítico, simplemente
,.8S-
miramos en las tablas el valor 𝑡+8 = 2,0452. Como |8,2279| > 2,0452, tenemos suficiente evidencia
estadística para rechazar la H0, y asumiremos que la variable peso de la escoba nos permite explicar el consumo
de la misma.

H0: 𝛽+ = 0; H1: 𝛽+ ≠ 0.
Para el 𝛽+ , procedemos de una forma similar al anterior. Basta con dividir la estimación entre el error estándar
y obtenemos que tobs=-2,24628. Como |-2,24628|> 2,0452, tenemos suficiente evidencia estadística para
rechazar la H0, y asumiremos que el tipo de motor también es importante para explicar el consumo de la
escoba.

e) El porcentaje de variabilidad explicado por el modelo es 82,27.


Para ello hemos calculado el coeficiente de determinación o R2 que sabemos que se calcula como la suma de
cuadrados del modelo entre la suma de cuadrados total. Además, sabemos que toma valores entre 0 y 1 (0 y
100 en porcentaje). Cuanto más cercano al 1 (100), estaremos explicando más variabilidad. Por tanto, en este
caso diríamos que SÍ tenemos un buen ajuste.
También se podría haber resuelto mediante el R2(Ajustado)
+ ”• +.L+SSp
𝑅“e|Fv = 1 − ”• –—' = 1 − p…+.…p…• = 1 − 0.1895 = 0.8105 = 81.05 %
˜™š›œ n7

f) Dado que ya tenemos el modelo ajustado:


Ÿ = 8,37319 + 0,00672 ∗ 𝑝𝑒𝑠𝑜𝑔1000 − 1,61802 ∗ 𝑚𝑜𝑡𝑜𝑟
𝑙100𝑘𝑚
Sustituyendo, 800 – 1000 = -200 en la variable pesog1000 y 1 en la variable motor, obtenemos que:

𝐸(𝐶𝑜𝑛𝑠𝑢𝑚𝑜/100𝑘𝑚) = 8,37319 + 0,00672 · (−200) − 1,61802 · 1 = 5.41117 𝑙/100𝑘𝑚.

Por tanto, el consumo esperado para un prototipo que pesa 800 gramos y usa un motor en línea es de 5,41117
litros/100km

Nombre:_____________________________________________________________

También podría gustarte