Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Solución a) Con los datos que tenemos si queremos ver si los datos presentan un aspecto
próximo a la normalidad o no lo más apropiado es hacer un histograma para lo cual
debemos transformar la tabla acumulada que se nos da en el problema en una tabla de
frecuencias absolutas. El histograma nos queda como sigue
42
39
36
33
30
Número de observaciones
27
24
21
18
15
12
9
6
3
0
[0M,0.5M) [1M,1.5M) [2M,2.5M) [3M,3.5M) [4M,4.5M) [5M,5.5M) [6M,6.5M) [7M,7.5M)
[0.5M,1M) [1.5M,2M) [2.5M,3M) [3.5M,4M) [4.5M,5M) [5.5M,6M) [6.5M,7M) [7.5M,8M)
Sueldo de los alcaldes
c) Hallar la probabilidad de que una unidad que sale al mercado sea no apta.
d) Hallar la probabilidad de que una unidad que se somete a reciclaje sea apta.
a) ¿Se puede afirmar a nivel 0.05 que es mayor la densidad media de los ladrillos horneados
a 125 C?
b) ¿Qué capacidad tiene la prueba realizada en a) para detectar una diferencia de 0.1
unidades en la densidad media?
c) ¿Cuántas observaciones se necesitan para que dicha diferencia pueda ser detectada por
la prueba realizada en a) con una potencia de 0.95?
d) El mayor coste del horneado a 125 C hace que sólo sea rentable utilizar esta tempe-
ratura si se prueba que existe una diferencia en la densidad media de 0.05 unidades.
¿Qué decisión tomarías con los datos del problema? Obtener el p-valor.
Problema 3 (3 puntos) En un estudio de ingeniería ambiental acerca de cierta reac-
ción química, interesa conocer la concentración de ciertas soluciones en función del tiempo.
Se fijaron 6 valores diferentes para el tiempo y se observó la concentración de 18 solu-
ciones, 3 para cada uno de los valores de tiempo fijados. Con esos datos se ajustó un
modelo de regresión lineal simple con la variable “Concen” como respuesta y “Tiempo”
como variable regresora que arrojó los siguientes resultados:
Coefficients
Least Squares Standard
Parameter Estimate Error
Intercept -1.9318 0.428579
Slope 0.245971 0.0372092
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model ****** ** 12.7054 43.70 *****
Residual ****** ** *****
Total (Corr.) ****** **
2
Studentized residual
-1
-2
-3
-0,5 0 0,5 1 1,5 2 2,5
predicted Concen
Sea ”” = ” ” (sale al mercado), por lo que:
( ) = 099 ( ) = 001
( ) = 005 ( ) = 095
c) Se pide calcular ( ) Aplicando la regla de Bayes:
() · ( )
( ) =
() · ( ) + () · ( )
001 · 005
= = 000050989
001 · 005 + 099 · 099
d) Para terminar, se pide calcular ( ) Aplicando Bayes de nuevo:
() · ( )
( ) =
() · ( ) + () · ( )
099 · 001
= = 05103
099 · 001 + 001 · 095
a) Se quiere ver si hay evidencias a partir de los datos de que la densidad media de los
ladrillos horneados a 125 C es superior a la densidad media de los ladrillos horneados
a 100 C, i.e., si 2 1 . Por tanto, hay que realizar el contraste de hipótesis
0 : 1 − 2 ≥ 0
1 : 1 − 2 0
Como las varianzas son desconocidas, debemos ver si podemos asumir que son iguales
o no. Para ello podemos construir un intervalo de confianza para el cociente 1 2 , o
equivalentemente, realizar el contraste de hipótesis,
0 : 1 = 2
1 : 1 6= 2
Si fijamos = 005, la región crítica para este último contraste es = {0
−1 2 2
770025∪ {0 770025 } = {0 02004} ∪ {0 499}. Como 0 = 12 = 0075
} 00832 =
2
08165 ∈ no podemos rechazar 0 , y podemos asumir la igualdad de varianzas. En
consecuencia el estadístico-test para el contraste de medias es
̄1 − ̄2 − 0 21745 − 21846 − 0
0 = q = q = −2554
11 + 12 0079 18 + 18
q q
(1 −1)21 +(2 −1)22 2 +7·00832
donde = 1 +2 −2
= 7·0075 14 = 0079.
La región crítica de este contraste es = {0 −1 +2 −2 } = {0 −14005 } =
{0 −1761}, por tanto, como 0 ∈ , rechazamos 0 y afirmamos con seguridad
que 2 1 . (De hecho, 001 − = (14 −2554) 0025).
b) La capacidad para detectar un valor de la alternativa es la potencia en ese punto.
Teniendo en cuenta el contraste en a) y que = 005, debemos utilizar las curvas
CO de la carta (g), donde = |1 −22 −∆0 | = |01−0|
2·0079
= 063. Para la curva en que
∗ = 2−1 = 15, observamos que ' 025, y por tanto la potencia es = 1− ' 075.
c) Utilizando las mismas curvas (g) y el mismo valor de , observamos que para que
= 095, tiene que ser 005 y esto ocurre aprox. para valores de ∗ algo superiores
a 30, con lo que aproximadamente 1 = 2 = ≥ 16.
d) Para resolver este apartado, si somos estrictos con el enunciado, deberíamos resolver
el contraste de hipótesis
0 : 2 − 1 = 005,
1 : 2 − 1 6= 005.
Sin embargo, otra opción razonable sería que la alternativa fuese ,
0 : 2 − 1 = 005,
1 : 2 − 1 005
Utilizando que podemos asumir las varianzas iguales el estadístico de contraste sería
̄2 − ̄1 − 0 21846 − 21745 − 005
0 = q = q = 129
1 1
1 + 2 0079 18 + 18
Si elegimos el contraste utilateral entonces el p-valor será ligeramente superior a
01 (025 = (14 0692) (14 129) (14 134) = 01). Si en cambio
realizamos el contraste bilateral, el p-valor será el doble, 2 · (14 129) 020. En
cualquier caso, no rechazamos la hipótesis nula, y por tanto la decisión será seguir
horneando a 100 C.
y el − = (16 0565) está entre 025 y 04 según las tablas de la distribución
con lo que no puede rechazarse la hipótesis nula y por tanto no puede asegurarse la
hipótesis alternativa.
c) El intervalo de predicción en un punto 0 es
v à !
u
u 1 (0 − ) 2
0 ∈ b0 ± −−12 t 1 + +
La predicción b0 en 0 es
b0 = b0 +
b1 0 = −19318 + 0245971 · 10 = 052791
Y sustituyendo el intervalo queda
v à !
u
u 1 (10 − 11)2
0 ∈ 052791 ± 1746t029074 · 1 + +
18 59749
0 ∈ 052791 ± 1746 · 055835
−044697 ≤ 0 ≤ 15028
d) A la vista del gráfico de residuales ofrecido es bastante claro que existen problemas
con las dos hipótesis fundamentales del modelo, la de linealidad y la de homogeneidad
de la varianza, puesto que hay una clara curvatura en los residuales y además son más
dispersos cuanto mayor es el valor estimado. Una posible solución sería efectuar una
transformación de la variable respuesta.
No parece haber problemas con las observaciones del modelo, ya que ninguno de los
residuales se sale de la banda [−3 3] y solamente uno sale de la banda [−2 2] lo que no
es extraño dado que en torno a un 5% de observaciones (18 · 005 = 09) puede salirse
de dicha banda.
e) Obviamente, si no se cumplen las hipótesis fundamentales del modelo ninguna de las
inferencias que se hagan tendrán validez ya que estas inferencias están basadas en
dichas hipótesis.
Estadística 1 Grados de Ingeniería Mecánica e
Ingeniería de Organización Industrial
7 de julio de 2011
99
1,7
95
percentage
0,7 80
50
-0,3 20
5
-1,3
1
-2,3 0,1
8 10 12 14 16 18 -2,3 -1,3 -0,3 0,7 1,7 2,7
Formacion SRESIDUALS
a) Sabiendo que 2 = 0499 y = 2532, construir la tabla ANOVA y hacer un test
de significación de la regresión en el modelo. Especificar claramente las hipótesis del
test y las conclusiones obtenidas del mismo.
b) Con este modelo, ¿puede afirmarse que 4 años más de formación suponen un incre-
mento medio de menos de 11000 anuales?
c) Utilizando el modelo que se ofrece y sabiendo que = 3548633, dar un intervalo de
confianza del 95% para los ingresos medios de los empleados con 15 años de formación.
d) A la vista de los resultados, ¿hay problemas con alguna de las hipótesis del modelo?
En caso de detectarse problemas con las hipótesis, especificar con cuáles y proponer
posibles soluciones. ¿Existen problemas con alguna de las observaciones presentes en
el modelo? Justificar.
e) Teniendo en cuenta las respuestas al apartado d), ¿qué validez crees que tienen las
conclusiones extraídas en los apartados b) y c)?
Estadística 1 Grados de Ingeniería Mecánica e
Ingeniería de Organización Industrial.
Soluciones
7 de julio de 2011
La predicción b0 en 0 es
b0 +
b0 = b1 0 = −23333 + 26667 · 15 = 37667