Está en la página 1de 3

Universidad Católica de la Santı́sima Concepción

Facultad de Ingenierı́a
Departamento de Matemática y Fı́sica aplicadas

Certamen N o 3 (MAT2203)

1. (15 puntos) Los siguientes valores corresponden a las edades (variable independiente)
de un grupo de personas que realizan un determinado deporte y al peso en Kg. de los
mismos.

Edades 18 26 28 34 42 48 52 54 60 36
Peso 54 64 54 62 70 76 66 76 74 68

a) Encuentre la recta de regresión e interprete.


Ingresando los datos a la calculadora obtenemos β0 = 46, 52 y β1 = 0,4994. Ası́ la
recta de regresión estimada es:
ŷi = 46,52 + 0,4994xi (5pt)
b) Encuentre la recta de regresión para un modelo exponencial yi = β0 eβ1 xi +εi .
Para el desarrollo de este problema tenemos que aplicar ln(·) al modelo exponen-
cial, ası́ nos queda:
ln(yi ) = ln(β0 ) + β1 xi + εi ,
luego el logaritmo natural de las edades es dado:

ln(edades) 3.99 4.16 3.99 4.13 4.25 4.33 4.12 4.33 4.3 4.22

Ahora ingresando los datos a la calculadora obtenemos el siguiente modelo de


regresión:
\
ln(yi ) = 3,88 + 0,0077xi (5pt)
c) Considerando el mejor modelo. Determine la edad si el peso es de 75 kilos.
Para obtener el mejor modelo consideramos el coeficiente de correlación de ambos
modelos: R12 = 0,7112 y R22 = 0,7056 debido a que el modelo lineal represen-
ta mejor la variabilidad del peso lo elegimos como el mejor modelo y ası́ 75 =
46,52 + 0,5x ⇒ x = (75 − 46,52)/0,5 = 56,96 (5pt)

2. (15 puntos) Considere los siguientes datos que mide la temperatura en C 0 de 5 marcas
de refrigeradores distintos 0,22, 0,86, −0,41, 0,86 y −1,52. Pruebe mediante un test de
hipótesis que los residuos siguen una distribución normal al 5 % de nivel de significa-
ción. Considere la media µ = 0 y la varianza σ 2 = 1.

Debemos plantear la siguientes hipótesis:


H0 : r ∼ N (0, 1) v/s H1q : r no se distribuye normal (2pt)
Ahora bajo H0 construimos la siguiente tabla para realizar la prueba de Kolmogorov-
Smirnov, utilizamos esta test debido a que n = 5.

i r(i) Fn (r(i) ) = i
n F (r(i) ) D+ = |Fn (r(i) ) − F (r(i) )| D− = |Fn (r(i) ) − F (r(i) )|
1 −1,52 0,2 1 − 0,94 = 0,06 0,14 0,06
2 −0,41 0,4 1 − 0,66 = 0,34 0,06 0,14
3 0,22 0,6 1 − 0,41 = 0,59 0,01 0,19
4 0,86 0,8 1 − 0,2 = 0,8 0 0,2
5 0,86 1 1 − 0,2 = 0,8 0,2 0
(8pt)
1
2

Ahora elegimos D = máx{D+ , D− } = 0,2 y comparamos con el de tabla D(α,n) =


D(0,005,5) = 0,56328 como D < D(α,n) no tenemos evidencia para rechazar H0 . (5pt)

3. (15 puntos) Se realizó una encuesta a 100 pacientes en un gran hospital para determi-
nar si hay o no conexión entre el hábito de fumar y el cáncer al pulmón. Cada paciente
es clasificado como fumador o no fumador y si tiene cáncer al pulmón o no, lo que se
resume en la siguiente tabla

Fumador/ Cáncer Si No Total


Si 15 25 40
No 5 55 60
Total 20 80 100
¿Existe dependencia entre el hábito de fumar y el cáncer al pulmón?. Considere
α = 0,05

Para probar estadı́sticamente la independencia de dos variables aleatorias plante-


mos las siguientes hipótesis:

H0 : Existe independencia entre el hábito de fumar y el cáncer al pulmón.


v/s
H1 : No existe independencia.
Y usamos el siguiente estadı́stico de prueba:
X (nij − np̂ij )2
χ2c = ∼ χ2(k−1)(s−1) (3pt)
i,j
np̂ ij

ni· n·j
donde p̂ij = n2 y nij las frecuencias dadas en la tabla. Se sigue que:
(40)(20) (40)(80)
p̂11 = p̂12 =
1002 1002

(60)(20) (60)(80)
p̂21 = p̂22 = (5pt)
1002 1002

Luego
X (nij − np̂ij )2 (15 − 8)2 (25 − 32)2 (5 − 12)2 (55 − 48)2
= + + + = 12,76 (5pt)
i,j
np̂ij 8 32 12 48

Ası́ χ2c = 12,76 como α = 0,05 tenemos de tabla que χ1 (0,05) = 3,84 y por lo tanto
rechazamos H0 con lo que concluimos que las variables son dependientes. (2pt)

4. (15 puntos) El rendimiento de una lı́nea de producción es función del número de horas
trabajadas X1 y de la temperatura inicial de la materia prima X2 . Para verificar la
aseveración anterior se registran los datos correspondientes a 7 dı́as de producción. Un
análisis preliminar dio como resultado la siguiente información parcial
   
88,8 −8,3 −2,9 0,9263
X 0 X −1 = −8,3 0,83 0,26  ; β̂ = 0,7447
−2,9 0,26 0,10 0,7647

a) Complete la tabla ANOVA y escriba el modelo.

Fuente de Variación G. L. Suma de Cuadrados Cuadrados Medios Fc


CM R
Regresión 2 2,0028 2,0028/2 Fc = CM E = 52, 844
Error 4 0,0758 0,0758/4
Total 6 2,0786
3

El modelo es dado por:


yi = β0 + β1 xi,1 + β2 xi,2 + εi (3pt)
b) Pruebe la significación de la regresión, use α = 0,05. ¿Qué conclusiones pueden
obtenerse?
De tabla tenemos que fk,n−(k+1)(α) = f2,4 (0,05) = 6,94 como Fc > ftabla recha-
zamos H0 , lo que quiere decir, que existe correlación con alguna de las variables
independientes. (2pt)

c) Construya un indicador que permita decidir si el modelo ajustado es bueno.


El coeficiente de determinación indica la fracción de la variabilidad de la variable
dependiente que es explicada por el modelo. En este caso el R2 = 1 − SCE SCT =
1 − (0,0758/2,0768) = 0,9635. Sin embargo, un mejor coeficiente es el ponderado o
n−1 SCE
ajustado por el numero de variables dado por Ra2 = 1− n−k SCT = 0,9562 (3pt)

d) Determine si el rendimiento es en función del número de horas trabajadas. En caso


de no depender del número de horas trabajadas escriba el nuevo modelo.
En este caso debemos probar la siguiente prueba de hipótesis:
H0 : β1 = 0 v/s H1 : β1 6= 0
donde el estadı́grafo es dado por tc = √ β̂21 ∼ tn−(k+1) (α). Ası́
σ̂ c1,1

0,7447
tc = p = 5,9379,
(0,01895)(0,83)
SCE
donde σ̂ 2 = n−(k+1) = 0,0758
4 . Como t4 (0,025) = 2,77 tenemos que |tc | > ttabla ,
por lo tanto, existe evidencia para rechazar H0 ası́ el modelo no cambia. (7pt)

JPL/jpl, Primer Semestre, 2013

También podría gustarte