Está en la página 1de 4

Ejercicio de Regresión Lineal Simple.

Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar.


(Devore, 6a. Edición. Pág. 517, problema 16)
Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de predicción
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP
1 5 4 25 16 20 3.0065609658 0.9934390342 -1.79026099 7.80338293 -9.28904753 15.3021695
2 12 10 144 100 120 8.7953729971 1.2046270029 4.42350582 13.1672402 -3.34075942 20.9315054
3 14 13 196 169 182 10.4493192917 2.5506807083 6.19349156 14.705147 -1.64549601 22.5441346
4 17 15 289 225 255 12.9302387337 2.0697612663 8.84321888 17.0172586 0.89378499 24.9666925
5 23 15 529 225 345 17.8920776176 -2.8920776176 14.1207035 21.6634517 5.95910857 29.8250467
6 30 25 900 625 750 23.6808896488 1.3191103512 20.2318382 27.129941 11.8458382 35.5159411
7 40 27 1600 729 1080 31.950621122 -4.950621122 28.8474511 35.0537911 20.211705 43.6895372
8 47 46 2209 2116 2162 37.7394331533 8.2605668467 34.7756243 40.703242 26.0365852 49.4422811
9 55 38 3025 1444 2090 44.3552183318 -6.3552183318 41.4286154 47.2818213 32.6617376 56.0486991
10 67 46 4489 2116 3082 54.2788960997 -8.2788960997 51.1595169 57.3982753 42.5356847 66.0221075
11 72 53 5184 2809 3816 58.4137618363 -5.4137618363 55.1357477 61.691776 46.6274196 70.2001041
12 81 70 6561 4900 5670 65.8565201622 4.1434798378 62.2018529 69.5111874 53.9599206 77.7531197
13 96 82 9216 6724 7872 78.261117372 3.738882628 73.7945743 82.7276605 66.0905589 90.4316759
14 112 99 12544 9801 11088 91.4926877291 7.5073122709 86.008974 96.9764014 78.9131963 104.072179
15 127 100 16129 10000 12700 103.897284939 -3.8972849389 97.3815516 110.413018 90.8348476 116.959722

n= 15
Sumas 798 643 63040 41999 51232 -3.108624E-14
Promedio 53.2 42.8666666667
Desv.Est. insesgada 38.346540168 32.1111166035
Varianza insesgada 1470.4571429 1031.1238095238
Sumas de cuadrados Sxx Syy Suma(Y2) Suma(X2) Sxy
20586.4 14435.7333333333 63040 41999 17024.4
Coef. de correlación, r= 0.9875570321 Intervalo de confianza para el promedio de y dado x:
Coef. de determinación, R2= 0.9752688917 <- 97.53% de la variación de Y está explicada por el modelo de regresión Si xo se fija en: 50
Bo=Y-B1*X -1.128304771 <- Ordenada al origen La estimación puntual para la respuesta media de yo es:
B1=Sxy/Sxx 0.8269731473 <- Pendiente 40.220353
SSE=Syy-B1*Sxy 357.01168409 <- Suma de cuadrados de los errores El error estándar estimado de la respuesta media es:
MSE=SSE/(n-2) 27.462437238 <- Cuadrados medios de los errores 1.3581198
El intervalo de confianza de (1-a)100% es:
Si b 1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y 37.286313 a 43.154392

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 2.1603686565

Prueba de Hipótesis sobre b 1: El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. Intervalo de predicción para y dado x
Si xo se fija en: 50
H 0 : β 1=0 ^ −β
β La predicción para la respuesta yo es:
1 1
T= = 22.6418585332 40.220353
H 1 : β1 ≠0
√ MS E
S xx
Por lo tanto: Se rechaza Ho
El error estándar estimado de la predicción:

Un intervalo de predicción para yo es:


28.525008 a 51.915697
5.4135872

Prueba de Hipótesis sobre r el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

H 0 : ρ=0 r √n−2
T= = 22.6418585332
H 1 : ρ≠0
√ 1−r2 Por lo tanto: Se rechaza Ho

140
Gráfica de residuos
10
Diagrama de dispersión
120
8

100 f(x) = 0.8269731473x - 1.1283047708 6


R² = 0.9752688917
ei
4 Linear (ei)
80

2
60
Y

0
ei

f(x) = - 3.76059267322827E-16x + 1.78277495438668E-14


R² = 1.11022302462516E-16
40 -2
Y
Linear (Y)
LIC -4
20 LSC
LIP
LSP
-6
0
0 20 40 60 80 100 120 140
-8
0 20 40 60 80 100 120 140
-20 X
X -10
Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de predicción
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP Diagrama de
1 1 2.8 1 7.84 2.8 2.219047619 0.580952381 1.2321869 3.20590834 0.53585232 3.90224292
2 2 4.8 4 23.04 9.6 5.4047619048 -0.6047619048 4.66386912 6.14565469 3.85293251 6.9565913
3 3 8.2 9 67.24 24.6 8.5904761905 -0.3904761905 8.01044504 9.17050734 7.10869062 10.0722618 25
4 4 12 16 144 48 11.7761904762 0.2238095238 11.1961593 12.3562216 10.2944049 13.257976
5 5 15.2 25 231.04 76 14.9619047619 0.2380952381 14.221012 15.7027975 13.4100754 16.5137342
6 6 18.1 36 327.61 108.6 18.1476190476 -0.0476190476 17.1607583 19.1344798 16.4644237 19.8308144
20
n= 6
f(x) = 3.1857142857x - 0
Sumas 21 61.1 91 800.77 269.6 0 15 R² = 0.9945972397
Promedio 3.5 10.1833333333

Y
Desv.Est. insesgada 1.8708286934 5.9760912532
Varianza insesgada 3.5 35.7136666667 10

5
Sumas de cuadrados Sxx Syy Sxy
17.5 178.5683333333 55.75
0
0 1 2 3 4
X
Coef. De Correlación, r= 0.9972949612
Intervalo de confianza para la respuesta media esperada dado x
Coef. De Determinación,
R2= 0.9945972397 <- 99.46% de la variación de Y está explicada por el modelo de regresión Si xo se fija en: 3.5 horas
La respuesta media esperada sería de: 10.183333
Bo=Y-B1*X -0.966666667 <- Ordenada al origen
B1=Sxy/Sxx 3.1857142857 <- Pendiente
Un intervalo de confianza para la calificación esperada es:
SSE=Syy-B1*Sxy 0.9647619048 <- Suma de cuadrados de los errores 9.6266688 a 10.739998

MSE=SSE/(n-2) 0.2411904762 <- Cuadrados medios de los errores Error estándar estimado de la respuesta media: 0.2004954

Si b 1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y Intervalo de predicción para y dado x
Si xo se fija en: 3.5 horas
Si a = 0.05 a/2= 0.025 La predicción para la respuesta yo es: 10.183333
La región de rechazo es: | t0 |>ta/2 2.7764451052
Un intervalo de predicción para yo es:
Prueba de Hipótesis sobre b 1: El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. 8.7105374 a 11.656129

H 0 : β 1=0 ^ −β
β Error estándar estimado de la predicción: 0.530461
1 1
T= = 27.1359962085
H 1 : β1 ≠0
√ MS E
S xx
Por lo tanto: Se rechaza Ho

Prueba de Hipótesis sobre r el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

H 0 : ρ=0 r √n−2
T= = 27.1359962085
H 1 : ρ≠0
√ 1−r 2 Por lo tanto: Se rechaza Ho
FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIÓN
POR EL MÉTODO DE MÍNIMOS CUADRADOS

Verdadera recta de regresión: Y =β 0 + β 1 X


Modelo lineal simple: y i=β 0 + β 1 x i +ε i 2
ε i ~ N ( 0, σ )
Los i se suponen errores aleatorios con distribución normal, media cero y varianza 2;
b0 y b1 son constantes desconocidas (parámetros del modelo de regresión)
Ahora, el modelo de regresión lineal simple ajustado (o recta estimada) es:

S xy
^y = β^ 0 + β^ 1 x donde:
β^ 0 = ȳ− β^ 1 x̄ ^ 1=
β
S xx
Suma de cuadrados de X Suma de cuadrados de Y
n 2 2

( )
n

n
2
S xx = ∑ ( xi − x̄ ) =∑ x −
n
2
∑ xi
i=1
n
S yy =∑ ( y i− ȳ ) =∑ y −
2
n
2
( )
∑ yi
i=1

i=1 i=1
i n i =1 i=1
i n
Suma de productos cruzados de X y Y
n n

n
S xy =∑ ( x i− x̄ ) y i=∑ xi y i −
n (∑ )(∑ )
i =1
yi
i =1
xi

i=1 i=1 n

Coeficiente de correlación: Coeficiente de determinación:


S xy 2 2
r= R =r
√ S xx S yy
El residuo o error en la estimación se define como: e i= y i − ^y i
n n
Suma de cuadrados de los errores: SS E =∑ e 2i =∑ ( y i − ^y i )2
i =1 i =1
Cuadrado medios de los errores (o varianza residual):
n
También:
∑ ( y i− y^ i )2
MS E = i=1 =
SS E SS E =S yy − β^ 1 S xy
n−2 n−2
Estimación de la respuesta media de yo dado un xo:

μ ^ +β
^ ( Y |x ) = β
^ Y = ^y 0 = E ^ x
0
0 0 1 0

Bandas de confianza para la recta de regresión:

√ [ ]
2
1 ( x o − x̄ )
^y 0 ±t α / 2, n−2 MS E +
n S xx
Bandas de predicción:

√ [ ]
2
1 ( x o − x̄ )
^y 0 ±t α / 2, n−2 MS E 1+ +
n S xx
No. hrs. estudio Calificación del examen Bandas de confianza Bandas de predicción 100
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP
1 1 71 1 5041 71 71.45 -0.45 67.1647411 75.7352589 63.1768167 79.7231833 95
2 2 71 4 5041 142 72.8375 -1.8375 69.0983479 76.5766521 64.8335399 80.8414601
3 4 74 16 5476 296 75.6125 -1.6125 72.6169957 78.6080043 67.9277642 83.2972358
4 4 80 16 6400 320 75.6125 4.3875 72.6169957 78.6080043 67.9277642 83.2972358 90
5 7 80 49 6400 560 79.775 0.225 76.4808953 83.0691047 71.9690251 87.5809749
6 12 86 144 7396 1032 86.7125 -0.7125 80.4657154 92.9592846 77.2729854 96.1520146
85 f(x) = 1.3875x + 70.0625
n= 6 R² = 0.855625
80
Sumas 30 462 230 35754 2421 -1.421085E-14
Promedio 5 77 75

Desv.Est. insesgada 4 6 70
Varianza insesgada 16 36
65
Desv. Est. sesgada 3.6514837167 5.4772255751
Varianza sesgada 13.333333333 30
60
Sumas de cuadrados Sxx Syy Sxy
80 180 111 55

50
0 1 2 3 4 5 6 7 8 9
Coef. De Correlación, r= 0.925
Intervalo de confianza para la respuesta media esperada dado x
Coef. De Determinación,
R2= 0.855625 <- 85.56% de la variación de Y está explicada por el modelo de regresión Si los alumnos estudian en promedio: 5 horas
La calificación esperada en promedio sería de: 77
Bo=Y-B1*X 70.0625 <- Ordenada al origen
B1=Sxy/Sxx 1.3875 <- Pendiente
Un intervalo de confianza para la calificación esperada es:
SSE=Syy-B1*Sxy 25.9875 <- Suma de cuadrados de los errores 74.110879 a 79.889121

MSE=SSE/(n-2) 6.496875 <- Cuadrados medios de los errores

Si b 1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y Intervalo de predicción para y dado x
Si un alumno estudia 5 horas
Si a = 0.05 a/2= 0.025 La predicción para su calificación es de: 77
La región de rechazo es: | t0 |>ta/2 2.7764451052
Un intervalo de predicción para la calificación es:
Prueba de Hipótesis sobre b 1: El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. 69.356104 a 84.643896

H 0 : β 1=0 ^ −β
β 1 1
T= = 4.8688425427
H 1 : β1 ≠0
√ MS E
S xx
Por lo tanto: Se rechaza Ho

Prueba de Hipótesis sobre r el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

H 0 : ρ=0 r √n−2
T= = 4.8688425427
H 1 : ρ≠0
√ 1−r 2 Por lo tanto: Se rechaza Ho

También podría gustarte