Está en la página 1de 57

FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIÓN

POR EL MÉTODO DE MÍNIMOS CUADRADOS

Y   0  1 X
Verdadera recta de regresión:

Modelo lineal simple:


yi   0  1 xi   i
Los i se suponen errores aleatorios con distribución normal, media cero y varianza 2;
0 y 1 son constantes desconocidas (parámetros del modelo de regresión)

Ahora, el modelo de regresión lineal simple ajustado (o recta estimada) es:

yˆ  ˆ0  ˆ1 x donde: ˆ0  y  ˆ1 x βˆ 1 


Suma de cuadrados de X Suma de cuadrados de Y
2
 n   n 
n n
  xi    y i 
  x i2   i 1 
n n
S xx    xi  x 
2
S yy    yi  y 
2
  yi 
2  i 1 
i 1 i 1 n i 1 i 1 n

Suma de productos cruzados de X y Y

 n  n 
n n
  y i   xi 
S xy   ( xi  x ) yi   xi yi   i 1  i 1 
i 1 i 1 n
OTRA FORMA DE CALCULO DE LOS PARAMETROS

INTERPRETACIÓN DE PARAMETROS
EJEMPLO:
SEA X = HORAS DE ESTUDIO DEDICADAS A LA SEMANA SI: Y = 3 + 2X
SEA Y = PROMEDIO DE CALIFICACIÓN
EL COEFICIENTE SIGNIFICA (β1): POR CADA HORA ADICIONAL DE ESTUDIO DEDICADA A LA SEMANA, SU CALIFICACIÓN AUMEN
LA CONSTANTE SIGNIFICA (β0): SI LA PERSONA NO DEDICA HORAS DE ESTUDIO SE ESPERA QUE SAQUE DE PROMEDIO TRES

Coeficiente de correlación: Coeficiente de determinac


r toma valores de -1 a 1

r
S xy R  r 2 2

S xx S yy Cuando el coeficiente r de Pearso


de la otra y viceversa. Es decir, el c
+-0.96 +-1.0 PERFECTA
+-0.85 +-0.95 FUERTE
+-0.70 +-0.84 SIGNIFICATIVA
+-0.50 +-0.69 MODERADA
+-0.20 +-0.49 DEBIL
+-0.10 +-0.19 MUY DEBIL
+-0.09 +-0.00 NULA
SE APLICA MAYORMENTE CUANDO LA ECUACION ES LINEAL
Mide el grado de asociación lineal entre dos variables X e Y
El coeficiente r de puede variar de -1 a 1, donde el signo indica la dirección
de la correlación y el valor numérico, la magnitud de la correlación.

INTERPRETACIÓN DE PARAMETROS
EJEMPLO:
si R^2 = 0.94…. ESTO QUIERE DECIR QUE EL 94% APROXIMADAMENTE DE LA VARIACIÓN EN LA VARIABLE Y PUEDE S
REGRESIÓN
DOS

 i ~ N (0,  2 )
anza 2;

S
βˆ 1  xy

S xx
adrados de Y
2
 n 
n


 y i 

  yi 
2 2 i 1

i 1 n

 n 
  xi 
 i 1 
n
Y = 3 + 2X

MANA, SU CALIFICACIÓN AUMENTARA EN DOS PUNTOS


E DE PROMEDIO TRES

eficiente de determinación:
EL R^2 ESTA ENTRE 0 Y 1

R  r
2 2

uando el coeficiente r de Pearson se eleva al cuadrado, el resultado indica el porcentaje de la variación de una variable debido a la variació
e la otra y viceversa. Es decir, el coeficiente de determinación, r al cuadrado o r², es la proporción de la variación en Y explicada por X.

CIÓN EN LA VARIABLE Y PUEDE SER EXPLICADA POR LA VARIACIÓN EN LA VARIABLE X


e una variable debido a la variación
riación en Y explicada por X.
PRACTICA
MODELO LINEAL GENERAL DE DOS VARIABLES O SIMPLE
EJERCICIO 1
Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado luga
a) Realice las pruebas de hipotesis y compruebe

Var Indep. Var. Dep. o regresiva


No. Observ. X2 Y2
X Y
1 5 4 25 16
2 12 10 144 100
3 14 13 196 169
4 17 15 289 225
5 23 15 529 225
6 30 25 900 625
7 40 27 1600 729
8 47 46 2209 2116
9 55 38 3025 1444
10 67 46 4489 2116
11 72 53 5184 2809
12 81 70 6561 4900
13 96 82 9216 6724
14 112 99 12544 9801
15 127 100 16129 10000
SUMATORIAS 798 643 63040 41999
PROMEDIO 53.2 42.8666666667
n
  yi  yˆ i 
2
SS E
MS E  i 1 
Sxx = 20586.400 n2 n2
Sxy = 17024.400 ECUACIÓN DE
Syy = 14435.733 REGRESIÓN Y= -1.128
β1 = 0.827
β0 = -1.128
Coef. De Correlación, r= 0.988
Coef. De Determinación, R2= 0.975 <- 97.53% de la variación de Y está explicada por el modelo de regresió
SSE= <- Suma de cuadrados de los errores
MSE= 27.462 <- Cuadrados medios de los errores

PRUEBAS DE HIP

Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 2.1603687

Prueba de Hipótesis sobre β1: El estadístico de prueba tiene distribución T-Student con n-2 grados

ˆ1  1
H 0 : β1  0 T  Tc = 22.6418585
MS E
H 1 : β1  0
S xx Por lo tanto: SE RECHAZA LA HIPOTESIS N

INTERPRETACIÓN: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA HIPOTESIS NULA;


ESCURRIMIENTO

Prueba de Hipótesis sobre ρ el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados

H0 :   0 r n2
T Tc = 22.6418585

H1 :   0 1 r 2 Por lo tanto: SE RECHAZA LA HIPOTESIS N

INTERPRETACIÓN: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA HIPOTESIS NULA;


ESCURRIMIENTO

INTERVALOS DE CO

Intervalo de confianza para el promedio de Y dado X:


Si el volumen de lluvia promedio es de: 50 m3
El volumen promedio de escurrimiento seria de: 40.2203525952

Un intervalo de confianza para el volumen esperado de escurrimiento es de:

37.29 a 43.15 m3

Intervalo de predicción para Y dado X


Si el volumen de lluvia es de: 50 m3
La predicción para el volumen de escurrimiento es: 40.2203525952

Un intervalo de predicción para el volumen de escurrimiento es de:

28.53 a 51.92 m3
 1 ( xo  x ) 2 
yˆ 0  ta / 2 , n  2 MS E 1   
3) en determinado lugar.  n S xx 

Bandas de confianza Bandas de predicción


XY yiestimada (Y - Yestimada)^2
LIC LSC LIP
20 3.00656097 0.9869211146 -1.7902609936 7.8033829252 -9.2890475341
120 8.795373 1.4511262162 4.4235058152 13.1672401789 -3.3407594235
182 10.4493193 6.5059720757 6.1934915623 14.7051470211 -1.6454960081
255 12.9302387 4.2839116996 8.8432188769 17.0172585904 0.8937849875
345 17.8920776 8.3641129461 14.1207035048 21.6634517304 5.959108575
750 23.6808896 1.7400521186 20.2318382498 27.1299410479 11.8458381903
1080 31.9506211 24.5086494939 28.8474511378 35.0537911062 20.2117050126
2162 37.7394332 68.2369646291 34.7756243111 40.7032419955 26.0365851953
2090 44.3552183 40.3888000454 41.428615355 47.2818213087 32.6617375644
3082 54.2788961 68.5401206295 51.159516934 57.3982752654 42.5356847053
3816 58.4137618 29.3088172201 55.1357476905 61.691775982 46.6274195617
5670 65.8565202 17.1684251664 62.2018528801 69.5111874443 53.9599206305
7872 78.2611174 13.9792433061 73.7945742739 82.7276604701 66.0905588507
11088 91.4926877 56.3597375326 86.0089740133 96.9764014449 78.9131963407
12700 103.897285 15.1888298952 97.3815516 110.413018278 90.8348476312
51232 643 357.0116840892

 yˆ i 
2
SS E

2 n2

+ 0.827 X

cada por el modelo de regresión

PRUEBAS DE HIPOTESIS

ineal entre X y Y n
  yi  yˆ i 
2
SS E
MS E  i 1

n2 n2
n
  yi  yˆ i 
2
SS E
MS E  i 1

n2 n2

ción T-Student con n-2 grados de libertad.

RECHAZA LA HIPOTESIS NULA

ECHAZA LA HIPOTESIS NULA; ES DECIR SI HAY REGRESIÓN LINEAL ENTRE EL VOLUMEN DE LLUVIA Y EL VOLUMEN DE

ción T-Student con n-2 grados de libertad.

RECHAZA LA HIPOTESIS NULA

ECHAZA LA HIPOTESIS NULA; ES DECIR SI HAY REGRESIÓN LINEAL ENTRE EL VOLUMEN DE LLUVIA Y EL VOLUMEN DE

INTERVALOS DE CONFIANZA

1 ( xo  x ) 2 
ˆ 0  ta / 2 , n  2
y MS E   
 n S xx 

 1 ( xo  x ) 2 
ˆ 0  ta / 2 , n  2
y MS E 1   
 n S xx 
( xo  x ) 2 
S xx 

Bandas de predicción
LSP
15.3021694658
20.9315054176
22.5441345915
24.9666924798
29.8250466602
35.5159411074
43.6895372315
49.4422811112
56.0486990992
66.0221074941
70.2001041109
77.7531196938
90.4316758933
104.072179118
116.959722247
UVIA Y EL VOLUMEN DE

UVIA Y EL VOLUMEN DE

xo  x ) 2 
S xx 

1 ( xo  x ) 2 
 
n S xx 
EJERCICIO 2
Los siguientes datos representan el número de horas de estudio (x) y la calificación obtenida (y) en un exa
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Estime el valor de la variable dependiente cuando la independiente es 15
Var Indep.
Var. Dep. o regresiva
No. hrs. estu Calificación del examen
No. Observ. X Y X2 Y2 XY yiestimada ei
1 1 71 1 5041 71 71.45 0.2025
2 2 71 4 5041 142 72.8375 3.37640625
3 4 74 16 5476 296 75.6125 2.60015625
4 4 80 16 6400 320 75.6125 19.2501563
5 7 80 49 6400 560 79.775 0.050625
6 12 86 144 7396 1032 86.7125 0.50765625
sumatorias 30 462 230 35754 2421 462 25.9875
Promedio 5 77

a) Grafique y obtenga su tendencia y ecuación

Col umn C Li nea r (Col umn C)


100
90
80 f(x) = 1.3875x + 70.0625
R² = 0.855625
70
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14

b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados

Sxx = 80 S
Sxy = 111 βˆ 1  xy
Syy =
β1 =
180
1.388
S xx
β0 = 70.063

Y=70.06+1.38X
ˆ 0  y  ˆ 1 x

0.855625 0.925 0.855625


r= 0.92500000

c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) C

Resumen

Estadísticas de la regresión
Coeficiente d 0.925
Coeficiente 0.855625
R^2 ajustado 0.81953125
Error típico 2.54889682
Observacione 6

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 154.0125 154.0125 23.7056277 0.00822656
Residuos 4 25.9875 6.496875
Total 5 180

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 70.0625 1.76439393 39.70910285 2.403E-06 65.1637571 74.9612429
Variable X 1 1.3875 0.28497533 4.868842543 0.00822656 0.59628165 2.17871835

d) Estime el valor de la variable dependiente cuando la independiente es 15

Y=70.06+1.38X = 90.76

2 Practic
Coef. De Determinación, R2= 0.856 <- 85.56% de la variación de Y está explicada por el modelo de regresión
SSE= 25.988 <- Suma de cuadrados de los errores
MSE= 6.497 <- Cuadrados medios de los errores
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 2.7764451

Prueba de Hipótesis sobre β1:


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 4.8688425

Por lo tanto: SE RECHAZA LA HIPOTESIS NULA

INTERPRETACION: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA


ESTUDIO (X) Y LA CALIFICACION OB

Prueba de Hipótesis sobre ρ el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 4.8688425

Por lo tanto: SE RECHAZA LA HIPOTESIS NULA

INTERPRETACION: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA


ESTUDIO Y LA CALIFICACION OB

INTERVALOS DE CONFIANZA

Intervalo de confianza para el promedio de Y dado X:


Si la variables independiente es : 15
El volumen promedio de escurrimiento seria de: 90.875

Un intervalo de confianza para el volumen esperado de escurrimiento es de: yˆ 0  ta / 2,n  2 MS E


82.45 a 99.30
Intervalo de predicción para Y dado X
Si la variables independiente es : 15
La predicción para el volumen de escurrimiento es: 90.875
yˆ 0  ta / 2,n  2 MS
Un intervalo de predicción para el volumen de escurrimiento es de:

79.87 a 101.88
ación obtenida (y) en un examen, para una muestra de seis estudiantes

 n  n 
 
la parte b) Comente.
n n
 y i  xi 

S xy   ( xi  x ) yi   xi yi   i 1  i 1 
i 1 i 1 n

2
 n 
n n


 xi 

S xx    xi  x    xi 
2 2 i 1

i 1 i 1 n

2
 n 
n n
  y i 
S yy    yi  y    y 2i   i 1 
2

i 1 i 1 n

uadrados

yˆ  ˆ0  ˆ1 x
xy

xx
SSxyxy
ˆ 1 x rr 
SSxxxxSSyyyy

enidos en la parte b) Comente.

DATOS
ANALISIS DE DATOS
REGRESION
RANGO DE SALIDAD

Inferior 95.0%
Superior 95.0%
65.1637571 74.9612429
0.59628165 2.17871835

diente es 15

2 Practica
modelo de regresión
ineal entre X y Y
n

  y  yˆ 
2
i i
SS E
MS E  i 1

n2 n2

ˆ1  1
T H0 : β1  0
MS E
H1 : β1  0
S xx

NTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LAS HORAS DE
(X) Y LA CALIFICACION OBTENIDA (Y)

r n2 H0 :   0
T
1 r 2 H1 :   0

NTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LAS HORAS DE
DIO Y LA CALIFICACION OBTENIDA

NFIANZA

 1 ( xo  x ) 2 
yˆ 0  ta / 2,n  2 MS E   
 n S xx 
 1 ( xo  x ) 2 
yˆ 0  ta / 2,n  2 MS E 1   
 n S xx 
 n 
  xi 
 i 1 
n
RE LAS HORAS DE

RE LAS HORAS DE
de datos
promedios
siguientes
, que se
obtuvieron
de los
EJERCICIO 3
registros
históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Estime el valor de la variable dependiente cuando la independiente es 64

N X Y X2 Y2 XY yiestimada
1 480 362 230400 131044 173760 463.8461288047
2 880 750 774400 562500 660000 760.8392382399
3 110 243 12100 59049 26730 189.1275025772
4 320 410 102400 168100 131200 345.0488850307
5 960 758 921600 574564 727680 820.237860127
6 950 1002 902500 1004004 951900 812.8130323911
7 240 320 57600 102400 76800 285.6502631436
8 510 365 260100 133225 186150 486.1206120124
9 750 618 562500 381924 463500 664.3164776735
SUMATORIA 5200 4828 3823600 3116810 3397720 4828
PROMEDIO 577.77777778 536.4444444

a) Grafique y obtenga su tendencia y ecuación

Col umn C Li near (Col umn C)


1200

1000

800
f(x) = 0.7424827736x + 107.4543974825
R² = 0.8571306624
600

400

200

0
0 200 400 600 800 1000 1200

b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados

Sxx = 819155.5556
Sxy = 608208.8889 Y=107.45+0.74X
Syy = 526856.2222
β1 = 0.742
β0 = 107.454

0.8571306624 0.925813514 0.85713066


r= 0.92581351

c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) C

Resumen

Estadísticas de la regresión
Coeficiente de c 0.925813514
Coeficiente de 0.857130662
R^2 ajustado 0.836720757
Error típico 103.697086
Observaciones 9

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 451584.623 451584.623 41.9958176 0.0003403507
Residuos 7 75271.5995 10753.0856
Total 8 526856.222

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 107.4543975 74.6789724 1.43888425 0.19335551 -69.1333117856
Variable X 1 0.742482774 0.11457328 6.48041801 0.00034035 0.4715600075

d) Estime el valor de la variable dependiente cuando la independiente es 64

Y=107.45+0.74X = 154.81

2 Practica
Coef. De Determinación, R2= 0.857 <- 85.71% de la variación de Y está explicada por el modelo de regresión
SSE= -81352.667 <- Suma de cuadrados de los errores
MSE= 10753.086 <- Cuadrados medios de los errores

Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Si a = 0.05 a/2= 0.025
La región de rechazo es: | t0 |>ta/2 2.3646243

Prueba de Hipótesis sobre β1:


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 6.4804180

Por lo tanto: SE RECHAZA LA HIPOTESIS NULA

INTERPRETACION: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA

Prueba de Hipótesis sobre ρ el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 6.4804180

Por lo tanto: SE RECHAZA LA HIPOTESIS NULA

INTERPRETACION: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA

INTERVALOS DE CONFIANZA

Intervalo de confianza para el promedio de Y dado X:


Si la variables independiente es : 64
El volumen promedio de escurrimiento seria de: 154.973295 yˆ 0  ta / 2, n  2
Un intervalo de confianza para el volumen esperado de escurrimiento es de: ˆ 0  ta / 2, n  2
y
-6.44 a 316.39

Intervalo de predicción para Y dado X


Si la variables independiente es : 64
La predicción para el volumen de escurrimiento es: 154.973295

Un intervalo de predicción para el volumen de escurrimiento es de:

-138.59 a 448.54
s en la parte b) Comente.

(Y - Yestimada)^2
10372.6339525099
117.4890856218
2902.2459785718
4218.6473357611
3873.5512331831
35791.7087130584
1179.9044221028
14670.2026542512
2145.2161040784
75271.5994791384

os cuadrados

yˆ  ˆ0  ˆ1 x
yˆ  ˆ0  ˆ1 x

obtenidos en la parte b) Comente.

Superior 95% Inferior 95.0%


Superior 95.0%
284.0421067506 -69.133312 284.042107
1.0134055397 0.47156001 1.01340554

ependiente es 64

2 Practica
da por el modelo de regresión

sión lineal entre X y Y


n
  yi  yˆ i 
2
SS E
MS E  i 1 
n2 n2
n
  yi  yˆ i 
2
SS E
MS E  i 1 
n2 n2
ˆ1  1
T H0 : β1  0
n-2 grados de libertad.
MS E
S xx H1 : β1  0

AS, ENTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y

H0 :   0
n-2 grados de libertad.
r n2
T
1 r 2 H1 :   0

AS, ENTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y

LOS DE CONFIANZA

 1 ( xo  x ) 2 
yˆ 0  ta / 2, n  2 MS E  

1n ( xoSxxx ) 2 


ˆ 0  ta / 2, n  2
y MS E   
 n S xx 

 1 ( xo  x ) 2 
yˆ 0  ta / 2, n  2 MS E 1  
 n ( xoSxxx ) 2 
1
yˆ 0  ta / 2, n  2 MS E 1   
 n S xx 
β1  0
β1  0

L ENTRE LA VARIBLE X Y Y

 0
 0

L ENTRE LA VARIBLE X Y Y
EJERCICIO 4
Para el conjunto de datos promedios siguientes, que se
obtuvieron de los registros históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Use la recta de Regresión para pronosticar la posible venta de la primera semana de Mayo (sema
X INDE Y DEPEN
N Semanas Ventas X2 Y2 XY yiestimada(Y - Yestimada)^2
1 1 6,757 1 45,657,049 6757 4115.48617 6977595.34
2 2 7,811 4 61,011,721 15622 4133.06324 13527218.8
3 3 1,219 9 1,485,961 3657 4150.64032 8594514.94
4 4 8,609 16 74,114,881 34436 4168.21739 19720550.2
5 5 2,707 25 7,327,849 13535 4185.79447 2186833.07
6 6 4,202 36 17,656,804 25212 4203.37154 1.88112609
7 7 1,472 49 2,166,784 10304 4220.94862 7556718.5
8 8 2,088 64 4,359,744 16704 4238.52569 4624760.75
9 9 951 81 904,401 8559 4256.10277 10923704.3
10 10 1,259 100 1,585,081 12590 4273.67984 9088294.55
11 11 1,336 121 1,784,896 14696 4291.25692 8733543.45
12 12 2,674 144 7,150,276 32088 4308.83399 2672682.18
13 13 4,904 169 24,049,216 63752 4326.41107 333608.975
14 14 9,551 196 91,221,601 133714 4343.98814 27112972.5
15 15 2,283 225 5,212,089 34245 4361.56522 4320433.36
16 16 4,828 256 23,309,584 77248 4379.14229 201473.242
17 17 6,802 289 46,267,204 115634 4396.71937 5785374.92
18 18 9,102 324 82,846,404 163836 4414.29644 21974564.6
19 19 5,823 361 33,907,329 110637 4431.87352 1935232.89
20 20 6,570 400 43,164,900 131400 4449.45059 4496729.79
21 21 1,516 441 2,298,256 31836 4467.02767 8708564.3
22 22 2,137 484 4,566,769 47014 4484.60474 5511248.03
SUMATORIA 253 94601 3795 582048799 1103476 94601 174986621
PROMEDIO 11.5 4300.04545455

a) Grafique y obtenga su tendencia y ecuación

Col umn C Li nea r (Col umn C)


12,000

10,000

8,000

6,000

4,000 f(x) = 17.5770750988x + 4097.9090909091


10,000

8,000

6,000

4,000 f(x) = 17.5770750988x + 4097.9090909091


R² = 0.0015609841

2,000

0
0 5 10 15 20 25

b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados

Sxx = 885.5 0.00156098 0.039509291 0.00156098


Sxy = 15564.5 r= 0.03950929
Syy = 175260198.955
β1 = 17.577
β0 = 4097.909
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) C
Resumen

Estadísticas de la regresión
Coeficiente d 0.0395092914
Coeficiente 0.0015609841
R^2 ajustado -0.0483609667
Error típico 2957.92681256
Observacione 22

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 273578.385 273578.385 0.031268492 0.86142115
Residuos 20 174986621 8749331.03
Total 21 175260199

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 4097.90909091 1305.53251 3.13887939 0.005167909 1374.616 6821.20218
Variable X 1 17.5770750988 99.4015465 0.17682899 0.86142115 -189.77092 224.925067

d) Use la recta de Regresión para pronosticar la posible venta de la primera semana de Mayo (sema

Y=4097.90+17.57X = 4502.01

2 Practic
Coef. De Determinación, R2= ###<- 0.16% de la variación de Y está explicada por el modelo de regresión
SSE= 174986620.569 <- Suma de cuadrados de los errores
MSE= 8749331.028 <- Cuadrados medios de los errores

Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 2.0859634

Prueba de Hipótesis sobre β1:


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 0.1768290

Por lo tanto: NO HAY EVIDENCIA SUFICIENTE PARA RECHAZAR LA HIP

INTERPRETACION: COMO T CALCULADA ES MENOR A LA T DE TABLAS, ENTONCES SE NO HAY EVIDE


LINEAL ENTRE LA VARIB

Prueba de Hipótesis sobre ρ el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 0.1768290

Por lo tanto: NO HAY EVIDENCIA SUFICIENTE PARA RECHAZAR LA HIP

INTERPRETACION: COMO T CALCULADA ES MENOR A LA T DE TABLAS, ENTONCES SE NO HAY EVIDE


LINEAL ENTRE LA VARIB
INTERVALOS DE CO

Intervalo de confianza para el promedio de Y dado X:


Si el volumen de lluvia promed 23 m3
El volumen promedio de escurr4502.18182

Un intervalo de confianza para el volumen esperado de escurrimiento es de:

1778.89 a 7225.47 m3
Intervalo de predicción para Y dado X
Si el volumen de lluvia es de: 23 m3
La predicción para el volumen 4502.18182

Un intervalo de predicción para el volumen de escurrimiento es de:

-2242.21 a 11246.57 m3
arte b) Comente.
emana de Mayo (semana 23)

Yestimada)^2
Y=4097.90+17.57X

dos en la parte b) Comente.

Inferior 95.0 Superior 95.0%


1374.616 6821.2021787888
-189.77092 224.9250671594

emana de Mayo (semana 23)

2 Practica
modelo de regresión

al entre X y Y
n
  yi  yˆ i 
2
SS E
MS E  i 1

n2 n2
ˆ1  1
T  H0 : β1  0
MS E
S xx H1 : β1  0

ARA RECHAZAR LA HIPOTESIS NULA

NCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HAY REGRESION
LINEAL ENTRE LA VARIBLE X Y Y

r n2 H0 :   0
T
1 r 2 H1 :   0
ARA RECHAZAR LA HIPOTESIS NULA

NCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HAY REGRESION
LINEAL ENTRE LA VARIBLE X Y Y
TERVALOS DE CONFIANZA
NO HAY REGRESION

NO HAY REGRESION
EJERCICIO 5
Para el conjunto de datos promedios siguientes, que se
obtuvieron de los registros históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Use la recta de Regresión para pronosticar las exportaciones cuando los gastos de marketing son

Gasto Marketing Exportaciones


(miles €) (miles €)
X Y X2 Y2 XY yiestimada
1 6 600 36 360000 3600 584.439655
2 8 760 60.84 577600 5928 789.525862
3 10 1080 104.04 1166400 11016 1062.97414
4 12 1265 144 1600225 15180 1268.06034
SUMATORIA 36 3,705 345 3,704,225 35,724 3,705
PROMEDIO 9 926.25

a) Grafique y obtenga su tendencia y ecuación

Col umn C Li near (Col umn C)


1400

1200 f(x) = 113.9367816092x - 99.1810344828


R² = 0.9948135463
1000

800

600

400

200

0
5 6 7 8 9 10 11 12 13

b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados

Sxx = 20.88
Sxy = 2379 Y=-99.18+113.93X
Syy = 272468.75
β1 = 113.937
β0 = -99.181

0.9948135463 0.997403402 0.99481355


r= 0.99740340

c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.

Resumen

Estadísticas de la regresión
Coeficiente de corre 0.997403402
Coeficiente de dete 0.9948135463
R^2 ajustado 0.9922203195
Error típico 26.581446083
Observaciones 4

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 271055.603 271055.6034 383.619948 0.0025966
Residuos 2 1413.14655 706.5732759
Total 3 272468.75

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción -99.1810344828 54.0153713 -1.836163153 0.2077474 -331.59042
Variable X 1 113.9367816092 5.81719144 19.58621832 0.0025966 88.907427

d) Use la recta de Regresión para pronosticar las exportaciones cuando los gastos de marketing son

Y=-99.18+113.93X 1204.301

2 Practica

Coef. De Determinación, R2= ### <- 99.48% de la variación de Y está explicada por el modelo de regre
SSE= 1413.147 <- Suma de cuadrados de los errores
MSE= 706.573 <- Cuadrados medios de los errores

Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 4.3026527
Prueba de Hipótesis sobre β1:
El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 19.5862183

Por lo tanto: SE RECHAZA LA HIPOTESIS NULA

INTERPRETACION: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA H

Prueba de Hipótesis sobre ρ el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = 19.5862183

Por lo tanto: SE RECHAZA LA HIPOTESIS NULA

INTERPRETACION: COMO T CALCULADA ES MAYOR A LA T DE TABLAS, ENTONCES SE RECHAZA LA H

INTER

Intervalo de confianza para el promedio de Y dado X:


Si el volumen de lluvia promedio 9.7 m3
El volumen promedio de escurrimie1006.005747

Un intervalo de confianza para el volumen esperado de escurrimiento es de:

946.20 a 1065.81 m3

Intervalo de predicción para Y dado X


Si el volumen de lluvia es de: 9.7 m3
La predicción para el volumen de e1006.005747

Un intervalo de predicción para el volumen de escurrimiento es de:

876.94 a 1135.07 m3
a parte b) Comente.
s gastos de marketing son 9.7 (miles de euros)

(Y - Yestimada)^2
242.124331
871.776531
289.879979
9.36571046
1,413
a parte b) Comente.

or crítico de F

Superior 95%Inferior 95.0%


Superior 95.0%
133.22835 -331.59042 133.22835
138.966136 88.907427 138.966136

s gastos de marketing son 9.7 (miles de euros)

licada por el modelo de regresión

neal entre X y Y
n
  yi  yˆ i 
2
SS E
MS E  i 1 
n2 n2
ˆ1  1
T
MS E
ˆ1  1
T H0 : β1  0
s de libertad.
MS E
S xx H1 : β1  0

ESIS NULA

ONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y

r n2 H0 :   0
T
s de libertad.
1 r 2 H1 :   0

ESIS NULA

ONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y

INTERVALOS DE CONFIANZA

miento es de:
 0
 0

LA VARIBLE X Y Y

LA VARIBLE X Y Y
EJERCICIO 6
Para el conjunto de datos promedios siguientes, que se
obtuvieron de los registros históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Use la recta de Regresión para pronosticar la variable dependiente cuando la independiente va

X Y X2 Y2 XY yiestimada
1 5 27 25 729 135 27.2272727
2 7 26 49 676 182 24.8181818
3 8 24 64 576 192 23.6136364
4 10 21 100 441 210 21.2045455
5 9 22 81 484 198 22.4090909
6 12 18 144 324 216 18.7954545
7 13 17 169 289 221 17.5909091
8 15 15 225 225 225 15.1818182
9 14 16 196 256 224 16.3863636
10 17 14 289 196 238 12.7727273
SUMATORIA 110 200 1,342 4,196 2,041 200
PROMEDIO 11 20

a) Grafique y obtenga su tendencia y ecuación

Col umn C Li near (Col umn C)


30

f(x) = - 1.2045454545x + 33.25


25 R² = 0.9771567718

20

15

10

0
4 6 8 10 12 14 16 18

b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados

Sxx = 132
Sxy = -159 Y=33.250-1.20X
Syy = 196
β1 = -1.205
β0 = 33.250

0.97715677 -0.9885124035 0.97715677


r= -0.98851240

c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b)

Resumen

Estadísticas de la regresión
Coeficiente d 0.9885124035
Coeficiente 0.9771567718
R^2 ajustado 0.9743013683
Error típico 0.7481036632
Observacione 10

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 191.522727 191.522727273 342.213198 7.5144E-08
Residuos 8 4.47727273 0.5596590909
Total 9 196

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 33.25 0.7543121 44.0798975014 7.7423E-11 31.5105532
Variable X 1 -1.2045454545 0.06511407 -18.4990053238 7.5144E-08 -1.3546988

d) Use la recta de Regresión para pronosticar la variable dependiente cuando la ind

Y=33.250-1.20X 16.09

2 Practic
Coef. De Determinación, R2= ###<- 97.72% de la variación de Y está explicada por el modelo de regresión
SSE= 4.477 <- Suma de cuadrados de los errores
MSE= 0.560 <- Cuadrados medios de los errores

Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = 0.05 a/2= 0.025


La región de rechazo es: | t0 |>ta/2 2.3060041

Prueba de Hipótesis sobre β1:


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = -18.4990053

Por lo tanto: NO HAY EVIDENCIA SUFICIENTE PARA RECHAZAR LA

INTERPRETACION: COMO T CALCULADA ES MENOR A LA T DE TABLAS, ENTONCES SE NO HAY


REGRESION LINEAL ENTRE L

Prueba de Hipótesis sobre ρ el coeficiente de correlación poblacional


El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

Tc = -18.4990053

Por lo tanto: NO HAY EVIDENCIA SUFICIENTE PARA RECHAZAR LA

INTERPRETACION: COMO T CALCULADA ES MENOR A LA T DE TABLAS, ENTONCES SE NO HAY


REGRESION LINEAL ENTRE L

Intervalo de confianza para el promedio de Y dado X:


Si el volumen de lluvia promed 14.3 m3
El volumen promedio de escurr 16.025

Un intervalo de confianza para el volumen esperado de escurrimiento es de:

15.29 a 16.76

Intervalo de predicción para Y dado X


Si el volumen de lluvia es de: 14.3 m3
La predicción para el volumen 16.025

Un intervalo de predicción para el volumen de escurrimiento es de:

14.15 a 17.90
os en la parte b) Comente.
e cuando la independiente vale 14.3

(Y - Yestimada)^2
0.05165289
1.39669421
0.14927686
0.04183884
0.16735537
0.63274793
0.34917355
0.03305785
0.14927686
1.50619835
4

18

os cuadrados
s obtenidos en la parte b) Comente.

or crítico de F

Superior 95%Inferior 95.0%


Superior 95.0%
34.9894468 31.5105532 34.9894468
-1.0543921 -1.3546988 -1.0543921

ependiente cuando la independiente vale 14.3

2 Practica
ada por el modelo de regresión

esión lineal entre X y Y


n
  yi  yˆ i 
2
SS E
MS E  i 1 
n2 n2
ˆ1  1
T H0 : β1  0
MS E
S xx H1 : β1  0
ˆ1  1
T H0 : β1  0
ados de libertad. MS E
S xx H1 : β1  0

CIENTE PARA RECHAZAR LA HIPOTESIS NULA

BLAS, ENTONCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HA
REGRESION LINEAL ENTRE LA VARIBLE X Y Y

r n2 H0 :   0
T
ados de libertad.
1 r 2 H1 :   0

CIENTE PARA RECHAZAR LA HIPOTESIS NULA

BLAS, ENTONCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HA
REGRESION LINEAL ENTRE LA VARIBLE X Y Y

INTERVALOS DE CONFIANZA

e Y dado X:

sperado de escurrimiento es de:

m3

de escurrimiento es de:

m3
 0
 0
 0
 0

S NULA, ES DECIR NO HAY

S NULA, ES DECIR NO HAY

También podría gustarte