Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VARIABLES CUANTITATIVAS
ANÁLISIS DE REGRESIÓN
Prof. G. Duret©®
ANÁLISIS DE REGRESIÓN
¿QUÉ ES?
MÉTODO ESTADÍSTICO PARA
EXPLICAR EL COMPORTAMIENTO DE
UNA VARIABLE CUANTITATIVA EN
FUNCIÓN DE OTRA U OTRAS
VARIABLES, QUE PUEDEN SER
CUALITATIVAS O CUANTITATIVAS
ANÁLISIS DE REGRESIÓN
¿PARA QUÉ?
PARA PREDECIR EL VALOR DE Y
¿CÓMO?
MEDIANTE UNA ECUACIÓN O FUNCIÓN O
MODELO ESTADÍSTICO
Y f (X 1 , X 2 , ..., Xk )
SIMBOLOGÍA
RESPUESTA
Y VARIABLE EXPLICADA
DEPENDIENTE
X 1 ; X 2 ; ; Xk
VARIABLES EXPLICATIVAS O
INDEPENDIENTE S
VARIABLE ALEATORIA
MODELO ESTADÍSTICO DE
REGRESION
Y f (X 1 , X 2 , ..., Xk )
Y f (X)
Y 0 1X
VARIABLE RESIDUO
EXPLICADA FUNCIÓN AFIN O RECTA ALEATORIO
RESIDUO O ERROR ALEATORIO
Y f (X)
RESIDUO DIFERENCIA ENTRE EL VALOR OBSERVADO
o ERROR = Y LA FUNCIÓN DE AJUSTE o FUNCIÓN DE
ALEATORIO REGRESIÓN (recta)
Y ( 0 1 X)
DIAGRAMA DE DISPERSIÓN
30,00
Y = f(X)
25,00
20,00
Y = f(X)
15,00
10,00
5,00
0,00
0 2 4 6 8 10 12
SUPUESTOS DE REGRESIÓN
No
E( ) 0
V( ) 2
cons tan te X
Cov( i , j ) 0
Cov( , X j ) 0 j 1 k
SUPUESTOS DE REGRESIÓN
E(Yij / Xj) 0 1 X j
2
RECTA DE REGRESIÓN ESPERADA O TEÓRICA
valor promedio esperado de
E(Yij / Xi) = gi = la variable explicada (Y)
para cada valor de la variable
= 0 + 1 Xi i explicativa (X) = esperanza
matemática condicionada,
Ŷ bo b 1 X RECTA de REGRESIÓN
MUESTRAL
2
S e
VARIANZA RESIDUAL MUESTRAL
VARIANZA DE ERROR
SUPUESTOS DE REGRESIÓN
E(Yij / Xj) 0 1 X j
2
DESVIACIONES EN REGRESIÓN
Ŷ b 0 b 1 X
Y0
DESVIACIÓN no EXPLICADA
ˆ
(Y0 Y) O RESIDUAL
(Y0 Y) Ŷ
DESVIA ˆ Y)
(Y DESVIACIÓN EXPLICADA O
CIÓN DEBIDA A LA REGRESIÓN
TOTAL Y
DE Y
X X0
VARIANZAS DE LA REGRESIÓN
DESVIACIÓN TOTAL Y = D. EXPLICADA + D. RESIDUAL
ˆ Y) (Y Y)
(Y0 Y) (Y ˆ
0
(Y0 Y) (Y Y) (Y0 Y)
2
ˆ 2 ˆ 2
(Y0 Y) (Y0 Y) (Y Y)
2
ˆ 2 ˆ 2
SCY
COEFICIENTE DE DETERMINACIÓN
MIDE LA PROPORCION DE LA VARIACIÓN TOTAL
DE Y QUE SE EXPLICA O SE DEBE A LA
VARIACIÓN DE X. medida de bondad del ajuste
SCRES
R 1
2
SCY
0R 1 2
COEFICIENTE DE DETERMINACIÓN
R 1
2 El 100% de la variación de Y se
explica por la variación de X
R 0
2 Nada de la variación de Y se explica
por la variación de X
2
SCEXP b SCx
R 2
1
SCY SCY
DISTRIBUCIÓN DE LOS ESTIMADORES
DISTRIBUCIÓN DE LA ORDENADA AL ORIGEN
b0 0
t (n 2 )
V̂(b 0 )
1 x 2
1 x 2
V̂(b 0 ) S e2 S 2
e
n (x x)2
n SCx
DISTRIBUCIÓN DE LOS ESTIMADORES
DISTRIBUCIÓN DEL COEFICIENTE DE REGRESIÓN
b1 1
t (n 2 )
V̂(b 1 )
Se2 Se2
V̂(b 1 )
SCx (x x) 2
INTERVALOS DE CONFIANZA PARA
LOS PARÁMETROS
PARA LA ORDENADA AL ORIGEN
ˆ
b 0 t (n 2 );( 1 2 ) V(b 0)
ˆ
b 1 t(n 2 );( 1 2 ) V(b 1)
INTERVALO DE CONFIANZA PARA
UNA PREDICCIÓN
Ŷ(x0 ) bo b1x0 ESTIMACIÓN PUNTUAL DE Y
PARA UN VALOR DE X DADO
1 (x x) 2
1 (x x) 2
ˆ ˆ
V Y(x 0 ) S e 1 0
2
2
1 0
S e
n SCx
n (x x) 2
ˆ
Y(x ) t ˆ Y(x
V ˆ )
0 (n 2 );( 1 2 ) 0
PRUEBA DE HIPÓTESIS PARA LOS PARÁMETROS
PARA LA ORDENADA AL ORIGEN
H0 : 0 b0 0
t (n 2 )
H1 : 0 V̂(b 0 )
X
EJEMPLO
Se realizó una investigación a fin de concientizar
acerca de la problemática de los residuos y la
contaminación. En la etapa inicial se relevaron
datos acerca del tamaño de los hogares y la
cantidad de basura que producían en un mes. El
objetivo fue establecer si existía relación entre el
tamaño del hogar, medido con un índice y la
cantidad total de basura que c/u producía en un
mes (en kilos) y predecir la cantidad de basura en
función del tamaño del hogar. Se tomó una
muestra piloto aleatoria de 62 hogares.
DATOS DEL EJEMPLO
b) Y SUPERIOR A 0,70.
1- IDENTIFICACIÓN DE LAS VARIABLES X E Y:
¿Qué depende de qué?
VARIABLE EXPLICATIVA O INDEPENDIENTE
20,00
total basura Kg
15,00
10,00
5,00
0,00
0 2 4 6 8 10 12
tamaño del hogar
3- ESTIMACIÓN DEL MODELO DE REGRESIÓN
X Y XY X Y
total 2 2
TABLA DE CÁLCULO
tamhog total(Kg)
orden x y x*y x^2 y^2
1 2 4,88 9,76 4,00 23,8205
2 3 9,05 27,16 9,00 81,9687
… … … … … …
53 6 20,76 124,56 36,00 431,0114
54 5 15,78 78,90 25,00 249,0209
55 4 16,90 67,60 16,00 285,6358
56 7 23,40 163,77 49,00 547,3809
57 5 11,25 56,27 25,00 126,6428
58 4 11,87 47,50 16,00 141,0153
59 2 5,10 10,21 4,00 26,0395
60 4 12,77 51,07 16,00 163,0361
61 2 5,05 10,11 4,00 25,5327
62 2 5,31 10,61 4,00 28,1643
total 230 771,78 3373,92 1086,00 11554,9652
3- ESTIMACIÓN DEL MODELO DE REGRESIÓN
X Y XY X 2
Y
2
SCx (x x) x nx
2 2 2
SCy (y y) y ny
2 2 2
SPxy (x x)(y y) xy nx y
3- ESTIMACIÓN DEL MODELO DE REGRESIÓN
X
x 230
3, 71 Y
y 771, 78
12 , 448
n 62 n 62
SCx 232, 77
SCy y 2 ny 2 11551, 9652 62.12, 4482 1944, 88
SCy 1944, 88
SPxy xy nx y 3373, 92 62.3, 71. 12, 448 510, 86
SPxy 510, 86
3- ESTIMACIÓN DEL MODELO DE REGRESIÓN
b1
SPxy
(x x)(y y) xy nx y
SCx (x x) 2
x nx 2 2
b0 y b1 x
Ŷ bo b1 X
3- ESTIMACIÓN DEL MODELO DE REGRESIÓN
SPxy 510, 86
b1 2 , 19
SCx 232, 77
ˆ b b X Y
Y ˆ 4, 32 2, 19 X
o 1
3- ESTIMACIÓN DEL MODELO DE REGRESIÓN
INTERPRETACIÓN
Ŷ(x 0 ) bo b 1 x 0
S 13, 8
2
e
2 2
b SC X 2 , 19 232 , 77
R
2 1
0, 57
SCY 1944, 88
R 0, 57
2
ˆ
b 1 t(n 2 );( 1 2 ) V(b 1)
Se2 13, 8
V̂(b 1 ) 0, 0593 V̂(b 1 ) 0, 0593 0, 2435
SCx 232 , 77
t(n 2 );( 1 2 ) t ( 60;0 ,975 ) 2 SE TOMÓ t CON 61 gl PORQUE 60 gl
NO FIGURA EN TABLA
2 , 19 2 0, 2435
1, 703 1 2 , 677
ˆ
b0 t(n 2 );( 1 2 ) V(b 0)
1 x2 1 3, 712
V̂(b 0 ) S
2
13, 8 1, 0386
62 232, 77
e
n SCx
4, 32 2 1, 019
2 , 282 0 6, 358
CON UNA CONFIANZA DEL 95%, CUANDO EL ÍNDICE DEL TAMAÑO
DEL HOGAR ES NULO, LA CANTIDAD DE BASURA ESTARÍA ENTRE
2,282 Y 6,358 KG. MENSUALES
8- INTERVALO DE CONFIANZA PARA UNA PREDICCIÓN E[Ŷ(X0 )]
ˆ
Y(x ) t ˆ Y(x
V ˆ )
0 (n 2 );( 1 2 ) 0
ˆ Y(x
ˆ 1 (x x) 2
1 (9 3, 71)2
V 9 ) S 1 0
2
13, 8 1 15, 6816
0 e
62 232, 77
n SCx
Ŷ(9) 4, 32 2, 19(9) 24, 03 ˆ Y(x
ˆ
V 0 9) 15, 6816 3, 96
24, 03 2 3, 96
b1 1
t (n 2 )
V̂(b 1 )
2 , 19
si t C 2 se rechaza H 0 tc 8, 99 2 rechaza H 0
0, 2435