Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2 Regresion
2 Regresion
“Y en función de X”
“Explicar a Y en términos de X”
V. Dependiente=salario. V. Independiente=educ
Bo= Valor del salario cuando educ =0
B1= El efecto sobre Y ante un cambio de x.
Por cada año adicional de educación recibida, su
salario aumentará $bi adicionales al actual.
U=otros factores que afectan al salario: horas de
trabajo, situación económica país…
Consideraciones adicionales de y, x, u
1. X , u son variables aleatorias.
2. Media de residuos
Media (u)=0
E(u)=0 Σ ui=0
3. Independencia entre X y u .
Correlación (x,u)=Cov(X,u)/[desv(x)*desv(u)]
Cov(X,u)=0
=E[(X-mediax)(U-mediau)]
=E[(X-mediax)(U)]
=E(X*U-Mediax*u)
0
=E(X*U)-Mediax *E(u)
=E(X*U)Σ xi*ui=0
Estimación de parámetros β 0 , β1
Mínimos Cuadrados Ordinarios (MCO)
Realiza la estimación de β 0 , β1 minimizando el
término de u. Y=bo+b1X
Ofrece la mejor recta de regresión lineal.
Y Recta MCO
X
Estimación parámetros MCO
Al despejar los parámetros:
2 ( Yi ) 2 SSxy
SSy Yi
n Pendiente= b1
SSx
( X i ) 2 Intercepto = Ybarra-Pendiente*
SSx X i
2
n
Xbarra
( X i )( Yi )
SSxy X iYi
n ESTADISTICA I
Y=Bo+B1X
Ejemplo
Y=Valor real
=Valor estimado o ajustado de Y
=residuo, diferencia entre el valor Y estimado y real
Suponga que la estimación MCO de los
parámetros fue : =11,36 ; =5,5 entonces:
X: Horas
Individuo Estudio Y: Notas ui=Y–Y^
semanal Y^=11.36+5,5X
1 2 20 =11,36+5,5*
2=22 20-22=-2
2 5 45 =11,36+5,5*
5=39 45-39=6
3 10 60 66 6
4 12 78 77 1
5 15 96 94 2
14000
12000
10000
salary
8000
6000
4000
2000
0
0 10 20 30 40 50
roe
Analice el comportamiento del residuo
Estadísticos principales Estadísticos principales, usando las observaciones 1 - 209
para la variable residuos (209 observaciones válidas)
Gráfico Media Mediana Mínimo Máximo
-9,6824e-014-253,96 -1160,2 13500,
Residuos de la regresión (= salary observada - estimada) Desv. Típica. C.V. Asimetría Exc. de curtosis
14000
1363,3 1,4080e+016 6,9154 58,158
Porc. 5% Porc. 95% Rango IQ Observaciones ausentes
12000
-782,94 918,81 671,68 0
10000
8000
residuo
6000
4000
2000
-2000
0 50 100 150 200
Ejercicio
Utilizando la base de datos WAGE1
(información de 526 individuos en el año 1976)
Analice las variables wage y educ.
Tipo de variable y unidades: ambas continuas
Tipo de datos:wage en dolares y educ en años
Estadísticos principales:
Wage min: 0,53, max: 24.98, prom:5.896
Educ: min: 0,max: 18, prom:12.563
Estime el modelo de regresión lineal donde se exprese el efecto de la
educación sobre el salario.
Realice la gráfica de variable estimada vs observada.
20
15
wage
10
-5
0 100 200 300 400 500
Analice el comportamiento del residuo
Estadísticos principales
Gráfico
Modelo 1: MCO, usando las observaciones 1-526
Variable dependiente: wage
Residuos de la regresión (= wage observada - estimada) Coeficiente Desv. Típica Estadístico tvalor p
20
10
Media de la vble. dep. 5,896103 D.T. de la vble.
dep. 3,693086
Suma de cuad. residuos 5980,682 D.T. de la
5 regresión 3,378390
R-cuadrado 0,164758 R-cuadrado corregido
0,163164
0 F(1, 524) 103,3627 Valor p (de F) 2,78e-22
Intercepto*=1000*963.19=963190
Pendiente*=(1000/0.1)*18,50=185000
Transformando las variables de la base de
datos Ceosal 1 y realizando la regresión.
Ejercicio
Si X = gastos en publicidad (cientos de dólares),
Y= ingresos por ventas (miles de dólares) para
una tienda deportiva durante cinco meses, la
regresión resultó.
Ŷ=1.0 + 1.2X
Exprese la regresión en unidades
Forma Funcional
Incorporación de no linealidades en la regresión lineal.
27
Modelos de regresión en Logaritmos
Caso I Modelo Nivel-Log
28
Modelos de regresión logaritmica
Caso II: Modelo Log-Nivel (Y en logaritmos, X no)
29
Modelos de regresión logarítmica
Caso III: Modelo Log-Log.
30
¿Cuál de las regresiones tiene mejor ajuste?
31
Significado de la regresión “lineal”
var( 1 )
X i
2
2
var( 2 )
2
n * SSx SSx
Regresión a través del origen
Yi 2 X i ui
Existen ocasiones en que se impone una
restricción que cuando x=0, y=0.
Se denomina regresión al origen porque la
recta pasa a través del punto x=0, y=0.
Para obtener la estimación del parámetro se
emplea MCO.
No suele usarse en la practica porque
elestimador de la pendiente es sesgado.
Diferencias
Y=β 1 + β2 X Y=β2 X
Para estimar Para estimar
parámetros se utilizan parámetros se utilizan
sumas cuadráticas SSX, sumas de cuadrados
SSy, SSXY. simples Σx2, Σy2 , Σxy.
Grados de libertad=n-2. Grados de libertad=n-1
Σ ui=0 No siempre Σ ui=0
r2 no negativo r2 puede resultar
negativo y por tanto
incorrecto.