Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4) ui N (0, 2 )
yixi ( y b2 x ) xi b2 xi
Método de los Mínimos Cuadrados Ordinarios2 más Sencillo. Si dos
cantidades (x,y) están relacionadas por una línea recta, la ecuación que
yixi y xi b2 x xi b2 xi
expresa la relación será de la forma :
y = mx + b
2
Minei Min ( yi yi ( yi b1 b2 xi ) 0
yixi y xi b2 () xi x xi
n n
i 1 i 1
2
b2 ( yixi y xi ) / ( xi x xi * n / n)
El objetivo es hallar b, b2 que minimicen los errores
2 para lo cual realizaremos la
derivada e igualaremos a cero:
bb12 (yyixi
b2 x y xi ) / ( xi nx )
2 2
b2 ( yixi nxy ) / ( xi x ) 2
b2 ( xi x )( yi y ) / ( xi x ) 2
Var (b1) =
2
u (1/ n x 2 / ( xi x )2 )
Descomposición de la Suma de Cuadrados. -
ei = yi y errores muéstrales
yi yi
ei
yi 2 yi
2 2eiyi
ei 2
yi 2
yi
2
2 yei
ei 2 (1)
yi 2
yi
2
ei 2
Coeficiente de Determinación. -
(Medida de la bondad de Ajuste) Que también la línea de regresión se ajusta a
los datos observados. Para definir el coeficiente de determinación dividimos la
ecuación (2) por SCT.
1= SCT/SCT = SCE/SCT+SCR/SCT
Denominamos coeficiente de determinación a la proporción de la SCT que se
encuentra explicada por la regresión es decir: R 2 = SCE/SCT
Cual es el recorrido de R 2 : Si no hay residuo SCR = 0 y
R 2 = 1, es el valor máximo y la relación entre las variables que se están
ajustando será perfecta. El valor mínimo será R 2 = 0, o sea que no hay ninguna
relación entre las variables y nada estará explicada por la regresión.
Coeficiente de Correlación. -
r = R 2 ( xi x )( yi y ) / ( xi x ) 2 ( yi y ) 2
r = n xy x y / (n x 2 ( x) 2 )(n y 2 ( y) 2 )
Propiedades del Coeficiente de Correlación.-
1) Puede ser (+) o (-). El signo depende de la covariación entre variables
(Covarianza).
2) Los límites son: -1 r 1
3) Cumple con la propiedad de simetría es decir: rxy = ryx
4) Es independiente del origen y de la escala
5) Si x, y son estadísticamente independientes r = 0
6) Es una medida de la asociación lineal solamente
b 2 ( xi x )( yi y ) / ( xi x ) 2
(1)
Inferencia estadística en el Modelo de Regresión.-
( xi x )( yi y ) ( xi x ) yi y ( ( xi x ) ( xi x ) yi
Cuáles son las distribuciones de Probabilidad asociadas a los estimadores de
los parámetros (b1, b2)
b2 ( xi x ) yi / ( xi x )
b2 = 2+wi ei 2= cte. 2
wi xi x / ( xi x ) 2
b2
b2es una combinación lineal de ei y como ei N ( 0,
wiyi
por lo tanto b2 tiende a una distribución normal
2
)
b2 N ( 2, u / ( xi x ) )
2 2
b1 N (1,u
2
(1/ n x 2 / ( xi x ) 2 )
Tanto en b1, b2 aparece el termino u 2 parámetro que hasta ahora es
desconocido. Se puede demostrar que un buen estimador para u 2 es la
varianza de los errores muéstrales
S 2 ei 2 / n 2
También se puede demostrar que es insesgado es decir:
E ( S 2 ) u 2
También se puede demostrar que:
ei 2
/ u 2 x 2 (n 2)
Para lo cual se debe demostrar que los errores se distribuyen según N(0,1)
para lo cual normalizamos igual que lo hicimos con la variable z = x-/.
b2 2 / (u / ( xi x ) 2
) N (0,1)
Para el cálculo se requiere u que es desconocida, por lo que se debe trabajar
con un estimador para lo cual se usa la distribución t.
Por definición de t:
t N (0,1) / x 2 / g. l. ((b2 2) ( xi x ) 2 ) / u / ei 2
/ u 2 / n 2
t (b2 2) ( xi x ) 2 / ei 2
/n2
t (b2 2) ( xi x ) 2
/ s b2 2 / s / ( xi x ) 2
t (n 2)
Intervalos de Confianza para b2.-
b2 t (1 / 2) s / ( xi x ) 2
tc = (b2 2o) ( xi x ) 2
/s
Si tc t(1-/2)(n-2)
Si se cumple se rechaza la hipótesis nula por encontrarse tc en la zona de
rechazo.
Intervalo de confianza. - Si b2 cae dentro del intervalo aceptamos la hipótesis
nula.
Si nos interesa la significación de la relación entre x,y debemos probar lo
siguiente :
Ho: 2 = 0 No hay relación entre x,y si la pendiente es nula
H1: 2 0
Hay dos formas de probar la hipótesis nula (0) a través de las dos colas de
significación y por la prueba t.
Para la prueba t usaremos el siguiente estadístico de prueba:
tc (b2 0) ( xi x ) 2
/s
Si tc t(1-/2)(n-2) se rechaza la hipótesis nula.
2- Colas de Significación (2-tail-sig). -
Se calcula p probabilidad de encontrarse en la zona de rechazo. El /2 = 0.025
para un 95 % de confianza
Si p /2 el parámetro es significativo y por lo tanto se rechaza la hipótesis Ho.
Para : 1
tc (b1 1) / s 1 / n x 2 / ( xi x ) 2 t (n 2)
Para los intervalos de confianza:
b1 t (1 / 2)(n 2) s 1 / n x 2 / ( xi x ) 2
Para prueba de hipótesis:
Ho : 1= 1o
H1 : 1 1o
tc (b1 1o) / s 1 / n x 2 / ( xi x ) 2
Si tc t (1-/2)(n-2) Se rechaza la hipótesis nula Ho.
Análisis de Varianza de una Regresión Lineal (Prueba F de Fisher). - Para el
caso de dos variables es indistinto usar t o F para el caso de regresión múltiple
es más recomendable usar F.
Hemos visto que:
b2 2 / (u / ( xi x ) 2
) N (0,1)
También sabemos que una N(0,1) elevada al cuadrado tiende a una ji-
cuadrado y a su vez la relación de dos ji-cuadrado nos da una F de Fisher.
(b2 2) 2 / (u2 / ( xi x ) 2 x 2 (1) (1)
Se puede demostrar que:
ei 2
/ u 2 x 2 (n 2) (2)
Por lo tanto dividiendo (1) y (2) obtenemos F:
F= ((b2 2) 2 ( xi x ) 2 / u 2 ) /( ei 2 / u 2 ) / n 2
F = (b2 2)
2
( xi x ) / ( 2
ei 2
/ n 2)
Si planteamos la hipótesis nula:
Ho : 2 = 0
En este caso el estadístico F queda :
Fc = b2
2
2
( xi x ) / ( ei / n 2) ( SCE
2
/ 1) / ( SCR / n 2)
Si Fc F(1-)(1,n-2) se rechaza la hipótesis nula Ho.
y la relación ( y, x ) es significativa.
y = b1 + b2 x
SSy = SCT = ( y y ) 2 y 2 ( y) 2 / n
SCE = b2 ( x x )( y y ) b2( xy
x y / n) b2 ( xi x ) 2
2
Análisis de Varianza.-
j 1 j 1
La suma de cuadrados debido a la regresión:
Y b1 b2 Xo (Modelo estimado)
Error (Eo) = Yo - Yo
Eo = 1+2xo+uo -b1-b2xo
Eo = uo -(b1-1) -(b2-2)xo
El objetivo es hallar la varianza por lo que elevamos los errores al cuadrado.
eo 2 (uo ((b1 1) (b2 2) xo) 2 =
uo 2 2uo(b1 1) 2uo(b2 2) xo (b1 1) 2 2(b1 1)(b2 2) xo (b2 2) 2 xo 2
Tomando valor esperado a la expresión anterior:
Var (eo) =
E (eo 2 ) E (uo 2 ) E (b1 1) 2 2 xoE (b1 1)(b2 2) xo 2 E (b2 2) 2 (1)
Tener Presente que E (uo) = 0, E (uo2) = u2
Cov ( b1,b2) = E(b1-1)(b2-2)= xu 2 / ( xi x ) 2
Entonces (1):
Var(eo) = u Var (b1) 2 xoCov (b1, b2) xo 2Var (b2)
2
Var (eo) =
u 2 u 2 (1 / n x 2 / ( xi x ) 2 ) 2 xox u 2 / ( xi x ) 2 xo2u 2 / ( xi x ) 2
= u (1 1 / n x /
2 2
( xi x ) 2
2 xox / ( xi x ) 2 xo 2 / ( xi x ) 2 )
= u (1 1 / n ( x xo) /
2
( xi x )
2
2
cuando xo x
La Var(eo) es mínima cuando se cumple lo anterior y va aumentando a medida
que se aleja de x.
x X0 X
0 2 1
Modelo Semilogaritmico. -
Log-Lin
lnyi = 1 + 2xi +ui
1 2 xi ui
yi =e
Para el caso de log-lin, la pendiente mide el cambio proporcional o relativo en y
para un cambio absoluto en x.
y y
2 0 2 0
x x
Modelo Reciproco. -
y = 1 + 2/x + u
Cuando x y 1
y = costo fijo x = Producción
y 2 0 1 0 2 0 1 0
y
1
x -1 x
y
2 0
1
-2/1 x
Análisis de los residuos. - Nos dan una idea de que problemas hay en los
supuestos. -
1) Si la relación funcional propuesta es la adecuada
2) Si hay problemas en el cumplimiento del supuesto de varianza cte.
(homocedasticidad)
3) Valores atípicos en los datos
4) Cambio de estructuras (si hubo cambios de política económica que no haga
homogénea a la muestra)
5) Problemas de no cumplimiento de la auto correlación
a x b x
ei ei
.
c x d x
ei ei
e x
x
ei
x
Gráfica a. - Sugiere revisar el modelo planteado, elección incorrecta del modelo (volver
a analizar el diagrama de dispersión).
Gráfica b y c. - Posibles cambios de estructuras en un momento en los datos. Verificar
cambios de estructuras en los datos.
Gráfica d y e. - Hay un valor atípico en los datos revisar el dato, en el caso positivo,
eliminarlo por que distorsiona el modelo.
Gráfica f.- El supuesto de varianza cte. no se cumple, no hay homocedasticidad en el
modelo.
Grafica g.- Caso ideal, el modelo está bien elegido y la varianza es cte.