Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4 Modelo de Regresion Lineal Simple - Inferencia Estadistica PDF
4 Modelo de Regresion Lineal Simple - Inferencia Estadistica PDF
2 = ki (1 + 2 X i + i )
Varianza ( )
E [i E (i )] = E i2 = 2
2
~ N (0, )
i
2
Razones para suponer distribucin
normal
1. El argumento ms comn es que como u es la suma de
muchos factores distintos no observados que influyen en
Y, por el teorema del limite central, llegamos a la
conclusin de que u tiene una distribucin normal.
2. Una variante del teorema del lmite central, establece
que aunque el nmero de variables no sea muy grande
o no sea estrictamente independiente, su suma puede
ser an normal.
3. La distribucin de probabilidad de los estimadores MICO
puede derivarse fcilmente.
4. La distribucin normal es una distribucin sencilla, con
tan slo dos parmetros: media y varianza.
5. Podemos hacer pruebas de hiptesis (t, F, X 2) sobre los
verdaderos parmetros
Crticas al Supuesto
1. Los factores que afecta u pueden tener distribuciones
poblacionales muy distintas. Aunque puede sostenerse el
teorema central del lmite, los resultados van a depender de
cuantos factores afecten a u y que tan diferentes sean sus
distribuciones.
2. Supone adems que todos los factores afectan a u en forma
lineal y aditiva
3. La normalidad es un problema emprico (no terico). Por
ejemplo, como el salario siempre es mayor que cero,
estrictamente hablando no tiene una distribucin normal;
adems hay leyes de salario mnimo que hacen que una
parte de la poblacin gane exactamente el mnimo. Una
solucin es transformar la variable, por ejemplo utilizando
logaritmos [log(salario)], lo cual puede generar una
distribucin que se acerque ms a la normal
Propiedades de los estimadores MCO
bajo Normalidad
1. Son insesgados
2. Tienen varianza mnima. Combinado con (1), son
estimadores con varianza mnima, o eficientes.
3. Son consistentes. A medida que el tamao de la
muestra aumenta indefinidamente, los estimadores
convergen hacia sus verdaderos valores
poblacionales.
Propiedades de los estimadores MCO
bajo Normalidad
4. 1
y 2 (al ser funcin lineal de i) estn
normalmente distribuidos con:
1 2
Media: ( )
E 1 = 1 ( )
E 2 = 2
Varianza: 2
=
X i
2
2
2
=
2
1
n X i
2 2
X i
2
(
1 ~ N 1 , 2 1
) (
2 ~ N 2 , 2 2
)
Distribucin normal 1 1
Z= 2 2
estandarizada: 2 Z=
1 2 2
Donde Z ~ N (0,1)
Propiedades de los estimadores MCO
bajo Normalidad
5. (n 2)( 2 / 2 ) est distribuida como la distribucin
(ji-cuadrada), con (n-2) grados de libertad.
6. (1 , 2 ) se distribuyen de manera independiente
con respecto a 2 .
7. 1 y 2 tienen varianza mnima entre todas las
clases de estimadores insesgados, lineales o
no lineales.
Si se supone E (Yi ) = 1 + 2 X i
var(Yi ) = 2
Podemos decir (
Yi ~ N 1 + 2 X i , 2 )
Intervalos de confianza
La estimacin de un intervalo de confianza consiste en
construir un intervalo alrededor del estimador puntual (ej.
Dentro de dos o tres errores estndar a cada lado del
estimador puntual), tal que el intervalo tenga un 95% de
probabilidad de incluir el verdadero valor del parmetro.
Ej. Suponga que deseamos encontrar que tan cerca est
2 de 2 . Con este fin se trata de encontrar dos nmeros
positivos, y (este ltimo entre 0 y 1), tal que la
probabilidad de que el intervalo aleatorio ( 2 - , 2 + )
contenga el verdadero 2 sea
1 .
Intervalo de confianza ( )
Pr 2 2 2 + = 1
Coeficiente de confianza 1
Nivel de Significancia
Limite de confianza inferior 2
Limite de confianza superior 2 +
Intervalos de confianza
Antes es preciso recordar que:
El intervalo no dice la probabilidad de que 2 est en el
intervalo con una probabilidad de (1-); sino que la probabilidad
de construir un intervalo que contenga 2 es de (1-).
El intervalo es aleatorio; va a depender de la muestra, ya que 2
es aleatorio.
Si se construyen intervalos de confianza, en promedio tales
intervalos contendrn, en (1-) de los casos, el valor verdadero
del parmetro.
Una vez obtenido un valor numrico especfico de 2 (en base a
una muestra especfica), no puedo decir que el intervalo contiene
al verdadero parmetro con probabilidad (1-), sino que la
probabilidad es 1 0.
Intervalos de confianza 1 y 2
Se puede utilizar la distribucin normal para hacer
afirmaciones probabilsticas sobre 1 y 2 siempre Z=
( 2 2 ) x 2
i
Para 1 Pr ( t
1 /2 ee( )
1 1 1 + t / 2 ee( )) = 1
1
0.4268 0.5914
Bajo H0: ( 2 2 )
~ t n -2
Rechazamos H0:
2
t > tc Rechazo H0 si
t < -tc |t| > tc
Como t=
( 2 2
,
)
2
No rechazo H0 Rechazo H0 si ( 2 2 )
> tc
Rechazo H0: Rechazo H0:
( ( )) ( ( ))
2
Regla de
Tipo de H0: Hiptesis H1: Hiptesis
decisin:
Hiptesis nula alterna
rechazar H0 si
Dos colas 2 = 2* 2 2* t > t / 2, g .de.l
Cola derecha 2 2* 2 > 2* t > t , g .de.l
Cola izquierda 2 2* 2 < 2* t < t , g .de.l
Notas:
-Es el valor numrico de 2 hipottico.
-|t| significa valor absoluto de t.
-t o t/2 significa el valor crtico de t al nivel de significancia o /2.
-g de l: grados de libertad, (n 2) para el modelo de dos variables, (n 3) para el modelo de 3 variables, y
as sucesivamente.
-Para probar hiptesis sobre 1 se sigue un procedimiento similar.
Aceptar o Rechazar la H0
Al momento de emitirse un dictamen sobre la
hiptesis nula, este debe de emitirse como
Rechazar H0 o No Rechazar H0.
No se puede aceptar una hiptesis nula,
puesto que no conocemos el verdadero valor,
sino que hacemos una inferencia del mismo.
Las hiptesis nulas aceptadas pueden ser
muchas dependiendo de cules hiptesis est
planteando.
Hiptesis nula o cero y regla prctica
2-t
La hiptesis nula H0:2=0 es usada frecuentemente
en el trabajo emprico, e implica que el coeficiente
de la pendiente es cero.
Esta H0 es un mecanismo para establecer si Y tiene
relacin con la variable X.
Estas pruebas pueden abreviarse adoptando la
regla de significancia 2-t:
(2)
Elevando al cuadrado
Tambin sabemos que
(3)
(4)
Simplificando tenemos que:
(5)
(6)
Recordando, cuando descompusimos la suma de cuadrados
tenamos:
(7)
(8)
Pruebas de Normalidad
Las pruebas de hiptesis e intervalos de confianza
estudiados, tienen como punto de partida el supuesto de
normalidad del residuo, por lo que si u no es normal,
estas pruebas no son vlidas.
Existen diferentes test que permiten verificar si los
residuos calculados para una muestra en particular (ei)
provienen de una distribucin normal. Uno de ellos es el
test de Jarque-Bera.
Test de Jarque Bera
Esta es una prueba asinttica que se basa en el tercer y cuarto
momento de la distribucin (asimetra y curtosis respectivamente).
Recordando:
Coeficiente de simetra: