Está en la página 1de 68

Universidad Nacional Autónoma de México

Instituto de Investigaciones Económicas

Econometría Intermedia
Econometría Intermedia
Distribuciones de
Distribuciones de probabilidad
probabilidad

Mtro. Uberto Salgado Nieto


ubertosalgado@comunidad.unam.mx

Especialidad en Econometría
Posgrado de Economía UNAM
Semestre 2021-I
 Nos interesa conocer información sobre
algunos aspectos de las distribuciones de las
variables aleatorias.

 Las características de interés se dividen en tres


categorías: medidas de tendencia central, de
variabilidad y dispersión.

 Revisaremos las distribuciones de probabilidad


que son las más empleadas en econometría.
La Distribución Normal
 Es la distribución más empleada en
econometría.

 Su función de densidad es:


 Es simétrica alrededor de la media y tiene
forma de campana, tiene dos parámetros, su
media y varianza

 La normal estándar cuya función de densidad


es:

 Toma el valor 0 en la media y de 1 en su


varianza; su sesgo es cero y curtosis es 3.
 clear
 quietly set obs 100000
 set seed 10101
 generate stnormal=rnormal()
 tabstat stnormal, stat(mean sd skew kurt min max) col(stat)
 histogram stnormal
Distribución Ji-cuadradada

 Las variables aleatorias y1,…yn son


independientes y tienen una distribución
normal estándar, si a cada muestra se le
calcula su varianza, se obtendrá la
distribución muestral de las varianzas y Para
conseguir aproximarnos a la varianza
poblacional se necesita conocer el estadístico
χ2
 Si tenemos una muestra de tamaño n de una
población normal con varianza σ2, el
estadístico tiene una distribución muestral
que es una ji-cuadrada con n-1 grados de
libertad y está dado por:

 Donde n es el tamaño de la muestra, S2 la


varianza muestral y σ2 la varianza poblacional
de la cual se extrae la muestra.
 Su FDP es:

 Tiene media “k”, varianza “2k” y sesgo


positivo
Ji-cuadrada en STATA
 Simulación de una ji cuadrada con 10 grados
de libertad

 clear
 quietly set obs 2000
 set seed 10101
 generate xc=rchi2(10)
 tabstat xc, stat(mean sd skew kurt min max) col(stat)
 histogram xc
Distribución t-student
 Si y y tanto y1 e y2 se
distribuyen independientemente, la
distribución de se conoce como la
distribución t con “r” grados de libertad t(r).

 Su FDP es:

 Para r>1 la media es igual a 0, y para r>2 la


varianza es igual a
 Tienen sesgo cero y curtosis mayor a 3
Distribución t en STATA
 Simulando 2000 datos para una t(10)

 clear
 quietly set obs 2000
 set seed 10101
 generate xt=rt(10)
 tabstat xt, stat(mean sd skew kurt min max) col(stat)
 histogram xt
Distribución F

 Si y , tanto y1 como y2 se
distribuyen de forma independiente, entonces
la distribución de es llamada la
distribución F con r1 y r2 grados de libertad.
Una variable aleatoria con distribución F se
construye como:
 La media de la distribución F es:

 La varianza de la distribución F es:


La distribución F en STATA
 Simulando 200 000 datos para una F(6,20)

 quietly set obs 200000


 set seed 10101
 generate xfnume=rchi2(6)/6
 generate xfdeno=rchi2(20)/20
 generate xf=xfnume/xfdeno
 tabstat xf, stat(mean sd skew kurt min max) col(stat)
 histogram xf
Universidad Nacional Autónoma de México
Instituto de Investigaciones Económicas

Econometría Intermedia
Econometría Intermedia
Pruebas de
Pruebas de hipótesis
hipótesis

Mtro. Uberto Salgado Nieto


ubertosalgado@comunidad.unam.mx

Especialidad en Econometría
Posgrado de Economía UNAM
Semestre 2022-I
 El supuesto de que los datos han sido generados
por una determinada ley de probabilidad nos
permite establecer que las propiedades
estadísticas del estimador de MCO se cumplen

◦ Teorema Gauss-Markov

 En un contraste de hipótesis nos preguntamos si


los datos observados han sido generados por
una determinada ley de probabilidad.
 El modelo de regresión lineal es empleado
por tres grandes razones: estimar, probar
hipótesis y generar pronósticos.

 Podemos considerar que el modelo es una


propuesta general mientras que una hipótesis
es una proposición que delimita dicha
propuesta
 Para probar hipótesis es necesario formular
un modelo estadístico que contenga las
hipótesis como restricciones a los parámetros.

 Considerando un modelo simple de inversión I

 Los inversionistas son sensibles a las tasas de


interés nominales, la tasa de inflación, al PIB
real y a otros factores con tendencia positiva
que depende del tiempo.
 Si consideramos la hipótesis de que a los
inversionistas solo les preocupa la tasa de
interés real, se obtendría la ecuación:

 Es ahora un modelo restringido, bajo el


contexto del primer modelo, esto implicaría
que B2+B3=0, por tanto es necesario probar la
hipótesis por medio de la inferencia
estadística.
 Sea una muestra aleatoria de
tamaño n de una distribución de probabilidad
p(y,θ), en donde θ es un parámetro
desconocido que pertenece al espacio
paramétrico

 Una hipótesis paramétrica es una conjetura


sobre un parámetro desconocido θ de una
distribución de probabilidad p(y,θ)
 La hipótesis de interés , se denomina
hipótesis nula y tiene asociada una hipótesis
alternativa , cumpliéndose que
y .

 Algunos ejemplos de hipótesis son:


◦ 1.- Significación individual
◦ 2.- Significación conjunta

◦ 3.- Restricciones lineales


 En estos tres ejemplos, H0 es una hipótesis simple y
H1 es una hipótesis compuesta de dos lados, algunos
otros posible ejemplos de hipótesis compuestas de
un lado son:

 La aproximación de Neyman y Pearson (1933) al


problema de contrastar hipótesis, señala que para
una realización de la variable aleatoria (Y1,Y2,…,Yn), se
desea encontrar una regla de decisión que indique si
la hipótesis nula se acepta o rechaza
 Parece razonable aceptar H0 cuando la
estimación está próxima a los
valores del parámetro θ fijados en H0.

 Siguiendo este criterio, el espacio muestral S de


todas las posibles realizaciones de la variable
aleatoria n-dimensional, se puede particionar
en dos conjuntos disjuntos, C y su
complemento Cc (S=CUCc), correspondientes a
las dos posibles decisiones: rechazar H0 o
aceptar H0, respectivamente.
 El conjunto C formado por todas las
realizaciones que rechazan H0 se denomina
región crítica

 En este problema de decisión se pueden


cometer dos errores: (1) rechazar H0 cuando
es cierta, que se denomina error de tipo I, y
(2) aceptar H0 cuando es falsa, que se
denomina error de tipo II
 Las probabilidades de estos dos errores se
recogen en la función potencia de contraste.

 La función potencia de un contraste es la


probabilidad de rechazar H0 en cualquier
punto del espacio paramétrico
 La máxima probabilidad del error de tipo I se
denomina nivel de significación o tamaño del
contraste, y se denota por α (tamaño de la
prueba)

 El contraste ideal seria aquel que siempre


conduce a la decisión correcta: aceptar H0
cuando es cierta y aceptar H1 cuando es
cierta; en otras palabras, el contraste ideal
sería aquel cuya función potencia es
 El poder de la prueba es la probabilidad de
que se rechace correctamente una hipótesis
nula falsa

 Para tratar de evitar caer en cualquiera de los


errores tipo I y II es necesario fijar la
probabilidad del error de tipo I en un nivel α
para tratar de minimizar la probabilidad del
error de tipo II.
Distribuciones asociadas a β
   consideramos que cada elemento del
Si
vector tiene una distribución normal con
media βj (el parámetro desconocido) y
varianza , donde ɑjj es el j-ésimo
elemento diagonal principal de la matriz de
varianzas y covarianzas
 Es posible llevar a cabo una transformación
lineal de βj por medio de una normalización,
que llamaremos la variable aleatoria zj

 Sin embargo, como no sabemos el valor del


parámetro desconocido , es necesario
sustituirlo por su estimación
  
Una aproximación de dicha estimación se
consigue por medio de emplear una nueva
variable aleatoria j que es una forma
idempotente cuadrática de un vector estándar
normal (ε/σ) por lo que tiene una distribución
ji-cuadrada con grados de libertad igual al
rango de M es decir n-k
 Por tanto tenemos que el estadístico ti:

 Bajo el teorema de Gosset (1908) sea z j una


variable aleatoria con distribución normal
estándar y sea ji una variable aleatoria con
distribución Ji-cuadrada con n grados de
libertad, siendo zj e ji independientes.
  
Entonces la variable aleatoria tiene una
distribución t de student con n grados de
libertad.
El contraste t
 Se desea contrastar la hipótesis nula de que
un parámetro individual βi es igual a un valor
específico , frente a la hipótesis alternativa
de que dicho parámetro βi es distinto de

 La hipótesis nula se rechaza al nivel de


significación α si
 Donde c es el valor crítico para el cual

 Se acepta H0 cuando la desviación relativa


de , sea pequeña en valor absoluto
 H0 :β2 = 0
 H :β ≠ 0
1 2
 Rechazo H si | t | > | t |
0 e c
 H0 :β2 ≤ β2*
 H1 :β2 > β*2
 Rechazo H0 si te > tc
Contraste de significación individual
 Un caso especial del contraste t de dos colas
es el contraste de significación individual:

 En donde supone eliminar la


variable explicativa Xi de la ecuación de
regresión.
 En este caso la hipótesis de significación
individual, rechaza la hipótesis nula al nivel
de significación α si

 En donde c es el valor crítico para el cual


 Cuando el número de datos es grande (n-
k>30), la hipótesis nula de que β=0 se
rechaza al nivel del 5% de significación si:

 En donde 2 es el valor crítico para el cual


Intervalo de confianza para βi
 Un método equivalente al contraste t de dos
colas es el intervalo de confianza.

 Un intervalo de confianza se construye a


partir de la probabilidad del error de tipo I
 Que puede escribirse como:

 O bien:

 Esta ecuación indica la probabilidad de que el


valor βi pertenezca al intervalo aleatorio
 Cuando el número de observaciones es
grande (n-k>30), el intervalo de confianza
puede aproximarse por
Ejemplo en STATA
 Abrimos la base de datos “mco.dta”

 Realizamos una regresión por mínimos cuadrados


ordinarios

 reg y x2 x3

 Para poder obtener acceso a los cálculos que


realizó STATA en la regresión lineal introducimos:

 ereturn list
  
Con este comando es posible obtener la
matriz de varianzas y covarianzas del
parámetro β, para hacer esto aplicamos:

 matrix list e(V)

 La diagonal de esta matriz es la varianza del


estimador β.
 Para obtener la desviación estándar del
coeficiente que calcula STATA:

 Para la constante:
 display (9.345)^(1/2)

 Para X3
 display (.875)^(1/2)

 Para X2
 display (.35)^(1/2)
 Para calcular el estadístico t de significación
estadística, donde H0: β=0 y H1: β≠0

 Para la constante:

 display 5.9/3.056959
 Para X3:

 display -2/.9354143

 Para X2:

 display 4.5/.591608
 Para poder tomar una decisión sobre la
prueba de hipótesis es necesario saber cual
es el valor “t” de tablas para contrastarlo con
la “t” calculada.

 El valor “t” de tablas en STATA se obtiene con


el comando invttail(n-k,1-(α/2))

 display invttail(2,0.975)
 Para calcular los intervalos de confianza:
 Cota inferior de la constante

 display 5.9 -4.3026*(9.345)^(1/2)

 Cota superior de la constante

 display 5.9 +4.3026*(9.345)^(1/2)


 Cota inferior de X3

 display -2 -4.3026*(.875)^(1/2)

 Cota superior de X2

 display -2 +4.3026*(.875)^(1/2)
 Cota inferior de X2

 display 4.5 -4.3026*(.35)^(1/2)

 Cota superior de X2

 display 4.5 +4.3026*(.35)^(1/2)


Un planteamiento general: hipótesis y
restricciones
 Las hipótesis son un conjunto de J restricciones
sobre el modelo lineal de regresión Y = Xβ+ε
 Las restricciones se pueden escribir:
 r11β1 + r12β2+………..r1kβk = q1
 r21β1 + r22β2+………..r2kβk = q2
⋮ ⋮ ⋮ ⋮
 rj1β1 + rj2β2+…………..rjkβk = qj
 El caso más simple es una restricción sobre un
coeficiente
 βk = 0
 El caso general se puede escribir
 Rβ = q

 Cada fila de R es una restricción sobre alguno


de los coeficientes. Normalmente R tiene pocas
filas y muchos ceros en cada fila. Ejemplos
1. Uno de los coeficientes es cero

R = (0 0..... 1 0... 0) y  q =0


2. Dos de los coeficientes son iguales
R = (0 0..... 1 - 1... 0) y  q =0
3. Un conjunto de coeficientes suman uno
β2+β3+β4=1
R = (0 1 1 1 0.....) y  q =1

4. Un conjunto de coeficientes son iguales a


cero β1=0, β2=0, β3=0

1 0 0 0 ... 0 0 
R  0 1 0 0 ... 0   I : 0    y   q  0
0 0 1 0 ... 0 0
5. Un conjunto de hipótesis β2+β3=1, β4+β6=6,
β5+β6=0

0 1 1 0\0 0 1 
R  0 0 0 1 0 1 y   q  6
0 0 0 0 1 1 0
El estadístico F
 Considerar la hipótesis nula basada en J
restricciones lineales

 H0 : Rβ – q = 0 y la alternativa
 H0 : Rβ – q ≠ 0

 La pregunta es si Rb - q es igual o cercano 0?

 Para ello se utiliza la prueba basada en el vector


m = Rb – q
 m es un vector con Media
E(m/X)=R E(b/X) –q
= Rβ – q = 0

 Y varianza

Var(m/X)=Var (Rb – q/X)


=R(Var(b/X))R´
=R (σ2(X´X)-1)R´
 De acuerdo con la prueba de Wald que consiste
en comparar el valor de un parámetro con otro
propuesto bajo el supuesto de que la diferencia
entre ambos tiene una distribución normal.

 El cuadrado de esta diferencia tiene una


distribución chi-cuadrado:

(q - q0 ) 2

var q
 En este caso el Criterio de Wald para la prueba
bajo Ho condicionado por la matriz X:

 W = m(Var[m])-1m
 = (Rb – q)´(σ2 R(X´X)-1R´)-1(Rb – q)
-1 -1
(Rb - q)´( R(X´X) R´) (Rb - q)
   2
( j)
 2

 No podemos usar la estadística anterior ya que σ2


es desconocida, debemos usar s2 y establecer su
distribución para poder realizar el contraste de Ho.
Al dividir el resultado entre J y multiplicar y dividir por (n-k)
obtenemos
Ws 2 (Rb - q)´( R(X´X)-1R´)-1 (Rb - q) 1 s 2 n - k
F = 2 =( )( )( 2 )( )
Js s 2
J s n- k

Tanto el numerador y el denominador se distribuyen como ji-


cuadrada, con J y (n-K) grados de libertad. Notar que tanto el
numerador y el denominador son funciones de variables
aleatorias independientes por lo que el cociente también lo es.
Así el estadístico de prueba tiene una distribución F con (J,n-K)
grados de libertad.

(Rb - q)´( R[S2 (X´X)-1 ]R´)-1 (Rb - q)


F( J ,n  k ) ( )
J
Contraste de significación global
 Es un caso especial del contraste F, donde:

 Donde el subvector incluye


todos los coeficientes del modelo salvo el
término constante, por tanto s=k-1
 Los pasos a seguir para contrastar esta
hipótesis son los siguientes:

 1.- Estimar el modelo de regresión:

 Calcular la suma de cuadrados de los


residuos, u’u=SCR

 2.- Estimar el modelo de regresión bajo H0:


β2=β3=….= βk=0
 Y calcular la suma de cuadrados de los
residuos

 3.- Calcular el estadístico de contraste


Ejercicio 1 en STATA
 Continuando con la misma base de datos del
ejercicio anterior “mco.dta”, es posible estimar en
forma alternativa la prueba de significación global
como:
 reg y x2 x3
 reg y

 display (111.2 - .7)/2


 display .7/2
 display as text "Estadístico F = " as result
55.25/.35
  Modo alternativo de calcular la F

 reg y x2 x3

 display (110.5/2)/(.7/2)
 Donde el estadístico F con n1=2 y n2=2
grados de libertad al 5% de significación en
las tablas, se calcula como:

 display invF(2,2,0.95)
 Para llevar a cabo una prueba de hipótesis
con restricciones lineales, STATA emplea el
estadístico F, por ejemplo en el caso de la
prueba de significación global tenemos:

 test x2=x3=0

También podría gustarte