Distribuciones de Probabilidad y Prueba de Hipótesis

Universidad Nacional Autónoma de México
Instituto de Investigaciones Económicas
Econometría Intermedia
Distribuciones de
Distribuciones de probabilidad
probabilidad
Mtro. Uberto Salgado Nieto

ubertosalgado@comunidad.unam.mx
Especialidad en Econometría
Posgrado de Economía UNAM
Semestre 2021-I
 Nos interesa conocer información sobre
algunos aspectos de las distribuciones de las
variables aleatorias.
 Las características de interés se dividen en tres

categorías: medidas de tendencia central, de
variabilidad y dispersión.
 Revisaremos las distribuciones de probabilidad

que son las más empleadas en econometría.
La Distribución Normal
 Es la distribución más empleada en
econometría.
 Su función de densidad es:

 Es simétrica alrededor de la media y tiene
forma de campana, tiene dos parámetros, su
media y varianza
 La normal estándar cuya función de densidad

es:
 Toma el valor 0 en la media y de 1 en su

varianza; su sesgo es cero y curtosis es 3.
 clear
 quietly set obs 100000
 set seed 10101
 generate stnormal=rnormal()
 tabstat stnormal, stat(mean sd skew kurt min max) col(stat)
 histogram stnormal
Distribución Ji-cuadradada
 Las variables aleatorias y1,…yn son

independientes y tienen una distribución
normal estándar, si a cada muestra se le
calcula su varianza, se obtendrá la
distribución muestral de las varianzas y Para
conseguir aproximarnos a la varianza
poblacional se necesita conocer el estadístico
χ2
 Si tenemos una muestra de tamaño n de una
población normal con varianza σ2, el
estadístico tiene una distribución muestral
que es una ji-cuadrada con n-1 grados de
libertad y está dado por:
 Donde n es el tamaño de la muestra, S2 la

varianza muestral y σ2 la varianza poblacional
de la cual se extrae la muestra.
 Su FDP es:
 Tiene media “k”, varianza “2k” y sesgo

positivo
Ji-cuadrada en STATA
 Simulación de una ji cuadrada con 10 grados
de libertad
 clear
 set seed 10101
 generate xc=rchi2(10)
 tabstat xc, stat(mean sd skew kurt min max) col(stat)
 histogram xc
Distribución t-student
 Si y y tanto y1 e y2 se
distribuyen independientemente, la
distribución de se conoce como la
distribución t con “r” grados de libertad t(r).
 Su FDP es:
 Para r>1 la media es igual a 0, y para r>2 la

varianza es igual a
 Tienen sesgo cero y curtosis mayor a 3
Distribución t en STATA
 Simulando 2000 datos para una t(10)
 clear
 set seed 10101
 generate xt=rt(10)
 tabstat xt, stat(mean sd skew kurt min max) col(stat)
 histogram xt
Distribución F
 Si y , tanto y1 como y2 se
distribuyen de forma independiente, entonces
la distribución de es llamada la
distribución F con r1 y r2 grados de libertad.
Una variable aleatoria con distribución F se
construye como:
 La media de la distribución F es:
 La varianza de la distribución F es:

La distribución F en STATA
 Simulando 200 000 datos para una F(6,20)

 set seed 10101
 generate xfnume=rchi2(6)/6
 generate xfdeno=rchi2(20)/20
 generate xf=xfnume/xfdeno
 tabstat xf, stat(mean sd skew kurt min max) col(stat)
 histogram xf
Universidad Nacional Autónoma de México
Instituto de Investigaciones Económicas
Pruebas de
Pruebas de hipótesis
hipótesis
Mtro. Uberto Salgado Nieto

ubertosalgado@comunidad.unam.mx
Especialidad en Econometría
Posgrado de Economía UNAM
Semestre 2022-I
 El supuesto de que los datos han sido generados
por una determinada ley de probabilidad nos
permite establecer que las propiedades
estadísticas del estimador de MCO se cumplen
◦ Teorema Gauss-Markov
 En un contraste de hipótesis nos preguntamos si

los datos observados han sido generados por
una determinada ley de probabilidad.
 El modelo de regresión lineal es empleado
por tres grandes razones: estimar, probar
hipótesis y generar pronósticos.
 Podemos considerar que el modelo es una

propuesta general mientras que una hipótesis
es una proposición que delimita dicha
propuesta
 Para probar hipótesis es necesario formular
un modelo estadístico que contenga las
hipótesis como restricciones a los parámetros.
 Considerando un modelo simple de inversión I
 Los inversionistas son sensibles a las tasas de

interés nominales, la tasa de inflación, al PIB
real y a otros factores con tendencia positiva
que depende del tiempo.
 Si consideramos la hipótesis de que a los
inversionistas solo les preocupa la tasa de
interés real, se obtendría la ecuación:
 Es ahora un modelo restringido, bajo el

contexto del primer modelo, esto implicaría
que B2+B3=0, por tanto es necesario probar la
hipótesis por medio de la inferencia
estadística.
 Sea una muestra aleatoria de
tamaño n de una distribución de probabilidad
p(y,θ), en donde θ es un parámetro
desconocido que pertenece al espacio
paramétrico
 Una hipótesis paramétrica es una conjetura

sobre un parámetro desconocido θ de una
distribución de probabilidad p(y,θ)
 La hipótesis de interés , se denomina
hipótesis nula y tiene asociada una hipótesis
alternativa , cumpliéndose que
y .
 Algunos ejemplos de hipótesis son:

◦ 1.- Significación individual
◦ 2.- Significación conjunta
◦ 3.- Restricciones lineales

 En estos tres ejemplos, H0 es una hipótesis simple y
H1 es una hipótesis compuesta de dos lados, algunos
otros posible ejemplos de hipótesis compuestas de
un lado son:
 La aproximación de Neyman y Pearson (1933) al

problema de contrastar hipótesis, señala que para
una realización de la variable aleatoria (Y1,Y2,…,Yn), se
desea encontrar una regla de decisión que indique si
la hipótesis nula se acepta o rechaza
 Parece razonable aceptar H0 cuando la
estimación está próxima a los
valores del parámetro θ fijados en H0.
 Siguiendo este criterio, el espacio muestral S de

todas las posibles realizaciones de la variable
aleatoria n-dimensional, se puede particionar
en dos conjuntos disjuntos, C y su
complemento Cc (S=CUCc), correspondientes a
las dos posibles decisiones: rechazar H0 o
aceptar H0, respectivamente.
 El conjunto C formado por todas las
realizaciones que rechazan H0 se denomina
región crítica
 En este problema de decisión se pueden

cometer dos errores: (1) rechazar H0 cuando
es cierta, que se denomina error de tipo I, y
(2) aceptar H0 cuando es falsa, que se
denomina error de tipo II
 Las probabilidades de estos dos errores se
recogen en la función potencia de contraste.
 La función potencia de un contraste es la

probabilidad de rechazar H0 en cualquier
punto del espacio paramétrico
 La máxima probabilidad del error de tipo I se
denomina nivel de significación o tamaño del
contraste, y se denota por α (tamaño de la
prueba)
 El contraste ideal seria aquel que siempre

conduce a la decisión correcta: aceptar H0
cuando es cierta y aceptar H1 cuando es
cierta; en otras palabras, el contraste ideal
sería aquel cuya función potencia es
 El poder de la prueba es la probabilidad de
que se rechace correctamente una hipótesis
nula falsa
 Para tratar de evitar caer en cualquiera de los

errores tipo I y II es necesario fijar la
probabilidad del error de tipo I en un nivel α
para tratar de minimizar la probabilidad del
error de tipo II.
Distribuciones asociadas a β
 consideramos que cada elemento del
Si
vector tiene una distribución normal con
media βj (el parámetro desconocido) y
varianza , donde ɑjj es el j-ésimo
elemento diagonal principal de la matriz de
varianzas y covarianzas
 Es posible llevar a cabo una transformación
lineal de βj por medio de una normalización,
que llamaremos la variable aleatoria zj
 Sin embargo, como no sabemos el valor del

parámetro desconocido , es necesario
sustituirlo por su estimación

Una aproximación de dicha estimación se
consigue por medio de emplear una nueva
variable aleatoria j que es una forma
idempotente cuadrática de un vector estándar
normal (ε/σ) por lo que tiene una distribución
ji-cuadrada con grados de libertad igual al
rango de M es decir n-k
 Por tanto tenemos que el estadístico ti:
 Bajo el teorema de Gosset (1908) sea z j una

variable aleatoria con distribución normal
estándar y sea ji una variable aleatoria con
distribución Ji-cuadrada con n grados de
libertad, siendo zj e ji independientes.

Entonces la variable aleatoria tiene una
distribución t de student con n grados de
libertad.
El contraste t
 Se desea contrastar la hipótesis nula de que
un parámetro individual βi es igual a un valor
específico , frente a la hipótesis alternativa
de que dicho parámetro βi es distinto de
 La hipótesis nula se rechaza al nivel de

significación α si
 Donde c es el valor crítico para el cual
 Se acepta H0 cuando la desviación relativa

de , sea pequeña en valor absoluto
 H0 :β2 = 0
 H :β ≠ 0
1 2
 Rechazo H si | t | > | t |
0 e c
 H0 :β2 ≤ β2*
 H1 :β2 > β*2
 Rechazo H0 si te > tc
Contraste de significación individual
 Un caso especial del contraste t de dos colas
es el contraste de significación individual:
 En donde supone eliminar la

variable explicativa Xi de la ecuación de
regresión.
 En este caso la hipótesis de significación
individual, rechaza la hipótesis nula al nivel
de significación α si
 En donde c es el valor crítico para el cual

 Cuando el número de datos es grande (n-
k>30), la hipótesis nula de que β=0 se
rechaza al nivel del 5% de significación si:
 En donde 2 es el valor crítico para el cual

Intervalo de confianza para βi
 Un método equivalente al contraste t de dos
colas es el intervalo de confianza.
 Un intervalo de confianza se construye a

partir de la probabilidad del error de tipo I
 Que puede escribirse como:
 O bien:
 Esta ecuación indica la probabilidad de que el

valor βi pertenezca al intervalo aleatorio
 Cuando el número de observaciones es
grande (n-k>30), el intervalo de confianza
puede aproximarse por
Ejemplo en STATA
 Abrimos la base de datos “mco.dta”
 Realizamos una regresión por mínimos cuadrados

ordinarios
 reg y x2 x3
 Para poder obtener acceso a los cálculos que

realizó STATA en la regresión lineal introducimos:
 ereturn list

Con este comando es posible obtener la
matriz de varianzas y covarianzas del
parámetro β, para hacer esto aplicamos:
 matrix list e(V)
 La diagonal de esta matriz es la varianza del

estimador β.
 Para obtener la desviación estándar del
coeficiente que calcula STATA:
 Para la constante:
 display (9.345)^(1/2)
 Para X3
 display (.875)^(1/2)
 Para X2
 display (.35)^(1/2)
 Para calcular el estadístico t de significación
estadística, donde H0: β=0 y H1: β≠0
 Para la constante:
 display 5.9/3.056959
 Para X3:
 display -2/.9354143
 Para X2:
 display 4.5/.591608
 Para poder tomar una decisión sobre la
prueba de hipótesis es necesario saber cual
es el valor “t” de tablas para contrastarlo con
la “t” calculada.
 El valor “t” de tablas en STATA se obtiene con

el comando invttail(n-k,1-(α/2))
 display invttail(2,0.975)
 Para calcular los intervalos de confianza:
 Cota inferior de la constante
 display 5.9 -4.3026*(9.345)^(1/2)
 Cota superior de la constante
 display 5.9 +4.3026*(9.345)^(1/2)

 Cota inferior de X3
 display -2 -4.3026*(.875)^(1/2)
 Cota superior de X2
 display -2 +4.3026*(.875)^(1/2)
 Cota inferior de X2
 display 4.5 -4.3026*(.35)^(1/2)
 Cota superior de X2
 display 4.5 +4.3026*(.35)^(1/2)

Un planteamiento general: hipótesis y
restricciones
 Las hipótesis son un conjunto de J restricciones
sobre el modelo lineal de regresión Y = Xβ+ε
 Las restricciones se pueden escribir:
 r11β1 + r12β2+………..r1kβk = q1
 r21β1 + r22β2+………..r2kβk = q2
⋮ ⋮ ⋮ ⋮
 rj1β1 + rj2β2+…………..rjkβk = qj
 El caso más simple es una restricción sobre un
coeficiente
 βk = 0
 El caso general se puede escribir
 Rβ = q
 Cada fila de R es una restricción sobre alguno

de los coeficientes. Normalmente R tiene pocas
filas y muchos ceros en cada fila. Ejemplos
1. Uno de los coeficientes es cero
R = (0 0..... 1 0... 0) y q =0

2. Dos de los coeficientes son iguales
R = (0 0..... 1 - 1... 0) y q =0
3. Un conjunto de coeficientes suman uno
β2+β3+β4=1
R = (0 1 1 1 0.....) y q =1
4. Un conjunto de coeficientes son iguales a

cero β1=0, β2=0, β3=0
1 0 0 0 ... 0 0 
R  0 1 0 0 ... 0   I : 0  y q  0
0 0 1 0 ... 0 0
5. Un conjunto de hipótesis β2+β3=1, β4+β6=6,
β5+β6=0
0 1 1 0\0 0 1 
R  0 0 0 1 0 1 y q  6
0 0 0 0 1 1 0
El estadístico F
 Considerar la hipótesis nula basada en J
restricciones lineales
 H0 : Rβ – q = 0 y la alternativa
 H0 : Rβ – q ≠ 0
 La pregunta es si Rb - q es igual o cercano 0?
 Para ello se utiliza la prueba basada en el vector

m = Rb – q
 m es un vector con Media
E(m/X)=R E(b/X) –q
= Rβ – q = 0
 Y varianza
Var(m/X)=Var (Rb – q/X)

=R(Var(b/X))R´
=R (σ2(X´X)-1)R´
 De acuerdo con la prueba de Wald que consiste
en comparar el valor de un parámetro con otro
propuesto bajo el supuesto de que la diferencia
entre ambos tiene una distribución normal.
 El cuadrado de esta diferencia tiene una

distribución chi-cuadrado:
(q - q0 ) 2
var q
 En este caso el Criterio de Wald para la prueba
bajo Ho condicionado por la matriz X:
 W = m(Var[m])-1m
 = (Rb – q)´(σ2 R(X´X)-1R´)-1(Rb – q)
-1 -1
(Rb - q)´( R(X´X) R´) (Rb - q)
   2
( j)
 2
 No podemos usar la estadística anterior ya que σ2

es desconocida, debemos usar s2 y establecer su
distribución para poder realizar el contraste de Ho.
Al dividir el resultado entre J y multiplicar y dividir por (n-k)
obtenemos
Ws 2 (Rb - q)´( R(X´X)-1R´)-1 (Rb - q) 1 s 2 n - k
F = 2 =( )( )( 2 )( )
Js s 2
J s n- k
Tanto el numerador y el denominador se distribuyen como ji-

cuadrada, con J y (n-K) grados de libertad. Notar que tanto el
numerador y el denominador son funciones de variables
aleatorias independientes por lo que el cociente también lo es.
Así el estadístico de prueba tiene una distribución F con (J,n-K)
grados de libertad.
(Rb - q)´( R[S2 (X´X)-1 ]R´)-1 (Rb - q)

F( J ,n  k ) ( )
J
Contraste de significación global
 Es un caso especial del contraste F, donde:
 Donde el subvector incluye

todos los coeficientes del modelo salvo el
término constante, por tanto s=k-1
 Los pasos a seguir para contrastar esta
hipótesis son los siguientes:
 1.- Estimar el modelo de regresión:
 Calcular la suma de cuadrados de los

residuos, u’u=SCR
 2.- Estimar el modelo de regresión bajo H0:

β2=β3=….= βk=0
 Y calcular la suma de cuadrados de los
residuos
 3.- Calcular el estadístico de contraste

Ejercicio 1 en STATA
 Continuando con la misma base de datos del
ejercicio anterior “mco.dta”, es posible estimar en
forma alternativa la prueba de significación global
como:
 reg y x2 x3
 reg y
 display (111.2 - .7)/2

 display .7/2
 display as text "Estadístico F = " as result
55.25/.35
 Modo alternativo de calcular la F
 reg y x2 x3
 display (110.5/2)/(.7/2)
 Donde el estadístico F con n1=2 y n2=2
grados de libertad al 5% de significación en
las tablas, se calcula como:
 display invF(2,2,0.95)
 Para llevar a cabo una prueba de hipótesis
con restricciones lineales, STATA emplea el
estadístico F, por ejemplo en el caso de la
prueba de significación global tenemos:
 test x2=x3=0

Distribuciones de Probabilidad y Prueba de Hipótesis

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Distribuciones de Probabilidad y Prueba de Hipótesis

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional Autónoma de México

Instituto de Investigaciones Económicas

Mtro. Uberto Salgado Nieto

 Las características de interés se dividen en tres

 Revisaremos las distribuciones de probabilidad

 Su función de densidad es:

 La normal estándar cuya función de densidad

 Toma el valor 0 en la media y de 1 en su

 Las variables aleatorias y1,…yn son

 Donde n es el tamaño de la muestra, S2 la

 Tiene media “k”, varianza “2k” y sesgo

 Para r>1 la media es igual a 0, y para r>2 la

 La varianza de la distribución F es:

 quietly set obs 200000

Mtro. Uberto Salgado Nieto

 En un contraste de hipótesis nos preguntamos si

 Podemos considerar que el modelo es una

 Considerando un modelo simple de inversión I

 Los inversionistas son sensibles a las tasas de

 Es ahora un modelo restringido, bajo el

 Una hipótesis paramétrica es una conjetura

 Algunos ejemplos de hipótesis son:

◦ 3.- Restricciones lineales

 La aproximación de Neyman y Pearson (1933) al

 Siguiendo este criterio, el espacio muestral S de

 En este problema de decisión se pueden

 La función potencia de un contraste es la

 El contraste ideal seria aquel que siempre

 Para tratar de evitar caer en cualquiera de los

 Sin embargo, como no sabemos el valor del

 Bajo el teorema de Gosset (1908) sea z j una

 La hipótesis nula se rechaza al nivel de

 Se acepta H0 cuando la desviación relativa

 En donde supone eliminar la

 En donde c es el valor crítico para el cual

 En donde 2 es el valor crítico para el cual

 Un intervalo de confianza se construye a

 Esta ecuación indica la probabilidad de que el

 Realizamos una regresión por mínimos cuadrados

 Para poder obtener acceso a los cálculos que

 matrix list e(V)

 La diagonal de esta matriz es la varianza del

 El valor “t” de tablas en STATA se obtiene con

 display 5.9 -4.3026*(9.345)^(1/2)

 Cota superior de la constante

 display 5.9 +4.3026*(9.345)^(1/2)

 display 4.5 -4.3026*(.35)^(1/2)

 display 4.5 +4.3026*(.35)^(1/2)

 Cada fila de R es una restricción sobre alguno

R = (0 0..... 1 0... 0) y q =0

4. Un conjunto de coeficientes son iguales a

 La pregunta es si Rb - q es igual o cercano 0?

 Para ello se utiliza la prueba basada en el vector

Var(m/X)=Var (Rb – q/X)

 El cuadrado de esta diferencia tiene una

 No podemos usar la estadística anterior ya que σ2

Tanto el numerador y el denominador se distribuyen como ji-

(Rb - q)´( R[S2 (X´X)-1 ]R´)-1 (Rb - q)

 Donde el subvector incluye

 1.- Estimar el modelo de regresión:

 Calcular la suma de cuadrados de los

 2.- Estimar el modelo de regresión bajo H0:

 3.- Calcular el estadístico de contraste

 display (111.2 - .7)/2