Está en la página 1de 70

5.

21

Pruebas de Hipótesis
1. Hipótesis Nula, H0.
2. Hipótesis Alternativa, H1.
3. Un estadístico de prueba.
4. Una región de rechazo.
PRUEBA DE HIPÓTESIS: COMENTARIOS GENERALES

AFIRMACIÓN RELATIVA A UN PARÁMETRO DE


LA POBLACIÓN SUJETA A LA VERIFICACIÓN
Estadístico y Parámetro
¿ Que es la Hipótesis ?

1 2 3

• Una persona es • Enfermo visita a • la Cantidad


inocente hasta que Doctor con varios Demandada de un
se prueba su exámenes. Bien depende de su
culpabilidad . Precio, o el
Consumo de las
personas está en
relación directa con
su nivel de Ingresos.
¿Que es la prueba de hipótesis ?
• Procedimiento basado en evidencia de la Muestra y la teoría de la
probabilidad para determinar si la hipótesis es una afirmación
razonable
PASO 1

Se establece HP Se establece HP hp : u =15 ( V)


Nula Altenativa Hp: u ≠ 15( no es V)
PASO 2
• Selecciona Nivel de Significancia
• Es Probabilidad de rechazar la hipótesis nula cuando es verdadera.

El nivel de significancia se expresa con la letra griega alfa,


α. En ocasiones también se conoce como nivel de riesgo.
Éste quizá sea un término más adecuado porque se trata
del riesgo que se corre al rechazar la hipótesis nula
cuando es verdadera
5.25
Errores Tipo I y Tipo II
Error Tipo I:
Cometemos el error de rechazar la hipótesis nula cuando
esta es verdadera.
a = P(rechazar H0 cuando es verdadera).
Error Tipo II :
Cometemos el error de no rechazar la hipótesis nula
cuando esta es falsa.
b = P(no rechazar H0 cuando es falsa).
TIPOS DE ERRORES
• ERROR DE TIPO 1 ERROR DE TIPO 2
PIB = C + I + G + X – M

• hipótesis en Economía

• Siendo C el consumo, I la inversión, G el gasto público, X las


exportaciones y M las importaciones. De esta fórmula vamos
despedazando cada dato hasta obtener todos. En
esta fórmula podemos ver, ceteris paribus, por qué cuando disminuye
el consumo interno de un país se reduce el PIB
5.24
Significancia estadística vs
práctica en Economía
Práctica pero no estadísticamente significativo:
Cuando el tamaño muestral es muy pequeño, una gran
diferencia salarial entre hombres y mujeres puede no ser
estadísticamente significativo.

Estadística pero no significativo en la práctica


Cuando el tamaño muestral es muy grande, una correlación
pequeña (algo como, r = 0.00000001) entre los números
ganadores de la lotería y el índice Dow-jones puede ser
estadísticamente significativo..
Paso 3: Se selecciona el estadístico de prueba
son muchos los mas comunes

Z
ESTADÍSTICOS
DE PRUEBA

T
5.22
Reglas para rechazar
1. Pruebas de dos colas:
Si el valor del estadístico de prueba cae en la región crítica de
cualquier cola de la distribución t, entonces rechazamos la
hipótesis nula en favor de la alternativa.

2. Prueba de cola inferior:


Si el valor del estadístico de prueba cae en la región crítica que
está en la cola inferior de la distribución t, entonces rechazamos la
hipótesis nula en favor de la alternativa.

2. Prueba de cola superior:


Si el valor del estadístico de prueba cae en la región crítica que
está en la cola superior de la distribución t, entonces rechazamos la
hipótesis nula en favor de la alternativa.
u = media población X media de la muestra
Prueba de la media poblacional: desviación
estándar de la población desconocida
Hipótesis en Economía
Cantidad demandada de un bien
• hpo = u ≥ 15000 cuando precio 23
• hp1 = u ≤ 15000 cundo precio es 23
Intervalo de Confianza en Prueba de
Hipotesis
• Lo que se busca es que la prueba de Hipotesis haga una afirmación sobre
el valor de parámetro Evaluado.
• Pero el estadístico o estimador que se usa en la prueba debe tener una
distribución de probabilodad F, t o c2

• EJEMPLO : H0 : Bi = B*i
H0 : Bi ≠ B* i
La regla es construir un intervalo
de confianza
• b1 valor del estimador

• T alfa /2 valor de la tabla de


distribución grados de libertad
(n-2)
• Se(b1) error estándar del
estimador
Si el valor de b1 de la hp nula se encuentra dentro
• a Nivel de significancia
de este intervalo, no se rechaza Ho.
Selección del nivel de significancia α
• El nivel de significación se suele establecer en un 5% (o 0,05), esto representa la
probabilidad de rechazar la hipótesis nula cuando es verdadera.

• Lo que se usan son los resultados de la Muestra para verificar si esa Hipótesis es
verdadera o falsa.

• Lo que se utiliza para estos análisis son los estadísticos de prueba


Distribución de Probabilidad del término de
perturbación
• MCO
• No hace supuestos de distribuciones de probabilidad
• Modelo clásico de regresión lineal dice q los residuos son
normalmente distribuidos
• Se cumple el teorema del limite central ( normal hasta el infinito)
• Estimadores son normales
• Conclusión todo estos características permiten utilizar las pruebas F y
t
Si Prueba es bilateral de dos colas
T calculado = b2 – B2/ se(b2) (error estándar del estimador )

Prueba t Nota : b2 =estimador de regresión


B2 ( valor de la hipótesis)
Donde n: tamaño de la muestra n-2 Grados de libertad 5.17
REGLA DE DECISIÓN (
Figura 5.1 Distribución t PRUEBA DE HIPOTESIS

SI t calculado < t v. critco


izquierdo -Rechazar H0

SI t calculado > t v.critco


derecho -Rechazar H0

EN TERMNOS VALOR
ABSOLUTOS
(1-a)
a/2 a/2 SI t calculado > t critco
valor absoluto Rechazar
H0

-tc 0 tc t
Área roja = región de rechazo para pruebas de dos colas
Otras pruebas Nota : b2 =estimador de regresión
B2 ( valor de la hipótesis)

• Si la prueba es unilateral o de una cola ( en éste caso, la cola


izquierda ), será de la forma Ho : b2 > o igual B2
• Ho : b2 < B2
<

• Si la prueba es unilateral o de una cola ( en éste caso, la cola derecha


, será de la forma Ho : b2 menor o igual B2
• Ho : b2 mayor B2
Regla
• Si se presenta el caso bilateral ( 2 colas )

• Ho : b2 = 0
• Ho : b2 ≠ 0
• b2 quiere decir que el verdadero valor del parámetro b2 es 0 y busca
ver si la variable Y tiene relación con la variable explicativa X ES DECIR
SI LA VARIABLE X ES SIGNIFICATIVA AL MODELO
• En este caso se determinará el nivel de significancia 5%
Se calcula un valor critico de la forma
• T critico = t a = 0,05 ,n – 2 mayor o igual 20
Esto nos dice que el nivel de significancia es igual 5%
y el numero de grados de libertad n-2 es mayor o
igual a 20, entonces habrá un único valor critico
que será igual a 2

Si t calculado > t crítico = Rechazar Ho


Caso – estudio para aumentar la supervivencia de
3 productos en una plata industrial
• Varianza ?
• Intervalo 95%
• Hipótesis coeficiente de determinación
• Ver significancia individual
Cosas adicionales sobre prueba de hipóteis

Para una n, si prob( reducir


Error al rechazar hpN El valor p o “p- value”es el
error de tipo1 = reducir α
cuando es V ( tipo 1) valor mas bajo para
Error de aceptar hpN =
rechazar la hp nula,
cuando es Falsa( tipo 2) Probabilidad (cometer
también lo dan los
error de tipo 2 y viceversa
Prob(error de sig)=α. softwares estadísticos
) El valor p o “p- value”
supervivencia a tres productos en una empresa

y x1 x2 x3
25,5 1,74 5,3 10,8
31,2 6,32 5,42 9,4
25,9 6,22 8,41 7,2
38,4 10,52 4,63 8,5
18,4 1,19 11,6 9,4
26,7 1,22 5,85 9,9
26,4 4,10 6,62 8
25,9 6,32 8,72 9,1
32 4,08 4,42 8,7
25,2 4,15 7,6 9,2
39,7 10,15 4,83 9,4
35,7 1,72 3,12 7,6
26,5 1,7 5,3 8,2
Análisis del caso
Intervalo de confianza del caso
Análisis de variables
• R2 vale 0,88es un buen ajuste
• Error stantar es 4,29 bajó
• Valor función objetivo 38,67 Sum squarred, es un valor mismo cuando estimamos en MCO
• Media 29.038 características básicas
• Un aumento unitario en la concentración del primer producto produce un aumento de 1,016 unidades de la
variable Y, es decir, un aumento de un 1,016 en la variable Y( en %)
• Un aumento unitario en la concentración del segundo producto produce un descenso de 1,86 unidades de la
variables Y, es decir, un descenso de un 1,86% en la variable Y
• Por último un aumento unitario en la concentración del tercer producto produce un descenso del 0,34% en
la variable Y
• La Constante de 39.15 es decir que las plantas de la empresa sobreviven 39,15%
• P- valor de prueba F es muy pequeño ( 0,000045) acepta la hipótesis nula osea una probabilidad alta (si
hay significancia en los parámetros )
• P- valor indiviual en el programa se ve Prob = 0,0001; 0,005;0,001; 0,59 sólo el último es mayor no es
significativo seria ,41% el resto sí entonces ésta variable se debería eliminar.
•Un modelo econométrico de proyección
de la demanda futura del flujo
vehicular en las concesiones en
trasporte
• En el presente artículo se propone una metodología que contribuya a la discusión de
proyección de la demanda futura del flujo vehicular de un proyecto de concesión, toda vez
que la demanda es una variable relevante para la toma de decisiones del Estado, en el
marco de las renegociaciones de los contratos de concesión. Al respecto, se propone una
metodología considerando una variante del “Modelo de Demanda de Viajes Basado en la
Elasticidades” y un “Modelo de Series de Tiempo No Estacionarias Multivariado”.

• La metodología propuesta se aplicará, a manera referencial, en la proyección del tráfico de


la Estación de Serpentín de la Concesión del Tramo Ancón–Huacho– Pativilca de la carretera
Panamericana Norte (Red Vial N.º 5).

• Palabras clave: estimación, proyección, cointegración, demanda.

• UTEQ – QUEVEDO
CASO REGRESION LINEAL
• En el presente artículo se propone una metodología que contribuya a la discusión
de proyección de la demanda futura del flujo vehicular de un proyecto de
concesión, toda vez que la demanda es una variable relevante para la toma de
decisiones del Estado, en el marco de las renegociaciones de los contratos de
concesión. Al respecto, se propone una metodología considerando una variante
del “Modelo de Demanda de Viajes Basado en la Elasticidades” y un “Modelo de
Series de Tiempo No Estacionarias Multivariado”.

• La metodología propuesta se aplicará, a manera referencial, en la proyección del


tráfico de la Estación de Serpentín de la Concesión del Tramo Ancón–Huacho–
Pativilca de la carretera Panamericana Norte (Red Vial N.º 5).

• Palabras clave: estimación, proyección, cointegración, demanda.

• UTEQ – QUEVEDO
Tráfico = f(PBI, Población )
• La explicación empírica hace referencia que a medida que se
incremente la actividad económica se incrementa el comercio, lo que
se deriva, finalmente, en un mayor tráfico vehicular; del mismo modo,
si la población se incrementa, entonces se incrementa la demanda del
uso vehicular y se incrementa el flujo del tráfico vehicular.
Significancia estadística en la variables
Análisis del caso básico
• Se evidencia que la población no presenta significancia individual ni al
10% de significancia ni una relación con consistencia teórica.
• Una explicación probable es que Estas zonas el incremento de la
población puede darse en zonas muy alejadas a la zona de análisis y si
el incremento de la población es por recién nacidos esto tiene un
impacto en el tráfico luego de varios años por tal motivo se omite
dicha variable del modelo.

• Por otro lado, el PBI real sí representa a una variable con alto poder
explicativo por lo que es determinante en el análisis y por ende en la
proyección del tráfico en la estación de Serpentín.
Hacia abajo borradores e
insumos
5.16

Estadístico t de student

(b2 - b2)
t = ~ t (T-2)
se(b2)

t tiene una distribución t


con T- 2 grados de libertad.
5.17
Figura 5.1 Distribución t

f(t)

(1-a)
a/2 a/2
-tc 0 tc t
Área roja = región de rechazo para pruebas de dos colas
5.4
Estimación de la Varianza
del Error
Estimador insesgado de la varianza del error:

S ^ 2
e
s
t
^2 =
T-2

Transformación a una distribución ji-cuadrado

(T - 2) s
s
^2
2
~ c T-2
5.15

(b2 - b2) (b2 - b2)


t = =
^
s
^2 var(b2)
S( xi - x )2

(b2 - b2)
t =
se(b2)
s2 5.14
var(b2) =
S( xi - x )2

(b2 - b2) Nótese la


simplificación
s2
S( xi - x )2 (b2 - b2)
t = =
^
(T-2) s 2 s
^2
(T- 2)
s2 S( xi - x )2
5.12
Z
t = ~ t(m)
V / (T- 2)

(b2 - b2)
donde Z =
var(b2)

s2
y var(b2) =
S( xi - x )2
5.7
Regresión Lineal Simple
y t = b1 + b 2 x t + e t donde E e t = 0

yt ~ N(b1+ b2x t , s 2)
dado que E yt = b1 + b2x t

e t = y t - b 1 - b2 x t

Entonces, e t ~ N(0,s 2) .
5.11
Distribución t de student

Z
t= ~ t(m)
V/m

Donde Z ~ N(0,1)
y V ~ c2
(m)
Antes de exponer el mecanismo preciso para la
construcción de los intervalos de confianza y de las pruebas
de hipótesis estadísticas debemos saber lo siguiente:
Conceptos importantes como:
probabilidad
distribuciones de probabilidad
errores tipo I y tipo II
nivel de significancia
potencia de una prueba estadística e intervalos de
confianza son cruciales para entender el material de este
capítulo y los siguientes.
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado
con una cierta probabilidad
Para poner en orden las ideas, consideremos el ejemplo de los salarios y el nivel de escolaridad
en la cual muestra que el incremento promedio estimado del salario medio por hora relacionado
con un año de aumento en la escolaridad (βˆ 2) es de e 0.7240, que constituye una cifra estimada
(puntual) del valor poblacional desconocido β2

Para ser más específi co, supongamos que se desea encontrar qué tan “cerca” está,
por ejemplo,βˆ2 β2. Con este fi n, se trata de encontrar dos números positivos, δ y α, este
último situado entre 0 y 1, de modo que la probabilidad de que el intervalo aleatorio
(βˆ2 − δ, βˆ2 + δ) contenga alverdadero β2 sea 1 − α. Simbólicamente,
Es muy importante conocer los siguientes aspectos de la estimación por intervalos:

1. La ecuación (5.2.1) no afi rma que la probabilidad de que β2 se encuentre entre los límites dados
sea 1 − α. Como se supone que β2, aunque se desconoce, es un número fi jo, se dice que está o no
está dentro del intervalo. La ecuación (5.2.1) establece que, al utilizar el método descrito en este
capítulo, la probabilidad de construir un intervalo que contenga β2 es 1 − α.

2. El intervalo (5.2.1) es un intervalo aleatorio; es decir, variará de una muestra a la siguiente


debido a que se basa en βˆ 2, el cual es aleatorio. (¿Por qué?)

3. Como el intervalo de confi anza es aleatorio, los enunciados probabilísticos que le corresponden
deben entenderse en un sentido de largo plazo, es decir, para muestreo repetido.
En el capítulo 4, sección 4.3, demostramos que con el supuesto de normalidad de
ui, los estimadores de MCO βˆ 1 y βˆ 2 son en sí mismos normalmente distribuidos
con medias y varianzas allí establecidas. Por consiguiente, por ejemplo, la variable

como se anotó en (4.3.6), es una variable normal estandarizada. Por tanto, parece
que se puede utilizar la distribución normal para hacer afirmaciones
probabilísticas sobre β2, siempre que se conozca la verdadera varianza
poblacional σ2 . Si se conoce σ2 , una propiedad importante de una variable
normalmente distribuida con media µ y varianza σ2 es que el área bajo la curva
normal entre µ ± σ es cercana a 68%, que entre µ ± 2σ es alrededor de 95%, y que
entre los límites µ ± 3σ el área es cercana a 99.7%.
Pero pocas veces se conoce σ 2 y, en la práctica, está determinada por el
estimador insesgado σˆ 2 . Si se reemplaza σ por σˆ, (5.3.1) puede escribirse así
donde ee (βˆ 2) se refi ere ahora al error estándar estimado. Se demuestra (véase el
apéndice 5A, sección 5A.2) que la variable t, así definida, sigue la distribución t con n − 2 gl.
normal, se puede utilizar la distribución t para construir un intervalo de confianza para β2 de
la siguiente forma: Pr (−tα/2 ≤ t ≤ tα/2) 1 − α (5.3.3) donde el valor t en el centro de esta
doble desigualdad es el valor t dado por (5.3.2), y donde tα/2 es el valor de la variable t
obtenida de la distribución t para un nivel de significancia de α/2 y n − 2 gl; a menudo se
denomina el valor crítico t a un nivel de significancia α/2. Al sustituir (5.3.2) en (5.3.3) se
obtiene
Intervalo de confianza para β1 y β2 simultáneamente
Hay ocasiones en que se necesita construir un intervalo de confianza
conjunto para β1 y β2 tal que, para un coeficiente de confianza (1 − α)
de, por ejemplo, 95%, tanto β1 como β2 caigan al mismo tiempo
dentro de ese intervalo. Como este tema es complejo, el lector quizá
desee consultar referencias apropiadas.5
intervalo de confianza para β2

Es una variable normal estandarizada. Por tanto, parece que se


puede utilizar la distribución normal para hacer afirmaciones En el capítulo 4, sección 4.3, demostramos
probabilísticas sobre β2, siempre que se conozca la verdadera que con el supuesto de normalidad de ui,
varianza poblacional σ2 . Si se conoce σ2 , una propiedad los estimadores de MCO βˆ 1 y βˆ 2 son en
importante de una variable normalmente distribuida con media sí mismos normalmente distribuidos con
µ y varianza σ2 es que el área bajo la curva normal entre µ ± σ medias y varianzas allí establecidas. Por
es cercana a 68%, que entre µ ± 2σ es alrededor de 95%, y que consiguiente, por ejemplo, la variable
entre los límites µ ± 3σ el área es cercana a 99.7%.
Pruebas de hipótesis: método del intervalo de confianza

Prueba bilateral o de dos colas Para ilustrar el enfoque del intervalo de confianza, una vez más nos
referiremos al ejemplo de salarios y nivel de escolaridad. Por los resultados de la regresión obtenidos en la
ecuación (3.6.1), sabemos que el coéficiente de pendiente es 0.7240. Supongamos que se postula que

H0:β2 0.5
H1:β2 0.5

es decir, el verdadero coéficiente de la pendiente es 0.5 según la hipótesis nula, pero menor o mayor que 0.5
según la hipótesis alternativa. La hipótesis nula es una hipótesis simple, mientras que la hipótesis alternativa
es compuesta; y, en la práctica, se conoce como hipótesis bilateral. Con mucha frecuencia, dicha hipótesis
alternativa bilateral refleja el hecho de que no se tiene una expectativa a priori o teórica sólida sobre la
dirección en la cual debe moverse la hipótesis alternativa respecto de la hipótesis nula.
Prueba unilateral o de una cola

Algunas veces tenemos una expectativa a priori o teórica sólida (o existen expectativas basadas en algún
trabajo empírico previo) de que la hipótesis alternativa es unilateral o unidireccional, en lugar de ser
bilateral o de dos colas, como acabamos de analizar. Así, para el ejemplo de los salarios y el nivel de
escolaridad, se puede postular que
H0:β2 ≤ 0.5 y H1:β2 > 0.5

Quizás la teoría económica o el trabajo empírico previo indiquen que la pendiente es mayor que 0.5.
Aunque el procedimiento para probar esta hipótesis se deriva fácilmente de (5.3.5), se explica mejor el
mecanismo real en términos del método de prueba de significancia siguiente.
Prueba de hipótesis: algunos aspectos prácticos

Hipótesis nula “cero” y regla práctica “2t”


Una hipótesis nula es una suposición que se utiliza para negar o afirmar un suceso
en relación a algún o algunos parámetros de una población o muestra.

La hipótesis nula que es objeto frecuente de prueba en el trabajo empírico es H0:


β2 0, es decir, el coeficiente de la pendiente es cero. Esta hipótesis nula de “cero”
es un mecanismo para establecer si Y tiene relación con X, la variable explicativa.

Regla practica 2t establece que si el numero de grados de libertad es 20 o más, con


un nivel de significancia fijado den 0.05, se rechaza Hipótesis nula β=0 si el valor t
en valor absoluto es superior a 2.
Formación de las hipótesis nula y alternativa
las expectativas teóricas o el trabajo empírico previo o ambos pueden ser la base para
formular hipótesis. Sin embargo, sin importar la forma de postular hipótesis, es en extremo
importante que el investigador plantee estas hipótesis antes de la investigación empírica.
De lo contrario, él o ella serán culpables de razonamientos circulares o profecía auto
cumplidas. Es decir, si se formula la hipótesis después de examinar los resultados
empíricos, puede presentarse la tentación de formular la hipótesis de manera que justifi
que los resultados. Deben evitarse estas prácticas a cualquier costo, al menos para salvar la
objetividad científica. Recuerde la cita de Stigler al principio de este capítulo.
Nivel exacto de significancia: Valor p
Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un
nivel de significancia de 0.05 ó 0.01 y seleccionar la región crítica en consecuencia.
Entonces, por supuesto, el rechazo o no rechazo estricto de Ho dependerá de esa
región crítica. En la estadística aplicada los usuarios han adoptado de forma
extensa la aproximación del valor P. La aproximación se diseña para dar al usuario
una alternativa a la simple conclusión de "rechazo" o "no rechazo"
Significancia estadística y significancia práctica
La prueba de la significancia estadística Para los administradores que están
se ocupa de las inferencias que tomando las decisiones, no solo importa
deseamos hacer de la muestra a la ver si existe una diferencia (significancia
población . estadística) si no ver que tanta diferencia
Es un concepto matemático que se existe.
refiere a las probabilidades de que un La forma mas simple y practica de
resultado especifico se deba o no al azar establecer la magnitud de la diferencia
Se a plica esta muestra cuando en un estudio seria comparar las medias.
queremos determinas que tan probable Sin embargo esto no funciona cuando se
es que las diferencias que se encuentra están comparando los resultados de
en las muestras sean encontradas en la diferentes estudios que utilizaron
población de la cual son tomadas mjuestras y estadísticos diferentes.
La prueba de significancia estadística se Para ello es necesario traducir los
utiliza para intentar rechazar la hipótesis resultados en términos comparables.
nula.
Análisis de regresión y análisis de varianza
El análisis de regresión es un método estadístico que permite examinar la relación entre dos o más
variables e identificar cuáles son las que tienen mayor impacto en un tema de interés.

Este método permite clasificar matemáticamente a través de diferentes preguntas como: ¿Qué
factores importan más? ¿Qué factores se pueden ignorar? ¿Cómo interactúan estos factores entre
sí?, y por último, ¿Qué tan seguro te siente de todos estos factores?

El proceso de realizar una regresión permite determinar con confianza cuáles son los factores más
importantes, cuáles se pueden ignorar y cómo influyen entre sí. Dichos factores se denominan
variables las cuales se clasifican en:

Variables dependientes

Variables independientes
10. Aplicación del análisis de regresión:
problemas de predicción

Predicción media Predicción Individual


Para ordenar las ideas, suponga que X0 20 y Si lo que interesa es predecir un valor individual
deseamos predecir E(Y|X0 20). Ahora, puede Y, Y0 correspondiente a un valor dado de X,
demostrarse que la regresión histórica digamos, X0, entonces, el mejor estimador lineal
proporciona la estimación puntual de esta insesgado de Y0 está dado también, pero su
predicción media de la siguiente forma: varianza es la siguiente:
Y0 =ˆ β1 + ˆ β2X0 var(Y0 − ˆ Y0) = E[Y0 − ˆ Y0]2 σ2 1+ 1 n +(X0
− X)2 x2 i
= − 0.0144+0.7240(20)
=14.4656 Además, se demuestra que Y0 también sigue
una distribución normal con media y varianza
dadas, respectivamente. Al sustituir σ ˆ2 por la
donde Y ˆ0 estimador de E(Y|X0). Puede
desconocida σ2, se colige que t Y0 − ˆ Y0 e(Y0
comprobarse que este predictor puntual es el
mejor estimador lineal e insesgado (MELI). − ˆ Y0)
Como Y ˆ0 es un estimador, es probable que
éste sea diferente de su verdadero valor. La
diferencia entre los dos valores dará alguna idea
del error de predicción o pronóstico. Para evaluar
este error es necesario encontrar la distribución
muestral de Y ˆ0.
Informe de resultados del análisis de regresión

• Hay diversas formas de presentar los resultados de un análisis de regresión; sin embargo, en este
texto utilizaremos el siguiente formato, con el ejemplo de los salarios y el nivel de escolaridad del
capítulo 3 a manera de ilustración:

• Yi =−0.0144 + 0.7240Xi

• ee= (0.9317) (0.0700) r2= 0.9065

• t=(−0.0154) (10.3428) gl =11

• p = (0.987) (0.000) F1.11= 108.30


Evaluación de los resultados del análisis de
regresión
• Pruebas de normalidad • Otras pruebas del ajuste del
• Aunque se han estudiado diversas pruebas de modelo
normalidad en la teoría, sólo consideraremos tres: 1)
histograma de residuos, 2) gráfica de probabilidad Recuerde que el MCRLN tiene muchos
normal (GPN) y 3) prueba Jarque-Bera. supuestos adicionales al de la normalidad
• Histograma de residuos Es un simple dispositivo del término de error. A medida que
gráfico para saber algo sobre la forma de la función de examinemos la teoría econométrica,
densidad poblacional (FDP) de una variable aleatoria. consideraremos diversas pruebas de la
En el eje horizontal se dividen los valores de la bondad del modelo (véase el capítulo 13).
variable de interés (por ejemplo, los residuos de MCO) Hasta entonces, recuerde que la
en intervalos convenientes, y sobre cada intervalo de
clase se construyen rectángulos cuya altura sea igual elaboración de modelos de regresión se
al número de observaciones (es decir, la frecuencia) basa en diversos supuestos simplifi
para ese intervalo de clase. Si mentalmente se coloca cadores que quizá no sean válidos en
la curva de distribución normal en forma de campana todos los casos.
sobre el histograma, se tendrá cierta idea sobre la
pertinencia o no de la aproximación normal (FDP)

También podría gustarte