Documentos de Académico
Documentos de Profesional
Documentos de Cultura
21
Pruebas de Hipótesis
1. Hipótesis Nula, H0.
2. Hipótesis Alternativa, H1.
3. Un estadístico de prueba.
4. Una región de rechazo.
PRUEBA DE HIPÓTESIS: COMENTARIOS GENERALES
1 2 3
• hipótesis en Economía
Z
ESTADÍSTICOS
DE PRUEBA
T
5.22
Reglas para rechazar
1. Pruebas de dos colas:
Si el valor del estadístico de prueba cae en la región crítica de
cualquier cola de la distribución t, entonces rechazamos la
hipótesis nula en favor de la alternativa.
• EJEMPLO : H0 : Bi = B*i
H0 : Bi ≠ B* i
La regla es construir un intervalo
de confianza
• b1 valor del estimador
• Lo que se usan son los resultados de la Muestra para verificar si esa Hipótesis es
verdadera o falsa.
EN TERMNOS VALOR
ABSOLUTOS
(1-a)
a/2 a/2 SI t calculado > t critco
valor absoluto Rechazar
H0
-tc 0 tc t
Área roja = región de rechazo para pruebas de dos colas
Otras pruebas Nota : b2 =estimador de regresión
B2 ( valor de la hipótesis)
• Ho : b2 = 0
• Ho : b2 ≠ 0
• b2 quiere decir que el verdadero valor del parámetro b2 es 0 y busca
ver si la variable Y tiene relación con la variable explicativa X ES DECIR
SI LA VARIABLE X ES SIGNIFICATIVA AL MODELO
• En este caso se determinará el nivel de significancia 5%
Se calcula un valor critico de la forma
• T critico = t a = 0,05 ,n – 2 mayor o igual 20
Esto nos dice que el nivel de significancia es igual 5%
y el numero de grados de libertad n-2 es mayor o
igual a 20, entonces habrá un único valor critico
que será igual a 2
y x1 x2 x3
25,5 1,74 5,3 10,8
31,2 6,32 5,42 9,4
25,9 6,22 8,41 7,2
38,4 10,52 4,63 8,5
18,4 1,19 11,6 9,4
26,7 1,22 5,85 9,9
26,4 4,10 6,62 8
25,9 6,32 8,72 9,1
32 4,08 4,42 8,7
25,2 4,15 7,6 9,2
39,7 10,15 4,83 9,4
35,7 1,72 3,12 7,6
26,5 1,7 5,3 8,2
Análisis del caso
Intervalo de confianza del caso
Análisis de variables
• R2 vale 0,88es un buen ajuste
• Error stantar es 4,29 bajó
• Valor función objetivo 38,67 Sum squarred, es un valor mismo cuando estimamos en MCO
• Media 29.038 características básicas
• Un aumento unitario en la concentración del primer producto produce un aumento de 1,016 unidades de la
variable Y, es decir, un aumento de un 1,016 en la variable Y( en %)
• Un aumento unitario en la concentración del segundo producto produce un descenso de 1,86 unidades de la
variables Y, es decir, un descenso de un 1,86% en la variable Y
• Por último un aumento unitario en la concentración del tercer producto produce un descenso del 0,34% en
la variable Y
• La Constante de 39.15 es decir que las plantas de la empresa sobreviven 39,15%
• P- valor de prueba F es muy pequeño ( 0,000045) acepta la hipótesis nula osea una probabilidad alta (si
hay significancia en los parámetros )
• P- valor indiviual en el programa se ve Prob = 0,0001; 0,005;0,001; 0,59 sólo el último es mayor no es
significativo seria ,41% el resto sí entonces ésta variable se debería eliminar.
•Un modelo econométrico de proyección
de la demanda futura del flujo
vehicular en las concesiones en
trasporte
• En el presente artículo se propone una metodología que contribuya a la discusión de
proyección de la demanda futura del flujo vehicular de un proyecto de concesión, toda vez
que la demanda es una variable relevante para la toma de decisiones del Estado, en el
marco de las renegociaciones de los contratos de concesión. Al respecto, se propone una
metodología considerando una variante del “Modelo de Demanda de Viajes Basado en la
Elasticidades” y un “Modelo de Series de Tiempo No Estacionarias Multivariado”.
• UTEQ – QUEVEDO
CASO REGRESION LINEAL
• En el presente artículo se propone una metodología que contribuya a la discusión
de proyección de la demanda futura del flujo vehicular de un proyecto de
concesión, toda vez que la demanda es una variable relevante para la toma de
decisiones del Estado, en el marco de las renegociaciones de los contratos de
concesión. Al respecto, se propone una metodología considerando una variante
del “Modelo de Demanda de Viajes Basado en la Elasticidades” y un “Modelo de
Series de Tiempo No Estacionarias Multivariado”.
• UTEQ – QUEVEDO
Tráfico = f(PBI, Población )
• La explicación empírica hace referencia que a medida que se
incremente la actividad económica se incrementa el comercio, lo que
se deriva, finalmente, en un mayor tráfico vehicular; del mismo modo,
si la población se incrementa, entonces se incrementa la demanda del
uso vehicular y se incrementa el flujo del tráfico vehicular.
Significancia estadística en la variables
Análisis del caso básico
• Se evidencia que la población no presenta significancia individual ni al
10% de significancia ni una relación con consistencia teórica.
• Una explicación probable es que Estas zonas el incremento de la
población puede darse en zonas muy alejadas a la zona de análisis y si
el incremento de la población es por recién nacidos esto tiene un
impacto en el tráfico luego de varios años por tal motivo se omite
dicha variable del modelo.
• Por otro lado, el PBI real sí representa a una variable con alto poder
explicativo por lo que es determinante en el análisis y por ende en la
proyección del tráfico en la estación de Serpentín.
Hacia abajo borradores e
insumos
5.16
Estadístico t de student
(b2 - b2)
t = ~ t (T-2)
se(b2)
f(t)
(1-a)
a/2 a/2
-tc 0 tc t
Área roja = región de rechazo para pruebas de dos colas
5.4
Estimación de la Varianza
del Error
Estimador insesgado de la varianza del error:
S ^ 2
e
s
t
^2 =
T-2
(T - 2) s
s
^2
2
~ c T-2
5.15
(b2 - b2)
t =
se(b2)
s2 5.14
var(b2) =
S( xi - x )2
(b2 - b2)
donde Z =
var(b2)
s2
y var(b2) =
S( xi - x )2
5.7
Regresión Lineal Simple
y t = b1 + b 2 x t + e t donde E e t = 0
yt ~ N(b1+ b2x t , s 2)
dado que E yt = b1 + b2x t
e t = y t - b 1 - b2 x t
Entonces, e t ~ N(0,s 2) .
5.11
Distribución t de student
Z
t= ~ t(m)
V/m
Donde Z ~ N(0,1)
y V ~ c2
(m)
Antes de exponer el mecanismo preciso para la
construcción de los intervalos de confianza y de las pruebas
de hipótesis estadísticas debemos saber lo siguiente:
Conceptos importantes como:
probabilidad
distribuciones de probabilidad
errores tipo I y tipo II
nivel de significancia
potencia de una prueba estadística e intervalos de
confianza son cruciales para entender el material de este
capítulo y los siguientes.
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado
con una cierta probabilidad
Para poner en orden las ideas, consideremos el ejemplo de los salarios y el nivel de escolaridad
en la cual muestra que el incremento promedio estimado del salario medio por hora relacionado
con un año de aumento en la escolaridad (βˆ 2) es de e 0.7240, que constituye una cifra estimada
(puntual) del valor poblacional desconocido β2
Para ser más específi co, supongamos que se desea encontrar qué tan “cerca” está,
por ejemplo,βˆ2 β2. Con este fi n, se trata de encontrar dos números positivos, δ y α, este
último situado entre 0 y 1, de modo que la probabilidad de que el intervalo aleatorio
(βˆ2 − δ, βˆ2 + δ) contenga alverdadero β2 sea 1 − α. Simbólicamente,
Es muy importante conocer los siguientes aspectos de la estimación por intervalos:
1. La ecuación (5.2.1) no afi rma que la probabilidad de que β2 se encuentre entre los límites dados
sea 1 − α. Como se supone que β2, aunque se desconoce, es un número fi jo, se dice que está o no
está dentro del intervalo. La ecuación (5.2.1) establece que, al utilizar el método descrito en este
capítulo, la probabilidad de construir un intervalo que contenga β2 es 1 − α.
3. Como el intervalo de confi anza es aleatorio, los enunciados probabilísticos que le corresponden
deben entenderse en un sentido de largo plazo, es decir, para muestreo repetido.
En el capítulo 4, sección 4.3, demostramos que con el supuesto de normalidad de
ui, los estimadores de MCO βˆ 1 y βˆ 2 son en sí mismos normalmente distribuidos
con medias y varianzas allí establecidas. Por consiguiente, por ejemplo, la variable
como se anotó en (4.3.6), es una variable normal estandarizada. Por tanto, parece
que se puede utilizar la distribución normal para hacer afirmaciones
probabilísticas sobre β2, siempre que se conozca la verdadera varianza
poblacional σ2 . Si se conoce σ2 , una propiedad importante de una variable
normalmente distribuida con media µ y varianza σ2 es que el área bajo la curva
normal entre µ ± σ es cercana a 68%, que entre µ ± 2σ es alrededor de 95%, y que
entre los límites µ ± 3σ el área es cercana a 99.7%.
Pero pocas veces se conoce σ 2 y, en la práctica, está determinada por el
estimador insesgado σˆ 2 . Si se reemplaza σ por σˆ, (5.3.1) puede escribirse así
donde ee (βˆ 2) se refi ere ahora al error estándar estimado. Se demuestra (véase el
apéndice 5A, sección 5A.2) que la variable t, así definida, sigue la distribución t con n − 2 gl.
normal, se puede utilizar la distribución t para construir un intervalo de confianza para β2 de
la siguiente forma: Pr (−tα/2 ≤ t ≤ tα/2) 1 − α (5.3.3) donde el valor t en el centro de esta
doble desigualdad es el valor t dado por (5.3.2), y donde tα/2 es el valor de la variable t
obtenida de la distribución t para un nivel de significancia de α/2 y n − 2 gl; a menudo se
denomina el valor crítico t a un nivel de significancia α/2. Al sustituir (5.3.2) en (5.3.3) se
obtiene
Intervalo de confianza para β1 y β2 simultáneamente
Hay ocasiones en que se necesita construir un intervalo de confianza
conjunto para β1 y β2 tal que, para un coeficiente de confianza (1 − α)
de, por ejemplo, 95%, tanto β1 como β2 caigan al mismo tiempo
dentro de ese intervalo. Como este tema es complejo, el lector quizá
desee consultar referencias apropiadas.5
intervalo de confianza para β2
Prueba bilateral o de dos colas Para ilustrar el enfoque del intervalo de confianza, una vez más nos
referiremos al ejemplo de salarios y nivel de escolaridad. Por los resultados de la regresión obtenidos en la
ecuación (3.6.1), sabemos que el coéficiente de pendiente es 0.7240. Supongamos que se postula que
H0:β2 0.5
H1:β2 0.5
es decir, el verdadero coéficiente de la pendiente es 0.5 según la hipótesis nula, pero menor o mayor que 0.5
según la hipótesis alternativa. La hipótesis nula es una hipótesis simple, mientras que la hipótesis alternativa
es compuesta; y, en la práctica, se conoce como hipótesis bilateral. Con mucha frecuencia, dicha hipótesis
alternativa bilateral refleja el hecho de que no se tiene una expectativa a priori o teórica sólida sobre la
dirección en la cual debe moverse la hipótesis alternativa respecto de la hipótesis nula.
Prueba unilateral o de una cola
Algunas veces tenemos una expectativa a priori o teórica sólida (o existen expectativas basadas en algún
trabajo empírico previo) de que la hipótesis alternativa es unilateral o unidireccional, en lugar de ser
bilateral o de dos colas, como acabamos de analizar. Así, para el ejemplo de los salarios y el nivel de
escolaridad, se puede postular que
H0:β2 ≤ 0.5 y H1:β2 > 0.5
Quizás la teoría económica o el trabajo empírico previo indiquen que la pendiente es mayor que 0.5.
Aunque el procedimiento para probar esta hipótesis se deriva fácilmente de (5.3.5), se explica mejor el
mecanismo real en términos del método de prueba de significancia siguiente.
Prueba de hipótesis: algunos aspectos prácticos
Este método permite clasificar matemáticamente a través de diferentes preguntas como: ¿Qué
factores importan más? ¿Qué factores se pueden ignorar? ¿Cómo interactúan estos factores entre
sí?, y por último, ¿Qué tan seguro te siente de todos estos factores?
El proceso de realizar una regresión permite determinar con confianza cuáles son los factores más
importantes, cuáles se pueden ignorar y cómo influyen entre sí. Dichos factores se denominan
variables las cuales se clasifican en:
Variables dependientes
Variables independientes
10. Aplicación del análisis de regresión:
problemas de predicción
• Hay diversas formas de presentar los resultados de un análisis de regresión; sin embargo, en este
texto utilizaremos el siguiente formato, con el ejemplo de los salarios y el nivel de escolaridad del
capítulo 3 a manera de ilustración:
• Yi =−0.0144 + 0.7240Xi