0% encontró este documento útil (0 votos)
44 vistas42 páginas

Modelos de Regresión Cualitativa y Probabilidades

Este documento presenta información sobre modelos de regresión cualitativa y modelos logit. Explica conceptos como variables dicotómicas y polictómicas y diferentes modelos como el modelo de probabilidad lineal y el modelo logit-probit. También cubre temas como la interpretación de coeficientes y odds ratios en estos modelos.

Cargado por

daniela.casallas
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
44 vistas42 páginas

Modelos de Regresión Cualitativa y Probabilidades

Este documento presenta información sobre modelos de regresión cualitativa y modelos logit. Explica conceptos como variables dicotómicas y polictómicas y diferentes modelos como el modelo de probabilidad lineal y el modelo logit-probit. También cubre temas como la interpretación de coeficientes y odds ratios en estos modelos.

Cargado por

daniela.casallas
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Clase 16 de Marzo de 2023

Cap. 15 Modelos de regresión de respuesta cualitativa. (pag 541)

E(Y/Xi) = Y = B0 + B1X1 + B2x2 + … + Bkxk + u

Y, es la variable cuantitativa (V. endógena, regresada, dependiente)


X1, son variables cuantitativas o cualitativas (v. explicativas)

Ahora vamos a ver cuándo Y, sus valores toman algunos atributos o categorías, si esta variable
cualitativa tiene dos atributos, entonces
2 atributos  V. dummy, v. dicótoma, v. ficticia, v. indicadora, v. binaria
Ejemplos: es pobre, no es pobre, zona rural, zona urbana
2 atributos  V. Policótoma
Ejemplos: Estado civil (Soltero, casado, unión libre, otro)
Estrato socioeconómico (I, II, III, IV, V, VI)

Cuando la variable respuesta es una variable cualitativa.

Modelos
V. respuesta dicótoma  1 – atributo tiene presencia
 0 atributo no tiene presencia el suceso esta ausente.

MODELO LINEAL DE PROBABILIDAD

E(Y/X) = Pr (Y =1/Xi) = Yi = B0 + B1X + Ui

Cuál es la probabilidad que una familia tenga casa dado sus ingresos
Yi  es la probabilidad de que una familia tenga casa propia dado sus ingresos.
1 -> Si tiene casa propia  Pi
0 -> No tiene casa propia  (1 – Pi)
X  Ingresos

Pi ~ Bernulli (no tiene distribución normal), Es equivalente a que y

E[Pi = 1Pi + 0 * (1 -Pi)


= Pi +0
=Pi

Ed E[Y/Xi = Pi = B0 + B1X + Ui
Var (Y) = n (1 -Pi)

Supuesto
1) 0 < E [ Y/Xi
2) Las perturbaciones o los errores no se distribuyen normal, solo cuando la muestra es grande se
distribuye normal, de lo contrario los errores se distribuyen bernulli
Ui ~ Bernulli  Ui = Yi = B0 – B1Xi con Prob Pi
3) La varianza de los errores es heteroscedastica.
Para corregir el modelo se pondera por la desviación estándar, si la varianza de los errores son
iguales.
Var(Ui) = Pi ( 1 -Pi)

Desviación estándar
[Link] (Ui) = √Pi (1 – pi) = √wi
Yi/√wi = B0/√wi + B1Xi/√wi + Ui/√wi

4) No Cumplimiento: 0 < E [Y = 1 / Xi < 1


Cuando Pi < 0  Pi = 0
Cuando Pi > 1 =

Tarea
Modelos probid, dicótomos binomiales

Clase - 11 de abril

P(Y = 1/X) = Bo + B1Xi +Ui


0<p<1

0 -> Negativo
1 -> Positivo >1 Problema modelo probilineal

Para corregir el problema de que los predictores del modelo de regresión de probabilidad lineal
sean negativos o mayores que 1. Surge el modelo de probabilidad logit – i . Probit -> binominal

Si Y = l 1
0 o logit multinomial Si y = 1 - Categorías
2
3
4
a partir del modelo p = Bo + B1Xi + Ui aplicamos modelo exponencial

P = eBo+B1Xi+Ui
----------------------------------
1 + eBo+B1Xi+Ui

Pi = eBo+B1Xi+Ui
-------------------------------------------------------

1 + eBo+B1X1+B2X2+ BkXk+Ui
P = ez
___________________
Modelo no lineal
1 + ez

Si linealiza aplicando log. natural a ambos lados de la igualdad.

Ln P = ln ( ez
___________________ )
1 + ez

Ln P = ln ez - ln (1 + ez )
Ln P = Z – ln ( 1 + p)
Ln p + ln (1+p) = Z
Ln (P(1+p) = Z

Ln (xy) = Lnx + Lny

P = P (Y = 1) Probabilidad de éxito

1 – P = P (y = 0) probabilidad de

Ln (P/1 – P1) = eBo+B1X1+…BkXk


tasa de riesgo

eln(p/1 -P) = eBo+B1X1+..+BkXk

P / 1 – P = eBo+B1X1+..+BkXk

P / 1 – P  tasa de riesgo

Ejercicio
Se mira la dirección de la probabilidad, si es inferior 0.05 no es significativa. Si hay distribución
Coef. = 
P valor = 
Chi2 = 
Seudo R2 = 5 

Edad es negativa que entre mayor edad menor es la probabilidad que la mujer este inmersa en el
trabajo.
Entre mayor educación tenga la mujer va tener mayor probabilidad de estar trabajando.
Entre mayor experiencia tenga la mujer va tener mayor probabilidad de que tenga empleo.

Investigar sobre:
- Ods radio = tasa de riesgo (Interpretación)

Ods radio > 1 existe mayor probabilidad de que ocurra el suceso a que no ocurra
<1 Existe menor probabilidad de que ocurra el suceso a que no ocurra
= 1 Existe igual probabilidad de que ocurra o no ocurra el suceso

D  Acertó
-D  No acertó

Correctly classsified  73.44% significa que a partir de 70%


Predicción = -6974534 significa

Clase 13/04/2023
Interpretación del modelo

Kidsage6  no es una variable significativa de acuerdo a su P>lzl = 0.504

Esta variable nos dice en Coef.  0.0494 que si una mujer tiene hijos entre los 6 a 18 tiene más
posibilidades de emplearse.
Debe ser menos Chi2 al 0.05, en este caso es 0.000

Coef 2.4 veces de que no ocurra

a) Odds Radio

P/1-P = Odds Radio = 1 probabilidad de que ocurra y no ocurra


> 1 La Probabilidad de que ocurra (1-P)
<1 Probabilidad de que ocurra suceso es menor que la probabilidad de que no ocurra.

b) Efectos marginales

Interpretación de los coeficientes

dy/dx

1. Si tienen hijos menores a 6 años con un coeficiente -0.25, quiere decir que se reduce la
probabilidad de conseguir empleo en un 25%

2.
Estat

Correctly  significa que se esta corrigiendo el modelo en un 73.57%

Sensibilidad- empieza en 1 (línea azul)


Especificidad – empieza en 0 (línea roja)

0.53
Este resultado lee la probabilidad

Are under ROC curve =0.7964


Es el poder predecir en un 79% (si un modelo está por debajo de 60 significa que no sirve para
predecir)

Se utiliza probit cuando la distribución de los datos tiene una distribución normal.
Se utiliza Logit cuando
interpretar P>lzl

Los resultados

La probabilidad dy/dx en:


Kidslt6  se reduce la probabilidad en un 26%
Clase 18 – 04 -2023

Y = [ V. cualitativa con mas de 2 categorias depende

En los modelos Logit Multinomiales: Se caracteriza por que la variable dependiente Y = toma
más de una categoría

1 – cuando ocurre el suceso


0 – cuando no ocurre el suceso

P (Y = 1
2
3

Ejercicio:
Se cargan los datos de una cuesta realizada para verificar porque las personas de la ciudad de
Medellín prefieren el Metro en lugar de otros medios de transporte, con el fin de implementar
unas políticas públicas en Medellín.

- Genero
- Ocupación
- Estrato
- Rango de edad

 = Bo + B1genero + B2estrato + B3ocupación + B4Edad + Ui


Se interpreta lo que sea menor a 0.05

Ejemplo:

0.000  menor probabilidad de ir en metro

La probabilidad esta entre 0 y 1, ejemplo -3.360042 solo se lee el signo, en este caso tienen
menor probabilidad.

El modelo se puede evaluar con Chi2


En general la mayor probabilidad de las categorías se la categoría ocho, prob8,
MODELOS DE RECUENTO

Y = 0, 1, 2, 3, 4 …n

bajo poisson se puede evidencia que Chi2 es significativo  el valor es menor a 0.05,
Chi2 = 0.00
Buscar datos en el DANE, en la encuesta de consumo cultural, actividades o hogar

Logi binomial
Logit
Modelo Poisson – encuesta de consumo cultural (lectura de libros)
Modelo multinomial (

Utilizar la base de datos de Excel BASE DE DATOS Logit probit 


Clase 27/04/2023

MODELOS ECONOMÉTRICOS DINÁMICOS: MODELOS AUTORREGRESIVOS Y DE REZAGOS


DISTRIBUIDOS

En el análisis de regresión con datos de series de tiempo, cuando el modelo de regresión


incluye no sólo valores actuales sino además valores rezagados (pasados) de las variables
explicativas (las X), se denomina modelo de rezagos distribuidos, ejemplo:

Si el modelo incluye uno o más valores rezagados de la variable dependiente entre sus
variables explicativas, se denomina modelo autorregresivo, Así:

1. ¿Cuál es el papel de los rezagos en economía?


2. ¿Con qué razones se justifican los rezagos?
3. ¿Existe alguna justificación teórica para los modelos rezagados comunes en la econometría
empírica?
4. ¿Cuál es la relación, si acaso, entre los modelos autorregresivos y los modelos de rezagos
distribuidos? ¿Pueden derivarse unos de otros?
5. ¿Cuáles son algunos problemas estadísticos relacionados con la estimación de tales
modelos?
6. ¿La relación adelantada-rezagada entre variables implica causalidad? De ser así, ¿cómo se
mide?
0.059/1.031 =
Modelo Koyck

¿Cuántos periodos se necesitarían para gastar el ingreso?


b0*1/1
MODELOS POISSON: Es un modelo no lineal

Son modelos de recuento, la variable dependiente es una variable conteo, es decir cuantas
veces ocurre un evento, pe

Y toma valores ejem:


Y= 0, 1, 2, 3… n, no muy alto

La variable Y es una variable discreta que no toma valores negativos.


Ej: el numero de libro leídos en un año, numero de visitas de idas al odontólogo, numero
de accidentes automovilísticos en un año.

λ  Es un promedio (# de veces de que ocurra un suceso)

Nota: La variable dependiente toma valores de 0 hasta n… pero de forma discreta es decir
no acepta valores (continuos, fraccionarios, decimales)

Clase 2-05-2023

Modelos: Expectativas adaptativas y Ajuste

¿en que porcetaje es la participación de las expectativas adaptativas?


Clase 4 -05-2023

unir las dos ecuaciones:

Ct = B0 + B1(C + I) +ut
Yt = (B0 + B1 Yt + ut) + B2I
Yt = B0 + B1Yt + B2I + Ut
Yt - B1Yt = B0 + B2I +Ut
Yt = B0 + B2It + ut/ 1-B1

Para unir las dos ecuaciones bilaterales, podemos reemplazar Ct en la segunda ecuación
con la primera ecuación de la siguiente manera:

Yt = Ct + It

Yt = β0 + β1Yt + ut + It
A continuación, podemos reorganizar esta ecuación para obtener una expresión en
términos de Yt:

Yt - β1Yt = β0 + ut + It

Factorizando Yt, obtenemos:

Yt(1 - β1) = β0 + ut + It

Finalmente, despejando Yt, obtenemos:

Yt = (β0 + ut + It) / (1 - β1)

Clase 9-05-2023

1. Estimación necesaria y suficiente del modelo

Necesarias: se identifica el modelo

K  indica número de variables predeterminadas en el modelo + el intercepto.


k  numero de variables predeterminadas en la ecuación
M  numero de variables endógenas, en el modelo

Si K-k = M – 1  la ecuación esta exactamente identificada. Se puede aplicar mínimos


cuadrados indirectos

Además, se mira el rango de la matriz:

1. Si el rango de la R(A) = M – 1  Condición suficiente


2. Si K – k > M-1 y R(A) = M-1  La ecuación esta sobreidentificada, se aplicados mínimos
cuadrado en dos etapas
3. Si K – k ≥ M-1 y R(A) < M -1  La ecuación esta subidentificada, se aplica mínimos
cuadrado indirectos.
4. Si K- k < M – 1 y R(A) < M-1  La ecuación no está identificada, no tiene solución.
5. Cuando las variables están causadas en una sola dirección y la ecuación son
independientes entonces se aplica mínimos cuadrado ordinarios

Para el escenario 1 y 2 se aplica que técnica de estimación

Ejercicio: el modelo macroeconómico keynesiano definido por

Ct = β0 + β1Yt + Et (1)
Yt = Ct + It (2)
M = Endógenas (variable dependiente), hay variables endógenas como ecuaciones halla.
K = Predeterminadas, (varibale independiente

m=1 =1
2 =1

2. REDUCCIÓN DEL MODELO  Método de sustitución

Ct = β0 + β1 Yt + Et (1)
Yt = Ct + It (2)
- Remplazamos la ecuación 2 en la ecuación 1
Ct = β0 + β1t (Ct + It) + Et
- Desperajar el paréntesis
Ct = β0 + β1Ct + β1It + Et
Ct - β1Ct = β0 + β1It + Et
Ct (1 – β1) = β0 + β1I + Et
Ct = β0 + β1It + Et / (1 – β1)
Ct = β0 / (1 – β1) + β1/ 1 – β1 * It + Et / (1 – β1)
Ct = π0 + π1 * It + Vt

3. PRUEBA DE SIMULTANIEIDAD  Prueba de Hausman


Estimar una ecuación reducida
1) Ct = π0 + π1It + Vt M.C.O

con la 2ª ecuación reducida se estima por M.C.O agregando la variable Vt residuos


estimados:
2 ) Yt = π2 + π3 It + Wt –> reducida
Yt = π2 + π3 It + λ Vt (V estimada) + Wt
Ho : No hay problema de simultaneidad
Ha : Existe problema de simultaneidad

Decisión si λ es significativo  se rechaza H0 se cponcluye que existe problemas de


simultaneidad

4. PRUEBA DE EXOGENEIDAD:
Estime unas de las ecuaciones reducidas por M.C.O, obtenga los residuales y los
predichos.
Con la ecuación original restante y agregue la variable predicha el modelo y estime
M.C.O

La ecuación (2) Yt = π2 + π3 It + Wt  M.C.O


Yt (Y estimada)  predicho V. dependiente
estimar ecuación original restante agregando esta variable predicha:

Ct =

No hay problemas de simultaneidad,


Se acepta Ha

H0: No Significativo (si no es significativo se rechaza H0)


HA: Significativo (Si es significativo se acepta Ha)
pib predicho se acepta la Ha

Estimar por mínimos cuadrados ordinarios y en dos etapas


Solo fue significativo el PIB, el modelo en dos etapas es significativo
Capitulo 21
No es estacionaria
los dos tienen dinámica creciente, las dos series tienen problemas de estacionariedad.
Tiene tendencia y cotendencia.
todad las barritas debería quedar dentro de la región gris que es el intervalo para que
sea estacionaria, pero hay muchas barritas por fuera quiere decir que esta
autocorrelacionado, sospechamos que esta serie tiene problemas de estacionariedad.
0.7457 > 0.05 no rechazo H0 la serie no es estacionaria,

¿Cómo la volvemos estacionaria?

Se rechaza la hipótesis nula, se acepta la hipótesis alternativa


Rt = Β0+β1Mt+ β2Yt+u1t

Yt = α0+ α1Rt+α2It+u2t

Clase 23-05-2023

La prueba de Dickey-Fuller busca determinar si una serie de tiempo tiene una raíz unitaria, lo que
implica que la serie es no estacionaria.

La estacionariedad es importante en el análisis de series de tiempo, ya que muchas técnicas y


modelos requieren que las series sean estacionarias para ser válidas.

H0: No es estacionaria - tiene raíz unitaria


Ha: Es estacionaria.
Si el valor p-value < nivel de significancia, se sugeriría evidencia para rechazar la hipótesis nula de
no estacionariedad y concluir que la serie de tiempo es estacionaria.

H0 : la variable tiene raíz unitaria (no es estacionaria)

Prueba de Granger

si el R2 > durbin Watson la regresión espuria (no es verdadera)


Es espuria R2 > dwatson
No es espuria 0.11 < 2.28

¿La serie esta cointegrada, ósea en equilibrio a largo plazo?

H0: Los errores son ruido blanco.


Ha: Los errores no son ruido blanco

Clase anterior la prueba de granyer fue para determinar equilibrio a corto plazo, la clase de hoy
con la prueba de granyer es para determinar el equilibrio a largo plazo.
Clase 25-05-2023

H0: La serie no es estacionaria lo que quiere decir que tiene raíz unitaria.
Ha: Es estacionaria

0.98 > 0.05 No se rechaza H0, y por lo tanto se acepta H0 y se rechaza Ha

H0: Los residuos son independientes lo que quiere decir son ruido blanco
Ha: Los residuos son independientes lo que quiere decir No son ruido blanco.

Prob > 0.05 se acepta H0

tiene tendencia creciente , lo que quiere decir que no es estacionaria,


por esto vamos a utilizar diquifuller para que sea estacionaria
con cero lags, 0.6998 > 0.05

ahora con 10 lags 0.1759 > 0.05


Se deben comprar todos los ic, se ecoge el menor, por tanto este es el mejor modelo se escoge el
arima 1 1 1

vamos a pronostica con este valor.


H0: Los errores son ruido blanco.
Ha: los errores No son ruido blanco

comparamos este valor con 0.05


0.1019 > 0.05, este resultado quiere decir que se acepta H0, por lo tanto sirve para predecir,

Clase 30-05-2023

Modelo VAR – Exposición

También podría gustarte