Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APLICACIÓN EN R
ámbito de econometría 1, queremos otorgar estas herramientas principales para iniciar este curso
investigaciones que aporten al aprendizaje total de esta área tan importante. Damos aporte final
de lo que fue nuestro curso de econometría 1 indicando que se tomaron y se evaluaron todos los
ítems de análisis.
Agradecimientos
Gracias al profesor Jorge Mario Salcedo Mayorga encargado de transmitir todos sus
modelos que permiten comprender de manera práctica y sencilla muchos factores de nuestra vida
común , damos gracias por todo su apoyo durante el semestre , por su paciencia , nos permite
La toma de decisiones en muchos contextos tanto sociales como naturales se basa con
frecuencia en el análisis de datos. Los datos reflejan el funcionamiento real de un sistema cuyo
La econometría aplicada moderna trata de como analizar datos para responder a preguntas
exactitud o de prever con absoluta certeza. Los métodos estadísticos y matemáticos que se
utilizan en la
econometría aplicada para analizar datos conforman lo que se denomina econometría teórica o
métodos econométricos.
aleatorias de los valores de algunas de las variables, incluidas en el modelo. Dicho de otro modo,
homocedastica, y otra parte variable según los valores de una determinada variable. Es muy
probable que esta asociación entre el proceso de heterocedasticidad y las variables no sea
Decision-making in many social and natural contexts is often based on data analysis. Data
reasonable decisions. Modern applied econometrics is about how to analyze data to answer
various questions about systems whose operation is impossible to characterize with complete
accuracy or to foresee with absolute certainty. The statistical and mathematical methods used in
economic methods. The origin of the heteroskedasticity is associated with the increasing
variance of the random perturbations of the values of some of the variables included in the
model. In other words, you could suppose that the variance of the disturbance is made up of a
constant, homoscedastic part, and another variable part according to the values of a determined
variable. This association between the heteroscedasticity process and the variables is very likely
not evident. The detection of heterocesdasticity in most of the procedures is useful to establish
Dedicatoria.................................................................................................................................iii
Agradecimientos.........................................................................................................................iv
Resumen......................................................................................................................................v
Abstract.......................................................................................................................................vi
Capítulo 1.........................................................................................................................................1
Introducción.................................................................................................................................1
Estadístico de Wald.....................................................................................................................2
Estadístico F robusto a la heterocedasticidad..........................................................................2
Cálculo de pruebas ML robustas a la heterocedasticidad........................................................3
Un estadístico ML robusto a la heterocedasticidad:................................................................5
Estadístico ML robusto a la heterocedasticidad......................................................................5
Factores que influyen en la productividad...................................................................................7
Consumo de materias primas (cosmate)..................................................................................7
Proxy del capital (activdef)......................................................................................................8
Consumo de energía eléctrica (eelec)......................................................................................8
Los trabajadores calificados (calificado).................................................................................8
Trabajadores no calificados (no calificado).............................................................................8
Prueba f....................................................................................................................................8
Prueba de shapiro-wilk..............................................................................................................10
Prueba de kolmogorov-smirnov................................................................................................11
Lilliefors (Kolmogorov-Smirnov) normality test......................................................................12
Lilliefors (Kolmogorov-Smirnov) normality test......................................................................12
Lilliefors (Kolmogorov-Smirnov) normality test......................................................................12
Lilliefors (Kolmogorov-Smirnov) normality test......................................................................13
Lilliefors (Kolmogorov-Smirnov) normality test......................................................................13
Prueba de shapiro-francia..........................................................................................................13
RESET test.............................................................................................................................15
Capítulo 2...................................................................................................................................15
Forward vamos a arrancar con 0 variables................................................................................16
Dos variables.........................................................................................................................16
Tres variables.........................................................................................................................17
Backward...............................................................................................................................17
Dummy origin........................................................................................................................19
Identificar colinealidad..........................................................................................................21
Analysis of Variance Table...................................................................................................21
vif(modelo_multiple).............................................................................................................21
Shapiro-Wilk normality test..................................................................................................22
Bibliografía....................................................................................................................................23
Lista de tablas
Tabla 1.............................................................................................................................................7
Tabla 2.............................................................................................................................................9
Tabla 3...........................................................................................................................................16
Tabla 4...........................................................................................................................................16
Tabla 5...........................................................................................................................................17
Tabla 6...........................................................................................................................................17
Tabla 7...........................................................................................................................................18
Capítulo 1
Introducción
procedimientos es útil para establecer algún tipo de solución que permite corregir este
entre ambas variables, la dispersión entre las variables debe ser aleatoria para evitar
restricción implica que los valores de la muestra de la variable dependiente (𝑦) son
iguales las varianzas de los errores (𝜐), para los distintos valores de (𝑥), es decir, la
estadístico Abraham Wald. Siempre que una relación dentro de o entre los elementos de
datos se puede expresar como un modelo estadístico con los parámetros a estimar a partir
de una muestra, la prueba de Wald se puede utilizar para poner a prueba el verdadero
valor del parámetro basado en la estimación de la muestra. Sea como sea, el uso de
sencillo debido a que, actualmente, muchos paquetes para econometría calculan estos
Suponga que se desea probar la hipótesis nula de que, una vez controlados los demás
factores, no existen diferencias en cumgpa de acuerdo con la raza esto se indica como:
H 0 : β ¿=0 , β ¿=0
El estadístico F usual se obtiene fácilmente, una vez que se tiene la R-cuadrada del
heterocedasticidad resulta ser .75, que sólo difiere ligeramente del de la versión no
robusta. El valor-p para la prueba robusta es .474, que no está próximo a los niveles de
significancia estándar. Con ninguna de las pruebas puede rechazarse la hipótesis nula.
heterocedasticidad. Por tanto, a veces es conveniente contar con una manera de obtener
facilidad usando casi cualquier paquete para regresión. Para ilustrar el cálculo del
y=β 0 +¿ β 1 X1 +β 2 X 2+ β3 X3 +β 5 X 5+ μ ¿
y suponga que se desea probar H 0 : β 4=0 , β 5=0 Para obtener el estadístico ML,
primero se estimará el modelo restringido (es decir, el modelo sin x4 ni x5 ) para obtener
los residuales, u˜. Después, se regresa u ˜ sobre todas las variables independientes y ML
Obtener una versión robusta a la heterocedasticidad requiere aún más. Una manera de
calcular el estadístico requiere sólo regresiones de MCO. Se necesitan los residuales, por
las variables independientes excluidas bajo la hipótesis nula se regresa sobre todas las
algo extraño, pero es, después de todo, sólo un recurso de cálculo. Se corre la regresión
de:
1 sobre r ˜ 1u ˜ , r ˜ 2 u ˜ ,
sin intercepto. Sí, efectivamente, se define una variable dependiente igual al valor uno
para todas las observaciones. Esta variable se regresa sobre los productos r ˜ 1 u ˜ y r ˜ 2
−¿¿
u ˜. El estadístico ML robusto resulta ser n SRC1 , donde SRC1 es la suma usual de
Básicamente, esto es hacer con la prueba del ML lo que los errores estándar robustos
hacen con la prueba de t. [Vea Wooldridge (1991b) o Davidson y MacKinnon (1993) para
2. Regresar cada una de las variables independientes excluidas bajo la hipótesis nula
sobre todas las variables independientes incluidas; si hay q variables excluidas, esto
3. Obtener los productos entre cada r ˜ j y u ˜ (para todas las observaciones). 4. Correr la
aproximadamente 2 q.
[.040][.034][.0101][.00021]
(.0087)(.0144)(.00034)
[.0062][.0142][.00023]
(.045)(.040)
[.058][.040]
n=2,725 , R 2 .0728 .
En este ejemplo, hay más diferencias sustanciales entre algunos de los errores estándar
usuales y los errores estándar robustos. Por ejemplo, el estadístico usual t para avgsen2
-2.48. Así, avgsen2 es más significativa empleando el error estándar robusto. El efecto de
avgsen sobre narr86 es un poco más difícil de reconciliar. Dado que es una relación
cuadrática, es posible imaginar dónde avgsen tiene efecto positivo sobre narr86 y dónde
recuérdese que esto se mide en meses. Literalmente, esto significa que narr86 está
relacionada positivamente con avgsen cuando avgsen es menor a 17 meses; entonces
avgsen tiene el efecto disuasivo previsto después de 17 meses. Para ver si la longitud
(vea la sección 5.2), se obtiene ML 3.54; en una distribución ji-cuadrada con dos gl, esto
valor-p .135. Ésta aún no es una evidencia muy fuerte contra H0 ; avgsen no parece tener
un efecto fuerte sobre narr86. [Incidentalmente, cuando avgsen aparece sola en (8.9), es
Tabla 1
Modelo log-log
Call:
lm(formula = log(PRODUCDEF) ~ log(CONSMATDEF) + log(EELEC) +
log(ACTIVDEF) + log(Calif1) + log(Ncalif1), data = sector_lacteo)
Residuals:
Min 1Q Median 3Q Max
-0.62616 -0.16737 -0.03384 0.11772 1.70932
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.66679 0.13371 12.466 < 2e-16 ***
log(CONSMATDEF) 0.74261 0.01318 56.363 < 2e-16 ***
log(EELEC) 0.12364 0.01436 8.612 < 2e-16 ***
log(ACTIVDEF) 0.06541 0.01060 6.173 1.28e-09 ***
log(Calif1) 0.09746 0.01199 8.131 2.75e-15 ***
log(Ncalif1) 0.02213 0.01585 1.396 0.163
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
16 < 0.05) por lo que la variable es estadísticamente significativa de las materias primas
(1.28e-9< 0.05) por lo que la variable es estadísticamente significativa del proxy del
capital.
eléctrica
(2.753-16 < 0.05) por lo que la variable es estadísticamente significativa los trabajadores
calificados
B. Realice las pruebas de Breush y Pagan, así como la prueba de White, muestre los
Heterocedasticidad?
data: reg
BP = 49.805, df = 5, p-value = 1.519e-09
P-Valor = 1.519 e-09 muy pequeño por lo que es menor al 0,05 rechazamos la hipótesis
Tabla 2
#White test
Call:
lm(formula = resid(reg)^2 ~ fitted(reg) + I(fitted(reg)^2))
Residuals:
Min 1Q Median 3Q Max
-0.08190 -0.06479 -0.04066 0.00815 2.83991
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.951750 0.442768 -2.150 0.0320 *
fitted(reg) 0.127169 0.055171 2.305 0.0215 *
I(fitted(reg)^2) -0.003911 0.001702 -2.297 0.0220 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
robustos explicando el proceso de forma teórica como se vio en clase e interpretando los
nuevos resultados.
una técnica muy sencilla. podemos observar que cambian un poco el p-valor de cada una
de las variables respecto con el error estándar tradicionales. Las variables son muy
Wilks, Shapiro Francia, KS, etc.), explique de forma teórica y presente los resultados
Prueba de shapiro-wilk
crítico proporcionado por la tabla elaborada por los autores para el tamaño muestral y el
“No es necesario realizar prueba para la base de datos ya que como son para muestras
Prueba de kolmogorov-smirnov
50.
data: sector_lacteo$EELEC
P-valor nos permite rechazar la hipótesis nula ya que 2.2e-16 es menor al alfa de 0.05
(2.2e-16 < 0.05) por lo que la variable no tiene normalidad en la energía eléctrica.
data: sector_lacteo$ACTIVDEF
P-valor nos permite rechazar la hipótesis nula ya que 2.2e-16 es menor al alfa de 0.05
(2.2e-16 < 0.05) por lo que la variable no tiene normalidad en el proxy del capital
data: sector_lacteo$CONSMATDEF
D = 0.31791, p-value < 2.2e-16
P-valor nos permite rechazar la hipótesis nula ya que 2.2e-16 es menor al alfa de 0.05
(2.2e-16 < 0.05) por lo que la variable no tiene normalidad en las materias primas
data: sector_lacteo$Ncalif1
P-valor nos permite rechazar la hipótesis nula ya que 2.2e-16 es menor al alfa de 0.05
(2.2e-16 < 0.05) por lo que la variable no tiene normalidad en los trabajadores no
calificados.
data: sector_lacteo$Calif
P-valor nos permite rechazar la hipótesis nula ya que 2.2e-16 es menor al alfa de 0.05
(2.2e-16 < 0.05) por lo que la variable no tiene normalidad en los trabajadores
calificados.
Prueba de shapiro-francia
Es una prueba estadística para la normalidad de una población, en base a datos de la
muestra. Fue introducido por SS Shapiro y RS Francia en 1972 como una simplificación
mejor, pero en la práctica las variantes de Shapiro-Wilk y Shapiro-Francia son casi igual
A. Investigue en que consiste la prueba de Reset de Ramsey para determinar sesgo por
variable omitida, cuál es su forma teórica e interprete los resultados para la base de datos
adjunta.
Una medida empírica para verificar la existencia de una forma funcional inadecuada es la
efectúa una regresión auxiliar en la que al modelo original se adicionan los términos Yi ˆ
data: reg
del sector manufacturero cuenta con una forma funcional inadecuada, es decir se acepta
Capítulo 2
lmtest), estime un modelo que determine como variable dependiente el precio o las millas
Tabla 3
Una variable
Call:
lm(formula = Price ~ Min.Price, data = Cars93)
Residuals:
Min 1Q Median 3Q Max
-3.4903 -1.3775 -0.4157 0.8945 13.7965
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.15138 0.53527 2.151 0.0341 *
Min.Price 1.07197 0.02787 38.468 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tabla 4
Dos variables
Call:
lm (formula = Price ~ Min.Price + Max.Price, data = Cars93)
Residuals:
Min 1Q Median 3Q Max
-0.050320 -0.000458 0.003157 0.004167 0.054450
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.0052010 0.0068482 -0.759 0.45
Min.Price 0.5003537 0.0008246 606.758 <2e-16 ***
Max.Price 0.4998382 0.0006539 764.452 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.02917 on 90 degrees of freedom
Multiple R-squared: 1, Adjusted R-squared: 1
F-statistic: 5.044e+06 on 2 and 90 DF, p-value: < 2.2e-16
Tabla 5
Tres variables
Call:
lm(formula = Price ~ Min.Price + Max.Price + Man.trans.avail,
data = Cars93)
Residuals:
Min 1Q Median 3Q Max
-0.060170 -0.002325 0.001600 0.010311 0.053160
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.0186863 0.0094615 -1.975 0.0514 .
Min.Price 0.5008934 0.0008533 587.033 <2e-16 ***
Max.Price 0.4996156 0.0006521 766.141 <2e-16 ***
Man.trans.availYes 0.0138995 0.0068518 2.029 0.0455 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.02868 on 89 degrees of freedom
Multiple R-squared: 1, Adjusted R-squared: 1
F-satisfice: 3.479e+06 on 3 and 89 DF, p-value: < 2.2e-16
Después de realizar la interacción con distintas variables se puede que todas las
variables que existen 3 variables que son relevantes para el modelo que son Min.Price,
Tabla 6
Backward
Call:
lm(formula = Price ~ Min.Price + Max.Price + MPG.city + MPG.highway +
EngineSize + Horsepower + RPM + Rev.per.mile + Man.trans.avail +
Passengers + Wheelbase + Width + Turn.circle + Rear.seat.room +
Luggage.room + Weight, data = Cars93)
Residuals:
Min 1Q Median 3Q Max
-0.060631 -0.011265 0.000749 0.011760 0.064099
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.510e-03 1.551e-01 0.042 0.9667
Min.Price 5.012e-01 1.122e-03 446.741 <2e-16 ***
Incluimos todas las variables, pero podemos observar que existe que no son estadísticas
significancias varias.
Tabla 7
Residual:
Min 1Q Median 3Q Max
-0.060170 -0.002325 0.001600 0.010311 0.053160
Coeficientes:
Estímate Sed. Error t value Pr(>|t|)
(Intercepta) -0.0186863 0.0094615 -1.975 0.0514.
Min.Price 0.5008934 0.0008533 587.033 <2e-16 ***
Max.Price 0.4996156 0.0006521 766.141 <2e-16 ***
Man.trans.availYes 0.0138995 0.0068518 2.029 0.0455 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Después de haber realizado las interacciones podemos concluir que las variables
resultantes son Min.Price, Max Price, Man.trans. availyes lo cuales son significativos
Claro es de gran importancia para obtener el mejor modelo y tenemos que fijarnos de
AIC para tomar una decisión es de gran importancia para conocer las variables que
afectan en el precio.
C. Construya una variable dummy para la variable origin. Que tome el valor de 1 si el
Dummy origin
Residuals:
Min 1Q Median 3Q Max
-12.509 -7.173 -2.109 2.791 41.391
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 18.573 1.395 13.316 <2e-16 ***
Originnon-USA 1.936 2.005 0.966 0.337
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residuals:
Min 1Q Median 3Q Max
-12.875 -5.851 -0.636 4.864 32.004
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 27.181 2.123 12.803 < 2e-16 ***
Originnon-USA 2.715 1.660 1.635 0.10548
AirBagsDriver only -7.220 2.337 -3.089 0.00268 **
AirBagsNone -15.445 2.424 -6.372 8.04e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Response: Price
Df Sum Sq Mean Sq F value Pr(>F)
Min.Price 1 8086.7 8086.7 9.7678e+06 < 2e-16 ***
Max.Price 1 497.2 497.2 6.0058e+05 < 2e-16 ***
Man.trans.avail 1 0.0 0.0 4.0877e+00 0.04623 *
EngineSize 1 0.0 0.0 4.0670e-01 0.52530
Residuals 88 0.1 0.0
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1
vif(modelo_multiple)
y Aplica : http://www.ub.edu/aplica_infor/spss/cap5-6.htm
https://www.zonaeconomica.com/definicion/rendimientosescala
https://es.qwe.wiki/wiki/Shapiro%E2%80%93Francia_test
Jorge Mario Salcedo Mayorga. (2020). Econometria 1 Base datos Excel. Bogota.
Obtenido de
https://economia.uniandes.edu.co/files/profesores/ramon_rosales_alvarez/docs/ec
onometria1/documentos%20de%20clase/Introduccion_.pdf
Cengage learning.