Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea 3 - Karen Jiménez - Grupo 16
Tarea 3 - Karen Jiménez - Grupo 16
Presentados Por:
C.c. 1075318907
ECACEN - Economía
Econométrica
Grupo N° 16
Ibagué - Tolima
Octubre 2021
Violación de Supuestos Básicos
2. Responder:
Dentro del modelo econométrico se puede cometer dos errores: El primero es el error de
especificación del modelo y el segundo error de especificación incorrecta del modelo. La
exclusión de una variable relevante, la acogida de la forma funcional errónea, la incorporación de
una variable innecesaria, errores en la medición, entre otros factores similares son la esencia del
error de especificación del modelo que se tiene en mente es verdadero, pero este no es aplicado o
estimado correctamente. Por otro lado, para el error de especificación incorrecto no se tiene
mucha claridad, pues no se tiene conocimiento de cuál es el modelo verdadero. (Gujarati 2009
página 470), dice que la especificación incorrecta del término de error estocástico y la suposición
de que el termino de error esta normalmente distribuido pertenece al segundo tipo de errores.
b) ¿Por qué los errores se miden como Y (real) – Y (estimado)? ¿qué son cada una de
estas variables Y (la real y la estimada)?
Cuando se habla de las variables real y estimada, se hace referencia al nivel efectivo o también
estimado de la variable Y, por ejemplo, cuando hablamos del peso de una persona, en cuanto a la
variable o el valor estimado, esta es la encargada de evidenciar el nivel estimado de la variable,
como por ejemplo el peso esperado de la persona, todo lo ya mencionado es obtenido mediante la
ecuación de regresión. Por otro lado, también se puede decir que estas dos variables nos permiten
distinguir el distanciamiento que se genera entre el valor que pertenece a los datos iniciales y el
valor que pertenece a los resultados arrojados por la regresión. A estos valores se les conoce
como Y real y de la misma forma los valores de Y estimado, se debe resaltar que el resultado de
la suma de estos valores no tiene que ser obligatoriamente cero (0), lo que se quiere decir con
esto es que al realizar la regresión entre la Y real y la Y estimada el valor del intercepto y la
pendiente se encontrar entre los valores de 0 y 1. Una interpretación gráfica que podemos dar
para representar Y real y estimada la encontramos en (Gujarati 2009. Página 450)
En conclusión, lo que nos indica Y real son los datos que se obtienen de la realidad (son los
punticos que se marcan en un gráfico de dispersión) y la Y estimada es la ecuación que se obtiene
a partir de la recta que trazan todos aquellos puntos.
c) ¿Qué significa “normalidad de los errores”?
d) ¿Por qué algunos modelos no utilizan las variables en sus unidades originales y las
transforman con diferentes estrategias como logaritmo, delta Δ (cambio, tasa),
variación porcentual, al cuadrado, al cubo, multiplicadas por pares, u otro?
En ocasiones los modelos utilizan sus unidades originales cuando hay magnitudes que tienen un
comportamiento relativamente constante, esto hace referencia a que cada vez que se midan los
resultados el valor de la magnitud se mantiene constante, es decir va a ser siempre el mismo, un
ejemplo, puede ser cuando hablamos del movimiento de la tierra o el movimiento de un objeto,
donde este valor puede ser fijo, acelerado o constante. Por otro lado, cuando el investigador opta
por recurrir a otras estrategias como el logaritmo, delta, variación porcentual, al cuadrado, entre
otros no se inclina por utilizar las variables de sus medidas originales y esto ocurre cuando se
quieren comparar dos posibilidades que son magnitudes determinadas.
3. Explicar con sus palabras los conceptos esenciales de la fase:
a) Multicolinealidad de las X
Cuando se habla de Multicolinealidad se refiere a que está existe en variables explicitas de un
modelo. Entonces cuando dos o más variables explicitas se encuentran relacionadas linealmente
entre sí o toman valores proporcionales. Por otro lado, cuando hay Multicolinealidad provoca que
la matriz (xx) sea aproximadamente de cero (0) y que el confidente de determinación sea muy
cercano a uno (1).
b) Heterocedasticidad de los errores
El término de Heterocedasticidad dentro del método econométrico, hace referencia a que la
varianza del término de error se encuentren una serie de variaciones a lo largo de las diferentes
observaciones. La Heterocedasticidad implica que la varianza del error sea diferente para cada
valor de X. En pocas palabras, es una varianza fluctuante.
c) Auto-correlación de los errores
La auto-correlación se refiere a que los errores encontrados entre las observaciones adyacentes
estén correlacionados entre sí. Cuando esto sucede la regresión de los mínimos cuadrados puede
llegar a minimizar el error estándar de los coeficientes.
4. Resolver los ejercicios de Gujarati (2009): 10.29 y 10.33, del modelo general de ambos
ejercicios:
Ejercicio 10.29: Con log-lineal eliminando la Multicolinealidad
a) Desarrolle un modelo lineal o log-lineal apropiado para estimar una función de
demanda de automóviles en Estados Unidos.
Comando SUM, genera una estadística descriptiva a cada una de las variables a trabajar:
En este ejercicio se refleja el número de observaciones que son 16 para 7 variables y se calcula en
cada una de las variables la desviación estándar, los máximos y mínimos.
Comando PWCORR, para calcular la correlación de las variables:
Se pueden evidenciar un alto nivel de correlación entre las variables X4 y X2 con un total de
0,9914. También resalta la correlación entre las variables X4 y X6 con valor de 0,9726. La
correlación de X2 y X3 tiene una correlación de 0,9969 y, por último, está la correlación más
baja con respecto a las anteriores que son X5 y X6 con un valor de 0,5362.
Comando REG, para sacar la regresión de las variables:
De
acuerdo con la teoría del R-cuadrado es superior a (0.8), pues el valor es de (0,85) por lo que se
supone una alta multicolinealidad.
c) Si espera lo anterior, ¿cómo resolvería el problema? Plantee los supuestos claramente y
muestre todos los cálculos de manera explícita.
Según las variables anteriores, se evidencia una fuerte relación entre X1 y X2 y tiende hacer
lineal, en cuanto a las X5 y X6 se evidencia también una relación fuerte y su tendencia es lineal.
La mayoría de las variables tiene una fuerte relación entre sí y tiene tendencia lineal, pero no
están evidente como las mencionadas.
b) Elabore una matriz de correlación. ¿Qué variables parecen relacionarse más ente sí,
sin incluir la dependiente?
Al omitir la variable dependiente se puede observar una alta relación entre las variables X1 con
X2 y X5 con X6. La relación más alta es de las variables es de X5 y X6. De lo anterior se puede
sugerir que, al haber alta correlación entre las variables puede haber un problema de colinealidad.
d) Con base en los resultados anteriores, ¿cree que estos datos sufren de
multicolinealidad?
Aplicando el comando VIF, se evidencia que existe multicolinealidad en las variables y, para
solucionar este problema eliminaremos las variables X5 y X6.
Como ultimo resultado podemos observar que al eliminar las variables X1 y X2 el problema de
multicolinealidad se solucionó. Por consiguiente, los datos ya no sufren de multicolinealidad.
Referencias Bibliográficas
Gujarati, D. (2009) Econometría, (5a. ed.), Ed. Mc Graw Hill. Cap.10-12 Recuperado
de http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?il=279&pg=1
Wooldrige, J. (2010). Introducción a la Econometría: Un enfoque moderno, (4a. ed.), Ed.
Parafino. Cap. 3.
Recuperado https://drive.google.com/drive/folders/1n7JQSvJVlWHwYd_cE45P0I7uiYf
Wr3fM?usp=sharing
Stata press publication. Stata Corp. Userguide reléase STATA. 2013. Recuperado
de http://www.stata.com/manuals13/u.pdf