Tarea 3 - Karen Jiménez - Grupo 16

Tarea 3: Violación de Supuestos Básicos
Tutor: Enrique Rincón Prieto
Presentados Por:
Karen Julieth Jiménez Acosta
C.c. 1075318907
Universidad Nacional Abierta y a Distancia (UNAD)
ECACEN - Economía
Econométrica
Grupo N° 16
Ibagué - Tolima
Octubre 2021
Violación de Supuestos Básicos
2. Responder:
a) ¿Qué son errores o residuos de un modelo econométrico?

En un modelo econométrico es difícil por no decir que imposible tratar de medir toda la
población cuando se hace una investigación o análisis, pues incluir todos los factores que
influyen en la investigación puede convertirse tedioso. Es por ello que los investigadores toman
la decisión de trabajar las variables que más afecten el análisis, pero no dejan de ser importantes
los factores que no se tiene en cuenta. Entonces debemos decir que un modelo de regresión de
análisis no se puede deducir correctamente pues este se debe enfrentar a sus errores o residuos
que comúnmente se dejan a un lado y se les resta importancia, pero muy por el contrario son los
errores y/o residuos lo que nos señalan que tan lejos está el resultado a la hora de implementarlo a
la realidad.
A los errores o residuos dentro de un modelo econométrico, se le conocen como errores de
especificación. Dentro de una ecuación econométricas estos factores que no se tiene en cuenta y
se representa con la letra “u”: Donde u, conocida como termino de perturbación es una variable
aleatoria con propiedades probabilísticas bien definidas. El termino perturbación representa el
conjunto de todos los factores que afectan la variable, pero no son considerados en el modelo de
forma explícita.
Dentro del modelo econométrico se puede cometer dos errores: El primero es el error de
especificación del modelo y el segundo error de especificación incorrecta del modelo. La
exclusión de una variable relevante, la acogida de la forma funcional errónea, la incorporación de
una variable innecesaria, errores en la medición, entre otros factores similares son la esencia del
error de especificación del modelo que se tiene en mente es verdadero, pero este no es aplicado o
estimado correctamente. Por otro lado, para el error de especificación incorrecto no se tiene
mucha claridad, pues no se tiene conocimiento de cuál es el modelo verdadero. (Gujarati 2009
página 470), dice que la especificación incorrecta del término de error estocástico y la suposición
de que el termino de error esta normalmente distribuido pertenece al segundo tipo de errores.
b) ¿Por qué los errores se miden como Y (real) – Y (estimado)? ¿qué son cada una de
estas variables Y (la real y la estimada)?
Cuando se habla de las variables real y estimada, se hace referencia al nivel efectivo o también
estimado de la variable Y, por ejemplo, cuando hablamos del peso de una persona, en cuanto a la
variable o el valor estimado, esta es la encargada de evidenciar el nivel estimado de la variable,
como por ejemplo el peso esperado de la persona, todo lo ya mencionado es obtenido mediante la
ecuación de regresión. Por otro lado, también se puede decir que estas dos variables nos permiten
distinguir el distanciamiento que se genera entre el valor que pertenece a los datos iniciales y el
valor que pertenece a los resultados arrojados por la regresión. A estos valores se les conoce
como Y real y de la misma forma los valores de Y estimado, se debe resaltar que el resultado de
la suma de estos valores no tiene que ser obligatoriamente cero (0), lo que se quiere decir con
esto es que al realizar la regresión entre la Y real y la Y estimada el valor del intercepto y la
pendiente se encontrar entre los valores de 0 y 1. Una interpretación gráfica que podemos dar
para representar Y real y estimada la encontramos en (Gujarati 2009. Página 450)
Donde Y i=Y real , Y^ i =Y estiamada y Ý =Y^ =Mediade Y
En conclusión, lo que nos indica Y real son los datos que se obtienen de la realidad (son los
punticos que se marcan en un gráfico de dispersión) y la Y estimada es la ecuación que se obtiene
a partir de la recta que trazan todos aquellos puntos.
c) ¿Qué significa “normalidad de los errores”?
La modalidad de errores permite estimar mediante intervalos de confianza, los coeficientes de

regresión y la predicción. Además, nos brinda la posibilidad de generar un planteamiento de
pruebas de hipótesis, todo lo anterior sobre los parámetros del modelo establecido. Es importante
resaltar que cuando los errores no son normales, los intervalos y la hipótesis tienden a no ser
exactos y por consiguiente llegan a ser invalidas. En pocas palabras la normativa de errores se da
cuando hay una distribución normal que no se encuentra sesgado o disperso.
d) ¿Por qué algunos modelos no utilizan las variables en sus unidades originales y las
transforman con diferentes estrategias como logaritmo, delta Δ (cambio, tasa),
variación porcentual, al cuadrado, al cubo, multiplicadas por pares, u otro?
En ocasiones los modelos utilizan sus unidades originales cuando hay magnitudes que tienen un
comportamiento relativamente constante, esto hace referencia a que cada vez que se midan los
resultados el valor de la magnitud se mantiene constante, es decir va a ser siempre el mismo, un
ejemplo, puede ser cuando hablamos del movimiento de la tierra o el movimiento de un objeto,
donde este valor puede ser fijo, acelerado o constante. Por otro lado, cuando el investigador opta
por recurrir a otras estrategias como el logaritmo, delta, variación porcentual, al cuadrado, entre
otros no se inclina por utilizar las variables de sus medidas originales y esto ocurre cuando se
quieren comparar dos posibilidades que son magnitudes determinadas.
3. Explicar con sus palabras los conceptos esenciales de la fase:
a) Multicolinealidad de las X
Cuando se habla de Multicolinealidad se refiere a que está existe en variables explicitas de un
modelo. Entonces cuando dos o más variables explicitas se encuentran relacionadas linealmente
entre sí o toman valores proporcionales. Por otro lado, cuando hay Multicolinealidad provoca que
la matriz (xx) sea aproximadamente de cero (0) y que el confidente de determinación sea muy
cercano a uno (1).
b) Heterocedasticidad de los errores
El término de Heterocedasticidad dentro del método econométrico, hace referencia a que la
varianza del término de error se encuentren una serie de variaciones a lo largo de las diferentes
observaciones. La Heterocedasticidad implica que la varianza del error sea diferente para cada
valor de X. En pocas palabras, es una varianza fluctuante.
c) Auto-correlación de los errores
La auto-correlación se refiere a que los errores encontrados entre las observaciones adyacentes
estén correlacionados entre sí. Cuando esto sucede la regresión de los mínimos cuadrados puede
llegar a minimizar el error estándar de los coeficientes.
4. Resolver los ejercicios de Gujarati (2009): 10.29 y 10.33, del modelo general de ambos
ejercicios:
Ejercicio 10.29: Con log-lineal eliminando la Multicolinealidad
a) Desarrolle un modelo lineal o log-lineal apropiado para estimar una función de
demanda de automóviles en Estados Unidos.
Comando SUM, genera una estadística descriptiva a cada una de las variables a trabajar:
En este ejercicio se refleja el número de observaciones que son 16 para 7 variables y se calcula en
cada una de las variables la desviación estándar, los máximos y mínimos.
Comando PWCORR, para calcular la correlación de las variables:
Se pueden evidenciar un alto nivel de correlación entre las variables X4 y X2 con un total de
0,9914. También resalta la correlación entre las variables X4 y X6 con valor de 0,9726. La
correlación de X2 y X3 tiene una correlación de 0,9969 y, por último, está la correlación más
baja con respecto a las anteriores que son X5 y X6 con un valor de 0,5362.
Comando REG, para sacar la regresión de las variables:
Podemos observar que estas variables se encuentran en términos de Heterocedasticidad, pues la

varianza de cada uno de los valores es diferente para cada valor de X. Encontramos que el valor
de la constante es de 1943,012, la fuerza laboral civil empleada es positiva con valor de 0003468, la tasa
de interés es negativa con valor de -2638009, el ingreso personal disponible es negativo con valor de -
0035054, se evidencia que el IPC es positivo con un coeficiente de (0984243) y los automóviles nuevos
tiene valor negativo de -0660258.
Prueba de Heterocedasticidad
b) Si decide incluir todas las regresoras dadas en la tabla como variables explicativas ¿espera
encontrar el problema de multicolinealidad? ¿Por qué?
De
acuerdo con la teoría del R-cuadrado es superior a (0.8), pues el valor es de (0,85) por lo que se
supone una alta multicolinealidad.
c) Si espera lo anterior, ¿cómo resolvería el problema? Plantee los supuestos claramente y
muestre todos los cálculos de manera explícita.
Se evidencia una fuerte

correlación entre autos nuevos (X2) y IPC (X3). Se eliminan las variables X2 y X3 en el modelo
pues, aunque tengan alta correlación con otras variables, no son imprescindibles para el modelo.
Utilizamos el comando VIF, para identificar por medio de vectores si el modelo de regresión que
se está trabajando tiene problemas de multicolinealidad.
Ejercicio 10.33: Modelo lineal de todas las

variables
Datos Longley actualizados. Ampliamos los datos de la sección 10.10 para incluir observaciones
de 1959-2005. Los nuevos datos aparecen en la tabla 10.17. Los datos se relacionan con:
Y _ número de personas empleadas, en millares;
X1 _ defl actor de precios implícito del PNB;
X2 _ PNB, millones de dólares;
X3 _ número de personas desempleadas, en millares;
X4 _ número de personas en las fuerzas armadas, en millares;
X5 _ población no institucionalizada mayor de 16 años,
X6 _ año, igual a 1 en 1959, 2 en 1960 y 47 en 2005.
a) Traza diagramas de dispersión, como se indica en el capítulo, para evaluar las
relaciones entre las variables independientes. ¿Hay relaciones fuertes? ¿Parecen
lineales?
Se pueden observar que existen relaciones fuertes, pero no perfectas entre las variables: x1x2.
X1x5. X1x6. X2x5. X2x6. X5x6.
Según las variables anteriores, se evidencia una fuerte relación entre X1 y X2 y tiende hacer
lineal, en cuanto a las X5 y X6 se evidencia también una relación fuerte y su tendencia es lineal.
La mayoría de las variables tiene una fuerte relación entre sí y tiene tendencia lineal, pero no
están evidente como las mencionadas.
b) Elabore una matriz de correlación. ¿Qué variables parecen relacionarse más ente sí,
sin incluir la dependiente?
Al omitir la variable dependiente se puede observar una alta relación entre las variables X1 con
X2 y X5 con X6. La relación más alta es de las variables es de X5 y X6. De lo anterior se puede
sugerir que, al haber alta correlación entre las variables puede haber un problema de colinealidad.
c) Ejecute una regresión estándar de MCO para pronosticar el número de personas

empleadas en millares. ¿Los coeficientes de las variables independientes se
comportan como esperaría?
Se observa que el resultado del número de personas empleadas en millares de – 11310.1 no es
lógico pues su número es negativo. Si analizamos la variable X4 podemos llegar a la conclusión
que no es del todo lo esperado, debido a que la variable X4 nos indica el número de personas en
las fuerzas armadas, en millares, este tiende a ser negativo, esto dejaría como resultado que se
presente una relación inversa.
d) Con base en los resultados anteriores, ¿cree que estos datos sufren de
multicolinealidad?
Aplicando el comando VIF, se evidencia que existe multicolinealidad en las variables y, para
solucionar este problema eliminaremos las variables X5 y X6.
Aplicamos el comando VIF, para asegurarnos que el problema de multicolinealidad se haya

solucionado:
Como se observa en los resultados aún el problema de multicolinealidad persiste, entonces
procedemos a eliminar las variables X1 y X2, las cuales son las de mayor multicolinealidad.
Como ultimo resultado podemos observar que al eliminar las variables X1 y X2 el problema de
multicolinealidad se solucionó. Por consiguiente, los datos ya no sufren de multicolinealidad.
Referencias Bibliográficas
 Gujarati, D. (2009) Econometría, (5a. ed.), Ed. Mc Graw Hill. Cap.10-12 Recuperado
de http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?il=279&pg=1
 Wooldrige, J. (2010). Introducción a la Econometría: Un enfoque moderno, (4a. ed.), Ed.
Parafino. Cap. 3.
Recuperado https://drive.google.com/drive/folders/1n7JQSvJVlWHwYd_cE45P0I7uiYf
Wr3fM?usp=sharing
 Stata press publication. Stata Corp. Userguide reléase STATA. 2013. Recuperado
de http://www.stata.com/manuals13/u.pdf

Tarea 3 - Karen Jiménez - Grupo 16

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea 3 - Karen Jiménez - Grupo 16

Cargado por

Copyright:

Formatos disponibles

Tarea 3: Violación de Supuestos Básicos

Tutor: Enrique Rincón Prieto

Karen Julieth Jiménez Acosta

Universidad Nacional Abierta y a Distancia (UNAD)

a) ¿Qué son errores o residuos de un modelo econométrico?

Donde Y i=Y real , Y^ i =Y estiamada y Ý =Y^ =Mediade Y

La modalidad de errores permite estimar mediante intervalos de confianza, los coeficientes de

Podemos observar que estas variables se encuentran en términos de Heterocedasticidad, pues la

Se evidencia una fuerte

Ejercicio 10.33: Modelo lineal de todas las

c) Ejecute una regresión estándar de MCO para pronosticar el número de personas

Aplicamos el comando VIF, para asegurarnos que el problema de multicolinealidad se haya

También podría gustarte