Está en la página 1de 7

UNIVERSIDAD NACIONAL AUTÓNOMA DE

HONDURAS-VS

ECONOMETRIA
SECCION 1500
Cesar Alfonso Rosales Amaya
CUENTA 20152006471
FORO #3
1. Primera Pregunta

¿Por qué se le llama estimación de mínimos cuadrados ordinarios?

R. El método de los mínimos cuadrados se utiliza para calcular la recta de regresión lineal que
minimiza los residuos, esto es, las diferencias entre los valores reales y los estimados por la
recta. Se revisa su fundamento y la forma de calcular los coeficientes de regresión con
este método.

2. Segunda Pregunta

Defina la diferencia entre el error y el residual, ¿En qué consiste esta diferencia?

R. El error por lo general se refiere al grado en que las funciones, fórmulas y estadísticos no
pueden explicar o modelar totalmente un valor real o teórico. En otras palabras, el error es la
diferencia entre un valor real y uno pronosticado. Si bien puede existir cierto grado de error o
incertidumbre en los análisis estadísticos, la identificación y cuantificación del error puede al
menos ayudarnos a explicar su presencia.

Error residual La variabilidad que queda una vez identificados todos los efectos principales y
las interacciones

Primera, al principio, esto sirve para simplificar el análisis e introducir poco a poco al lector a
las complejidades del análisis de regresión.

Segunda, en situaciones experimentales tal vez no sea irreal suponer que los valores de X son
fijos.

Tercera, como se muestra en el capítulo 13, aunque las variables X sean estocásticas, los
resultados estadísticos de la regresión lineal basada en el caso de las regresoras fijas también
son válidos cuando las variables X son aleatorias, en tanto se cumplan algunas condiciones;
una de ellas es que la regresora X y el término de error ui sean independientes.

3. Tercera Pregunta

¿Cuáles son los supuestos básicos de los Mínimos Cuadrados Ordinarios?

R. Modelo de regresión lineal: El modelo de regresión es lineal en los parámetros, aunque


puede o no ser lineal en las variables. Es decir, el modelo de regresión como se muestra en la
ecuación
Valores fijos de X, o valores de X independientes del término de error: Los valores que toma
la regresora X pueden considerarse fijos en muestras repetidas (el caso de la regresora fi ja), o
haber sido muestreados junto con la variable dependiente Y (el caso de la regresora
estocástica). En el segundo caso se supone que la(s) variable(s) X y el término de error son
independientes, esto es, cov (Xi, ui) 0.

El valor medio de la perturbación ui es igual a cero: Dado el valor de Xi, la media o el valor
esperado del término de perturbación aleatoria ui es cero. Simbólicamente, tenemos que E(ui|
Xi) 0 (3.2.1) O, si X no es estocástica,

E(ui) 0

perturbación, es la misma sin importar el valor de X. Simbólicamente, tenemos que var(ui) E [ui
−E(ui|Xi)]2

E (u2 i|Xi), por el supuesto 3

E (u2 i), si Xi son variables no estocásticas σ2

No hay autocorrelación entre las perturbaciones: Dados dos valores cualesquiera de X, Xi y Xj


(i j), la correlación entre dos ui y uj cualesquiera (i j) es cero. En pocas palabras, estas
observaciones se muestrean de manera independiente. Simbólicamente, cov (ui, uj|Xi, Xj)0 cov
(ui, uj)0, si X no es estocástica (3.2.5) donde i y j son dos observaciones diferentes y cov
significa covarianza.

El número de observaciones n debe ser mayor que el número de parámetros por estimar:
Sucesivamente, el número de observaciones n debe ser mayor que el número de variables
explicativas.

La naturaleza de las variables X: No todos los valores X en una muestra determinada deben
ser iguales. Técnicamente, var(X) debe ser un número positivo. Además, no puede haber
valores atípicos de la variable X, es decir, valores muy grandes en relación con el resto de las
observaciones.

Cuarta Pregunta

Si E (Ui / Xi) ≠ 0, es decir el valor esperado de los errores dado los diferentes valores de X es
diferentes de 0, ¿Cuál es el problema? ¿Y por qué se complica la estimación?

R. Establece que el valor de la media de ui, que depende de las Xi dadas, es cero.
Geométricamente, este supuesto se representa mediante una gráfica, como en la fi gura 3.3,
que muestra algunos valores de la variable X y las poblaciones Y asociadas a cada uno de ellos.
Puede observar que cada población Y correspondiente a un X dado está distribuida alrededor
de su media (que se representa por los puntos dentro de un círculo sobre la FRP), con algunos
valores de Y por encima y por debajo de ésta. Las distancias por encima y por debajo de los
valores medios no son otra cosa que la ui. La ecuación (3.2.1) requiere que el promedio o valor
medio de estas desviaciones correspondientes a cualquier X dado sea cero.
Es importante señalar que el supuesto 3 implica que no hay sesgo de especificación o error de
especificación en el modelo del análisis empírico. En otras palabras, el modelo de regresión
está especificado correctamente.

También observe que si la media condicional de una variable aleatoria, dada otra variable
aleatoria, es cero, la covarianza entre las dos variables es cero y, por tanto, las dos variables no
están correlacionadas. En consecuencia, el supuesto 3 implica que Xi y ui no están
correlacionadas.

5. Quinta Pregunta.

Sea niños la cantidad de hijos que ha tenido una mujer, y educ los años de educación que tiene
esta mujer. Un modelo sencillo para relacionar fertilidad con años de educación es

Niños = Bo + Bi educ +u

Donde u es el error no observado.

¿Qué tipo de factores son los contenidos en u? ¿Es posible que estos factores estén
correlacionados con el nivel de educación?

R. Son aquellas variables no observadas ya sea por falta de información o la dificultad que hay
para medir la variable. Estas variables no observadas pueden estar directamente
correlacionadas con el nivel de educación, como lo es el índice de pobreza.

¿Es posible que con un análisis de regresión simple se halle el efecto Ceteris Paribus de
educación sobre l fertilidad? Explique

R. No es posible. La fertilidad tiene distintas variables que explican tanto contextuales como
personales que explican la razón por la cual puede tener o no más niños. Al no contemplar
esto dentro del modelo, no hay forma que dentro de la regresión simple se pueda hallar un
efecto causal de una variable sobre la otra.

Segunda parte

1. Primera Pregunta

En la función lineal de consumo

Cons = -124.84 + 0.853 inc

La propensión marginal a consumir estimada (PMgC) del ingreso no es más que la pendiente,
B1, mientras que la propensión media a consumir (PMeC) es consline = Bo linc + B1. Usando las
observaciones sobre el ingreso anual y consumo de 100 familias (ambos medidos en dólares),
se obtiene la ecuación siguiente:

Cons = -124.84 + 0.853 inc

N= 100, R2 = 0.692
1.Intrprete el intercepto en esta ecuación y analice su signo y su magnitud

R. El intercepto de la ecuación comprende que cuando el incremento sea igual a 0 (inc =0) se
prevé que el negativo sea $ 124.84, es decir -124.84 es el nivel de consumo de alguien con inc
= 0. No tiene mucho sentido que el signo sea negativo ya que técnicamente una familia no
puede tener un consumo negativo, debido a esto nuestra función se convierte en un débil
predictor de consumo de niveles muy bajos de ingresos.

2. Cual es el consumo que se predice si el ingreso familiar es de $ 30,000?

R. Reemplazamos $ 30,000 en la ecuación:

Cons = -124.84 + 0.853*inc

Cons = -124.84 + 0.853*30.0000

Cons = 25465,16

El consumo predicho para un ingreso familiar de US 30.000 es de US25.465

3. Con inc en el eje x, trace una grafica la PMgC estimada y la PMeC estimada

R. El grafico comienza con un nivel de ingresos anual $ 1000 en dólares de 1970

Segunda pregunta

La base de datos BWGHT.RAW contiene cifras sobre los hijos nacidos de mujeres en Estados
Unidos. Las dos variables de interés son la variable independiente, peso en onzas del niño al
nacer (bwght) y la variable explicativa, cantidad promedio diaria de cigarros consumidos por la
madre durante el embarazo (cigs). La siguiente ecuación de regresión simple se estimo con
datos de n = 1,388 nacimientos

Bwght = 119.77 – 0.514 cigs

¿Cuál es el peso al nacer que se predice si cigs =? Y cuando cigs = 20 (un paquete por día )
Analice la diferencia

R. Evaluando los valores en la variable “número de cigarrillos consumidos”, se aprecia una


diferencia significativa en el peso de los recién nacidos, cuando “cigs” vale 0 el peso tomará el
valor de b0, es decir, 119.77. Cuando el valor de la variable “cigs” es 20 (un paquete por día) el
peso del recién nacido disminuirá a 109.50, se puede apreciar el efecto negativo que tiene el
efecto del consumo de cigarrillos en el peso de los infantes.
¿Capta esta ecuación de regresión simple una relación causal entre el peso del niño al nacer y
el habito de fumar de la madre? Explique

R. Una regresión puede arrojar resultados significativos, sin embargo, no necesariamente toda
regresión explica una relación causal. Pueden existir otros factores que ayuden a determinar el
peso del niño, los cuales no están estando dentro de este modelo.

Para que el peso al nacer predicho sea de 125 onzas ¿Cual tiene que ser el valor de cigs?

R. El resultado de cigarrillos consumidos para que el peso sea 125 onzas es negativo, lo cual no
tiene sentido. Esto se da debido a que el peso con el que se trabaja es mayor al peso del recién
nacido, en caso de que la madre no consuma cigarrillos durante el embarazo.

La proporción de mujeres en la muestra que fumaron durante el embarazo es


aproximadamente 0.85 ¿Ayuda esto a entender sus hallazgos del 3?

R.  1176 de 1388 mujeres no fumaron cigarrillos durante el embarazo. Este porcentaje del 85%
no nos ayuda a entender directamente nuestros resultados en el inciso 11, dado que la
proporción de mujeres que no fumaron al estar embarazadas no es una variable que hayamos
considerado para elaborar la regresión. Sin embargo, debido a que en la regresión se
consideran las variables “Bwght” (dependiente) y “cigs” (independiente); siendo la variable
“cigs” la cantidad de cigarrillos que consumen las madres, la proporción obtenida ayuda a
predecir la cantidad de infantes que pesarán aproximadamente 119.77, que será igual a la
cantidad de madres que no consumieron cigarros. 𝑏𝑤𝑔ℎ𝑡𝑖 = 119,77 - 0,514𝑐𝑖𝑔𝑠.

Tercera pregunta

Usando los datos de Kiel y McClain (1995) sobre las casas vendidas en 1988 en Andover,
Massachusetts, en la ecuación siguiente se relaciona el precio de las casas (price) con la
distancia a un incinerador de basura construido recientemente (dist):

log(price) 9.40 0.312 log(dist) n 135, R2 0.162.

i) I interprete el coeficiente de log(dist). ¿Es el signo de esta estimación el que se esperaba?

R. El coeficiente nos dice que un aumento de un 1% en la distancia desde incinerador esta


correlacionado con un valor predicho mas alto de un 0.312%. El signo de esta estimación si es
el que esperaba ya que existe una relación positiva entre las dos variables, es decir que a
mayor distancia del incinerador mayores serán lo precios de las viviendas en relación a las
preferencias.

ii) ¿Considera que la regresión simple proporciona un estimador insesgado de la elasticidad


ceteris paribus de Price (precio) respecto a dist? (Reflexione en la decisión de la ciudad sobre
dónde colocar el incinerador.)

R. Si se eligió ubicar el incinerador en un área alejada de barrios más caros, entonces log (dist)
esta positivamente correlacionada con la calidad de la vivienda. Esto quebrantaría el modelo
de regresión lineal y la estimación de los mínimos cuadrados seria sesgada.
iii) ¿Qué otros factores relacionados con una casa afectan su precio? ¿Pueden estos factores
estar correlacionados con la distancia al incinerador?

R. El tamaño de la vivienda, la antigüedad, el numero de habitaciones y la calidad del barrio


donde se ubica. Estos factores podrían estar correlacionados con la distancia del incinerador
(log(dist) como se menciona en la respuesta anterior, esto lleva a que el supuesto exogeneidad
estricta no se cumpla.

También podría gustarte