Está en la página 1de 22

Fase 2: Modelos econométricos de regresión lineal simples y múltiples

Tutor: Enrique Rincón Prieto

Presentados Por:

Karen Julieth Jiménez Acosta

C.c. 1075318907

Universidad Nacional Abierta y a Distancia (UNAD)

ECACEN - Economía

Econométrica

Grupo N° 16

Ibagué - Tolima

Octubre 2021
Regresión lineal simple y múltiple

a) ¿Qué es un coeficiente beta? ¿Por qué la prueba de significancia se basa en la


hipótesis de que beta es igual a cero?
El coeficiente de beta es el valor que mide el efecto que tienen los valores de la variable
dentro de su correlación. Como se puede ver en el ejemplo del cultivo de frijol donde y es
el rendimiento que tiene el cultivo, x la cantidad de fertilizante que se utiliza y el
coeficiente de beta es el efecto que tiene el fertilizante sobre el rendimiento.
Cuando beta es igual a cero, quiere decir que para probar la significancia la hipótesis nula
es aceptada indicando la eliminación de la variable regresora del modelo. Es decir que
cuando beta es igual a cero la variable independiente es igual a cero y es eliminada de la
ecuación.
b) Apoyándose en la función de la recta en la matemática, explique qué es el
intercepto y qué es la pendiente, y relaciónelos con los coeficientes beta de los
modelos de regresión.
La pendiente de una recta es la medida que nos indica la inclinación de una recta cuando
están ubicados en un par de coordenadas (que pueden ser el eje y Y el eje X). El intercepto
es el punto donde la recta se cruza con el eje y. Dicho esto decimos que en una regresión
lineal la pendiente está representada por β 1 x que es el valor de la variable independiente y
el intercepto es igual a β 0 que es el coeficiente de intercepción.
c) Qué significa el concepto de “determinación” en econometría y, por tanto, ¿qué
mide el coeficiente de determinación? ¿Y cómo se interpreta?
El coeficiente de determinación es una medida porcentual que nos indica que tan cerca
están los datos de la línea de regresión ajustada. Lo que quiere decir que es un porcentaje de
variación en la variable de respuesta que es explicado por el modelo lineal representado así
coeficiente de determinación es igual a la variación explicada dividida por la variación
total. Esta ecuación mide que tan buena o confiable es la correlación y/o explicación de los
movimientos entre los grupos de las variables. Cuando el valor del coeficiente de
determinación es de cero o cerca del mismo nos indica que el modelo aplicado no es el
correcto por tanto su resultado no es confiable, por otro lado, cuando el valor es de uno o
cerca de uno nos indica que el modelo aplicado para los datos es el correcto y su resultado
es fiable.
d) ¿Qué significa causalidad estadística?
En el área estadística se puede confundir muchas veces la causalidad con la correlación,
pero se bebe tener en cuenta que es erróneo decir que una variable es causa de la otra por
causalidad (A lo que se refiere causalidad es a la relación de causa y efecto) sin antes
buscar un enfoque experimental para conocer si verdaderamente existe este nexo. Un
ejemplo de esto, puede ser la relación que tiene un estudiante de universidad con la semana
de exámenes y la ansiedad que se puede presentar. Entonces se puede decir que la ansiedad
es el efecto del rendimiento en los exámenes de toda la semana, o por el contrario podemos
decir que, la semana de exámenes puede afectar más a los estudiantes poco preparados
aumentando su ansiedad y que a los estudiantes mejor preparados puedan manejar con más
tranquilidad la semana de exámenes y obtener mejores resultados.
e) ¿Cuál es la diferencia entre el modelo simple y el modelo múltiple? Y de dos
ejemplos, a través de ecuaciones, donde se especifiquen las variables
La regresión lineal simple establécela relación de dos variables mediante una línea recta.
Esta regresión intenta trazar una línea muy cercana a los datos para poder encontrar los
valores de la pendiente y el intercepto que son los que definen la línea y dan fiabilidad a los
resultados de la investigación.
La regresión múltiple busca explicar la relación de una variable dependiente (la variable
principal) utilizando más de una variable independiente. Esta regresión puede en algunos
casos lineal o no lineal.
Entonces decimos que las diferencias entre las regresiones lineales simples y múltiples, es
que la simple busca explicar la relación solo de dos variables mientas los demás aspectos
que la pueden cambiar se mantiene constante. Por el contrario, la regresión múltiple busca
explicar la relación de una variable dependiente teniendo en cuenta más de un aspecto que
la pueda modificar, en este caso más de una variable independiente.
Ejemplo de regresión lineal simple:
Las clasificaciones de los estudiantes en los exámenes están dadas por:
Calificaciones=β 0 + β 1 tiempo de estudio+u
Donde y=Calificaciones y x=¿ tiempo de estudio que dedican los estudiantes. El
investigador quiere saber el efecto que causa el tiempo de estudio que dedican los
estudiantes para presentar los exámenes. u=¿ Factores como capacidades en la materia,
horarios en los que estudian etc. Entonces β 1 mide el efecto que tiene las horas de estudios
que dedican los estudiantes sobre las calificaciones en los exámenes cuando todos los
demás factores se mantiene constantes.
∆ Calificaciones=β 1 ∆ tiempo de estudio

Ejemplo de regresión múltiple:


Suponiendo que el salario de un CEO está relacionado con las ventas de la empresa y la
antigüedad que tiene el CEO en la organización. Se expresa de la siguiente manera:
2
log ( Salario )=β 0 + β 1 Ventas de la empresa+ β2 Antiguedad + β 3 Antiguedad
En esta ecuación encaja (k =3) diciendo que y=el salario del CEO ,
X 1 =Las ventas de la empresa , x 2= Antiguedad que tiene el CEO en la organización y
x 3=La antiguedad del CEO al cuadrado .
f) ¿Cuál es la relación entre coeficiente de correlación y coeficiente de
determinación?
La correlación es la en cagada de medir la relación entre dos variables que es medida en un
nivel de intervalos donde se refleja el grado de intensidad y la asociación de las dos
variables y y x. La correlación puede tener resultados entre -1 y 1, donde- 1 es una relación
negativa perfecta y 1 es una relación positiva perfecta. Cuando la correlación es elevada al
cuadrado se convierte en coeficiente de determinación y su resultado indica la variación de
una variable debido a la variación de la otra. Es decir, que r 2 es la proporción en la
variación de y explicada por x. Este cambio de coeficiente de correlación a el de
determinación se da por que la correlación solo puede resolver datos que tengan una
inclinación lineal, lo que quiere decir que los intervalos de los datos tienen que ser puntos
que formen una recta para ser medidos, entonces cuando no es así su resultado no es fiable
y se debe recurrir al coeficiente de determinación que arrojen resultados más acertados.
g) ¿Cuál es la diferencia de cálculo entre el coeficiente de determinación y el
coeficiente de determinación ajustado?
El coeficiente de determinación es el que nos indica la proporción de varianza total de la
variable explicada de por la regresión, reflejando la bondad del ajuste de un modelo a la
variable que se quiere explicar. El resultado del coeficiente de determinación se encuentra
entre cero y uno, entonces decimos que cuando el valor este cerca de uno mayor será el
ajuste que se le hará al modelo de la variable que se quiere explicar, contrario a que si el
valor esté más cerca de cero menos será el ajuste que se le hará a la variable y que por tanto
menos fiable será el resultado. La ecuación del coeficiente de determinación es:
T

∑ ( ^y t − y )2
R2= t=1
T

∑ ( ^y t − y )2
t=1

El coeficiente de determinación ajustado es utilizado en la regresión múltiple para ver el


grado de intensidad o efectividad que tienen las variables independientes en explicar la
variable dependiente. En otras palabras el R2a indica que porcentaje de variación de la
variable dependiente es explicado conjuntamente por todas las variables independientes. Su
ecuación de termina así:
2
Ra =1−
[( n−1
n−k−1 )]
∗( 1−R )
2

Entonces podemos decir que estos cálculos miden los mismo con la diferencia que el
coeficiente de determinación ajustado sanciona la inclusión de variables no significativas,
contrario del coeficiente de determinación que no sanciona la inclusión de variables
independientes no significantes, pero que pueden hacer variar sus resultados y volverlos
poco confiables.
Ejercicios Wooldridge (2010)
2.10 ¿Que conclusión general deduce de este diagrama? ¿La lineal de regresión del
diagrama es una línea de regresión poblacional o línea de regresión muestra?
El diagrama refleja un aumento en el salario en el área manufacturera entre los años 1970 y
1990 por el crecimiento del PIB, lo que quiere decir que la línea de regresión es positiva y
que la tendencia de los datos es de crecimiento lo que indica que entre más exporten los
países hay más incrementos en sus salarios reales.
Como en el grafico indica que los datos tomados para el análisis son solo de 50 países
entonces el método de regresión tomado es una línea de regresión muestral.
2.12 ¿Qué revela el diagrama de dispersión 2,10? ¿Se puede decir que las leyes del
salario mínimo proporcionan bienestar económico?
El diagrama de dispersión 2,10 muestra una relación inversa entre los salarios mínimos de
los países y el per cápita, esto muestra una evidente crisis representada por la mala
distribución de los recursos dentro de los países. Lo que muestra un gran problema en el
nivel de vida de las personas, entonces los salarios mínimos pueden depender del efecto
sobre el empleo combinado con las industrias que se imponen en estos países y la mala
gestión de los gobiernos hace que se cumpla esta relación inversa.
2.15 La tabla 2.8 proporciona datos de gastos en comida y gasto total de 55 familias en
la india.
a) Grafique los gastos para el eje vertical con comida y el eje horizontal en el gasto
total. Trace una línea de regresión atreves de los puntos de dispersión.

Gasto de familias Indias


450,000

400,000

350,000

300,000
Gasto Total

250,000

200,000

150,000

100,000

50,000

0
350,000 400,000 450,000 500,000 550,000 600,000 650,000 700,000
Gasto por comida

b) ¿Qué conclusiones generales se pueden deducir de este ejemplo?


Se observa una relación entre los gastos de comida y los gastos totales de las 55 familias
que es proporcionalmente directa, lo que quiere decir que a medida que mayor sea el gasto
total mayor es el gasto en comida. Debe resaltarse la relación de variabilidad entre ambas
variables es mayor cuando el gasto total es mayor de 700.000 rupias.
c) Diga a priori si se esperaría que el gasto en comida se incrementará de manera
lineal conforme al gasto total aumentase, independientemente del nivel del gasto. ¿Por
qué? ¿Se puede emplear el gasto total como representante del ingreso total?
No hay una relación lineal indefinida entre estas dos variables, ya que, cuando se satisfaga
la necesidad de comida de estas familias, el gasto tiende a disminuir, pues la tendencia de
compra de las personas cambia cuando se satisface la necesidad y optan por destinar su
dinero en la compra de bienes y servicios distintos. Como se ve en la gráfica una vez los
gatos totales pasan o llegan a 700.000 rupias se da una mayor variabilidad en la relación
lineal.
2.16 En la tabla 2.9 se presentan datos sobre el promedio de calificaciones de
exámenes de aptitud académica SAT de los estudiantes que solicitaron admisión a
literatura de 1972 a 2007
a) Con el eje horizontal para los años y el eje vertical para las calificaciones del
examen SAT. Grafique las calificaciones de lectura crítica y matemáticas de hombres
y mujeres por separado

LECTURA CRÍTICA
535
530
525
520
CALIFICACIONES

515
510 Hombres
505 504
500
495
490
485
1970 1975 1980 1985 1990 1995 2000 2005 2010
AÑO
LECTURA CRÍTICA
540

530

520
CALIFICACIONES

510
Mujeres
502
500

490

480

470
1970 1975 1980 1985 1990 1995 2000 2005 2010

AÑOS

MATEMÁTICAS
540

535
533
530
CALIFICACIONES

525

520 Hombres

515

510

505

500
1970 1975 1980 1985 1990 1995 2000 2005 2010
AÑOS
MATEMÁTICAS
510

500 499

490
CALIFICACIONES

Mujeres
480

470

460

450
1970 1975 1980 1985 1990 1995 2000 2005 2010

b) ¿Qué conclusiones generales se obtiene?


En los gráficos de dispersión en las calificaciones de lectura crítica para los hombres y
mujeres se ve que en los años de entre 1972 y 1974 las calificaciones eran sobre 485 pero
bajan y hasta en el año 1980 comienza haber un ascenso sostenible nuevamente. Para las
calificaciones en Matemáticas la relación es similar para las mujeres y los hombres solo que
en este gráfico a partir del año 1981 se ve un crecimiento exponencial en las calificaciones.
c) Al conocer las calificaciones de lectura crítica de hombres y mujeres ¿Cómo
haría para predecir las calificaciones de matemáticas?
Se puede aplicar el modelo de regresión simple a las calificaciones de lectura crítica con las
calificaciones de matemáticas con forme a la puntuación de los dos sexos. Además, no hay
que olvidar que estas calificaciones son inversamente proporcionales.
d) Grafique las calificaciones de matemáticas de las mujeres contra la de los
hombres. ¿Qué observa?
MATEMÁTICAS
560

540
CALIFICACIONES

520

500 Hombres
Mujeres
480

460

440
1970 1975 1980 1985 1990 1995 2000 2005 2010
AÑOS

En este grafico combinado por las calificaciones de ambos géneros se puede observar que
las calificaciones de hombres y mujeres se comporta muy similar con el paso del tiempo,
sin embargo, se puede apreciar que el puntaje de los hombres en el examen de matemáticas
es superior que el de las mujeres en todos los años.
Ejercicios Wooldridge (2010)
C.3.3 El archivo CEOSAL2.RAW contiene datos de 177 CEO (directores generales) y
puede utilizarse para examinar los efectos del desempeño de la empresa sobre el
sueldo de los CEO.
i) Estime un modelo que relacione el sueldo anual (salary) con las ventas de la
empresa (sales) y el precio de mercado (mktval). Use el tipo de modelo que tiene
elasticidad constante para ambas variables independientes. Escriba los resultados en
forma de ecuación.
ii) Añada profits (utilidades de la empresa) al modelo del inciso (i). ¿Por qué esta
variable no puede incluirse en forma logarítmica? ¿Diría usted que estas variables de
desempeño de la empresa explican la mayor parte de la variación en sueldos de los
CEO?

Observando los resultados de las variables de desempeño de la empresa, se puede decir que
no pueden explicar la variación de los sueldos del CEO, pues las utilidades de la empresa
arrojan información escasa, pues el coeficiente de determinación ajustado no cambia.
iii) Añada la variable ceoten (antigüedad del CEO en el puesto) al modelo del inciso
(ii) ¿Cuál es el rendimiento porcentual estimado por un año más de permanencia del
CEO en la empresa, manteniendo constantes los otros factores?

El promedio porcentual estimado por un año más de permanencia del CEO en la empresa es
de 1,17% manteniendo todos los demás factores constantes.
iv) Encuentre el coeficiente de correlación muestral entre las variables log(mktval) y
profits. ¿Estas variables están fuertemente correlacionadas? ¿Qué indica esto sobre
los estimadores de MCO?

Si están fuertemente relacionadas pues su resultado de 0,7769 que está muy cerca del 1lo
indica. Este resultado tiene una relación muy alta pero no perfecta. Aunque el modelo no se
ve afectado puede causar que las varianzas aumenten. Lo que puede demostrar que Profits
no añade valor al modelo.
C.3.4 Para este ejercicio, utilice los datos del archivo ATTEND.RAW.
i) Obtenga los valores mínimo, máximo y promedio para las variables atndrte,
priGPA, y ACT (porcentaje de asistencia a clases, calificación promedio general
acumulada, calificación en el examen de admisión a la universidad, respectivamente).

ii) Estime el
modelo
atndrte=β 1 + β 2 priGPA+ β 3 ACT +u
y escriba los resultados en forma de ecuación. Interprete el intercepto. ¿Tiene un
significado útil?

iii) Analice los coeficientes de pendiente estimados. ¿Hay alguna sorpresa?

El coeficiente de pendiente da sorpresa ya que su resultado es negativo, y se esperaría uno


positivo.
iv) ¿Cuál es el atndrte si priGPA 3.65 y ACT 20? ¿Qué piensa de este resultado?
¿Hay alumnos en la muestra con estos valores de las variables explicativas?

Los estudiantes con valores de variables explicitas son: ApriGPA – 3.1 y ACT – 21 y el
estudiante BpriGPA – 2.1 y ACT – 26.

v) Si el alumno A tiene priGPA 3.1 y ACT 21 y el alumno B tiene priGPA 2.1 y ACT
26, ¿cuál es la diferencia predicha en sus tasas de asistencia?

La diferencia que el estudiante que falta más a clases tiene menores clarificaciones que el
estudiante que asiste a clase regularmente y sus calificaciones son más altas.

C.3.6Para este problema, utilice los datos del archivo WAGE2.RAW. Como de
costumbre, asegúrese de que todas las regresiones que siguen contengan un intercepto.

i) Corra una regresión simple de IQ sobre educ para obtener el coeficiente de


pendiente, por ejemplo, ̃δ1.
ii) Corra la regresión simple de log(wage) sobre educ y obtenga el coeficiente de
pendiente, β 1

ii) Corra la regresión múltiple de log(wage) sobre educ e IQ y obtenga los coeficientes
de pendiente, β 1 y β 2 respectivamente.
~ ~
iv) Verifique que β 1= ^β 1+ ^β 2* δ 1

0.0391199+0.0058631∗3.5338292=0.0598282438

C.3.8 Utilice la base de datos DISCRIM.RAW para responder esta pregunta. Hay
datos sobre los

precios de diversos artículos de restaurantes de comida rápida situados en zonas con


distinto código postal, así como características de la población residente en dicho
código, pertenecientes a Nueva Jersey y Pennsylvania. La idea es ver si los
restaurantes de comida rápida tienen precios más altos en áreas con mayor
concentración de población afro estadounidense.

i) Determine los valores promedio, en la muestra, de prpblck (proporción de afro


estadounidenses) y de income (ingreso familiar medio), junto con sus desviaciones
estándar. ¿Cuáles son las unidades de prpblck y de income?
El promedio de media prpblck es de 0.1134 y su desviación estándar es de 13.179.29

El promedio de media income es de 47.053.78 y su desviación estándar es de 13.179.29

Entonces según el enunciado prpblck se expresa en proporción de income y este es medido


por dólares.

ii) Considere un modelo para explicar el precio de las bebidas refrescantes, psoda, en
términos de la proporción de población afro estadounidense y de ingreso medio:

psdoda= β0 + β 1 prpblck + β 2 income +u

Estime este modelo mediante MCO y dé los resultados en forma de ecuación


incluyendo el tamaño de la muestra y la R-cuadrada (No use notación científica al dar
las estimaciones). Interprete el coeficiente de prpblck. ¿Considera que es grande desde
el punto de vista económico?

psdoda=0.9563+0.1149882 prpblck +0.0000016 income+u

Muestra = 401

R – Cuadrado ajustado = 0.0642

El coeficiente de prpblck es de 0.115 aproximadamente lo que nos dice que la proporción


de afro estadounidenses crece en 1, entonces el precio de las bebidas refrescantes sube en
11 centavos lo que refleja un aumento de precio bastante alto.
iii) Compare la estimación del inciso ii) con la estimación mediante regresión simple
de psoda sobre prpblck. ¿Es el efecto de la discriminación mayor o menor cuando se
controla el ingreso?
En este caso la afectación disminuye a 0.0649 que es casi la mitad del resultado del inciso,
entonces el resultado es mejor cuando hay menos discriminación al no tomar el ingreso.

iv) Un modelo con una elasticidad constante del precio respecto al ingreso puede ser
más apropiado. Proporcione las estimaciones del modelo

psdoda= β0 + β 1 prpblck + β 2 log (income)+u

Si prpblck aumenta en .20 (20 puntos porcentuales), ¿cuál es el cambio porcentual


estimado para psoda? (Sugerencia: la respuesta es 2.xx, usted tiene que dar las “xx”.)

log(Psoda) = −0.793768 + 0.121583prpblck + 0.07655114log(income) + μ

Si prpblck aumenta en 0.2 lpsoda aumenta en: 0.2 (0.121583) *100 = 2.43%
v) Agregue ahora la variable prppov (proporción de personas en pobreza) a la
regresión del inciso iv). ¿Qué pasa con ^β prpblck
El β de prpblck disminuye a 0.0728072, lo que refleja que la proporción de
Afro estadounidense aumenta en 1, el precio aumenta en 7.28%. Ahora el aumento del
precio es menor.
vi) Encuentre la correlación entre log(income) y prppov. ¿Es aproximadamente lo que
esperaba?

En el caso de esta relación si se esperaba el resultado, ya que, al aumentar el ingreso se


espera que disminuya la proporción de personas en condición de pobreza, entonces se
esperaba que el signo fuera negativo y su coeficiente alto.
Referencias Bibliográficas

 Wooldrige, J. (2010). Introducción a la Econometría: Un enfoque moderno, (4a.


ed.), Ed. Parafino. Cap. 3.
Recuperado https://drive.google.com/drive/folders/1n7JQSvJVlWHwYd_cE45P0I7
uiYfWr3fM?usp=sharing
 Gujarati, D. (2009) Econometría, (5a. ed.), Ed. Mc Graw Hill. Cap.10-12
Recuperado de http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?
il=279&pg=1
 Wooldrige, J. (2010). Introducción a la Econometría: Un enfoque moderno, (4a.
ed.), Ed. Parafino. Cap. 3.
Recuperado https://drive.google.com/drive/folders/1n7JQSvJVlWHwYd_cE45P0I7
uiYfWr3fM?usp=sharing
 Gujarati, D. (2009) Econometría, (5a. ed.), Ed. Mc Graw Hill. Cap.10-12
Recuperado de http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?
il=279&pg=1

También podría gustarte