Está en la página 1de 14

Resolución de ejercicios - Unidad 2 – Proyección Econométrica

Universidad Técnica de Manabí


Índice

Título: Regresión con Datos de Panel 3


Descripción de la actividad 3
Objetivos 3
1. Definición y resolución del ejercicio 1 3
Resultados y Análisis 7
2. Definición y resolución del ejercicio 2 7
Resultados y Análisis 10
3. Definición y resolución del ejercicio 2 10
Resultados y Análisis 14

Universidad Técnica de Manabí


Título: Regresión con Datos de Panel

Descripción de la actividad
Para la presente actividad, el estudiante deberá analizar las conjeturas propuestas en los ejercicios
planteados en esta actividad. La principal guía serán los ejercicios contenidos en el compendio de la
unidad 2 de la asignatura, la clase magistral y las clases semanales de la unidad.

Para resolver el ejercicio, recuerde que el uso del Software R y/o Rstudio serán de vital importancia al
momento de procesar los datos y en base a dichos resultados se pueden llegar a su análisis.

Objetivos
El trabajo tiene el objetivo de aplicar los conocimientos técnicos adquiridos en la asignatura respecto
a la Correlación, Regresión Simple y Múltiple.

1. Definición y resolución del ejercicio 1

La siguiente tabla de Existencias, recoge información sobre Productos (en


unidades), gasto en Mercadeo (en dólares) y volumen (en miles) de 8 líneas de
productos.

Prod Merc Vol


8 9 8
3 7 5
5 8 8
9 9 6
7 2 4
3 2 6
8 5 7
7 9 6
9 12 5
8 5 7
7 3 5

Se pide:
a) Cargue la data frame con nombre Existencias que almacene los datos.

Universidad Técnica de Manabí


b) Dibujar el diagrama de dispersión de las variables Productos y Mercadeo
y determinar si puede existir una cierta relación lineal entre ambas

Dado a que el valor p es de 0.2225 y mayor a 0.05, podemos decir que la


correlación no es significativa y podría ser considero 0

Universidad Técnica de Manabí


c) ¿Cuál es la recta de regresión lineal simple que considera a Producto
como variable dependiente y al Mercadeo como variable independiente?
Interpreta los parámetros de esa recta

merc y = 0,6142x + 2,3228


R² = 0,1602
14

12

10

0
0 2 4 6 8 10

d) ¿Son significativos estos parámetros? ¿Qué puede decirse del ajuste del
modelo a los datos?

Por defecto, la salida que muestra la función lm incluye únicamente las estimaciones
para los parámetros, en nuestro caso 𝛽̂0 𝑦 𝛽̂1 . Por tanto, el modelo lineal puede
escribirse del siguiente modo:𝑝𝑟𝑜𝑑𝑖 = 5.0435 + 0.2609𝑚𝑒𝑟𝑐𝑖

Estos dos parámetros pueden interpretarse del siguiente modo: 5.0435 es el valor de
prod para un mer de 0, lo cual no tiene sentido.

Universidad Técnica de Manabí


e) ¿Cuál es la correlación lineal de Pearson entre ambas variables? ¿Es
significativa?

Puesto que el p-valor del contraste es de 0.2225, por lo tanto, mayor que 0.05,
podemos concluir que la correlación no es significativa.
f) ¿Cuál es la recta de regresión lineal si se considera también como
variable independiente a Volumen?

Universidad Técnica de Manabí


Resultados y Análisis

2. Definición y resolución del ejercicio 2

Una compañía que se dedica a la venta de automóviles desea conocer la ecuación


que permita predecir las ventas (en miles de dólares) en función de los gastos en
publicidad en redes (en miles de dólares), la inversión en entrenamiento a ventas (en
miles de euros) y la inversión en innovación de modelos (en miles de dólares). Se
realiza un estudio en el que se reúnen los datos mensuales correspondientes a los
últimos 18 meses. Estos datos se muestran en la siguiente tabla

Ventas Redes Entre_Vent Inno


11 0,9 48 0,5
13 1,2 54 0,5
12 1,4 56 0,45
12 1,4 55 0,6
11 1,6 63 0,3
12 1,7 67 0,45
14 1,8 69 0,48
12 1,1 68 0,44
15 1,3 64 0,46
9 0,9 66 0,44
10 0,7 95 1,1
21 0,8 67 0,4
9 0,9 64 0,6
8,5 1 58 0,48
7,7 2,5 72 0,41
14 1,9 112 0,5
14 2 78 0,85
20 1,7 78 0,88

Se pide:

a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación


de los parámetros del modelo y su interpretación.

Universidad Técnica de Manabí


El modelo puede escribirse tal y como sigue:𝑉𝑒𝑛𝑡𝑎𝑠𝑖 = 9.591 − 0.026𝑟𝑒𝑑𝑒𝑠𝑖 −
0.032𝐸𝑛𝑡𝑟𝑒𝑣𝑒𝑛𝑡 𝑖 + 1.245𝑖𝑛𝑛𝑜𝑖

Universidad Técnica de Manabí


El valor de la constante 9.591 indica cual sería el valor de las ventas en el caso de que todas las
variables independientes tomasen el valor 0, es decir, en el caso en que no se invirtiera nada en
ningún tipo de redes. Los valores de los parámetros asociados a cada una de las variables indican
el aumento o disminución en las ventas por cada unidad de incremento en la variable en cuestión.

b) Contrastar la significación del modelo propuesto

F-statistic: 0.1564 on 3 and 14 DF, p-value: 0.9238. En estadística general y


contrastes de hipótesis, el valor p se define como la probabilidad de que un valor
estadístico calculado sea posible dada una hipótesis nula cierta.
En este caso, el p-valor asociado a este contraste es inferior a 0.9 de manera que
podemos concluir que, asumiendo un nivel de significación del 9% al menos uno de
los parámetros es significativamente distinto de 0 y, por tanto, tiene sentido plantear
un modelo de regresión lineal para estos datos.
c) ¿Puede eliminarse alguna variable del modelo? Realiza los contrastes de
significación individuales.

El valor t (t value) mide el tamaño de la diferencia en relación con la variación en


los datos de la muestra. Dicho de otro modo, T es simplemente la diferencia
calculada representada en unidades de error estándar. Cuanto mayor sea la
magnitud de T, mayor será la evidencia en contra de la hipótesis nula.

considerando un nivel de significación del 9%, vemos que tanto el parámetro


asociado a la variable redes como el asociado a la variable entre_vent, pueden
suponerse iguales a 0, pues sus p-valores son mayores que 0.05. Por ello, ambas
variables podrían eliminarse del modelo, pues no están relacionadas linealmente
con la variable dependiente.

Universidad Técnica de Manabí


d) Coeficiente de determinación y de determinación corregido

Multiple R-squared: 0.03243, Adjusted R-squared: -0.1749

Este coeficiente, que oscila entre 0 y 1.

En la salida del modelo de regresión múltiple encontramos los dos valores que nos
piden en este apartado. Por un lado, el coeficiente de determinación toma el valor
0.03243.

En nuestro caso, con un valor cercano a 0.03 concluimos que el ajuste de los datos al
modelo es malo ya que este no se acerca a uno.

Los valores del coeficiente de determinación corregido también oscilan entre 0 y 1 y


su interpretación es similar a la del coeficiente de determinación. En este ejemplo, el
valor del coeficiente de determinación corregido es de 0.03 lo que indica un ajuste
medio-malo de los datos al modelo.

Resultados y Análisis

3. Definición y resolución del ejercicio 2

Se pretende estudiar la posible relación lineal entre el precio de pisos en miles de


euros, en una conocida ciudad española y variables como la superficie en m2 y la
antigüedad del inmueble en años. Para ello, se realiza un estudio, en el que se
selecciona de forma aleatoria una muestra estratificada representativa de los distintos
barrios de la ciudad. Los datos aparecen en la siguiente tabla.

Universidad Técnica de Manabí


Precio Superficie Antiguedad
200 100 20
120 70 15
155 120 30
310 150 20
320 90 12
400 227 400
100 75 100
80 65 80
75 80 75
169 150 169
110 120 110
210 100 210
200 125 200
180 137 180
140 90 140
95 110 95

Se pide:

a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación


de los parámetros del modelo y su interpretación.

Universidad Técnica de Manabí


El modelo puede escribirse tal y como sigue:
𝑝𝑟𝑒𝑐𝑖𝑜𝑖 = 124.117 + 0.203𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒𝑖 + 0.289𝑎𝑛𝑡𝑖𝑔𝑢𝑒𝑑𝑎𝑑𝑖
El valor de la constante 124.117 indica cuál sería el valor de los precios por pisos, en
el caso de que todas las variables independientes tomasen el valor 0. Es decir, en el
caso de que se tomara en cuentas las variables asociadas como superficie de 0.203
y antigüedad, mientras más altos son sus valores el precio de los pisos aumentan.

Universidad Técnica de Manabí


b) Contrastar la significación del modelo propuesto.
En la parte final de la salida anterior aparece el estadístico de contraste y el p-valor
que nos permiten resolver el contraste anterior.
En estadística general y contrastes de hipótesis, el valor p se define como la
probabilidad de que un valor estadístico calculado sea posible dada una hipótesis nula
cierta.
F-statistic: 1.217 on 2 and 13 DF, p-value: 0.3277
En este caso, el p-valor asociado a este contraste es menor a 0.05 de manera que
podemos concluir que, asumiendo un nivel de significación del 5%, al menos uno de
los parámetros es significativamente distinto de 0 y, por tanto, tiene sentido plantear
un modelo de regresión lineal para estos datos.
c) ¿Cuánto será el precio estimado del piso en una ciudad X para una
superficie en 130 m2 y 35 años de antigüedad?
El precio estimado del piso en una ciudad X para una superficie en 130 m2 y 35 años
de antigüedad es de 124.12
d) ¿Puede eliminarse alguna variable del modelo? Razone la respuesta.
En este caso, los contrastes a resolver son los siguientes:

Considerando un nivel de significación del 5%, vemos que tanto el parámetro asociado
a la variable superficie como el asociado a la variable antigüedad pueden suponerse
iguales a 0, pues sus p-valores son mayores que 0.05. Por ello, ambas variables
podrían eliminarse del modelo, pues no están relacionadas linealmente con la variable
dependiente. Entonces, se debería ajustar un nuevo modelo sin considerar estas dos
variables. Ello nos lleva a rechazar la hipótesis nula del contraste correspondiente y a
concluir la significación de ambos parámetros

Universidad Técnica de Manabí


e) Coeficiente de determinación y de determinación corregido.
Interpretación.
Multiple R-squared: 0.1577, Adjusted R-squared: 0.02812
El coeficiente de determinación toma el valor 0.1577 Este coeficiente, que oscila entre
0 y 1, indica “cómo de bien” se ajustan los datos al modelo lineal planteado.
En nuestro caso, con un valor cercano a 0.16 concluimos que el ajuste de los datos al
modelo es malo ya que este no se acerca a uno.
El coeficiente de determinación corregido soluciona este problema, puesto que
penaliza la entrada en el modelo de variables no relevantes para la explicación de la
variable dependiente. Los valores del coeficiente de determinación corregido también
oscilan entre 0 y 1 y su interpretación es similar a la del coeficiente de determinación.

Resultados y Análisis

Universidad Técnica de Manabí

También podría gustarte