Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EMPÍRICA
OPTATIVA-TÉCNICAS DE ENI
TOURIA ZOUINE
CO NTE NIDO
PRIMERA PARTE......................................................................................................... 3
INTRODUCCIÓN ........................................................................................................ 3
METODOLOGÍA ......................................................................................................... 4
RESULTADOS ............................................................................................................. 5
Análisis descriptivo.................................................................................................... 5
Gráficos de dispersión................................................................................................ 8
Estimación e interpretación económica del modelo ................................................ 12
Contraste de Hipótesis ............................................................................................. 14
Comparativa de varios modelos ............................................................................... 15
Multicolinealidad ..................................................................................................... 17
Heterocedasticidad ................................................................................................... 20
Test de White y Koenker de heterocedasticidad ...................................................... 22
Matriz de varianzas y covarianzas de White............................................................ 23
CONCLUSIONES ...................................................................................................... 24
SEGUNDA PARTE ...................................................................................................... 25
RESULTADOS ........................................................................................................... 25
Estimación del modelo e interpretación de coeficientes .......................................... 25
Estudio de la existencia o no de autocorrelación ..................................................... 26
Corrección del problema .......................................................................................... 28
Valoración final: contrastes de hipótesis y coeficiente de determinación ............... 29
CONCLUSIONES ...................................................................................................... 30
1
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Í NDICE DE TABLA S
2
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
En este sentido, el objetivo de este ensayo es analizar la relación entre el gasto en vivienda
y seis variables socioeconómicas específicas, mediante la aplicación de un modelo de
regresión múltiple.
Las variables seleccionadas para el análisis son: la autonomía, la edad del principal
perceptor de renta, el número de miembros en el hogar, el sector de actividad del principal
perceptor de renta, la renta del hogar y el nivel de estudios completado. La variable de
gasto en vivienda se refiere al monto gastado por un hogar en el alquiler o la compra de
una vivienda.
El análisis de estas variables permitirá determinar cuál o cuáles son las más significativas
en la explicación del modelo de regresión múltiple, y en qué medida influyen en el gasto
en vivienda. Asimismo, se busca identificar posibles patrones y relaciones entre estas
variables, y su impacto en el gasto en vivienda.
Este análisis permitirá una mejor comprensión de la dinámica económica y social de los
hogares españoles en lo que respecta a la vivienda, y servirá como base para la
formulación de políticas públicas efectivas en materia de vivienda y bienestar social.
Además, el análisis permitirá una mejor comprensión de los factores que influyen en el
gasto en vivienda en España.
3
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
MET ODOLOG ÍA
Por último, realizaremos una valoración final del modelo, incluyendo contrastes de
hipótesis y el coeficiente de determinación ajustado, para evaluar la significación global
del modelo y su capacidad para explicar la variabilidad de la variable dependiente.
También es importante discutir las limitaciones del modelo y posibles mejoras o
expansiones futuras.
4
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
La variable "Edad" muestra que la media de edad de la persona principal que percibe
ingresos en el hogar es de 52.21 años, con una desviación estándar de 15.37 años. Esto
indica que la mayoría de las personas principales en los hogares encuestados tienen entre
37 y 67 años. La edad mínima es de 17 años y la máxima de 91 años.Esto indica que la
muestra abarca a personas de diversas edades, lo que podría tener implicaciones en la
capacidad de las personas para pagar su vivienda.
La variable "Miembros" muestra que la media de miembros por hogar es de 3.44, con una
desviación estándar de 1.58. Esto indica que la mayoría de los hogares encuestados tienen
entre 2 y 5 miembros. El número mínimo de miembros en un hogar es de 1, mientras que
el máximo es de 11. Esto indica que hay una variabilidad en el tamaño de los hogares, lo
que podría tener implicaciones en la cantidad de espacio y la calidad de vida que las
personas tienen en su vivienda.
5
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
ACTIVIDAD
En resumen, la variable "Actividad" nos brinda información valiosa sobre los trabajos y
la distribución geográfica de los encuestados, lo que puede ayudarnos a entender mejor
la relación entre el gasto en vivienda y las condiciones económicas y sociales de la
población encuestada.
La variable "Nivest" muestra que la media del nivel de estudios completado por la persona
principal que percibe ingresos en el hogar es de 2.81, con una desviación estándar de 2.33.
Esto indica que la mayoría ha completado al menos la educación primaria, pero que
también hay una amplia variedad de niveles educativos representados en la muestra, desde
personas que no han completado ningún nivel educativo hasta aquellas que han obtenido
títulos universitarios o de postgrado. Esto indica que hay una variabilidad en el nivel
educativo de las personas, lo que podría tener implicaciones en su capacidad para acceder
a empleos bien remunerados y, por lo tanto, en su capacidad para pagar su vivienda.
6
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
En general, estos resultados del análisis descriptivo nos proporcionan una visión general
de la distribución de las variables seleccionadas y su posible influencia en el gasto en
vivienda. Ahora, es importante continuar con el análisis y aplicar técnicas de modelado
para evaluar la relación entre estas variables y el gasto en vivienda.
Estos resultados nos permitirán en el siguiente paso, realizar una exploración más
profunda de las variables y su relación entre ellas.
Ilustración 1: Histogramas de las variables analizadas
7
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
8
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Si los puntos se agrupan en torno a una línea recta que sube o baja, se dice que existe una
relación lineal positiva o negativa, respectivamente. Una relación lineal positiva significa
que a medida que aumenta el valor de la variable en el eje x, también lo hace el valor en
el eje y. Por otro lado, una relación lineal negativa indica que a medida que aumenta el
valor de la variable en el eje x, disminuye el valor en el eje y. Si los puntos no se agrupan
en torno a una línea recta, se dice que existe una relación no lineal. En este caso, puede
ser útil realizar transformaciones de las variables para obtener una relación lineal.
Además, los gráficos de dispersión también permiten identificar valores atípicos o puntos
que se alejan del patrón general de los datos. Estos valores pueden tener un impacto
significativo en los resultados del análisis y pueden requerir una evaluación adicional.
Ilustración 2: gráfico de dispersión de vivienda y autonomía
En este gráfico podemos observar que la mayoría de los puntos están concentrados en la
parte inferior izquierda del gráfico, lo que indica que hay una gran cantidad de hogares
que tienen un gasto en vivienda bajo independientemente de la comunidad autónoma en
la que residen. Sin embargo, también se puede ver que a medida que aumenta el gasto en
vivienda, hay una mayor dispersión de puntos, lo que indica que hay ciertas comunidades
autónomas donde el gasto en vivienda es significativamente más alto que en otras.
9
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
En el gráfico de dispersión de "Edad vs. Vivienda", también podemos ver que no hay una
relación clara entre estas dos variables. Los puntos están bastante dispersos y no se
observa una tendencia clara. Aun así, se puede observar una correlación negativa débil
entre ambas variables.
Ilustración 4: gráfico de dispersión de vivienda y miembros del hogar
10
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
En el gráfico de dispersión de "Actividad vs. Vivienda", podemos ver que, en general, los
hogares con una vivienda más grande tienden a estar más concentrados en el sector
primario. Sin embargo, también hay una buena cantidad de hogares en los otros dos
sectores (primario e industrial) con viviendas de diferentes tamaños. Se muestra una
correlación débil negativa.
Ilustración 6: gráfico de dispersión de vivienda y nivel de estudios
En el gráfico de dispersión de "NIVEST vs. Vivienda", podemos ver que los hogares con
viviendas más costosas tienden a tener un nivel de estudios más alto (mayor valor en la
variable "NIVEST"). Sin embargo, también hay hogares con viviendas menos costosas
que tienen un nivel de estudios alto, y algunos hogares con viviendas más costosas que
tienen un nivel de estudios bajo. Se observa una tendencia positiva entre estas dos
variables.
Ilustración 7: gráfico de dispersión de vivienda y renta del hogar
11
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Por otro lado, la variable "Miembros" tiene un coeficiente de 4079.11 con un error
estándar de 9647.082 y un valor de t de 0.42 con un p-valor de 0.673. Esto indica que no
hay una relación significativa entre la variable "Miembros" y la variable dependiente
"Vivienda" al nivel de significancia del 0.05.
12
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
entre la renta del hogar y el precio de la vivienda. Es decir, a medida que aumenta la renta
del hogar, también aumenta el precio de la vivienda.
En resumen, los resultados de la regresión indican que el nivel educativo y la renta del
hogar son factores significativos que influyen en el precio de la vivienda, mientras que la
actividad económica, el grado de autonomía en la vivienda, la edad y el número de
miembros en el hogar no tienen una influencia significativa en el precio de la vivienda.
Es importante tener en cuenta que estos resultados son específicos para el conjunto de
datos proporcionado y pueden variar en diferentes contextos.
El valor de R en la tabla indica que existe una correlación débil entre las variables
independientes y la variable dependiente (vivienda). El valor de R cuadrado es de 0.1309,
lo que significa que el modelo explica el 13.09% de la varianza en la variable dependiente.
El modelo en conjunto es significativo, lo que significa que al menos una de las variables
independientes está relacionada con la variable dependiente. El F estadístico indica que
el modelo en su conjunto es significativo, con un valor de p significativamente menor que
0.05, lo que sugiere que el modelo es una buena descripción de la relación entre las
variables. Sin embargo, el R cuadrado indica que el modelo no es una buena explicación
de la varianza en la variable dependiente, ya que solo explica el 13.09% de la varianza.
Al evaluar los coeficientes de regresión individuales, podemos observar que solo hay dos
variables independientes que están significativamente relacionadas con la variable
dependiente: NIVEST y RENTAHOGAR.
NIVEST tiene un coeficiente positivo de 40653.85, lo que indica que cuanto mayor sea
el nivel educativo, mayor será el valor de la vivienda.
Por otro lado, RENTAHOGAR tiene un coeficiente positivo de 0.0656845, lo que sugiere
que a medida que aumenta la renta del hogar, también aumenta el valor de la vivienda.
Los otros coeficientes no son significativos, lo que sugiere que no están relacionados
significativamente con la variable dependiente.
13
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Los contrastes de hipótesis son una técnica estadística utilizada para evaluar si una
hipótesis es compatible con los datos observados o no. En econometría y economía
aplicada, es común utilizar dos tipos de contrastes de hipótesis: los contrastes de
significación individual y los contrastes de significación conjunta o global.
Para evaluar estas hipótesis, se utiliza un estadístico de contraste, que es una medida de
la discrepancia entre los datos observados y la hipótesis nula. Este estadístico se compara
con una distribución conocida de probabilidad (por ejemplo, la distribución normal o t de
Student), y se calcula un valor p que representa la probabilidad de obtener un resultado al
menos tan extremo como el observado si la hipótesis nula es cierta. Si este valor p es
menor que un nivel de significancia predeterminado (por ejemplo, 0,05), se rechaza la
hipótesis nula y se acepta la hipótesis alternativa. En este caso, se rechaza la hipótesis
nula ya que dos valores tienen una probabilidad inferior al 0,05. Por tanto, la variable
dependiente es significativa en el modelo.
Por otro lado, los contrastes de significación conjunta o global se utilizan para evaluar la
significación conjunta de varios coeficientes o parámetros en un modelo econométrico.
Entonces, se puede utilizar un contraste de significación conjunta o global para evaluar si
la renta, el nivel de estudios y los otros predictores juntos tienen un efecto significativo
sobre el gasto de los hogares.
La hipótesis nula en este caso sería que los predictores juntos no tienen un efecto
significativo sobre el gasto de los hogares. La hipótesis alternativa sería que al menos uno
de los coeficientes de los predictores es diferente de cero, lo que indica que al menos uno
de los predictores tiene un efecto significativo sobre el gasto de los hogares. Para realizar
el contraste de significación conjunta, se puede utilizar el estadístico F, que mide la
varianza explicada por el modelo en relación con la varianza residual.
En este caso, el valor del estadístico F obtenido del modelo de regresión es de 24.13, con
un valor p de 0.0000, lo que indica que al menos una de las variables explicativas tiene
un efecto significativo sobre el gasto en vivienda. Por lo tanto, se rechaza la hipótesis
nula y se acepta la hipótesis alternativa, lo que indica que al menos una de las variables
explicativas es significativa para explicar el gasto en vivienda.
14
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
El LR test (prueba de razón de verosimilitud, por sus siglas en inglés) se utiliza para
comparar dos modelos. En primer lugar, compararemos el modelo A y el modelo B. La
hipótesis nula es que el modelo B está anidado (incluido) dentro del modelo A, lo que
significa que el modelo A es un modelo más amplio que incluye todos los términos en el
modelo B y, además, incluye al menos un término adicional.
15
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
El resultado del LR test es una prueba estadística que nos indica si el modelo A, que tiene
más parámetros libres que el modelo B, es significativamente mejor que el modelo B en
términos de ajuste al modelo verdadero que generó los datos. Si el valor de p obtenido es
menor a un nivel de significancia determinado, generalmente 0.05, se rechaza la hipótesis
nula de que ambos modelos tienen la misma bondad de ajuste y se concluye que el modelo
A es significativamente mejor que el modelo B. Si el valor de p obtenido es mayor al
nivel de significancia, se acepta la hipótesis nula y se concluye que ambos modelos tienen
una bondad de ajuste similar.
En este caso, el valor de p obtenido es de 0.2475, lo que indica que no hay suficiente
evidencia estadística para rechazar la hipótesis nula de que ambos modelos tienen la
misma bondad de ajuste. Por lo tanto, no podemos concluir que el modelo A es
significativamente mejor que el modelo B en términos de ajuste al modelo verdadero que
generó los datos.
Tabla 8: prueba de razón de verosimilitud (Modelos A y C)
Si ninguno de los dos modelos rechaza la hipótesis nula, significa que no hay suficiente
evidencia estadística para afirmar que uno de los modelos es significativamente mejor
que el otro. En otras palabras, ambos modelos son igualmente buenos para explicar la
varianza en la variable dependiente. La conclusión general es que no hay razón para
preferir uno de los modelos sobre el otro, y que se puede elegir cualquiera de los dos en
función de las necesidades específicas del análisis.
16
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
MU LT IC OLIN EA LIDA D
La matriz de correlación muestra la relación lineal entre los regresores. Una correlación
cercana a 1 indica una relación positiva fuerte, mientras que una correlación cercana a -1
indica una relación negativa fuerte. Si la correlación es cercana a 0, indica que no hay una
relación lineal fuerte entre los regresores.
La variable EDAD tiene una correlación negativa débil con VIVIENDA, con un valor de
-0.1068. Esto sugiere que, en promedio, las personas mayores tienden a gastar menos en
17
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
La variable MIEMBROS tiene una correlación positiva débil con VIVIENDA, con un
valor de 0.1159. Esto sugiere que, en promedio, a medida que aumenta el número de
miembros en una familia, también lo hace el gasto en vivienda. Sin embargo, al igual que
con la variable EDAD, la correlación no es lo suficientemente fuerte como para hacer una
afirmación definitiva.
La variable ACTIVIDAD tiene una correlación negativa moderada con VIVIENDA, con
un valor de -0.1472. Esto sugiere que, en promedio, a medida que aumenta la actividad
laboral de una persona, disminuye su gasto en vivienda. Sin embargo, la correlación
tampoco es lo suficientemente fuerte como para hacer una afirmación definitiva sobre
esta relación.
La variable NIVEST tiene una correlación positiva moderada con VIVIENDA, con un
valor de 0.3087. Esto sugiere que, en promedio, a medida que aumenta el nivel de estudios
de una persona, también lo hace su gasto en vivienda. Esta correlación es más fuerte que
las correlaciones anteriores, lo que sugiere que puede haber una relación más significativa
entre estas dos variables.
En general, se puede concluir que hay algunas variables que tienen una correlación
moderada con la variable VIVIENDA, como NIVEST y RENTAHOGAR, mientras que
otras variables tienen una correlación débil con VIVIENDA, como AUTONOMIA,
EDAD y MIEMBROS. Es importante tener en cuenta que la correlación no implica
causalidad y que se necesitaría un análisis más detallado para determinar si estas
correlaciones son significativas
El valor del determinante puede oscilar entre 0 y 1, siendo 0 indicativo de que las variables
están altamente correlacionadas y no pueden ofrecer información única, mientras que 1
indica que las variables están completamente descorrelacionadas y no hay redundancia
en la información. En este caso, el valor del determinante está más cerca de 0, lo que
indica que hay una cierta cantidad de correlación entre las variables.
18
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Este valor indica que hay multicolinealidad en los datos, lo que significa que hay una alta
correlación entre los regresores y puede dificultar la interpretación de los coeficientes de
regresión.
En resumen, la matriz de correlación muestra una correlación débil o moderada entre los
regresores, mientras que el valor del determinante indica una alta multicolinealidad en los
datos. Por tanto, si hay problemas de multicolinealidad.
El mejor modelo para corregir la multicolinealidad sería aquel que tenga el valor de R
cuadrado ajustado más alto, ya que esto indica que este modelo explica una mayor
proporción de la varianza en la variable dependiente con el menor número posible de
variables independientes.
En este caso, el modelo con el R cuadrado ajustado más alto es el tercer modelo con un
valor de 0,1263. Este modelo es ligeramente superior a los otros modelos, y aunque la
mejora en el R cuadrado ajustado no es muy grande, puede ser significativa en términos
de la reducción de la multicolinealidad.
19
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
20
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Con el test de Breusch-Pagan que se realiza, se puede confirmar que hay presencia de
heterocedasticidad en los residuos del modelo. El valor de chi-cuadrado obtenido (52.68)
con un p-valor muy bajo (0.0000) indica que se rechaza la hipótesis nula de igualdad de
varianzas para los residuos del modelo. En otras palabras, se puede concluir que la
varianza de los errores no es constante y, por lo tanto, hay heterocedasticidad en el
modelo. Es importante tener en cuenta que el test de Breusch-Pagan/Cook-Weisberg es
un método común para detectar heterocedasticidad en modelos de regresión.
21
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
El test de White es utilizado para verificar si existen errores heterocedásticos en los datos.
La hipótesis nula (H0) es que no existe heterocedasticidad, lo que significa que los errores
tienen una varianza constante en todo el rango de valores de las variables independientes.
La hipótesis alternativa (Ha) es que existe heterocedasticidad, lo que significa que la
varianza de los errores no es constante en todo el rango de valores de las variables
independientes.
22
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Se puede observar que se han utilizado errores estándar robustos, que son corregidos para
la heterocedasticidad.
Los resultados indican que sólo las variable NIVEST y RENTAHOGAR son
significativas al nivel de confianza del 95% (p-valor<0.05). La variable NIVEST en la
predicción de la variable dependiente VIVIENDA es significativa, ya que su intervalo
dep valor es menor que 0,05.
Es importante destacar que, aunque se han realizado pruebas para identificar y corregir la
heterocedasticidad, existen otras limitaciones que podrían afectar la validez de los
resultados, como la presencia de multicolinealidad o la omisión de variables relevantes.
23
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
C ONC LUSIONE S
En general, el modelo de regresión lineal utilizado parece ser adecuado para predecir la
variable dependiente VIVIENDA. Sin embargo, antes de hacer una valoración final del
modelo, es importante examinar detalladamente todos los resultados obtenidos en el
análisis descriptivo, gráficos, pruebas de multicolinealidad y heterocedasticidad.
En cuanto al análisis descriptivo, se puede observar que las variables tienen una media y
una mediana similares, lo que sugiere una distribución más o menos simétrica. Además,
los valores mínimos y máximos son bastante amplios, lo que indica una gran variabilidad
en los datos.
Teniendo en cuenta todos estos resultados, podemos concluir que el modelo de regresión
lineal utilizado es adecuado para predecir la variable dependiente VIVIENDA. Sin
embargo, se debe tener en cuenta la evidencia de heterocedasticidad encontrada y
considerar la corrección de White para obtener estimaciones más precisas de los
coeficientes de regresión. Además, se debe tener en cuenta que solo dos de las variables
predictoras, NIVEST y RENTAHOGAR, son significativas en la predicción de
VIVIENDA, lo que sugiere que otras variables podrían ser necesarias para mejorar la
capacidad predictiva del modelo.
24
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
SEGUNDA PA RTE :
En este apartado se realiza una estimación del modelo de regresión lineal múltiple, donde
la variable dependiente es el índice de ocupación hotelera (OC) y la variable
independiente es el número de viajeros y pernoctaciones (V). Así mismo, se realiza una
interpretación de los coeficientes del modelo, indicando la relación que tiene cada
variable independiente con la variable dependiente.
25
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
(Estadístico de Durbin-Watson)
26
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
Análisis gráfico de los residuos: se realizan gráficos de los residuos del modelo para
detectar patrones de autocorrelación.
27
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
En general, no parece haber una autocorrelación significativa en los residuos del modelo.
C OR RECC IÓN DE L PR OB LE MA
28
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
VA LORAC IÓN FINAL: CONTRA ST ES DE H IPÓTE SIS Y C OE FICIENTE DE DETE RMINAC IÓN
El cálculo del coeficiente de determinación R² para evaluar el ajuste del modelo a los
datos en términos generales, cuanto mayor sea el valor de R², mejor será el ajuste del
modelo a los datos. Sin embargo, es importante tener en cuenta que el valor de R² también
puede depender del número de variables explicativas que se incluyan en el modelo y de
29
ENSAYO APLICACIÓN EMPÍRICA |TÉCNICAS ENI
la complejidad del modelo en sí. Por lo tanto, siempre es recomendable utilizar múltiples
criterios para evaluar la calidad del ajuste del modelo a los datos. La suma de los
cuadrados del modelo es 0.0175. El valor varía entre 0 y 1, cuanto más cercano a 0 indica
que el modelo no explica ninguna variación de datos.
C ONC LUSIONE S
30