Está en la página 1de 21

Trabajo Final Opción Económica - Econometría Espacial

Se desarrollará el contenido del trabajo de acuerdo a las pautas definidas en el documento


guía:

El objetivo de este trabajo es que el estudiante utilice los distintos métodos abordados
durante el curso, para analizar los posibles determinantes del precio de venta de bienes
inmuebles en Medellín. En particular, analizará el comportamiento de los precios de oferta
de venta de Apartamentos usados en Medellín, extraídos del Observatorio Inmobiliario de
Medellín (OIME).

Consultar fuentes académicas (esto excluye Wikipedia, rincón del vago, etc.)

A. AEDE en la tradición de la estadística espacial

1. Consultar en qué consisten los polígonos de Thiessen, también llamados


diagrama de Voronoi o teselación de Voronoi. ¿Para qué sirven?

Dentro del marco teórico que envuelve el Análisis Exploratorio de Datos Espaciales (AEDE),
siendo este definido como el grupo de herramientas estadísticas y gráficas que analizan las
distribuciones espaciales, encontramos los polígonos de Thiessen, los cuales teóricamente
se definen de la siguiente manera:

POLÍGONOS DE THIESSEN

Según Ripley (1981), los Polígonos de Thiessen, también conocidos como Teselaciones o
Diagramas de Voronoi, o celdas de Dirichlet, son las áreas de un espacio bidimensional
más cercanas a un punto asociado a un dato conocido, tal que los puntos dentro de estas
áreas son más cercanos al punto que representa al dato, que a cualquier otro.

La siguiente definición es obtenida del trabajo “Sistema de información para la interpolación


espacial y temporal de datos sobre el tiempo atmosférico y el clima de Ecuador”, realizado
por la Escuela de Ingeniería de la Escuela Politécnica Nacional de Quito.

“Los polígonos de Thiessen son uno de los métodos de interpolación más simples, siendo
especialmente apropiado cuando las variables son cualitativas. Está basado en las áreas de
influencias de las estaciones, que se crean al unirlas entre sí, trazando las mediatrices de
los segmentos de unión. Las intersecciones de estas mediatrices determinan una serie de
polígonos en un espacio bidimensional alrededor de un conjunto de puntos de control
(estaciones).
A partir de los polígonos creados, simplemente se asignan pesos como segmentos del área
de influencia sobre el área total. Los polígonos de Thiessen fueron creados para el análisis
de datos meteorológicos (estaciones pluviométricas) aunque en la actualidad han sido
aprovechados de mejor manera en estudios en los que hay que determinar áreas de
influencia (centros hospitalarios, estaciones de bomberos, bocas de metro, centros
comerciales, control del tráfico aéreo, telefonía móvil, análisis de poblaciones de especies
vegetales, etc.).

Dado que el presente trabajo exige un análisis del valor del metro​2 de la oferta de
apartamentos usados ​obtenidos de la base OIME, se procede a hacer el tratamiento de la
base de datos para poder extraer los valores específicos que se necesitan:
Al mismo tiempo realizamos los histogramas respectivos tanto para la totalidad de oferta de
venta de apartamentos por metro​2 ​(histograma de la izquierda) como para el valor del metro​2
de la oferta de apartamentos usados (histograma de la derecha).

Se observa que ambos evidencian cola derecha, sin embargo, la cola más pronunciada la
presenta el histograma de la totalidad de apartamentos (en total son 1747 contabilizando
nuevos y usados), donde el valor de algunos de estos (nuevos particularmente) alcanzan a
una cifra cercana a los 10 millones por metro​2​.​. Por su parte, la oferta de apartamentos
usados a la venta ( son 1405 de la totalidad de apartamentos) llegan a un máximo de valor
de casi 6 millones por metro​2​. Es apropiado informar que el shape de Medellín se ha
recortado para no considerar los corregimientos. Asimismo representamos la distribución de
estos puntos del valor del metro​2 de apartamentos usado sobre el shape de Medellín, para
ver inicialmente su distribución en cuantiles sobre el área de la ciudad:
2. El archivo de precios de la propiedad raíz de la OIME corresponde a un shape
de puntos. A partir de este shape de puntos ud generará un shape de
Polígonos, en particular, ud. deberá crear un conjunto de polígonos de
Thiessen o teselaciones de Voronoi (al respecto puede consultar script
<<Interpolacion.R>>). Luego, con las teselaciones de Voronoi:

Inicialmente, se crean los polígonos:


a. Generar tres mapas coropletos para el valor por M2 de las ofertas de venta de
apartamentos usados, donde ud. definirá los intervalos de visualización
mediante cuantiles, desviaciones estándar, el método jenks (se sugiere utilizar
paquete <<tmap>> y generar grilla de una fila por tres columnas para visualizar
los mapas). ¿El patrón espacial detectado es robusto al tipo de intervalo de
visualización?

El mapa de cuantiles busca agrupar los datos de acuerdo a su similaridad, de manera que
los grupos creados tengan una cantidad aproximadamente igual de datos; el mapa de
desviaciones estándar separa los datos según su cercanía a la media, es decir, los agrupa
según la similitud en sus desviaciones estándar, en categorías donde cada categoría
representa una desviación estándar respecto a la media; el creado usando el algoritmo de
Jenks, segmenta los datos buscando minimizar la varianza intra-clase, es decir, buscando
agrupar datos similares. Para generar estos mapas, se ejecuta el siguiente código:
Los mapas generados, en un mismo gráfico:

Ya que no se pueden apreciar de manera clara los intervalos, se muestran los mapas de
manera individual a continuación:
Los tres mapas muestran un patrón transversal: los predios en las categorías de mayor
valor están ubicados en la zona central, occidental, suroccidental, y sur de la ciudad; y
aquellos en las categorías de menor valor, están ubicados en la parte norte y oriental de la
ciudad. Este patrón no es sorprendente: en las zonas donde están los predios de mayor
valor se encuentran los barrios de estratos más altos, y los predios de uso industrial.

b. Estime el Moran Global y los LISA y genere un mapa de clusters para el valor
por M2 de las ofertas de venta de apartamentos usados. Para tal fin, utilice: i)
una matriz de vecindades tipo Reina ii) una matriz de vecindades con los 30
vecinos más cercanos.
i. Usando una matriz de vecindades tipo Reina:

El índice global de Moran así calculado es:

Lo cual indica que, predomina una asociación espacial positiva: los predios de mayor valor
están cerca de predios de mayor valor. Dicha medida es significativa, lo que se deduce de
un P-valor cercano a cero, y que permite rechazar la hipótesis nula de ausencia de
autocorrelación. Es importante notar que el índice de Moran se calcula sobre los datos
directamente y no sobre los residuales de la variable regresada sobre el intercepto; esto se
hace así, ya que según Bivand, Pebesma y Rubio (2013), el hacerlo de la segunda forma
equivale a asumir normalidad en la distribución de la variable, lo cual, como se verificó al
inicio, no es cierto. De haberse asumido normalidad, y por tanto, estimar el índice de Moran
sobre los residuales de una regresión, la prueba de significancia hubiera sido espuria.
A continuación se hallan los índices de autocorrelación espacial local (LISA):

Ya que el estadístico global es significativamente distinto de cero, los clusters señalados por
el mapa son en realidad los núcleos de los clusters. Se observa que, como se dedujo de los
mapas coropletos, en la zona centro, occidente y sur de Medellín se encuentran las
propiedades de mayor valor, cuyos vecinos también tienen los mayores valores por metro
cuadrado; mientras que en la zona norte y oriente, se encuentran los predios de menor
valor, cuyos vecinos tienen menor valor de metro cuadrado.

ii. Usando una matriz de pesos espaciales de tipo k-nearest neighbour,


con k=30.

El índice de Moran con esta matriz de pesos espaciales es:


El valor del estadístico cambia de manera significativa, reduciéndose. No obstante, sigue
exhibiendo autocorrelación espacial positiva y significativa.

El mapa de cluster muestra una mayor cantidad de núcleos de clusters, pero muestra el
mismo patrón: en la zona centro, occidente y sur de Medellín se encuentran las propiedades
de mayor valor, cuyos vecinos también tienen los mayores valores por metro cuadrado;
mientras que en la zona norte y oriente, se encuentran los predios de menor valor, cuyos
vecinos tienen menor valor de metro cuadrado.

3. ¿Son consistentes los patrones detectados con el conocimiento que ud


tiene de la ciudad? Interprete los resultados obtenidos en los mapas
coropletos y los mapas de clusters.

Sí son consistentes: en la comuna de La Candelaria, que se ubica en la zona centro, se


encuentran predios de uso comercial, y fábricas y predios dedicados a uso industrial, al
igual que en una parte de la zona sur, correspondiente a la comuna de Guayabal, lo que
implica un mayor valor por metro cuadrado; en la zona sur y occidental, se encuentran los
barrios de estratos más altos tales como El Poblado, Laureles y Belén, lo cual explica el alto
valor de los predios. En general, este es el patrón observado, y anteriormente explicitado,
que se encontró en los mapas coropletos y los mapas de clusters.

4. Para el shape de puntos original, estimar una densidad kernel para los
apartamentos nuevos. Según la densidad kernel estimada, ¿en cuáles zonas
de la ciudad se ha concentrado recientemente la oferta de Apartamentos
nuevos? ¿En cuáles es donde menos oferta de Apartamentos nuevos se
encuentra? Plantear algunas hipótesis acerca de cuál puede ser la explicación
de los patrones observados.
La densidad Kernel es la siguiente:

Esto indica que la oferta de apartamentos nuevos está concentrada en las comunas de
Laureles, La América, Belén, y partes de Guayabal y San Javier, e irradia a El Poblado y
Robledo. Se pueden plantear dos hipótesis al respecto: en primer lugar, la falta de espacio
hace que las construcciones se ubiquen en zonas limítrofes de la ciudad, como es el caso
observado pues el núcleo de la nueva oferta está muy cerca de los corregimientos de San
Cristóbal y Altavista; y en segundo lugar, ya que dicha oferta corresponde a viviendas, esta
debe localizarse en zonas residenciales de estrato medio para generar la mayor demanda
posible, y este es el perfil de las comunas recogidas en el área de mayor incidencia.

B. AEDE en la tradición de la Geoestadística

Con el shape de puntos de precios de la propiedad, analizar la distribución espacial


del valor por M2 de los precios de oferta de Apartamentos usados. Para ello, haga lo
siguiente:

a. Grafique el variograma empírico, y luego modele la semivarianza. ¿A qué


distancia se desvanece aproximadamente la correlación espacial?

A partir de este variograma


empírico podemos verificar a qué
tipo de semivariograma se ajusta
más apropiadamente, lo cual nos
permite identificar inicialmente que
el ajuste sería en su forma
exponencial o logarítmica.
El mejor ajuste sale de su forma
exponencial, dado que al hacerlo
en su forma logarítmica arroja un
error de modelo singular, motivo
por el cual al realizar el plot del fit
no arroja ningún resultado visible.
Por tanto, se concluye que el
variograma exponencial es el que
mejor se ajusta respecto al
evidenciado en el variograma
empírico. Los resultados son:

b. Calcule un kriging ordinario para el valor por M2 y grafique la interpolación


resultante.
Realizado el ajuste de la grid para Medellín, procedemos a realizar el kriging ordinario con el
variograma exponencial elegido anteriormente:

Los resultados obtenidos son los siguientes mapas, primero los correspondientes a los
resultados del kriging ordinario sobre la grilla de Medellín (mapa de la izquierda) y a su vez
el mismo resultado pero
convertido a
SpatialPixelsDataFrame y
luego tipo raster para usar la
función tmap (mapa de la
derecha):

Los resultados de la
predicción del raster son los
siguientes:

Por último, se realiza el mapa con la delimitación de las comunas para poder hacer una
interpretación apropiada de los resultados, apoyándonos de un mapa externo para delimitar
e identificar a qué zona corresponde cada lugar señalado:
De estos resultados de predicción se puede concluir que los valores que evidencian un
mayor incremento del valor del metro​2​(15.0 - 15.5 ) se encuentran la mayoría en la comuna
de poblado, principalmente por la zona de los Balsos que limita con el corregimiento de
Santa Elena, donde se ubican muchas viviendas tipo campestre y edificios de lujo. También
en el extremo sur de esta misma comuna, por los sectores de San Lucas y La Abadía, justo
en el sector conocido como La Frontera, donde limita con el municipio de Envigado. En la
zona norte de la comuna de El Poblado, limitando con la comuna La Candelaria y Buenos
Aires, en las zonas correspondientes a Barrio Colombia, Ciudad del Rìo y parte de la vìa
Las Palmas, se observan tambièn puntos de alta valorización según este método, algo que
tampoco extraña dadas las nuevas edificaciones que allí se encuentran y lo central de su
ubicación respecto a toda el área metropolitana, además de los diferentes locales
comerciales y discotecas que se encuentran en el sector. En la Comuna Laureles Estadio,
en una zona correspondiente entre la Calle 33 y el Segundo Parque de Laureles, se
encuentran unos puntos de alta valorización, lo cual puede deberse al crecimiento de
comercio en ese sector y la alta frecuencia de diferentes tipos de clientes, ya que allí no se
observan nuevas edificaciones.

En el siguiente nivel respecto a valorización del metro​2 ​(14.5 - 15.0 ), evidenciamos que toda
la extensión de las comunas El Poblado, Laureles Estadio y La América se encuentran
mínimo en este rango, al mismo tiempo que gran parte de La Candelaria, principalmente la
zona que corresponde al centro de la ciudad debido al comercio, y Belén también casi que
cubierta en su totalidad por la fuerte oleada de edificaciones habitacionales nuevas y por el
incremento del valor del suelo usado con fines de industria por el barrio Tenche (cercanías a
la estación Industriales del metro). De igual forma esto se evidencia en el sector más central
de Robledo en límite con el barrio Los Colores, se han llevado a cabo la construcción de
edificaciones de más de 20 pisos por el sector. En la comuna de Guayabal también se
observa una alta valorización en este rango, debido quizás al costo del suelo para dedicarse
a la Industria.
Las zonas que evidencian menores valores en términos de la predicción obtenida son las
comunas de Santa Cruz, Popular, Manrique y el 12 de Octubre, seguido en el siguiente
rango por Castilla, Villa Hermosa y Buenos Aires. Estos resultados van de la mano con la
evidencia empìrica, ya que estos barrios son considerados populares y de un progreso
relativamente estancado respecto a las otras zonas de la ciudad.

c. ¿Guardan alguna relación los patrones espaciales obtenidos a través del


kriging con los patrones espaciales obtenidos a través de los LISA? Interprete
y explique sus resultados.

Lo resultados anteriores respecto al Kriging ordinario en efecto confirman lo evidenciado por


los patrones a través de los LISA: son las zonas centro (la comuna de La Candelaria
principalmente), occidente (área comprendida por las comunas Laureles Estadio, la América
y Belén limitando con las anteriores) y sur-oriente de Medellín (toda la comuna de El
Poblado y algunos sectores industriales de Guayabal) las que poseen el más alto costo de
propiedades por metro​2​. Observamos también que es la zona norte de la ciudad, tanto hacia
el occidente como al oriente, los lugares donde se encuentran las propiedades con menor
costo por metro​2​, comprendiendo respectivamente las comunas 12 de Octubre y parte de
Castilla hacia el nor-occidente, y en el nor-oriente las comunas de Santa Cruz, Popular,
Aranjuez y Manrique. A pesar de ser métodos distintos, arrojan resultados bastantes
similares y permiten concluir resultados confirmatorios respecto al valor de las propiedades.

C. AEDE: la comunión entre la Geoestadística y la Estadística Espacial

1. Teniendo en cuenta los resultados arrojados por la modelación del variograma,


genere una matriz de vecindades teniendo en cuenta un criterio de distancia.
En particular, genere una matriz de distancias donde considere como vecinos
únicamente a los Apartamentos dentro de un determinado radio de distancia,
siendo dado ese radio de distancia por el rango del variograma. Luego, con
esta nueva matriz de pesos espaciales vuelva a calcular el Moran Global y los
LISA. Además, grafique los mapas de clusters resultantes.

Según el variograma obtenido en el numeral anterior, la distancia a la cual deja de


evidenciarse autocorrelación espacial es 7142.611 metros. Teniendo en cuenta este
resultado se crea una nueva matriz de pesos espaciales según un criterio de distancia:
Por tanto, el resultado cuantitativo cambia y se reduce significativamente el estadístico, pero
el resultado cualitativo se mantiene: hay autocorrelación espacial positiva y significativa, lo
cual implica que predios de mayor valor tendrán como vecinos predios con mayor valor por
metro cuadrado.

Como hay autocorrelación espacial, y esta es significativa, el mapa de cluster nos muestra
los núcleos de los clusters, como se especificó anteriormente. En este caso, al usar la
nueva matriz de pesos espaciales, el patrón se mantiene: los núcleos de los clusters donde
los predios de mayor valor tienen como vecinos predios de las mismas características, están
ubicados en el centro, occidente, y sur de la ciudad.

D. Análisis Confirmatorio

1. Estime un modelo de regresión donde relacione el valor por M2 de los


apartamentos usados algunas de las siguientes variables:
1. Distancia a las estaciones de metro y metrocable.
2. Distancia a las paradas de metroplús.
3. Distancia al parque de Berrío.
4. Distancia al parque de El Poblado.
5. Homicidios.
6. Hurtos.
7. Equipamientos.
8. Espacio Públicos.

Para calcular la cantidad de homicidios, hurtos, equipamientos y espacios públicos


dentro del área de influencia de cada predio, puede utilizar como medida del área de
influencia o del vecindario de cada predio los polígonos de Thiessen calculados en el
punto A2.
Como proxy de la densidad poblacional alrededor de cada predio puede utilizar la
cantidad direcciones registradas en la nomenclatura domiciliaria de Medellín.
De esta manera, como medida de intensidad del crimen (hurtos, equipamientos), y
dotaciones públicas (equipamientos, espacios públicos), puede utilizar el cociente
entre la variable respectiva con respecto a la cantidad de direcciones registradas
dentro del área de influencia del predio.
También, puede utilizar fuentes de información adicionales o variables alternativas
que ud. considere.
Asimismo, a la hora de elegir el modelo que mejor ajuste arroja, recuerde examinar
los residuales y verificar que su distribución sea aleatoria (es decir, descartar la
existencia de dependencia espacial residual)

Los dos primeros modelos presentados se harán por medio de Kriging Universal,
considerando nuevamente el valor del metro​2 de la oferta de apartamentos usados a la
venta, y con base a modelos de regresión que dependen de la distancia al Parque de El
Poblado y al Parque Berrio.

Modelo respecto a la distancia al Parque de El Poblado

Lo resultados obtenidos al revisar el summary de


este modelo, respecto a la distancia de los
apartamentos usados con el parque de El
Poblado son los siguientes:

Los siguientes mapas muestran respectivamente los resultados del Kriging Universal del
valor del metro​2 ​de la oferta de apartamentos usados en venta respecto a la distancia con el
parque de El Poblado sobre la grilla de Medellín, luego convertido en Raster y por último
delimitando las comunas:
Modelo respecto a la distancia al Parque Berrio

Lo resultados obtenidos al revisar el summary de


este modelo, respecto a la distancia de los
apartamentos usados con el parque Berrío son
los siguientes:

Nuevamente como para el caso anterior, los siguientes mapas muestran respectivamente
los resultados del Kriging Universal del valor del metro​2 ​de la oferta de apartamentos usados
en venta respecto a la distancia esta vez con el parque Berrío sobre la grilla de Medellín,
luego convertido en Raster y por último delimitando las comunas:
Los resultados de ambos modelos son bastante similares, de hecho, estos se asemejan a
los trabajados en clase donde se disponía de información del precio del suelo para el año
de 2008. Aquí al hacer la segmentación por apartamentos usados, observamos patrones
muy similares, salvo pequeñas diferencias:

Por ejemplo, al comparar los mapas previamente presentados, observamos para las zonas
de las comunas de La Candelaria, Buenos Aires y Laureles Estadio, que el valor esperado
de los apartamentos respecto al parque Berrío es un poco menor que el determinado
respecto a la distancia con el parque de El Poblado.

De igual manera, observamos que para las comunas 12 de Octubre, Popular, Santo
Domingo y Manrique, el valor del metro cuadrado se hace un poco más barato respecto a la
distancia con El Poblado que el observado comparativamente con el obtenido de la
distancia con el centro en parque Berrío.
Referencias

Ripley, B. (1981). ​Spatial statistics​. New York: Wiley.

Bivand, R., Pebesma, E., & Gómez-Rubio, V. (2013). ​Applied spatial data analysis with R​.
New York: Springer.

También podría gustarte