Está en la página 1de 15

1.

INTRODUCCIÓN

En estas notas de clase se presentan los distintos tipos de regionalizaciones posibles y las
herramientas disponibles para delimitarlas.

Antes de realizar la regionalización es necesario definir qué es una región. Una región o área es
una delimitación geográfica que se realiza en consideración de elementos comunes de cada una
de las unidades que la integran, ya sean económicos, sociales, culturales, geográficos,
administrativos y/o políticos.

El espacio a regionalizar y, por lo tanto, las regiones a obtener puede variar desde un espacio
relativamente pequeño a uno muy grande. En todos los casos se trata de distinguir con
denominaciones como zonas o áreas a las divisiones espaciales pequeñas relativamente, dejando
el concepto de regiones para las divisiones espacialmente mayores. La regionalización debe
cumplir una serie de requisitos mínimos que se detallan a continuación.

i) Cada punto del espacio debe corresponder a una y sólo una región en forma
excluyente, condición básica para que las regiones queden determinadas.

ii) Cada punto del espacio debe corresponder a alguna región, es decir, que no
existirán vacíos. El conjunto de regiones en que se divida el espacio agotará
totalmente al mismo.

iii) Principio de contigüidad: todas las unidades del área que comprende la región
guardarán contigüidad entre sí. Por ejemplo, si aparecen unidades con
características de la región II interpuestas entre unidades del tipo de región I,
habrá que optar por incorporar en I o en II aquellas unidades que no se
corresponden estrictamente con la región para evitar la pérdida de continuidad
geográfica de las respectivas regiones.

Principio de contigüidad
iv) El número de regiones resultante debe ser de un tamaño razonable.
v) Debe mantenerse un criterio objetivo. Deben existir definiciones claras para
evitar la ambigüedad, de manera que investigadores distintos aplicando las
mismas metodologías lleguen al mismo resultado.

2. TIPOS DE REGIONALIZACIÓN

Existen tres tipos de enfoques para llevar a cabo una regionalización, que fueron sistematizados
por Perroux (1955).

El caso clásico es el tipo de región homogénea donde detrás de la definición de las regiones está
la idea de similitud entre las unidades territoriales. Es decir, se busca dividir el espacio
reuniendo dentro de una región a aquellas unidades lo más similares posibles, buscando
establecer diferencias con las unidades territoriales que conforman otras regiones.

La idea básica para establecer regiones homogéneas es tratar de agrupar unidades territoriales
que presenten características similares, y la diferencia entre una región y otra es que esta
característica difiere entre ellas. En general se reúnen unidades para las cuales el nivel de cierto
indicador/es o variable/s es similar pero que difiere respecto al de las otras regiones.
El problema de este tipo de regiones es que si bien resulta útil para fines descriptivos del espacio,
produce regiones homogéneas en algunos aspectos pero con heterogeneidad en otros que
también son relevantes para el análisis. Esta dificultad se manifiesta cuando se intenta tomar
varios aspectos para definir una región: cuando se eleva el nivel de análisis y se comienzan a
utilizar varios índices o variables surgen las limitaciones propias de este tipo de regionalización.

En segundo lugar se encuentra el tipo de región polarizada, funcional o nodal. En este caso nos
concentramos en unidades territoriales que constituyen polos o nodos y una periferia relacionada
funcionalmente con dichos centros.

Acá el interés no está en el nivel absoluto que puedan tener las distintas variables o indicadores
en cada unidad territorial, sino en la relación interna que existe entre una unidad y otra dentro de
una región. Es decir, lo que se busca es poder explicar ciertas funciones específicas que se
cumplen dentro de las regiones y que muestran dependencia de las unidades territoriales
periféricas respecto de la unidad central o polo. Esta relación interna es la que genera y explica el
crecimiento de toda la región (modelos de centro - periferia de Krugman).
por ejemplo, en chile su oficina de planificación Nacional diseñó la regionalización del país
basándose en un sistema de polos de desarrollo. El territorio quedó dividido en once regiones y
una zona metropolitana. Este sistema se caracterizó por la creación de unidades espaciales en las
que cada una tuviera un lugar central, determinado por una ciudad o polo de desarrollo que se
expandiera al resto de la región. se estableció como centro del desarrollo nacional la ciudad de
santiago, con la zona metropolitana a su alrededor, y tres polos de desarrollo multirregional, que
fueron: Antofagasta, valparaíso y concepción, y en un tercer nivel de jerarquía otra serie de
polos de desarrollo regional.

El tercer tipo de región es la región política, plan o programa, constituida por el conjunto de
aquellas unidades territoriales hasta donde llega el efecto de las decisiones tomadas por una
determinada persona. Acá tenemos distintos niveles que van desde los correspondientes al
ámbito de las decisiones gubernamentales hasta las de un pequeño productor o empresario que
define su área de comercialización.

3. DELIMITACIÓN DE LAS REGIONES

Es muy importante encontrar herramientas concretas para poder delimitar regiones mediante
métodos operacionales precisos y rigurosos de manera de eliminar la subjetividad lo más
posible.
3.1. DELIMITACIÓN DE REGIONES HOMOGÉNEAS

si la región fuera absoluta y totalmente homogénea la delimitación se podría realizar fácilmente.


por ejemplo, si tomamos el coeficiente de superficie sembrada de cierto cultivo y tenemos que
en algunos predios es del 80% (zona más oscura) y en otros del 40% (zona más clara) sin
intercalarse geográficamente, los distintos niveles de este indicador nos permite trazar la línea de
frontera entre las dos regiones y el desvío estándar del indicador en cada región será igual a cero.

El problema se presenta cuando existe una superposición entre lo que seria la región con niveles
altos de superficie sembrada y la región con niveles bajos.

Supongamos que existen dos regiones A y B y dos alternativas respecto al tratamiento de una
discontinuidad espacial: una opción es incluir en la región A el punto de alta superficie sembrada
con el cual se arrastran otros partidos de nivel bajo; la otra es excluir de la región dicho punto de
nivel alto, por lo que quedaría en la región B.

Delimitación de regiones homogéneas

Sean Xi y J¡ la media y el desvío estándar de cada región bajo la primer alternativa y


Delimitación de regiones
homogéneas

x i y J\ los que surgen de la segunda opción. La mejor alternativa será aquella con menor desvío

estándar:
si O A > O y <B >O ;
A B se elige la primera alternativa

si O A < O y < B <O ;


A B se elige la segunda alternativa

si < A > <A y O B <O o viceversa, se debe ponderar si lo que se gana en B es


B

mayor o menor a lo que se pierde en A, es decir:

si | O A - O | < | O B -O |
A B se elige la primera alternativa

si | O A - O | > | O B -O |
A B se elige la segunda alternativa

Delimitar este tipo de regiones es relativamente fácil si se toma en cuenta una sola actividad o
variable, pero cuando se consideran varias variables resulta más difícil. El análisis de clusters se
presenta como una herramienta adecuada para delimitar las regiones teniendo en cuenta más de
una variable.

3.2. DELIMITACIÓN DE REGIONES POLARIZADAS.

para la delimitación de regiones polarizadas existen varios métodos o criterios que pueden
aplicarse: funciones, flujos, densidades y equipontenciales o gravitatorios.

3.2.1. mÉTODO DE FUNCIONES


Esta técnica fue desarrollada por Losch (1973) y tiene como objetivo identificar aquella función
característica del polo de orden superior que difiere del resto de actividades comunes para otros
centros. Por ejemplo, en el caso de la salud, encontramos centros sanitarios expandidos por casi
todos los pueblos, hospitales simples en muchas ciudades y hospitales de alta complejidad sólo
en algunas ciudades. Hay que tener en cuenta que no se está considerando la intensidad con la
que se cumplen cada una de las funciones, sino el número de las mismas.

Este método permite identificar la jerarquía de los polos urbanos pero no establecer las fronteras
entre las distintas regiones (la periferia).

3.2.2. mÉTODO DE FLUJOS


La idea que está de detrás de este procedimiento es que en una región polarizada los flujos entre
los polos va disminuyendo en intensidad a medida que nos alejamos de uno de ellos, alcanzan un
mínimo en la frontera y a partir de allí los flujos empiezan a subir al acercarnos al siguiente polo.
A partir de esto, se intenta reconstruir la trama del espacio polarizado con los flujos que sea
posible medir. Pueden utilizarse los flujos comerciales, flujos de transporte, flujos migratorios,
etc.
Gráfico N° 5
Delimitación de regiones polarizadas: método de flujos

3.2.3. MÉTODO DE DENSIDADES

Este método permite identificar los polos y delimitar las regiones. La idea sigue siendo la
misma, en el sentido que se espera que la densidad sea máxima en los polos y luego vaya
disminuyendo, llegue a un mínimo y vuelva a crecer a medida que nos aproximamos a otro polo.
Puede utilizarse la densidad demográfica (población/km2), densidad de la actividad económica
(Producto Bruto/km2), ventas, actividad industrial, actividad agropecuaria, etc.

3.2.4. MÉTODO DE EQUIPOTENCIALES O GRAVITATORIO


Este método desarrollado por Isard en 1960 está basado en el modelo de la física newtoniana y
plantea una analogía entre el espacio físico y el espacio económico permitiendo identificar los
polos y las fronteras de las regiones. La idea es que existen masas (en nuestro caso, polos o
centros de orden superior) que ejercen fuerzas de atracción sobre otras masas o puntos (en
nuestro caso, otros centros menores). La importancia de cada una de las masas puede estar dada
por el tamaño que tengan las distintas variables utilizadas para medir su fuerza de atracción o
potencial. Así, cada una de las masas podría medirse, por ejemplo por la población que tiene un
centro urbano, en cuyo caso se estaría midiendo el potencial demográfico. En la práctica, lo
importante es determinar "a priori" las masas para luego medir el potencial ejercido sobre los
distintos puntos.

Si llamamos j a las masas e i a los puntos, definimos a


P3
V/ = —
di

como el potencial ejercido por la masa j sobre el punto i en donde PJ es el valor de la masa j en
términos de la variable seleccionada y dij la distancia que separa a la masa j

del punto i. Se puede observar que el potencial es directamente proporcional al tamaño de la


masa e inversamente proporcional a la distancia.

Gráfico N° 5
Delimitación de regiones polarizadas: método de equipotencialidades.

También se puede medir el potencial total sobre el punto i dado que existen diferentes masas
afectando al mismo punto.

Con los datos obtenidos se puede armar un mapa de equipotenciales (mapa en el cual se unen los
puntos con igual valor gravitatorio). Este mapa permite identificar los polos y las fronteras, dado
que las equipotenciales irán creciendo y se cerrarán en torno a los polos y disminuirían de valor
en las fronteras. Con esto se esta delimitando regiones polarizadas.

Resumen: Los cuatro métodos descriptos parten de la idea de un polo rodeado de una región
geográfica que llega hasta un cierto límite, donde comienza el dominio de otro polo. Todos los
métodos comparten la ventaja de determinar los polos y describir las fronteras 1. En la práctica se
utilizan todos los métodos posibles siempre que se cuente con la información estadística
necesaria.
4. ANÁLISIS DE CLUSTERS

Un cluster es, por definición, un grupo de puntos u observaciones. El objetivo del análisis de
clusters es dividir a los puntos u observaciones en grupos de modo que los puntos dentro de cada
grupo o cluster sean similares entre sí y, a su vez, distintos a los de cualquier otro grupo o
cluster.

Es importante notar que cada punto u observación tiene más de una dimensión. A cada
dimensión la llamamos atributo. Por ejemplo, en una base de datos de personas como la de la
Encuesta Permanente de Hogares (EPH) cada punto u observación es un individuo y las
dimensiones o atributos son las variables (edad, nivel educativo, ingreso, etc.). El análisis de
clusters nos permite armar grupos de individuos similares entre sí en términos de edad, nivel
educativo e ingreso maximizando la distancia entre los grupos. El análisis de clusters es un
método multivariado que permite tener en cuenta el comportamiento de varias variables o
atributos para generar los grupos.

El análisis de clusters se divide en tres pasos fundamentales:

1. Elección de variables relevantes para identificar los grupos:

Todas las variables importantes para la determinación de los grupos deben ser incorporadas,
mientras que deben excluirse aquellas que no aporten información relevante. Por ejemplo, si el
objetivo es agrupar provincias para analizar el problema del desarrollo regional, no podríamos
excluir del análisis la calidad de los recursos humanos que habitan cada jurisdicción. Por el
contrario, sí podríamos ignorar variables tales como el origen étnico de la población. Sin
embargo, la elección final inevitablemente implica cierto grado de subjetividad por parte del
investigador.

2. Elección de una medida de proximidad o distancia:

La noción de distancia o similitud entre puntos está directamente vinculada al análisis de


clusters: si queremos agrupar puntos que sean similares entre sí en términos de ciertos atributos
tendremos que definir una medida de distancia que nos permita medir cuan disímiles son dos
puntos que tienen más de una coordenada (atributo).

1 A excepción del método de funciones para delimitar regiones polarizadas con el cual no puede identificarse la
frontera entre las distintas regiones.
La naturaleza de las observaciones es clave para la elección de una medida de proximidad. Para
el caso de variables continuas suele utilizarse la distancia euclídea:

Donde d(xi, xj) es la medida de distancia entre los puntos u observaciones i y j y P es

el número de atributos que estamos considerando. Siguiendo con el ejemplo anterior, i y j son
dos individuos y P sería igual a tres porque queremos armar grupos de individuos en términos
de tres atributos (edad, nivel educativo e ingreso).
Cuando la naturaleza de las variables es binaria se presentan cuatro situaciones posibles:
1x 0
x
ik = x j k = k = ; x
jk =1
0
1 Xjk =
x
k = xjk = 0

x Definimos:

si
a
i=1 = x
jk =1

si
a
2=l xik = 0; Xj =1 k

si x
a
3=1 kk =1; x
jk =0

si x
a
4=1 k = x jk = 0

En la práctica se usa la siguiente medida de distancia:

d (x., xj) = —.
a1 + aa 4 + A(a 2 + a3)

Donde 5 y X son factores de ponderación.


Nombre de la medida 5 A Definición
Jaccard 0 1 a1
a1 + a2 + a3
Tanimoto 1 2 a1 + a4
a1 + 2(a2 + a3) + a4
Simple matching 1 1 a1 + a4
P
Russel y Rao - - a1
P
Dice 0 0.5 2a1
2a1 + a2 + a3
a
Kulezynski - - 1
a
2 + a3
Nota: P es el número total de atributos.
3. Elección de un algoritmo para construir los grupos

Existen dos tipos de algoritmos de clusters disponibles: los algoritmos jerárquicos y los no
jerárquicos.

Algoritmos jerárquicos

Los pasos del algoritmo jerárquico son los siguientes:

• Se inicia con la partición más fina posible de las observaciones, es decir, que cada
observación será un grupo o cluster. Por ejemplo, cada individuo de la base de personas
de la EPH constituye un grupo.

• Se computan las distancias entre pares de observaciones usando la medida de


proximidad que corresponda de acuerdo a la naturaleza de los datos. Para el caso de
edad, años de educación e ingreso se puede usar la distancia euclídea.

• Identificamos el par de observaciones para las cuales la distancia computada en el paso


anterior fue menor y las agrupamos. Por ejemplo, en la base de personas de la EPH
tenemos n individuos y computamos la distancia entre todos los pares posibles. Si entre
todas las distancias calculadas la menor correspondió a los individuos i y j, agrupamos a
esas dos personas en un cluster. Pasamos de tener n grupos a tener n-1.

• Volvemos a calcular las distancias entre los nuevos grupos y juntamos a aquellos para
los cuales la medida de distancia sea menor. La medida de distancia que usamos en este
caso ya no es la distancia euclídea. Es necesario hacer un ajuste para tener en cuenta que
dos de los grupos iniciales ya fueron unidos. Existen varias medidas de distancias
disponibles para aplicar en esta y las siguientes etapas del procedimiento. Por ejemplo,
la distancia mínima entre los elementos de los grupos (single linkage), la distancia
máxima entre ellos (complete linkage), un promedio ponderado de las distancias
(average linkage), etc.

• Este procedimiento se repite hasta llegar a tener un sólo cluster que contiene a todas las
observaciones. En este ejemplo, obtenemos un único grupo que contiene a todos los

Tomado de Finding Groups in Data: Introduction to Cluster Analysis, Kaufman y Rousseeuw.

individuos.

La representación gráfica de la secuencia de clustering se llama dendograma o diagrama de


árbol. El dendograma nos muestra las observaciones y su distancia y la secuencia de
agrupamiento hasta llegar a un único cluster.
Algoritmos no jerárquicos
Entre los algoritmos no jerárquicos se encuentra el de k-medias, el cual parte de una primera
configuración arbitraria de k grupos y reasigna las observaciones entre ellos buscando minimizar
cierta función objetivo. Normalmente se utiliza la siguiente función de pérdida:
1K

I
2
W x,. x
j

(K)
2
k=1
,j k
i e

1/2 2
)
donde xi x j
j
i
I (x
p=1
ip x
jp
2

Intuitivamente, el algoritmo intenta minimizar las distancias entre observaciones al interior de


cada grupo. Puede demostrarse que esto es equivalente a maximizar la distancia entre los grupos.

Los pasos que sigue el algoritmo de k-medias son los siguientes:

• Parte de una configuración de K grupos y computa los vectores de medias de cada


atributo o variable. Por ejemplo, partiendo de K grupos de individuos el algoritmo
calcula dentro de cada cluster la media de edad, años de educación e ingreso.

• Reasigna las observaciones al cluster más cercano en base a las medias calculadas en el
paso anterior.
• Itera hasta que no haya reasignaciones posibles, es decir, hasta que se alcance el valor
óptimo de la función objetivo.

Notar que podríamos optimizar la función objetivo W(K) chequeando todas las posibles
asignaciones de los N individuos en K grupos. La ventaja sería que alcanzaríamos el mínimo
global pero computacionalmente es imposible de aplicar. Si tenemos N individuos y queremos
formar K grupos existen 1 K K
-----(-1)K-k (—)kN agrupamientos distintos. La alternativa es el algoritmo de k-
K!
k=1 k
medias con el que llegamos a un mínimo local.

Como la media es sensible a outliers también se utiliza el algoritmo de k-medianas que es


idéntico al de k-medias pero el procedimiento calcula la mediana de cada variable en lugar de las
media.

Las principales diferencias entre los métodos jerárquicos y no jerárquicos para armar clusters
tienen que ver con la posibilidad de reasignación de observaciones entre grupos y el momento de
elección del número de grupos: los métodos jerárquicos no requieren definir el número de
grupos previamente a aplicar el procedimiento mientras que en los métodos no jerárquicos el
punto de partida es un agrupamiento de las observaciones en el número de clusters que se
pretende formar. Los métodos jerárquicos no permiten reasignar observaciones entre grupos
mientras que los no jerárquicos las reasignan hasta optimizar una función objetivo.

Recomendaciones: Antes de iniciar un análisis de cluster deben tomarse tres decisiones. La


primera es la elección de las variables relevantes para identificar los grupos, la segunda es la
elección de la medida de proximidad entre las observaciones y por último la elección del criterio
para agrupar individuos en grupos o clusters.

Es muy importante la selección de variables que realmente sean relevantes para identificar los
grupos de acuerdo con el objetivo que se pretenda lograr, de lo contrario el análisis carecerá de
sentido. Un punto importante es que las variables deben estar expresadas en la misma escala, es
decir, que es necesario normalizarlas antes de aplicar cualquier procedimiento. Por ejemplo,
podemos dividir cada variable por su rango (valor máximo - valor mínimo) o por su valor
medio:

edad.
n1 (edadi) =
[max(edad) - min(edad)]
edadt
n
)
2 ( e d a d , = ^-----------------------------------j-
I edadi N
i=1 /
Distintos medidas de proximidad pueden dar resultados distintos utilizando los mismos datos.
Para elegir el algoritmo de cluster es conveniente conocer las principales características de los
métodos disponibles.
Bibliografía

Hardle & Simar (2003): "Applied Multivariate Statistical Analysis", capítulo 11.

Isard, W. (1960): "Methods of Regional Analysis", Cambridge, MIT Press.

Krugman, P. (1991): Geography and Trade, MIT Press, Cambridge, MA, 1991).

Losch, A. (1973): "The Economics of Location" Yale University Press.


Perroux, F. (1955) : "Note sur la notion de pole de croissance" Economique Appliquée 1-2:
307-22.

También podría gustarte