Está en la página 1de 15

Captulo 2.

Procesamiento de los datos


1. Introduccin
El primer paso en el proceso cartogrfico es decidir una jerarqua para las clases a cartogra-
fiar, as como el modelo de distribucin que se tomar el conjunto de datos va a conce-
birse como continuo y uniforme por ejemplo. El cartgrafo debe utilizar tcnicas estads-
ticas al utilizar escalas nominales, ordinales, de intervalo y de ndice en la manipulacin de
datos. Tambin las utilizar en la seleccin de las categoras; por ejemplo, la realizacin de
un mapa de suelos exige la elaboracin de las categoras modales.
Tras estas decisiones bsicas se puede proceder a valorar una serie de cuestiones relacionadas
con los datos.
Como se apunt anteriormente los datos estadsticos a menudo se obtienen a partir de dis-
tintas fuentes y es necesario homogeneizarlos de modo que proporcionen valores compara-
bles. Por ejemplo, diversos pases utilizan distintas unidades de medidas tales como las
mtricas, las toneladas largas o cortas, las hectreas o los kilmetros cuadrados etc.
Tambin con frecuencia es necesario depurar las estadsticas de modo que queden elimina-
dos aquellos aspectos que no se desean reflejar, como al preparar por ejemplo un mapa de
poblacin rural, donde es necesario eliminar los datos referentes a la poblacin urbana del
conjunto de datos total.
En algunos casos, el siguiente paso es convertirlos a datos que puedan utilizarse en la elabo-
racin cartogrfica como ndices, rendimientos por hectrea, densidades, porcentajes y otras
varias, que deben calcularse antes de proceder al diseo del mapa. Asimismo es habitual que
posteriormente sea necesario proceder a la clasificacin de los datos en intervalos de clase.
2. Datos absolutos y datos relativos
Los mapas cuantitativos se hacen representando en ellos valores de dos tipos: absolutos o
relativos. Son ejemplos del primer grupo los mapas que muestran la produccin o el consu-
mo de bienes, las elevaciones de la superficie terrestre sobre el nivel del mar Una repre-
sentacin de datos en forma absoluta significa que los valores se muestran tal y como se
toman. Las cantidades se observan respecto a un solo tipo de datos, y podemos expresarlas
sobre el mapa en trminos absolutos, como por ejemplo la produccin de energa hidroe-
lctrica por provincias, o la poblacin por regiones. En ningn caso de los expuestos, los
datos expresan relaciones.
Los mapas que representan valores relativos expresan algn tipo de resumen o alguna clase
de relacin entre dos o ms juegos de datos. Entre los ejemplos de este segundo grupo se
pueden citar la densidad de poblacin, los ingresos per cpita, la tasa de paro
En definitiva, se trata de resumir los datos brutos con el fin de facilitar su posterior repre-
sentacin grfica, as como de proporcionar nuevos datos que resulten esclarecedores en
cuanto al tema que tratan, o que expliquen situaciones mediante dicha combinacin de
18
variables. Los tipos de relaciones ms utilizadas en cartografa son las que se tratan ms ade-
lante bajo los epgrafes de ndices y densidades.
3. Promedios
Los promedios constituyen probablemente el tipo ms comn de variables derivadas emple-
adas, ya que utilizan una cualidad o cantidad seleccionada para caracterizar una serie de
datos que normalmente son numerosos. Existen muchos tipos de promedios, pero en tr-
minos generales, en cartografa interesan principalmente tres de ellos que son, la media arit-
mtica, la mediana y la moda (de la que ya se habl anteriormente).
La media aritmtica
La mayora de los mapas de clima, ingresos, produccin, y otros elementos tratados en el
estudio del carcter fsico y humano de las regiones se basan en medias aritmticas obteni-
das mediante la reduccin de grandes cantidades de datos estadsticos.
Sin querer abundar en este concepto, s es interesante destacar que en catografa a menudo
la media debe considerarse en funcin de una superficie. Si en un mapa se representa el valor
de la tierra de cultivo por hectrea en cada comunidad por ejemplo, ste ha de prepararse a
partir de datos obtenidos por promedios regionales, entre las que existirn (grandes) dife-
rencias de tamao.
Si se da la misma importancia a todas las regiones se falsea el promedio de las comunidades,
por lo que siempre que los valores (x) en una distribucin estn relacionados de cualquier
modo con una extensin de superficie, stos deben considerarse en funcin de su frecuencia
superficial.
La expresin general para cualquier media considerada en funcin del rea es, por lo tanto:
xs = Sa x/A; donde Sa x representa la suma de los productos de cada valor x por su superfi-
cie, y A es la superficie total. La media considerada en funcin de la superficie tambin se
denomina media geogrfica.
La mediana
Si ordenamos todos los valores que toma una variable desde el inferior hasta el superior, la
mediana es el valor situado en el centro, de forma que la mitad de los valores sern superio-
res y la otra mitad inferiores a dicho valor. Es otro tipo de medida relativa de la tendencia
central, utilizable por ejemplo en un mapa que represente, en este caso, la mediana de los
valores de tierra de cultivo por hectrea en cada provincia, obtenida a partir de los datos
municipales.
Al igual que en el caso anterior, si las regiones varan muchsimo en cuanto a extensin, debe
considerarse la mediana en funcin de la superficie. Hacindolo as, la mediana geogrfica
ser el valor por encima y por debajo del cual se halla la mitad de la superficie total. El valor
19
de la mediana geogrfica es aquel cuya superficie acumulada asociada, resulta igual a la mitad
de la superficie total.
4. Indices
Otra clase de cantidad relativa es la consistente en medidas como razones o ndices, propor-
ciones y porcentajes, en las que algo se mide por unidades de otro elemento, o en las que
algn elemento de los datos se individualiza para compararlo con el resto.
Los mapas que representan el porcentaje de das de lluvia, la proporcin de ganado vacuno
dentro de la ganadera en general, las tasas o ndices de mortalidad, o la tasa de crecimiento
o decrecimiento de algn fenmeno son algunos ejemplos. En este grupo el valor numrico
representado en el mapa ser normalmente el resultado de una de las siguientes operaciones:
Razn o ndice
La razn es una expresin de relacin entre datos. que se expresa de la forma fa/fb, en
donde fa es la frecuencia de una clase a, y fb es la frecuencia o nmero de elementos de
otra clase b.
Como ejemplo podemos considerar la razn de sexos de una pequea poblacin. Saber que
existen 3000 hombres da una idea al respecto, pero si adems se sabe que el nmero de
mujeres es de 1500 la idea cambia y vemos que la razn es de dos hombres por mujer.
Proporcin
La proporcin es la razn entre la frecuencia de una clase (fa para la clase a) y el total
(fa/N) siendo N la frecuencia total. En el ejemplo anterior, la proporcin de hombres es
de 3000/4500, es decir de 0,66.
Porcentaje
Normalmente las proporciones se dan multiplicadas por 100, o lo que es lo mismo en
porcentajes. En este caso decir que el 66% de la poblacin son hombres, es ms sencillo
y fcil de entender que hablar de una proporcin de hombres de 0,66.
Tambin estas estadsticas presentan a veces las caractersticas de un promedio espacial. Este
tipo de razones son la base del concepto de densidad que se trata ms adelante. Una razn
tpica de la geografa es la de densidad de poblacin, definida como el nmero de habitan-
tes por kilmetro cuadrado o por otra unidad superficial. Si el rea de la poblacin anterior
es de 10 kilmetros cuadrados, la densidad de poblacin sera de 4.500/10, es decir 450
hab/km
2
.
La cartografa de este tipo de cantidades relativas se elabora para mostrar las variaciones de
un lugar a otro de la relacin definida, y normalmente se prepara a partir de resmenes de
datos estadsticos. Cuando los porcentajes, razones y tasas se simbolizan en unos lmites, el
usuario supone que el valor representado se extiende de modo ms o menos uniforme a tra-
vs de dicha unidad.
Si esto no se produce en la realidad, entonces los datos representados pueden resultar un
tanto equvocos. Otro tanto sucede si hay muy pocos elementos, de modo que el 100% de
nios escolarizados puede ser el resultado de que los diez jvenes de una regin despoblada
20
asistan a clase. Por otro lado nunca deben servir de base para una razn cantidades no com-
parables o que carezcan de sentido dentistas por kilmetro cuadrado, el sentido comn
normalmente indicar maneras de asegurar la posibilidad de comparacin.
5. Densidades
Las densidades se utilizan cuando lo que se quiere reflejar es la acumulacin o escasez geo-
grfica relativa de datos discretos. Se calcula dividiendo el dato por la superficie en la que se
encuentra, pero en muchos casos este valor no es tan significativo como el que expresa la
razn entre otros factores que estn ms estrechamente relacionados. Por ejemplo, la relacin
entre nmero de personas y superficie productiva en sociedades predominantemente agrco-
las. Esta relacin se considera ms til que lo que lo es el simple clculo de la poblacin con
respecto al rea total, productiva o no.
Al trabajar con densidades el cartgrafo est limitado en el detalle que puedan presentar los
tamaos de las unidades de enumeracin (municipios, regiones o pases) en las que se ha ela-
borado el recuento de elementos, aunque en muchos casos los datos iniciales deben com-
plementarse con los proporcionados por otras fuentes con el fin de presentar una distribu-
cin ms cercana a la realidad.
Otra categora de cantidades relativas son los potenciales (o criterio de gravedad), que tam-
bin se utilizan en mapas, y que suponen que los elementos de una distribucin personas
o precios por ejemplo influyen entre s directamente con las magnitudes del fenmeno e
inversamente con la distancia entre sus ubicaciones. De este modo el valor del potencial en
un punto, es la suma de la influencia de todos los dems puntos sobre l, ms su propia
influencia.
6. Clasificacin de los datos en intervalos de clase
En pginas anteriores se menciona la repercusin que tiene en un mapa el sistema de clasi-
ficacin de datos que se haya empleado en su confeccin, ya que por absolutos o relativos
que sean los datos que describen la distribucin, a menudo stos son demasiado numerosos
como para ser representados grficamente uno a uno.
Si se piensa en lo que respecta a las poblaciones de un mapa general, lo normal es que stas
se presenten categorizadas, en clases ordenadas y con diferencias cuantitativas expresas, de
modo que stas se agrupan en funcin de que tengan menos de 25.000 habitantes, o de
25.000 a 100.000 y as sucesivamente hasta alcanzar el mximo, o la ciudad ms habitada.
En este caso ser raro que se represente con signo propio la poblacin con 26.023 habitan-
tes, o la que cuenta con 26.102 etc.
La forma de categorizar las poblaciones anteriores es desde luego arbitraria, en el sentido de
que los lmites pueden ser cualesquiera, aunque siempre se debe buscar la forma ms repre-
sentativa de mostrar la distribucin que se trate.
21
Este aspecto es especialmente decisivo al emplear la tcnica coropltica, donde se ver que
hay que resumir en un nmero de clases reducido el total de los datos que hay que repre-
sentar.
Son dos las decisiones fundamentales a tomar al clasificar los datos; por un lado el nmero
de clases que se representarn, y por otro los lmites de cada uno de los intervalos. Cada sub-
divisin de datos estadsticos en intervalos de clase puede ser comparada con un proceso de
generalizacin, asumiendo que esta generalizacin afecta a la superficie estadstica corres-
pondiente, uniformizando sus irregularidades.
La realizacin de intervalos tambin puede compararse con la obtencin de curvas de nivel
que son el resultado de intersectar planos horizontales con un modelo del terreno.
Igualmente los intervalos pueden obtenerse intersectando planos horizontales con la super-
ficie estadstica que describe una distribucin determinada. Todas las z comprendidas entre
dos planos consecutivos, pertenecern a la misma clase.
No cabe la menor duda acerca de que un sistema de clasificacin no adecuado para los datos
de partida puede proporcionar un mapa alejado de la realidad, y que incluso puede distor-
sionarla, por lo que la clasificacin final que se realice para un mapa, requiere de un estudio
previo orientado a encontrar aquel sistema que se adapte bien a los datos iniciales. Se trata
de proporcionar una imagen clara y legible, sin desvirtuar la distribucin original.
22
La superficie estadstica
Una superficie estadstica es la superficie
formada al asignar a cada punto del terri-
torio (x,y), una z proporcional al valor que
toma una variable cuantitativa en dicho
punto.
Al formar esta superficie, pueden no existir
saltos bruscos de modo que tal y como ocurre
con la topografa del terreno, el cambio de
las diferentes z es ms o menos suave, pero
siempre gradual. As sucede con las tem-
peraturas, precipitaciones, presin atmosfri-
ca
Entre dos datos puntuales puede obtenerse el
valor correspondiente a un punto intermedio
sin ms que interpolar. Adems existen
valores para todos los puntos de la superfi-
cie. No existen saltos bruscos, estamos
hablando de una superficie estadstica sua-
vizada, que ser la que corresponda a fen-
menos continuos, como la temperatura, las
presiones atmosfricas.
Por el contrario a distribuciones discretas
les corresponder una superficie estadstica
escalonada, donde los valores pueden variar
de forma brusca, sin que existan valores
intermedios. La mayora de las distribucio-
nes socio-econmicas como la densidad de
poblacin, las ocupaciones profesionale
son de este tipo y, por continuar con el ejem-
plo anterior, entre dos puntos de control no
tiene por qu existir un valor intermedio.
El nmero de clases
El nmero de clases es funcin del detalle necesario para mostrar adecuadamente el conte-
nido temtico, pero viene limitado por aspectos perceptivos (as como de la tcnica a emple-
ar en la representacin y el proceso de impresin). Lgicamente con tres intervalos no es
posible detallar tanto el comportamiento de la variable en el espacio como lo haramos con
doce, pero elegir un nmero demasiado alto no est exento de problemas; hay que buscar un
punto de equilibrio segn cada caso particular.
Los lmites de clase
Una vez decidido el nmero de clases que se van a emplear en una representacin, el siguien-
te paso es establecer por dnde se realizarn los cortes en la distribucin. Los sistemas que se
pueden emplear son muy numerosos por lo que slo algunos de ellos se muestran en los
ejemplos ms adelante.
Como gua general a seguir, se deben buscar lmites que reduzcan al mnimo las diferencias
entre los datos de una misma clase, y que a ssu vez hagan mximas las diferencias entre cla-
ses. Esto puede estar reido tambin con la lectura del mapa, ya que intervalos iguales y con
lmites redondos siempre son ms rpidos de interpretar que otros irregulares y con lmites
menos memorizables.
7. Lmites de clase
Es este un tema que se trata de manera diferente segn la bibliografa cartogrfica que se con-
sulte, donde diferentes autores realizan sus propias clasificaciones para los distintos sistemas
de realizacin de intervalos de clase. Por otro lado, los sistemas de clasificacin son tan
numerosos que parece necesario categorizarlos de algn modo.
Hay quien distingue entre matemticos/estadsticos y empricos (Gorkin & Gocham 1974).
Dickinson habla de 5 formas principales de las que 4 de ellas seran matemticas/estadsticas.
Robinson (1985) slo diferencia tres; intervalos iguales, sistemticamente desiguales e irre-
gulares, y es el esquema que se presenta en el siguiente apartado. Wonka (1980) tambin
habla de tres formas principales, pero subdivide la categora de los empricos en exgenos y
los determinados en base a su distribucin espacial.
Evans (1977) habla de cuatro mtodos principales; exgenos, arbitrarios (buscan lmites de
fcil lectura sin preocuparse de la distribucin original de los datos), ideogrficos (se basan
en detalles especficos del conjunto de datos para representar los puntos de ruptura de la
distribucin), y por ltimo menciona las series (intervalos iguales, en progresin).
Pasamos ahora a mostrar la clasificacin empleada por Robinson en su clsico, Elemetos de
Cartografa, que como se ha indicado distingue tres categoras: Intervalos iguales, sistemti-
camente desiguales e irregulares.
23
7.1. Intervalos de clase iguales
7.1.1. Iguales segn la amplitud de los datos
Consiste en dividir la amplitud mxima existente entre los datos, entre el nme-
ro de clases que se haya elegido (nf-ni)/n. Este tipo de clasificacin puede ser til
para realizar mapas de isolneas por ejemplo. Puede proporcionar clases con
muchas observaciones y otras con muy pocas o ninguna cuando la distribucin
se asemeja a una distribucin normal. Se adapta mejor a distribuciones rectan-
gulares y es ms representativa cuando la amplitud del conjunto de datos es
pequea.
7.1.2. Iguales segn los parmetros de la distribucin normal
Para elegir los intervalos de clase, pueden utilizarse los parmetros de una dis-
tribucion normal. Basta obtener la media del conjunto de datos y su desviacin
estndar, que puede ser sumada y restada desde la media (en fracciones o ml-
tiplos). Cuanto ms normal sea la distribucin de los datos, mejores resultados
se obtendrn de la aplicacin de este mtodo, que adems resulta til para mos-
trar los desvos respecto a dicha media.
Tambin se puede buscar equilibrar la distribucin dividiendo los datos por
medias sucesivas, de forma que se halla primero la media del conjunto total, y a
su vez las medias de los grupos que sta deja por encima y por debajo. Para cada
una de estas cuartas partes se realiza la operacin anterior, y as sucesivamente.
Este sistema puede ser til cuando el nmero de intervalos requerido sea 2n.
7.1.3. Iguales segn el nmero de observaciones; cuantiles
Consiste en dividir el nmero de observaciones en partes iguales al nmero de
clases que queramos. Son habituales los cuartiles (4 clases), los quintiles (5), los
septiles (7), los deciles (10). Para obtener cuartiles se ordenan los datos y se divi-
den en cuatro partes con igual nmero de observaciones cada uno.
Los percentiles muestran los valores donde se encuentran ciertos porcentajes de
casos por encima y por debajo. As el percentil 25 es el valor por debajo del cual
se encuentra el 25% de los valores observados de una variable, y por encima del
que se encuentran el 75% de los valores restantes.
Los cuantiles de superficie consisten en intervalos que en el mapa ocupan una
cantidad de superficie similar. La superficie total se divide en el nmero de cla-
ses elegido y los lmites de cada intervalo se desprenden en funcin de esta igual-
dad de superficies. Su ventaja consiste en que en el mapa los colores se distri-
buyen por igual, pero por otro lado su utilizacin puede desnaturalizar conside-
rablemente la distribucin original y presentar mapas alejados de la realidad que
se desea describir.
24
7.2. Intervalos en progresin
Generalmente las series de datos que tienen una amplitud menor causan menos problemas
cartogrficos que las series que abarcan un rango mayor. En el ltimo caso los intervalos de
clase tienen que ser grandes y con ellos no se pueden mostrar detalles en toda la amplitud de
datos.
Sin embargo, a menudo se necesita detallar la distribucin en los valores ms bajos, ya que
pequeas diferencias absolutas, pueden tener una gran importancia relativa, tal y como suce-
de en la eleccin de los intervalos de altura para la representacin del relieve por medio de
tintas hipsomtricas. Una forma de detallar ms la distribucin en los valores ms bajos es
utilizando series en progresin, donde los intervalos crecen sistemticamente. Se describen
algunas de ellas a continuacin.
7.2.1. Intervalos en progresin aritmtica
En este sistema el tamao de cada intervalo aumenta progresivamente con un
valor constante. Conociendo el nmero de clases en que se ha de dividir una
serie de datos, el clculo de los intervalos de clase se hace como sigue:
a+x+2x+3x+4x+................+nx= b; donde a es valor ms bajo y b el valor ms
alto, n el nmero de clases y x el tamao del primer intervalo.
Puesto que a, b, y n son conocidos, el valor
del incremento x se puede despejar, y defi-
nir por tanto los intervalos como siguen.
Es posible considerar que el valor del incre-
mento tambin aumente cada vez, obte-
niendo una serie en progresin aritmtica
con un ndice en aumento, de forma que el
intervalo crezca ms rpido.
7.2.2 Intervalos empleando progresiones geomtricas
Este caso es igual que el anterior, slo que el intervalo va aumentando cada vez
siguiendo una progresin geomtrica, con un crecimiento ms rpido del tama-
o del intervalo. Una forma sencilla de emplear progresiones de este tipo es fijar
que sean los lmites los que respondan a esta clase de progresin. Siendo a el
valor mas bajo, x la razn de la progresin y n el nmero total de clases, estas
quedan definidas tal y como se muestra abajo.
El mayor valor de la ltima clase iguala al valor ms alto en
el conjunto de datos, es decir que b= ax
n
. As es posible cal-
cular el valor de x, y con slo multiplicar obtener los lmi-
tes de clase.
25
a - (a+x) diferencia x
(a+x) - (a +3x) 2x
(a +3x) - (a+6x) 3x
(a+6x) - (a+10x) 4x
a - ax
ax - ax
2
ax
2
- ax
3

ax
n-1
- ax
n
7.3. Intervalos irregulares
En los sistemas anteriores los lmites de clase son impuestos al utilizar la regla matemtica
del sistema seleccionado, de forma que del clculo del tamao de los intervalos se despren-
den unos valores, que son los que rompen en el continuo de la distribucin, y son los que
se emplean despus como lmites de los intervalos. De algn modo, son unos lmites impues-
tos o forzados.
Sin embargo antes de elegir el sistema de clasificacin es sin duda muy til la observacin de
los datos, utilizando por ejemplo grficos, como la curva de frecuencias. Se trata de conocer
cmo se comportan los datos, observar qu tendencias siguen, ver si su crecimiento es cons-
tante o si hay cambios bruscos en el comportamiento del dato. Nos interesa tambin saber
en qu regiones hay ms observaciones, dnde se acumulan y dnde se dispersan.
Puntos de ruptura
En la observacin anterior quiz se manifiesten claramente los llamados puntos de ruptura
naturales de la distribucin. Son puntos de ruptura aqullos que representan puntos signifi-
cativos de sta, irregularidades que pueden corresponderse con puntos de inflexin, cambios
de pendiente, ausencia del dato
Una vez determinados estos puntos crticos los intervalos son los que de se desprenden natu-
ralmente. De este modo podrn ser completamente irregulares, por ejemplo: 0-10; 10-25;
25-40; 40-60; 60-75 donde los intervalos de clase son respectivamente de: 10, 15, 15, 20 y
15 (de ah el incluirlos en este epgrafe de intervalos irregulares) sin atender a ninguna regla
lgica.
Si estos lmites propios de la distribucin son claros y estn bien definidos, resulta intere-
sante seleccionar los intervalos empleando como gua dichos puntos de ruptura, procedien-
do en sentido contrario al del caso de los intervalos de igual tamao o de los intervalos en
progresin: En ellos los lmites son consecuencia de la aplicacin del tamao del intervalo,
y son ajenos a la distribucin. En este otro caso se parte del conocimiento de los lmites que
no son ajenos a la distribucin desprendindose de ellos los intervalos.
Este tipo de clasificacin puede utilizarse para realzar elementos que con otros sistemas pasa-
ran desapercibidos. Para observar la distribucin de los eventos en el conjunto de la infor-
macin, pueden construirse una serie de grficos que proporcionen una imagen adecuada de
la distribucin de las caractersticas.
Tales grficos son por ejemplo los grficos de dispersin, la curva de frecuencias, la curva de
frecuencias acumulativas, la curva clinogrfica, etc. Todos ellos ayudan a sealar las irregula-
ridades de la distribucin de los datos.
Solamente si los grficos muestran claramente las irregularidades, pueden elegirse sin difi-
cultad los puntos que delimitarn las clases. Muchas veces sin embargo, las irregularidades
no son tan importantes o no estn tan inequvocamente sealadas, en cuyo caso nos decidi-
remos por elegir intervalos de clase ms sistemticos, y ms sencillos de interpretar.
26
Tambin es posible emplear tcnicas estadsticas en la definicin de intervalos segn los pun-
tos de ruptura naturales. El llamado Mtodo de Optimizacin de Jenks, es el que implemen-
tan diferentes aplicaciones informticas bajo la opcin de realizar intervalos segn los pun-
tos de ruptura naturales de la distribucin (natural breaks). Este mtodo persigue el doble
propsito de obtener clases de gran homogeneidad interna, con mximas diferencias entre
las clases para el nmero de intervalos que se haya especificado previamente.
Para ello realiza la clasificacin basndose en la prueba de la bondad del ajuste Goodness of
Variance Fit (GVF) que indica cmo de bien describen las clases al conjunto. Dicho indi-
cador toma diferentes valores segn los agrupamientos que se hagan de un mismo conjunto
de datos, siendo ms representativos aquellos agrupamientos que proporcionen los valores
ms altos. Se trata de un proceso iterativo que calcula la media de cada clase con las respec-
tivas varianzas, y traslada observaciones entre clases hasta obtener el valor mximo del GVF.
Lmites exgenos
En ocasiones resulta interesante incluir como lmites de intervalo ciertos valores que siendo
ajenos a los datos observados, son significativos para la variable. Se trata de valores impor-
tantes para el tema en cuestin, aunque no representen un lmite natural en la distribucin
que corresponda representar. Tienen un significado en s mismos y son ajenos al conjunto
observado, de donde viene su denominacin.
En una mapa de renta per cpita por ejemplo, resultar expresivo introducir el valor que se
corresponde con el ndice de pobreza, o el valor crtico de densidad de poblacin en el
caso de un mapa de densidad de poblacin A menudo existe la posiblilidad de delimitar
ciertos intervalos con valores exgenos interesantes; stos deben considerarse antes de reali-
zar la clasificacin definitiva, y si en el tema que corresponde describir pueden definirse
valores de este tipo, hay que considerar la opcin de incluirlos en el mapa.
8. Conclusiones
La clasificacin de datos en intervalos es un proceso de generalizacin que afecta a la
superficie estadstica correspondiente, donde se uniformizan sus pequeas irregularidades.
No obstante se deben intentar mantener los rasgos ms destacados de cada distribucin, de
modo que si entre los datos existe alguno excepcional, ste debe constar como tal en el
mapa.
Se debe intentar seleccionar las clases de manera que se mantengan las caractersticas ms
significativas de la distribucin, abarcando todo el rango de datos y sin que existan clases
vacas. Asimismo resulta conveniente dividir los datos en grupos de nmeros de observa-
ciones razonablemente similares, as como buscar una relacin lgica en los tamaos de los
intervalos pues facilitar la lectura.
A modo de gua se puede decir que los intervalos iguales segn rango son tiles en el caso
de que el histograma del conjunto de datos sea ms o menos rectangular, lo que no habitual
en los fenmenos geogrficos, y los corogramas (en el caso de tratarse de mapas de corople-
27
tas) fueran de tamaos similares. En estos casos la clasificacin proporciona un mapa bien
ordenado y metdico, de fcil lectura.
La clasificacin basada en la distribucion normal slo debera utilizarse cuando la distribu-
cin de datos se asemejara a una distribucin normal, y es particularmente til cuando el
propsito del mapa es mostrar la desviacin respecto a la media del conjunto. En estos
casos normalmente las categoras quedan limitadas a seis clases.
Los cuantiles no deberan utilizarse en el caso en que los tamaos de los corogramas varia-
ran considerablemente. Para utilizar cuantiles de superficie, precisaramos tambin de
corogramas de tamaos similares.
Una progresin aritmtica ser adecuada cuando la grfica de la distribucin del conjunto
de datos se asemeje a una progresin aritmtica, y lo mismo ocurrira con las progresiones
geomtricas, que sern aplicables cuando la grfica tienda a mostrar una progresin geo-
mtrica.
Los puntos de ruptura de la distribucin nos proporcionarn grupos de valores homogne-
os, lo que sin duda es deseable, y su utilizacin ser interesante cuando dichas rupturas
queden claramente definidas. Adems este sistema puede utilizarse junto con algn otro
sistema de clasificacin.
Vistos los distintos tipos de clasificacin para un mismo conjunto de datos, slo queda ver
cul de ellos es el que mejor se adeca a la distribucin real de los mismos. Para ello se puede
construir la superficie estadstica correspondiente a la distribucin real y las correspondien-
tes a las calsificaciones. La que parecida al modelo real es la correspondiente a la mejor cla-
sificacin para el conjunto de datos.
A continuacin se muestran los efectos que tendra la aplicacin de algunos sistemas de clasificacin de
datos, sobre un supuesto mapa de coropletas, donde los datos de partida varan de cero a cien. Con esto
se pretende mostrar la realizacin prctica de intervalos de clase, y ms an dejar claro su manifesta-
cin directa en los mapas. Se elige una base cartogrfica de delimitacin provincial y la realizacin de
cuatro intervalos de clase.
28
29
1 Lleida 1 37 Almera 29, 8
2 Castelln 8 1, 6 38 Vizcaya 28 , 9
3 Baleares 8 , 2 39 Salamanca 28 , 4
4 Girona 78 , 2 4 Jan 28 , 1
5 Soria 77, 2 41 Mel i l l a 25, 8
6 Teruel 76 , 1 42 Cceres 23, 4
7 Huesca 74, 9 43 Asturias 21, 4
8 Navarra 73, 3 44 Len 2 , 4
9 Tarragona 71, 5 45 Ceuta 2 , 3
1 Alava 6 9, 2 46 Mlaga 19, 9
11 Zaragoza 6 8 , 6 47 Granada 18 , 8
12 Rioja 6 7, 5 48 Badajoz 16 , 9
13 Cuenca 6 1, 1 49 Sevilla 15, 2
14 Segovia 6 , 2 5 Crdoba 9, 1
15 Guipzcoa 57, 4 51 Huelva , 3
16 Guadalajara 57, 1 52 Cdiz
17 Lugo 55
18 Toledo 52, 2
19 Burgos 49, 6
2 Avila 49, 4
21 Barcelona 47
22 Zamora 46 , 9
23 Corua (A) 45, 8
24 Alicante 44, 7
25 Madrid 43, 4
26 Palencia 41, 8
27 Palmas (Las) 38 , 7
28 Murci a 37, 7
29 Cantabria 36 , 5
3 S.C.Tenerife 35, 4
31 Pontevedra 34, 5 mx 1
32 Valladolid 33, 7 mn
33 Ourense 33, 6 media 54, 8 944444
34 Ciudad Real 32, 8 desv.tip 17, 76 6 6 18 9
35 Valencia 32 mediana 5 , 9
36 Albacete 31, 4
Los Datos Cuatro intervalos de 0 a 100
30
31
32

También podría gustarte