Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ax
n-1
- ax
n
7.3. Intervalos irregulares
En los sistemas anteriores los lmites de clase son impuestos al utilizar la regla matemtica
del sistema seleccionado, de forma que del clculo del tamao de los intervalos se despren-
den unos valores, que son los que rompen en el continuo de la distribucin, y son los que
se emplean despus como lmites de los intervalos. De algn modo, son unos lmites impues-
tos o forzados.
Sin embargo antes de elegir el sistema de clasificacin es sin duda muy til la observacin de
los datos, utilizando por ejemplo grficos, como la curva de frecuencias. Se trata de conocer
cmo se comportan los datos, observar qu tendencias siguen, ver si su crecimiento es cons-
tante o si hay cambios bruscos en el comportamiento del dato. Nos interesa tambin saber
en qu regiones hay ms observaciones, dnde se acumulan y dnde se dispersan.
Puntos de ruptura
En la observacin anterior quiz se manifiesten claramente los llamados puntos de ruptura
naturales de la distribucin. Son puntos de ruptura aqullos que representan puntos signifi-
cativos de sta, irregularidades que pueden corresponderse con puntos de inflexin, cambios
de pendiente, ausencia del dato
Una vez determinados estos puntos crticos los intervalos son los que de se desprenden natu-
ralmente. De este modo podrn ser completamente irregulares, por ejemplo: 0-10; 10-25;
25-40; 40-60; 60-75 donde los intervalos de clase son respectivamente de: 10, 15, 15, 20 y
15 (de ah el incluirlos en este epgrafe de intervalos irregulares) sin atender a ninguna regla
lgica.
Si estos lmites propios de la distribucin son claros y estn bien definidos, resulta intere-
sante seleccionar los intervalos empleando como gua dichos puntos de ruptura, procedien-
do en sentido contrario al del caso de los intervalos de igual tamao o de los intervalos en
progresin: En ellos los lmites son consecuencia de la aplicacin del tamao del intervalo,
y son ajenos a la distribucin. En este otro caso se parte del conocimiento de los lmites que
no son ajenos a la distribucin desprendindose de ellos los intervalos.
Este tipo de clasificacin puede utilizarse para realzar elementos que con otros sistemas pasa-
ran desapercibidos. Para observar la distribucin de los eventos en el conjunto de la infor-
macin, pueden construirse una serie de grficos que proporcionen una imagen adecuada de
la distribucin de las caractersticas.
Tales grficos son por ejemplo los grficos de dispersin, la curva de frecuencias, la curva de
frecuencias acumulativas, la curva clinogrfica, etc. Todos ellos ayudan a sealar las irregula-
ridades de la distribucin de los datos.
Solamente si los grficos muestran claramente las irregularidades, pueden elegirse sin difi-
cultad los puntos que delimitarn las clases. Muchas veces sin embargo, las irregularidades
no son tan importantes o no estn tan inequvocamente sealadas, en cuyo caso nos decidi-
remos por elegir intervalos de clase ms sistemticos, y ms sencillos de interpretar.
26
Tambin es posible emplear tcnicas estadsticas en la definicin de intervalos segn los pun-
tos de ruptura naturales. El llamado Mtodo de Optimizacin de Jenks, es el que implemen-
tan diferentes aplicaciones informticas bajo la opcin de realizar intervalos segn los pun-
tos de ruptura naturales de la distribucin (natural breaks). Este mtodo persigue el doble
propsito de obtener clases de gran homogeneidad interna, con mximas diferencias entre
las clases para el nmero de intervalos que se haya especificado previamente.
Para ello realiza la clasificacin basndose en la prueba de la bondad del ajuste Goodness of
Variance Fit (GVF) que indica cmo de bien describen las clases al conjunto. Dicho indi-
cador toma diferentes valores segn los agrupamientos que se hagan de un mismo conjunto
de datos, siendo ms representativos aquellos agrupamientos que proporcionen los valores
ms altos. Se trata de un proceso iterativo que calcula la media de cada clase con las respec-
tivas varianzas, y traslada observaciones entre clases hasta obtener el valor mximo del GVF.
Lmites exgenos
En ocasiones resulta interesante incluir como lmites de intervalo ciertos valores que siendo
ajenos a los datos observados, son significativos para la variable. Se trata de valores impor-
tantes para el tema en cuestin, aunque no representen un lmite natural en la distribucin
que corresponda representar. Tienen un significado en s mismos y son ajenos al conjunto
observado, de donde viene su denominacin.
En una mapa de renta per cpita por ejemplo, resultar expresivo introducir el valor que se
corresponde con el ndice de pobreza, o el valor crtico de densidad de poblacin en el
caso de un mapa de densidad de poblacin A menudo existe la posiblilidad de delimitar
ciertos intervalos con valores exgenos interesantes; stos deben considerarse antes de reali-
zar la clasificacin definitiva, y si en el tema que corresponde describir pueden definirse
valores de este tipo, hay que considerar la opcin de incluirlos en el mapa.
8. Conclusiones
La clasificacin de datos en intervalos es un proceso de generalizacin que afecta a la
superficie estadstica correspondiente, donde se uniformizan sus pequeas irregularidades.
No obstante se deben intentar mantener los rasgos ms destacados de cada distribucin, de
modo que si entre los datos existe alguno excepcional, ste debe constar como tal en el
mapa.
Se debe intentar seleccionar las clases de manera que se mantengan las caractersticas ms
significativas de la distribucin, abarcando todo el rango de datos y sin que existan clases
vacas. Asimismo resulta conveniente dividir los datos en grupos de nmeros de observa-
ciones razonablemente similares, as como buscar una relacin lgica en los tamaos de los
intervalos pues facilitar la lectura.
A modo de gua se puede decir que los intervalos iguales segn rango son tiles en el caso
de que el histograma del conjunto de datos sea ms o menos rectangular, lo que no habitual
en los fenmenos geogrficos, y los corogramas (en el caso de tratarse de mapas de corople-
27
tas) fueran de tamaos similares. En estos casos la clasificacin proporciona un mapa bien
ordenado y metdico, de fcil lectura.
La clasificacin basada en la distribucion normal slo debera utilizarse cuando la distribu-
cin de datos se asemejara a una distribucin normal, y es particularmente til cuando el
propsito del mapa es mostrar la desviacin respecto a la media del conjunto. En estos
casos normalmente las categoras quedan limitadas a seis clases.
Los cuantiles no deberan utilizarse en el caso en que los tamaos de los corogramas varia-
ran considerablemente. Para utilizar cuantiles de superficie, precisaramos tambin de
corogramas de tamaos similares.
Una progresin aritmtica ser adecuada cuando la grfica de la distribucin del conjunto
de datos se asemeje a una progresin aritmtica, y lo mismo ocurrira con las progresiones
geomtricas, que sern aplicables cuando la grfica tienda a mostrar una progresin geo-
mtrica.
Los puntos de ruptura de la distribucin nos proporcionarn grupos de valores homogne-
os, lo que sin duda es deseable, y su utilizacin ser interesante cuando dichas rupturas
queden claramente definidas. Adems este sistema puede utilizarse junto con algn otro
sistema de clasificacin.
Vistos los distintos tipos de clasificacin para un mismo conjunto de datos, slo queda ver
cul de ellos es el que mejor se adeca a la distribucin real de los mismos. Para ello se puede
construir la superficie estadstica correspondiente a la distribucin real y las correspondien-
tes a las calsificaciones. La que parecida al modelo real es la correspondiente a la mejor cla-
sificacin para el conjunto de datos.
A continuacin se muestran los efectos que tendra la aplicacin de algunos sistemas de clasificacin de
datos, sobre un supuesto mapa de coropletas, donde los datos de partida varan de cero a cien. Con esto
se pretende mostrar la realizacin prctica de intervalos de clase, y ms an dejar claro su manifesta-
cin directa en los mapas. Se elige una base cartogrfica de delimitacin provincial y la realizacin de
cuatro intervalos de clase.
28
29
1 Lleida 1 37 Almera 29, 8
2 Castelln 8 1, 6 38 Vizcaya 28 , 9
3 Baleares 8 , 2 39 Salamanca 28 , 4
4 Girona 78 , 2 4 Jan 28 , 1
5 Soria 77, 2 41 Mel i l l a 25, 8
6 Teruel 76 , 1 42 Cceres 23, 4
7 Huesca 74, 9 43 Asturias 21, 4
8 Navarra 73, 3 44 Len 2 , 4
9 Tarragona 71, 5 45 Ceuta 2 , 3
1 Alava 6 9, 2 46 Mlaga 19, 9
11 Zaragoza 6 8 , 6 47 Granada 18 , 8
12 Rioja 6 7, 5 48 Badajoz 16 , 9
13 Cuenca 6 1, 1 49 Sevilla 15, 2
14 Segovia 6 , 2 5 Crdoba 9, 1
15 Guipzcoa 57, 4 51 Huelva , 3
16 Guadalajara 57, 1 52 Cdiz
17 Lugo 55
18 Toledo 52, 2
19 Burgos 49, 6
2 Avila 49, 4
21 Barcelona 47
22 Zamora 46 , 9
23 Corua (A) 45, 8
24 Alicante 44, 7
25 Madrid 43, 4
26 Palencia 41, 8
27 Palmas (Las) 38 , 7
28 Murci a 37, 7
29 Cantabria 36 , 5
3 S.C.Tenerife 35, 4
31 Pontevedra 34, 5 mx 1
32 Valladolid 33, 7 mn
33 Ourense 33, 6 media 54, 8 944444
34 Ciudad Real 32, 8 desv.tip 17, 76 6 6 18 9
35 Valencia 32 mediana 5 , 9
36 Albacete 31, 4
Los Datos Cuatro intervalos de 0 a 100
30
31
32