Está en la página 1de 25

Análisis Exploratorio

de Datos Espaciales
UAH
Dr. Francisco Maturana Miranda
fmaturana@uahurtado.cl
www.fmaturana.cl
EL MÉTODO CIENTÍFICO EN CIENCIAS SOCIALES
• ¿Por qué es necesario?

• ¿Cuál es el proceso científico? Un método para obtener resultados, validarlos


y difundirlos!

• Entre lo cuantitativo y cualitativo. Investigaciones mixtas.

• ¿Cuáles son las ventajas de su aplicación?

• ¿Cuál es el rol de la estadística en las ciencias humanas y su contribución a la


sociedad?

• La estadística es una herramienta indispensable para el mundo profesional!!!


La estadísticas descriptiva:

• Tiene como objetivo la representación de datos mediante tablas, gráficos y


medidas.

La estadísticas inferencial:

• Tiene como objetivo la generalización de los resultados obtenidos de una


muestra a partir de una determinada población. La estimación de parámetros
y prueba de hipótesis son uno de sus elementos principales.

Hipótesis: es una “declaración” que expresa la problematización de algo y que se


puede validar o rechazar.
Los datos……

• Dónde encontrar los datos

• La importancia de su elaboración y su producción. Censo 2012 y 2017.

• Los metadatos: datos que describen los datos y nos permite utilizar e interpretar el dato
de manera correcta al meno debe tener:

 Nomenclatura utilizada
 Lugar y fechas de observación
 En caso de encuesta, lugares precisos, etc.

• La pertinencia en su manipulación.

• No sólo apretar botones, saber qué estamos haciendo.


ALGUNAS NOCIONES DE BASE…..

-Población:

Def: conjunto de elementos o individuos observados. Se puede emplear:

• Un grupo humano (conjunto de habitantes de una ciudad).


• Objetos inanimados (redes de estaciones meteorológicas, transporte, conjunto de
empresas).
• Conjuntos mas o menos abstractos (días del año, accidentes de transito, etc.).

• En geografía las unidades estadísticas en general son consideradas como lugares o


porciones del espacio! (países, regiones, provincias, comunas, ciudades, barrios, etc.).

• En geografía debemos considerar la “agregación” de las unidades espaciales. Una


región estará compuesta por provincias o también de comunas.
Algunas nociones de base…..

-Carácter:

Def: una propiedad común a todos los individuos de una población y que se observa de
manera homogénea sobre estos:

• Por ejemplo un conjunto de habitantes de una ciudad pueden ser descritos por su edad,
sexos, lugar de nacimiento, profesión, etc.
• En una estación meteorológica cada cierta hora medir, temperatura del aire, presión y
humedad atmosférica, orientación del viento, etc.
• Estudiar un conjunto de ciudades a partir de su número de habitantes, superficie, rango
mundial, etc.

Cuantitativo Carácter Cualitativo


Traduce una cantidad y se puede medir. Su código es numérico y se le
Cuantitativo aplica cálculos aritméticos. Ejemplos:
• Superficie
• Altitud
• Número de habitantes
• velocidad
Discreto o continuo:
• Cuantitativo discreto: los valores posibles son números enteros. Ejemplo:
 número de hijos por familia (1, 2, 3).
 número de habitantes en una ciudad.
 Numero de trabajadores en una empresa (permite agrupación),. 1 a 4,5 a 9, a 10, a 19, más de 20.

• Cuantitativo continuo: sus valores pueden ser números reales (decimales en la práctica). Ejemplos:
 Talla
 Peso
 Edad
 Superficie de ciudades
 Temperaturas

En ocasiones difícil a distinguir. Por ejemplo la edad, podría tomar las dos formas. Generalmente no tiene incidencia en
los análisis.
Traduce una cualidad y generalmente tienen por base una operación de categoría la
cual puede ser numérica o alfabética:
Cualitativo • Categoría socio profesional
• Estatus de ocupación de una vivienda
• Tipo de uso de suelo
• Estatus matrimonial.

En ocasiones como las ramas de actividades económicas o espaciales pueden tomar


varias categorías. Se pueden usar nomenclaturas ejemplo:
 Código geográfico (nº comuna, manzana, sector).
 Nomenclatura de categorías socio profesionales.
Ordinal o nominal:
• Cualitativo ordinal las modalidades puede ser ordenadas considerando la posición de cada individuo en una
clasificación jerárquica para la característica estudiada. Ejemplo:
 Tamaño de explotaciones agrícolas clasificadas en pequeña, mediana y grande.
 Mención a un examen cuya modalidad sea aprobación: muy mal, mal, medio, bien y muy bien.

• Cualitativo nominal : las modalidades no están jerarquizadas


 Pertenencia a un país: México, Chile, Francia, etc. Modalidad: forma que puede tomar
 Tipo de ocupación de suelo: forestal, urbano, etc. una variable. Por ejemplo variable
 Tipo de desplazamiento urbano: a pie, bicicleta, auto, bus, etc. estado de vida puede “tener” 2
modalidades (vivo o muerto). Sexo
¿puede tener dos?
Resumen Carácter
Conjunto de ciudades en el mundo
Cuantitativo Cualitativo
Población
Discreto Continuo Nominal Ordinal
Cuasi continuo
Individuos N° de habitantes País de Rango
pertenencia

Fuente: Dumoloard, et al. 2003 p. 13 Modalidades

El tipo de carácter nos va a determinar la representación que debemos


realizar y también sus posibilidades de cálculo!!!
Particularidades de los datos en geografía
• Los individuos estadísticos son localizables en el espacio y por tanto cartografiables.

 Por un parte: cada individuo podrá tener uno o varios valores. Por ejemplo una provincia con varias
comunas y sus números de habitantes.

 Por otra, la información de su posición en el espacio, expresado en un cartografía, entrega información


por ella misma. Por ejemplo una tasa de mortalidad, natalidad, empleo, etc. Se expresa en una carta
temática.

 Lo anterior es el vínculo con los SIG, es decir, una base de datos espacial.

• Los datos en geografía frecuentemente están compuestos de un conjunto de personas, empresas, puntos
de observación, zonas de diferentes tamaño, redes, etc.
Unidades espaciales primarias
Unidades espaciales: población y carácter  Puntos de observación la tierra
 Pixeles de una imagen
 Zona de uso de suelo

La población sería el conjunto de estos


Fuente: Dumoloard, et al. 2003
Ejemplos de
cartografías

Fuente: Pumain, et al. 2015


Ejemplos
de
cartografías

Urban population potentials between 1200 and 1990 (variable distances over time)

evolution of the size of European cities from 1000 to 1990 – absolute figures
Ejemplos de cartografías
Escalas de medida :
Medir: operación que atribuye un valor numérico a la característica estudiada de una unidad estadística de manera de
fijar su estado, intensidad o amplitud.
Ejemplo:

 Clasificar por categorías, orden según grados o de valor.

A CONSIDERAR: No es posible medir las emociones de una personas de la misma manera que la altura de las
personas!!!

1. Escala nominal: escala de medida que atribuye códigos arbitrarios (distintos) a las diferentes formas de una
variable.
Codificación variable lengua materna
Codificación variable sexo Lengua Código
Sexo Código Español 0
Masculino 0 Francés 1
Femenino 1 Inglés 2
Alemán 3
2. Escala ordinal: escala de medida que clasifica según una jerarquía las diferentes formas de una variable.

Codificación variable opinión del sujeto


Lengua Código
Totalmente e 1  Los códigos representan la jerarquía de la modalidades.
desacuerdo
En desacuerdo 2
Acuerdo 3
Muy de acuerdo 4

3. Escala de intervalos: caracterizada por la presencia de una unidad de medida normalizada y un cero relativo. Permite
distinguir y comparar valores. Además permite cuantificar diferencias.
 Cero relativo: punto de referencia establecido de manera arbitraria o por convención.

Ejemplos:

 La medida de temperatura a partir de un termómetro en una estación meteorológica, expresa grados Celsius y emplea
escala de intervalo. El punto de referencia es 0° punto de congelación del agua.

 La altitud sobre el nivel del mal. El cero relativo corresponde al nivel del mar. Esta última es la unidad de medida
normalizada.
4. Escala de relación: se caracteriza por la presencia del cero absoluto.

Cero absoluto: denota la ausencia total de la característica medida.

Ejemplo:
-El número de hijos de una familia es medida según una escala de relación. Cero es absoluto.

-La edad de los individuos también (cero denota ausencia de edad).

-La temperatura cero, significa 0°, lo cual NO implica ausencia de temperatura.


TIPOS DE REPRESENTACIÓN

Representación numérica de datos: cada individuo de una población puede ser definido por un cierto número
de caracteres y este mismo por una cierta cantidad de modalidades.

Población de n individuos Carácter x de k modalidades

Persona 1 A
Persona 2
Persona 3
Persona 4 B
Persona i

Persona n C

El número de efectivos se vincula a un número determinado de


caracteres que expresa determinadas modalidades Fuente: Dumoloard, et al. 2003
Frecuencias y frecuencia relativa:
• A partir de la tabla, permiten discriminar el peso relativo que desarrolla cada modalidad en la
población y comparar el comportamiento de los efectivos de la población.
• Las frecuencias son números comprendidos entre 0 y 1, generalmente expresadas en %.

Frecuencias simples: es un efectivo relativo


fj = nj/n Donde: fj: frecuencia simple; nj: efectivo parcial; n: efectivos totales
OJO: una frecuencia se puede expresar en %, pero todo % no es una frecuencia. Ejemplo la tasa de crecimiento
de población entre dos censos expresada en % no es un efectivo relativo. Puesto que la tasa podría ser < 0 ó > 1
Frecuencias acumuladas: se obtienen por adición sucesiva de las frecuencias simples.

Rápida lectura de algunas características!!! Número de hijos por pareja Interpretación


Número de nj fj Fj crecientes Fj decrecientes 0,64 el 64% de la población
niños estudiada tiene a los más
0 200 0,14 1 2 hijos (ya sea 0, 1 ó 2).
0,14 (200/1400)
1 300 0,21 0,36 (0,14+0,21) 0,86 (1-0,14)
2 400 0,64 (0,36+0,29) 0,65 (0,86-0,21) 0,86 el 86% de la población
0,29 estudiada tiene al menos
3 500 0,36 1 0,36 1 hijo (sea 0, 1,2 ó 3)
Total parejas 1.400 Fuente: Dumoloard, et al. 2003
Como resumir nuestra información de las tablas y su paso………. Las frecuencias acumuladas

Carácter cualitativo nominal (no jerarquizadas)


Ciudades Rama Rama nj fj

Temuco Servicios Agrícola 2 0,2


60% de las ciudades
Antofagasta Minería Minería 2 0,2 presenta una
vocación en el área
Servicios 6 0,6 (6/10) servicios
Curicó Agrícola
Concepción Servicios
Santiago Servicios
Arica Servicios
Iquique Servicios
Coquimbo Servicios
Copiapó Minería

Linares Agrícola
Fuente: Dumoloard, et al. 2003
Carácter cualitativo ordinal (jerarquía)

Ciudades Rango en
calidad de Calidad de vida nj fj Fj creciente Fj decreciente
vida
Temuco Muy Buena
Antofagasta Mala Mala 3 0,3 0,3 1
Curicó Buena
Concepción Regular Regular 2 0,2 0,5 0,7
Santiago Mala
Buena 4 0,4 0,9 0,5
Arica Regular
Iquique Buena
Muy buena 1 0,1 1 0,1
Coquimbo Buena
Copiapó Mala
Linares Buena 0,9, 90% de las ciudades tienen a lo mas una rango de calidad de vida
buena.
0,7, el 70% de las ciudades tiene a lo menos una calidad de vida
regular. (considere
2 ciudades regular, 4 buenas y una muy buena).
Carácter cuantitativo discreto (números enteros) con pocos valores*

Conjunto de hogares y número de autos

Individuos N° de N° de autos por nj fj Fj creciente Fj decreciente


(hogar) autos hogar

1 1
2 2
0 135 0,14 0,14 1
3 2
1 407 0,40 0,54 0,86
4 1
2 312 0,31 0,85 0,46
5 3
3 110 0,11 0,96 0,15
6 1
4 36 0,04 100 0,40
7 1
8 1
 40% de los hogares pose un auto
9 1  54% de los hogares no poseen mas que un auto (entre 0 y 1)
10 0  86% de los hogares posee al menos un autos (1, 2, 3 ó 4 autos)
.
. *Se considera como “pocos” valores máximo de 9, que podrían ser
representados en una carta
100 2 Fuente: Dumoloard, et al. 2003
Carácter cuantitativo discreto con muchos valores o cuantitativo continuo

• Se deberá realizar por clases y resumir en una tabla. Con efectivos parciales y/o las frecuencias por clase
Corte en clases
Si tenemos muchos valores, podemos sintetizar la información en otro tipo de tabla.
La información será simplificada al ser asignadas a diferentes clases.

Clase: intervalo cerrado a izquierda y abierto a derecha. La clase estará determinada por bordes. Ejemplo:

Clases de edades: de 1 a 19; de 20 a 39; de 40 a 59: de 60 a 74; 75 y más

Los efectivos nj de la clase j es el número de individuos cuyo carácter toma un valor superior o igual a su límite inferior y
estrictamente inferior al borde superior !!!!!!!!

Centro de una clase es: cj = (binf + bsup) / 2

La amplitud de un borde de la clase es: aj = bsup – binf

Fuente: Dumoloard, et al. 2003


La discretización operación que permite separar en clases una serie de variables cualitativas de variables cuantitativas.
Esta operación simplifica la información agrupando los objetos geográficos que presentan las mismas características en
distintas clases. Una discretización es satisfactoria cuando permite la creación de clases homogéneas y distintas entre sí:
los objetos geográficos de una misma clase deben parecerse más entre sí que con los objetos de las otras clases. (
http://www.hypergeo.eu/spip.php?article647)

Debemos tener cuidado en resguardar las características esenciales de los datos.

El número óptimo de clases a obtener en una partición es siempre función del número de individuos observados
(unidades espaciales). Un índice que permite conocer el número ideal de clases para una distribución; se considera
solamente como una ayuda indicativa.
Índice de Huntsberger:

N(cl)=1+3,3 log10(N)
N= número de observaciones
N(cl) = número de classes

Para discretizar se deben considerar 2 elementos:

1. No ser muy finos. Por ejemplo 40 individuos en 10 clase no tendría sentido


2. Ser poco fino. Por ejemplo 1.000 individuos en 3 clases.

IMPORTANTE!!!! La representación cartográfica limita visualmente el número de clases


Fuente: http://www.hypergeo.eu/spip.php?article647)
Selección del número de clases en función de los efectivos de una población

Así algunas orientaciones:

 0 a 9 individuos: no hacer clases

 10 a 20: 2, 3 ó 4 clases

 21 a 30: 4 ó 5

 31 a 50: 5 ó 6

 51 a 100: 6 ó 7

 101 a 150: 7 u 8

 Más de 150: 8 ó 9 clases

Fuente: Dumoloard, et al. 2003 p. 35


Bordes y amplitud de clase

• Dependerá en gran medida del tipo de variable y la distribución de los datos en estudio.

• Algunas medidas como moda, mediana, cuartiles, dispersión, nos pueden ayudar.

• La regla de base es que los límites establecidos en la clase deben considerar todos los elementos de unas unidades
estadísticas a tratar.

• Elegir valores “redondos” para los limites.

Ejemplos:

-Sea una variable cuya distribución de datos está entre 18 incluido y 62 excluido:

-[18-20[, [32-40[,[50-62[ sería mal realizada, puesto los valores 21, 22 y 45 no pertenecerían a ninguna clase.

-[18-20[, [19-42[,[40-62[ estaría mal realizada, los valores 19, 40 y 41 pertenecen a dos clases.

-[18-20[, [20-40[,[40-50[, [50-62[ estaría bien realizado. Todos los valores pueden pertenecer a una clase.

Para ir más allá: algunos métodos para discrterizar: natural breaks (jenks), progresión geométrica Fuente: Dumoloard, et al. 2003

También podría gustarte