Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Datos Espaciales
UAH
Dr. Francisco Maturana Miranda
fmaturana@uahurtado.cl
www.fmaturana.cl
EL MÉTODO CIENTÍFICO EN CIENCIAS SOCIALES
• ¿Por qué es necesario?
La estadísticas inferencial:
• Los metadatos: datos que describen los datos y nos permite utilizar e interpretar el dato
de manera correcta al meno debe tener:
Nomenclatura utilizada
Lugar y fechas de observación
En caso de encuesta, lugares precisos, etc.
• La pertinencia en su manipulación.
-Población:
-Carácter:
Def: una propiedad común a todos los individuos de una población y que se observa de
manera homogénea sobre estos:
• Por ejemplo un conjunto de habitantes de una ciudad pueden ser descritos por su edad,
sexos, lugar de nacimiento, profesión, etc.
• En una estación meteorológica cada cierta hora medir, temperatura del aire, presión y
humedad atmosférica, orientación del viento, etc.
• Estudiar un conjunto de ciudades a partir de su número de habitantes, superficie, rango
mundial, etc.
• Cuantitativo continuo: sus valores pueden ser números reales (decimales en la práctica). Ejemplos:
Talla
Peso
Edad
Superficie de ciudades
Temperaturas
En ocasiones difícil a distinguir. Por ejemplo la edad, podría tomar las dos formas. Generalmente no tiene incidencia en
los análisis.
Traduce una cualidad y generalmente tienen por base una operación de categoría la
cual puede ser numérica o alfabética:
Cualitativo • Categoría socio profesional
• Estatus de ocupación de una vivienda
• Tipo de uso de suelo
• Estatus matrimonial.
Por un parte: cada individuo podrá tener uno o varios valores. Por ejemplo una provincia con varias
comunas y sus números de habitantes.
Lo anterior es el vínculo con los SIG, es decir, una base de datos espacial.
• Los datos en geografía frecuentemente están compuestos de un conjunto de personas, empresas, puntos
de observación, zonas de diferentes tamaño, redes, etc.
Unidades espaciales primarias
Unidades espaciales: población y carácter Puntos de observación la tierra
Pixeles de una imagen
Zona de uso de suelo
Urban population potentials between 1200 and 1990 (variable distances over time)
evolution of the size of European cities from 1000 to 1990 – absolute figures
Ejemplos de cartografías
Escalas de medida :
Medir: operación que atribuye un valor numérico a la característica estudiada de una unidad estadística de manera de
fijar su estado, intensidad o amplitud.
Ejemplo:
A CONSIDERAR: No es posible medir las emociones de una personas de la misma manera que la altura de las
personas!!!
1. Escala nominal: escala de medida que atribuye códigos arbitrarios (distintos) a las diferentes formas de una
variable.
Codificación variable lengua materna
Codificación variable sexo Lengua Código
Sexo Código Español 0
Masculino 0 Francés 1
Femenino 1 Inglés 2
Alemán 3
2. Escala ordinal: escala de medida que clasifica según una jerarquía las diferentes formas de una variable.
3. Escala de intervalos: caracterizada por la presencia de una unidad de medida normalizada y un cero relativo. Permite
distinguir y comparar valores. Además permite cuantificar diferencias.
Cero relativo: punto de referencia establecido de manera arbitraria o por convención.
Ejemplos:
La medida de temperatura a partir de un termómetro en una estación meteorológica, expresa grados Celsius y emplea
escala de intervalo. El punto de referencia es 0° punto de congelación del agua.
La altitud sobre el nivel del mal. El cero relativo corresponde al nivel del mar. Esta última es la unidad de medida
normalizada.
4. Escala de relación: se caracteriza por la presencia del cero absoluto.
Ejemplo:
-El número de hijos de una familia es medida según una escala de relación. Cero es absoluto.
Representación numérica de datos: cada individuo de una población puede ser definido por un cierto número
de caracteres y este mismo por una cierta cantidad de modalidades.
Persona 1 A
Persona 2
Persona 3
Persona 4 B
Persona i
Persona n C
Linares Agrícola
Fuente: Dumoloard, et al. 2003
Carácter cualitativo ordinal (jerarquía)
Ciudades Rango en
calidad de Calidad de vida nj fj Fj creciente Fj decreciente
vida
Temuco Muy Buena
Antofagasta Mala Mala 3 0,3 0,3 1
Curicó Buena
Concepción Regular Regular 2 0,2 0,5 0,7
Santiago Mala
Buena 4 0,4 0,9 0,5
Arica Regular
Iquique Buena
Muy buena 1 0,1 1 0,1
Coquimbo Buena
Copiapó Mala
Linares Buena 0,9, 90% de las ciudades tienen a lo mas una rango de calidad de vida
buena.
0,7, el 70% de las ciudades tiene a lo menos una calidad de vida
regular. (considere
2 ciudades regular, 4 buenas y una muy buena).
Carácter cuantitativo discreto (números enteros) con pocos valores*
1 1
2 2
0 135 0,14 0,14 1
3 2
1 407 0,40 0,54 0,86
4 1
2 312 0,31 0,85 0,46
5 3
3 110 0,11 0,96 0,15
6 1
4 36 0,04 100 0,40
7 1
8 1
40% de los hogares pose un auto
9 1 54% de los hogares no poseen mas que un auto (entre 0 y 1)
10 0 86% de los hogares posee al menos un autos (1, 2, 3 ó 4 autos)
.
. *Se considera como “pocos” valores máximo de 9, que podrían ser
representados en una carta
100 2 Fuente: Dumoloard, et al. 2003
Carácter cuantitativo discreto con muchos valores o cuantitativo continuo
• Se deberá realizar por clases y resumir en una tabla. Con efectivos parciales y/o las frecuencias por clase
Corte en clases
Si tenemos muchos valores, podemos sintetizar la información en otro tipo de tabla.
La información será simplificada al ser asignadas a diferentes clases.
Clase: intervalo cerrado a izquierda y abierto a derecha. La clase estará determinada por bordes. Ejemplo:
Los efectivos nj de la clase j es el número de individuos cuyo carácter toma un valor superior o igual a su límite inferior y
estrictamente inferior al borde superior !!!!!!!!
El número óptimo de clases a obtener en una partición es siempre función del número de individuos observados
(unidades espaciales). Un índice que permite conocer el número ideal de clases para una distribución; se considera
solamente como una ayuda indicativa.
Índice de Huntsberger:
N(cl)=1+3,3 log10(N)
N= número de observaciones
N(cl) = número de classes
10 a 20: 2, 3 ó 4 clases
21 a 30: 4 ó 5
31 a 50: 5 ó 6
51 a 100: 6 ó 7
101 a 150: 7 u 8
• Dependerá en gran medida del tipo de variable y la distribución de los datos en estudio.
• Algunas medidas como moda, mediana, cuartiles, dispersión, nos pueden ayudar.
• La regla de base es que los límites establecidos en la clase deben considerar todos los elementos de unas unidades
estadísticas a tratar.
Ejemplos:
-Sea una variable cuya distribución de datos está entre 18 incluido y 62 excluido:
-[18-20[, [32-40[,[50-62[ sería mal realizada, puesto los valores 21, 22 y 45 no pertenecerían a ninguna clase.
-[18-20[, [19-42[,[40-62[ estaría mal realizada, los valores 19, 40 y 41 pertenecen a dos clases.
-[18-20[, [20-40[,[40-50[, [50-62[ estaría bien realizado. Todos los valores pueden pertenecer a una clase.
Para ir más allá: algunos métodos para discrterizar: natural breaks (jenks), progresión geométrica Fuente: Dumoloard, et al. 2003