Está en la página 1de 12

CURSO DE METODOS MATEMATICOS EN LAS

CIENCIAS GEOGRAFICAS.

Profesor: Dr. Julio Iván González Piedra


Universidad de La Habana, CUBA.

Encuentro 4
Tema III. Relación entre variables y Series cronológicas. Introducción. Métodos de

regresión y correlación entre variables geográficas. Uso de software.

Desarrollo de contenido.

RELACION ENTRE VARIABLES GEOGRÁFICAS

Introducción.

La relación entre las variables geográficas es un tema de gran importancia para los
investigadores de las geociencias. Dos o más variables geográficas pueden relacionarse,
pero no siempre significa que existe una relación causal entre ellas, es decir, que exista
una dependencia física u objetiva entre estas, es el caso de considerar al escurrimiento
de una corriente fluvial dependiente de una determinada magnitud de lluvia, es un caso
evidente de relación causal, lo mismo puede suceder con la relación entre la demanda de
un producto alimenticio determinado de consumo frecuente y el crecimiento de la
población en ese lugar. Ambos ejemplos son del tipo causa – efecto, muy común en las
Ciencias Geográficas. Sin embargo, existe otro tipo de relación entre variables que no es
causal sino más bien de carácter comparativo, por ejemplo, relacionar las características
más importantes de dos poblados o ciudades a través de una o más variables, válidas
también para dos o más ecosistemas.
En ambos casos es posible la determinación del grado de esta relación a través de
diferentes indicadores o coeficientes de correlación o de asociación, en dependencia a
veces del tipo de variables que se utilicen, ya sean cuantitativas, cualitativas o
cualicuantitativas. La expresión de dicha relación puede darse a través de una ecuación
o modelo matemático conocido como ecuación de regresión, pudiendo ser una recta o
una expresión no lineal.
Tanto el indicador de relación como su representación matemática, son aplicables a
todas las variables del espacio geográfico, sean naturales o socioeconómicas, solo que el
investigador debe conocer bien la teoría de su ciencia para emplear las variables
adecuadas, ya sean continuas y/o discretas, y el modo de combinarlas. Recordar siempre
que los métodos matemáticos en nuestro caso son el medio o instrumento para llegar al
fin u objetivo supremo que estamos investigando. No valen de nada las perfecciones de
los métodos si no son bien interpretados los resultados por el investigador.

1
Ejemplificación del uso de los indicadores de relación entre variables geográficas.

3.1.- Utilización del coeficiente de correlación lineal de Pearson (r).

El coeficiente de correlación “r” oscila entre -1 y 1. La relación cercana a ambos


extremos significa buena relación, cercana o igual a cero, significa poca o ninguna
relación. Si “r” es negativo, la relación entre las variables es inversa, es decir, cuando
aumenta una disminuye la otra, si es positivo, la relación es directa, al aumentar una
aumenta la otra.

Ejemplo:

Tabla 3.1. Datos de variables hidroclimatológicas de la cuenca del río Bengla.

N P R Et Hr DP
(mm) (mm) (mm) %

1 1450 489 940 75.9 50


2 1258 258 965 74.8 45
3 1369 309 1065 79.5 39
4 1476 520 890 81.2 64
5 1400 365 1098 80.3 45
6 1833 685 1130 74.6 75
7 1920 710 1196 79.5 80
8 1750 500 1385 78.9 66
9 1887 520 1357 78.1 47
10 1399 299 1120 77.5 42
11 1294 167 1145 77.1 37
12 1288 354 1054 66.8 36
13 1344 369 955 73.5 29
14 1811 652 1200 78.9 76
15 1099 155 200 74.6 25
16 1185 129 1020 76.1 24
17 1993 687 1286 80.2 82
18 1893 639 1244 79.8 81
19 1478 385 1060 74.1 33
20 1266 194 1045 73.3 26

N, No. Orden; P, lluvia anual; R, Escurrimiento anual; Et, evapotranspiración anual; Hr,
humedad relativa; DP, dias con lluvia. (Base de datos en STGPLUS – Balance)

Ejemplo: Para la cuenca del río Bengla existe información de la lluvia y el


escurrimiento para 20 años de observación. El coeficiente de correlación “r” es igual a
0.92, indicando una buena relación entre ambas variables, además positiva, y su recta de
regresión resultó ser:

R = 0.628P - 536……………. (3.1)

2
Esta relación anterior es causal, no por el resultado matemático de la relación (r = 0.92),
sino por la relación física entre ambas variables que expresan ambos fenómenos
hidrológicos, la dependencia de R con relación a P.
Queda claro que ambas series son de variables cuantitativas y continuas.

800

700

600

500
R

400

300

200

1100 1200 1300 1400 1500 1600 1700 1800 1900 2000

Fig. 3.1.- Gráfica de la relación R = f (P) para la cuenca del río Bengla.

La confiabilidad del valor de “r” puede establecerse considerando el error de


estimación del mismo por la fórmula:

Er = (1 – r 2 ) / √ n – 1 …………. (3.2)

Donde, Er, error de “r”; n, No. miembros de la serie. Generalmente se acepta el


valor de “r” si su error es ≤ 15 % de su valor.

De la tabla 3.1, la variable R, además de tener buena relación con la lluvia (P),
también tiene buena relación con la variable de dias con lluvia (DP), considerando
pues una posible relación múltiple entre estas variables, por lo que
R = f (P, DP) puede expresarse por la ecuación siguiente:

R = 0.357 P + 4.247 DP – 336.41 ……. (3.3)

Con un coeficiente de correlación múltiple de R2 = 0.90, siendo este modelo


estadísticamente significativo al 95 % de garantía.

3.2.- Coeficiente de correlación landa (λ)

Se utiliza generalmente para variables cualitativas y/o cuantitativas que definen


intervalos para las variables que se estudian.

3
Ejemplo:

La tabla 3.2 ofrece la información de 60 agroecosistemas con las variables


cobertura vegetal CV (baja, media y alta) y pendiente Y (baja, media y alta).

Tabla 3.2.- Valores de cobertura vegetal (CV) y pendiente (Y) para 60


agroecosistemas.

Y (pendiente)

CV
( Cob. Vegetal) B M A η2

B 12 4 9 25

M 3 3 9 15

A 5 3 12 20

η1 20 10 30 60

Σ ( f2 / η2 ) 7.61 1.69 15.84

Σ ( f2 / η2 ) / η1 0.38 0.169 0.528 1.077

a = Σ (Σ (f 2 / η2 ) / η1 ) = 1.077

El Coeficiente de correlación landa (λ) se determina por la expresión siguiente:

λ = (a -1) / √ (k1 – 1) (k2 – 1) ………………… (3.4)

λ oscila de 0 ( no hay relación) hasta 1.0 ( máxima relación).


Donde,

f, frecuencia absoluta de cada casilla ; η1 frecuencia absoluta de cada columna ; η2


frecuencia absoluta de cada hilera. ; k1, k2, numero de rangos de cada columna e
hilera.

Según (3.4), λ = 0.038, siendo muy baja la relación entre las variables.

Para demostrar la garantía o seguridad de la estimación de λ, se procede así:

Θ = n (a -1) = 60 (1.077 -1) = 4.62 y se busca en la tabla de Chi – cuadrado (χ2) el


valor critico para los grados de libertad υ = (k1 -1) (k2 -1) = 4 y para el nivel de
significación del 5 % (0.05). Este valor de la tabla resultó ser χ2 = 9.49.
Por tanto, si Θ < χ2 , quiere decir que el valor λ = 0.038 no es significativo
estadísticamente.

4
3.3.- Coeficiente de Asociación (Ka).

Es un coeficiente que caracteriza la relación entre variables cualitativas o también


dicotómicas, véase el ejemplo:

Se tienen 60 pequeñas ciudades, y se quiere saber la coincidencia entre la variable


o condición de tenencia de Internet y Alto Nivel Educacional.

Tabla 3.3.- Distribución de ciudades con Internet y Alto Nivel Educacional (ANE).

Con Internet (a) Sin Internet (b)

ANE (c) 22 6

No ANE (d) 15 17

La relación se determina por la expresión:

Ω = (ad – bc) / √ (a+b) (c+d) (a+c) (b+d) ………………… (3.5)

Sustituyendo en (3.5):

Ω = 0.32, significando que existe cierta coincidencia, pero no muy convincente por
el relativamente bajo valor de Ω.

La garantía de que sea válido el valor de Ω = 0.32 (sea alto o bajo) se determina
por:

Θ = n Ω2 = 60 (0.32)2 = 6.14

Este valor se compara con el Chi-cuadrado de la tabla para los grados de libertad
υ = (k1 -1) (k2 -1), donde k1 y k2, son los rangos de cada variable, es decir, dos en
cada caso, por tanto, υ = 1 y para ω = 0.05 como nivel de significación. Este valor
resulto ser χ2 = 3.84.
Si se cumple que χ2 < Θ, ello significa que es aceptable como cierto con una
garantía del 95 % el valor de Ω = 0.32.

5
SERIES DE TIEMPO

Introducción.

Las series de tiempo son muy importantes en las Ciencias Geográficas y las Geociencias
en general. A través de ellas se pueden estudiar las variaciones de las variables
geográficas que tienen observaciones temporales como la precipitación, temperatura,
evaporación, que son generalmente de carácter continuas, sin embargo, también se
estudian variables discretas mas relacionadas con la actividad socioeconómica.
Los temas que mas interesan son: ciclicidad y tendencia de las serie fundamentalmente.
Se trata de conocer si las series que se estudian, son totalmente aleatorias en el tiempo o
tienen alguna repetición o ciclicidad cada cierto tiempo, por ejemplo, se sabe que en los
trópicos, específicamente en Cuba, la lluvia mensual se corresponde con un modelo
estacional de dos estaciones, una mas húmeda que la otra, y esta repetición se da todos
los años, por lo que es válido hablar de ciclo anual en este caso. Con la temperatura
promedio anual sucede algo similar, hay ciclo anual. Para una variable socioeconómica
discreta como las ventas de helados o refrescos, veremos que también se comporta de
forma cíclica anual, al incrementarse las ventas en el verano con relación a los meses de
invierno. En cuanto a la tendencia, también es muy importante definir y conocer cual es
la tendencia o futuro comportamiento de una variable a partir de su comportamiento en
periodos de tiempo anteriores.
Al conocer tanto la ciclicidad como la tendencia de la variable, se esta en condiciones
de poder acercarse a un pronóstico del comportamiento de la misma, sobre todo en el
primer caso, que la variable, al ser cíclica, no es totalmente aleatoria.
Las técnicas que más se utilizan para uno y otro tema se describen más abajo, tratando
de que a través de ejemplos prácticos se comprendan mejor dichos temas.

6
Ejemplificación del tratamiento de variables en series de tiempo.

3.4.- Ciclicidad. Análisis espectral.

El análisis espectral (o del periodograma) consiste en someter a la serie en cuestión al


análisis de ciclicidad. Ello implica conocer si existen ciclos o no en la serie.
En el ejemplo que se muestra a continuación, se analiza la variable lluvia mensual (P)
para un periodo de 15 años o sea 180 meses.
El software utilizado (PAST) nos muestra la gráfica del espectro o periodograma en la
figura 3.2.

50

40

30
Power

20

10

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Frequency

Fig. 3.2.- Periodograma o espectro de la lluvia mensual P. (PAST)

Esta grafica muestra los valores picos que significan cambios en la distribución
homogénea de los valores en el tiempo. El análisis en este caso de la gráfica debe llegar
solamente hasta la frecuencia de 0.5, desechando el resto hacia la derecha. En el anterior
entorno se evidencian 3 picos, el primero, en la frecuencia de 0.0838, con un valor de
45.82; el segundo pico en 0.026 con un valor de 20; y el tercero en 0.0338 con un valor
de 8. Los valores iguales o superiores a 8.856 son significativos al 5 % (95 % de
garantía) de probabilidad y los iguales o superiores a 10.49 lo son para el 1 % (99 % de
garantía).
En el orden práctico, el de mayor interés es el primero por ser el de mayor potencia o
valor (45.82). Para calcular el periodo de repetición (Tr) o gran ciclo, se halla el inverso
de la frecuencia es decir:

Tr = 1 / f = 1 / 0.0838 = 12 meses

Lo que implica que hay un ciclo significativo cada 12 meses.

7
3.5.- Autocorrelación de la lluvia mensual P.

Se trata de conocer si la variable que se estudia es autocorrelacionada, es decir, si no es


totalmente aleatoria.
En nuestro ejemplo, si se acaba de demostrar que existe un ciclo evidente cada 12
meses, ya ello implica que nuestra variable es autocorrelacionada, no es aleatoria,
porque hay repetición de valores (estadísticamente) cada cierto tiempo, ello hace que
exista correlación en el interior de la serie.

1
Correlation

-1

10 20 30 40 50 60 70 80

Lag

Fig. 3.3.- Gráfica de autocorrelación de la lluvia mensual P. (PAST)

En la grafica 3.3 se evidencia una monotonía (línea roja), significando la existencia de


repetición cada cierto tiempo (ciclos). Mientras que la línea punteada a ambos lados del
valor cero (0) significa el entorno del nivel de significación del 5 %.

8
200
Power

100

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Frequency

Fig. 3.4.- Periodograma de los caudales medios mensuales del río Guadalquivir
donde se evidencia ciclicidad al 0.08 (Repetición de valores cada 12 meses).
(PAST)

9
1
Correlation

100 200

Lag

Fig.3.5.- Autocorrelación de los caudales medios mensuales del río Guadalquivir.


(PAST)

10
3.6.- Tendencia de la variable R.

La tendencia de una variable es su posible trayectoria futura, tanto grafica como


analíticamente. Sirve para hacer pronósticos a corto plazo.
Las figuras 3.6 y 3.7 muestran la grafica del comportamiento de R en los 20 años y su
tendencia, respectivamente. La tendencia, definida por la recta que se presenta tiene por
ecuación R = - 4.046 t + 461.8. El coeficiente de correlación lineal r = - 0.125,
considerado muy bajo, pero aun así muestra tendencia a la disminución.

800

700

600

500
Y

400

300

200

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Fig. 3.6.- Gráfica de la variable R en el tiempo (20 años).

La variable R tiende a disminuir lentamente en el tiempo según se observa en la recta


representativa de esa tendencia en la figura 3.7.

11
800

700

600

500
R

400

300

200

10 20

Fig. 3.7.- Tendencia de la variable R.

12

También podría gustarte