Está en la página 1de 23

Anlisis Estadstico de Datos

Climticos

Tcnicas exploratorias para datos apareados:


- scatterplots
- coefs. de correlacin de Pearson y Spearman
- funcin de autocorrelacin; persistencia teporal

Tcnicas eploratorias para datos


multi-dimensionales

Datos multidimensionales:

una estacin con medidas de varias variables


diferentes (temp, precip, humedad, etc...)
una variable medida en varias estaciones.
salida de un modelo con la variable en una grilla (lat x
lon). La cantidad de variables fsicas de un modelo no
es menor a 20.
Entonces tenemos un numero no menor de
20 x 100 x 50 x 10 = 1x106 variables.
Matriz de correlacin
Mapas de correlacin
Mapas de teleconectividad

Matriz de correlacin
Consideremos datos de precip, humedad relativa, temperatura
mnima, temperatura mxima y temperatura media diarias para la
estacin de Las Brujas en julio de 1975.
%Cargar datos de la estacin Las Brujas (INIA)

pre=nc_varget('Precip_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','pcpn');
rh=nc_varget('RelatHum_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','rh');
tmi=nc_varget('TempMin_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempmin');
tma=nc_varget('TempMax_LasBrujas_INIA_1Jan197531Dec1995.cdf','tempmax');
tme=nc_varget('TempMedia_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempavg');

%Datos para Julio 1975 (es aproximado pues considero meses de 30 dias)
pre=pre(6*30+1:7*30);
rh=rh(6*30+1:7*30);
tmi=tmi(6*30+1:7*30);
tma=tma(6*30+1:7*30);
tme=tme(6*30+1:7*30);
%Matriz de datos y traspongo
datos=[pre; rh; tma; tme; tmi];
datos=datos';

% variable x tiempo= 5 x 30
% tiempo x variable = 30 x 5

Matriz de datos
diarios en
Las Brujas
julio de 1975

PRE
7.2000
13.5000
24.5000
1.5000
0
23.4000
0
0
0
0
1.0000
0
0
0
6.5000
3.8000
0
1.0000
0
0
0
0
0
0
0
2.0000
0
0
0
0

RH
97.0000
98.0000
100.000
93.0000
91.0000
71.000
67.0000
60.0000
69.0000
78.0000
94.0000
89.0000
75.0000
88.0000
93.0000
51.0000
67.0000
78.0000
78.0000
80.0000
74.0000
91.0000
95.0000
95.0000
92.0000
78.0000
72.0000
82.0000
84.0000
96.0000

TMAX
16.2000
14.2000
14.0000
15.0000
17.4000
11.8000
12.0000
17.8000
19.6000
21.6000
17.0000
13.4000
13.4000
15.4000
14.6000
8.8000
7.3000
6.9000
10.0000
12.0000
13.7000
13.8000
12.2000
13.8000
10.2000
8.4000
9.2000
9.6000
14.9000
12.9000

TMED

TMIN

13.9000
13.8000
13.3000
11.7000
11.9000
10.3000
9.5000
12.0000
12.9000
15.4000
14.7000
12.7000
9.8000
10.1000
12.4000
7.6000
4.8000
4.9000
4.3000
4.3000
6.4000
6.8000
7.2000
10.3000
8.3000
6.2000
5.2000
4.7000
10.3000
7.7000

13.0000
13.4000
11.8000
9.8000
9.4000
8.2000
5.6000
4.0000
7.0000
10.2000
13.1000
10.3000
6.2000
3.8000
9.1000
2.6000
2.0000
3.5000
0.1000
-0.4000
0.2000
0.1000
4.3000
6.7000
5.9000
4.8000
0.6000
-2.1000
7.0000
2.4000

tiempo
(30 dias)

Supongamos que quiero hallar la correlacion entre


las diferentes variables
Tengo que correlacionar cada variable con las otras.
Para eso hago:
R=corrcoef(datos);
Pearson

%coef. de correlacion de

y obtengo la matriz de correlacion R


PRE
PRE
RH
TMAX
TMED
TMIN

1.0000
0.1848
0.0028
0.3334
0.4598

RH
0.1848
1.0000
0.2440
0.3341
0.4605

TMAX
0.0028
0.2440
1.0000
0.8114
0.5496

TMED
0.3334
0.3341
0.8114
1.0000
0.9008

TMIN
0.4598
0.4605
0.5496
0.9008
1.0000

Propiedades de R
PRE
PRE
RH
TMAX
TMED
TMIN

RH

TMAX

TMED

TMIN

1.0000 0.1848 0.0028 0.3334 0.4598


0.1848 1.0000 0.2440 0.3341 0.4605
0.0028 0.2440 1.0000 0.8114 0.5496
0.3334 0.3341 0.8114 1.0000 0.9008
0.4598 0.4605 0.5496 0.9008 1.0000

Correlacin entre
RH y TMED.

Simtrica con respecto a la diagonal. En general se toma el triangulo


inferior para mostrar los resultados.

La diagonal son siempre 1 pues es la correlacin de una variable


consigo misma

Para K variables se tienen K(K-1)/2 coeficientes diferentes

Notar que TMIN es la variable mas correlacionado con las dems.

En general la matriz de correlacin se


puede escribir como

r ij=r ji

Mapas de correlacin
Las matrices de correlacin son tiles para
mostrar la relacion entre diferentes
variables en una estacin.
Muchas veces se quiere relacionar la
variabilidad en una estacin (o regin) con
el resto del globo. En este caso es til
presentar las correlaciones
grficamente/espacialmente.

Correlacin de TS (56W,35S) con TS global en


c/punto. Perodo: meses Ene1949-Ago2007

La correlacin es mxima (=1) sobre (56W,34S) y decrece a medida que


nos alejamos. La escala espacial de caida de correlacin nos da la escala
de autocorrelacion espacial.

%Cdigo Matlab
temp=nc_varget('sfctemp.cdf','temp');
X=nc_varget('sfctemp.cdf','X');
Y=nc_varget('sfctemp.cdf','Y');

%size(temp) =704x73x144

[clim,anom]=climatology(X,Y,temp,0);
%Calculo correlacin d (X,Y)=(52,122)=(35S,56W) con el resto
for i=1:144
for j=1:73
cc(j,i)=corrcoef(anom(:,51,122),anom(:,j,i));
end
end
%Grafico
cont_netcdf(X,Y,cc',0,(-1:0.2:1))
colormap(rednblue3)
%seteo paleta de colores
set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ...
'50E';'100E';'150E';'160W';'110W';' 60W';' 10W']) %cambio nombres eje x

Correlacin de Precip (56W,35S) con Precip


global en c/punto. Perodo: meses Ene1979Dic2006

Menor autocorrelacin espacial. Mas ruidosa.

Correlacin de TS (56W,35S) con TS global


en c/punto. Mayos de 1949-2007

Este mapa sugiere la presencia de un fenmeno ondulatorio que


modula las correlaciones en el hemisferio sur. Regiones lejanas estan
relacionadas = teleconexiones.

%En Matlab
for i=1:144
for j=1:73
cc5(j,i)=corrcoef(anom(5:12:end,51,122),anom(5:12:end,j,i));
end
end
cont_netcdf(X,Y,cc5',0,(-1:0.2:1))
colormap(rednblue3)
set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ...
'50E';'100E';'150E';'160W';'110W';' 60W';' 10W'])

Correlacin de PS (56W,35S) con PS global


en c/punto. Mayos de 1949-2007

Un mapa de correlacin de presion a nivel del mar tambien sugiere el


fenmeno ondulatorio, aunque est concentrado en el Pacifico sur.

Correlacion de la TSM en la zona


ecuatorial con el resto de los oceanos
La TSM en
el Pacifico
ecuatorial
tiende a
covariar en la
direccion
longitudinal
pero esta
restringido
en la direccion
latitudinal.
la zona
ecuatorial
tiene una
dinamica
propia.

La zona ecuatorial tiene correlacion


espacial anisotropica.
Que tiene de especial el ecuador?

La fuerza de
Coriolis es
despreciable.

Para monitorear los


procesos oceanicos
ecuatoriales (El Nio)
basta con una red de
boyas entre 8S y 8N

Generalizaciones del mapa de


correlacion
La idea bsica de mapear correlaciones puede
extenderse:
usar variables diferentes: por ejemplo,
correlacionar las anomalas de precipitacin en
Uruguay con las temperaturas de superficie
globales.

construir una matriz de correlacin con retraso


temporal.

Los mapas de correlacion muestran solo una fila de la


matriz de correlacion

dim(R)= Nlon x Nlat

Vimos que estos mapas pueden mostrar patrones de


teleconexion. Una forma de resumir la informacion sobre
teleconexiones de la matriz de correlacion es hacer una
mapa de teleconectividad T, el cual se define como,
para cada fila i se determina

Por ejemplo para la PS en (56W,35S) durante los


mayos de 1949-2007, el T(56W,35S)~|-0.5|=0.5
(ubicado alrededor de (100W,70S)).

Mapa de teleconectividad para para la


altura de geopotencial en 500mb en el
invierno del H.N.
Pacific North
American pattern

North Atlantic
Oscillation

La altura de geopotencial
es casi la altura a la
cual la presion
atmosferica tiene un
determinado valor.

Patrn de teleconexin forzado por El


Nio

Los mapas de teleconectividad son de otra


poca.

Fueron usados en meteorologa hasta los


aos ochenta para encontrar patrones de
circulacin que covaren.

Hoy da fueron sustituidos por


metodologas estadsticas mas potentes
como anlisis de componentes principales y
anlisis de mxima covarianza que veremos
mas adelante.

También podría gustarte