Está en la página 1de 6

IX Congreso Galego de Estatstica e Investigacin de Operacins

Ourense, 121314 de novembro de 2009

PROCESOS PUNTUALES ESPACIALES APLICADOS AL ESTUDIO DE LOS INCENDIOS


FORESTALES EN GALICIA
Isabel Fuentes Santos1, Wenceslao Gonzlez Manteiga2 y Manuel F. Marey Prez3
1 Departamento de Matemticas. Facultade de Informtica. Universidade da Corua.
2 Departamento de Estatstica e Investigacin Operativa. Universidade de Santiago de Compostela.
3 Departamento de Ingeniera Agroforestal, Escola Politcnica Superior, Campus de Lugo, Universidade
de Santiago de Compostela.
RESUMEN
En este trabajo se aplican diversas tcnicas de anlisis e inferencia estadstica en procesos
puntuales espaciales al estudio de los incendios forestales, la principal amenaza que han sufrido los
bosques gallegos en las ltimas dcadas. Nuestro objetivo es conocer la distribucin espacial de los focos
para despus modelar y predecir el comportamiento de los incendios, informacin que resultara de gran
ayuda en la elaboracin de planes de prevencin y lucha contra el fuego.

Palabras y frases clave: CSR, intensidad, K-funcin.


1. INTRODUCIN
Los incendios forestales suponen uno de los principales problemas medioambientales a los que se
enfrenta la sociedad actual. En particular, en Galicia el fuego es la principal causa de destruccin de los bosques.
El objetivo de este trabajo es utilizar la metodologa estadstica desarrollada en procesos puntuales espaciales
para analizar y modelar el comportamiento de los incendios forestales en Galicia.
Si a cada incendio se le asocian sus coordenadas espaciales, longitud y latitud del centroide de la zona
quemada o del lugar donde se ha detectado, junto con otras variables como magnitud o causa del incendio y
adems se controla el momento temporal en el que se ha producido, podemos identificar el conjunto de
incendios forestales con un proceso estocstico espacio-temporal. Este tipo de procesos suelen presentar
dependencia entre las posiciones espaciales y los instantes temporales, as como interdependencia entre ambas.
En esta ocasin nos centraremos en el aspecto espacial, entendiendo el conjunto de datos como un proceso
puntual espacial con marcas e incluyendo el aspecto temporal (ao del incendio) como una marca.
En este trabajo se han aplicado distintas tcnicas de anlisis e inferencia en procesos puntuales espaciales
al conjunto de datos correspondiente a los incendios forestales registrados en el distrito Fonsagrada- Ancares,
uno de los ms conflictivos de nuestra Comunidad Autnoma, en el periodo 1991-2008. En la seccin 2 se
presentan las tcnicas de contraste y estimacin utilizadas para, a continuacin mostrar algunos de los resultados
derivados de su aplicacin al estudio de los incendios. Este trabajo se ha llevado a cabo con la ayuda del
paquete Spatstat de R ( Baddeley, A. &Turner, R. 2005 )
2. METODOLOGA
El primer paso en el anlisis de un proceso puntual espacial es contrastar la hiptesis de aleatoriedad
espacial completa CSR (complete spatial ramdonness), un proceso puntual es completamente aleatorio cuando:
(i) el nmero esperado de eventos en la regin plana A con rea |A| tiene distribucin de Poisson con rea |A|,
y (ii) dados n eventos {xi}i=1,,n en A, estos son una muestra aleatoria de la distribucin uniforme en A. La
constante en (i) es la intensidad del proceso, o nmero esperado de eventos por unidad de rea. Segn la
condicin (i), CSR implica que la intensidad es constante y segn (ii), la CSR tambin implica que no hay
interaccin entre eventos, los procesos que verifican esta propiedad se denominan procesos Homogneos de
Poisson. Rechazar esta hiptesis es un requisito mnimo previo al desarrollo de un modelo para un patrn

observado, dado que la aleatoriedad espacial completa acta como una hiptesis intermedia entre diseos
regulares y agregados.
En primer lugar, se ha aplicado un test Chi-cuadrado (quadrat counts) para determinar si la intensidad es
homognea. Se divide el rea de inters en m subregiones de tamao similar y se cuentan los eventos observados
en cada una, se define el estadstico de contraste como:
m

X 2 = ( ni ni ) ni

(1)

i =1

Donde ni = n wi , siendo n = n m y wi la proporcin del i-simo cuadrante rectangular que est dentro de la
regin de observacin, as se corrige el efecto frontera producido cuando la regin de estudio no es cuadrada.
Bajo CSR el estadstico tiene distribucin aproximada m2 1 . En este contexto rechazar la hiptesis nula puede
indicar una distribucin no homognea de los eventos o la existencia de relaciones de dependencia. En
particular, valores de X2 suficientemente grandes o pequeos indican, respectivamente, distribuciones agregadas
o regulares.
Este contraste se ha combinado con un test grfico basado en la funcin de segundo momento reducida o
K-funcin que caracteriza la estructura de segundo orden del proceso y, para un proceso puntual estacionario e
isotrpico, se define como:
(2)
K (t ) = 1 E [ eventos a una distancia menor que t de un evento arbitrario ]
Para un proceso Homogneo de Poisson en R2, K ( t ) = t 2 .
El test grafico implementado en Spatstat consiste en (i) estimar la K-funcin del diseo observado K i ( t )
(ii) simular 99 procesos Homogneos de Poisson del mismo tamao que el observado y estimar las K-funciones
correspondientes. (iii) definir las envolturas superior e inferior de las simulaciones como:
(3)
U ( t ) = max K i ( t ) , L ( t ) = min K i ( t )
i = 2:...100

i = 2:...100

(iv) valores de la K-funcin emprica mayores que la envoltura superior o menores que la inferior indican,
respectivamente, diseo agregado o regular.
Cuando el proceso no es completamente aleatorio, el anlisis de su estructura de segundo orden mediante
la K-funcin homognea nos puede llevar a sobreestimar la dependencia entre eventos, al interpretar en el
contraste de CSR la tendencia como interaccin. Para salvar esta dificultad y extender el anlisis de segundo
orden del proceso al caso no homogneo, se introduce la K-funcin inhomognea. As se elimina la hiptesis de
intensidad constante, aunque pueden seguir mantenindose estacionariedad e isotropa. La interpretacin de la
K-funcin inhomognea es anloga a la del caso homogneo, salvo que ahora la intensidad no es constante, sino
que depende de la localizacin de los eventos. Si no hay interaccin entre eventos se verifica K in hom ( t ) = t 2 .
Baddeley et al (2000) propusieron el siguiente estimador puntual insesgado de la K-funcin
inhomognea:
I xi x j t
1
(4)
K in hom ( t ) =

A x X A x ( X A) \{x } ( x ) ( x ) w

ij

Una vez estimada la K inhomognea para el diseo observado, se puede aplicar un contraste de
independencia anlogo al propuesto para CSR. En este caso aceptar la hiptesis nula significa que el diseo
corresponde a un proceso Inhomogneo de Poisson, esto es un proceso con intensidad variable y que no presenta
interaccin entre eventos.
Para calcular K in hom se necesita estimar previamente la intensidad variable, en esta ocasin se ha
utilizado un estimador no paramtrico:

h ( x ) =

1
ph

1
k (x X ) =

k (( x X ) h)
p ( x) h
( x)
h

i =1

(5)

i =1

donde k es la funcin ncleo, h el parmetro de suavizado y ph ( x ) = h 2 k ( ( x u ) h )du el corrector de efecto

frontera. Spatstat utiliza un ncleo Gaussiano donde acta como ventana. As valores de grandes nos llevan
a un sobresuavizado, aproximando la intensidad a una constante, mientras que valores pequeos introducen
demasiada variabilidad reflejando tendencia local en lugar de global. Para seleccionar la ventana ptima se ha
tomado como referencia el mtodo bootstrap propuesto por Cowling, Hall y Philips (1996) que permite
aproximar el MSE del estimador de la intensidad de un proceso puntual en R mediante bootrstrap suavizado. As
se ha desarrollado un mtodo de remuestreo para obtener la ventana ptima a partir de la estimacin bootstrap
del MISE.

La base de datos de incendios es un proceso puntual espacial marcado por, entre otras variables, ao,
causa y tipo de fuego. La interaccin espacial entre dos tipos de eventos sucede cuando los eventos de distintos
tipos aparecen ms prximos o alejados de lo que se espera cuando ambos procesos son independientes.
Cuestiones como estn los fuegos registrados en 1995 cerca o lejos de los de 1994?, se han registrado
incendios cerca de los conatos? pueden responderse analizando la funcin K-cross, que es la extensin de la Kfuncin a procesos puntuales multitipo. Para un proceso puntual con intensidad constante para cada tipo de
eventos, la funcin K-cross se define como:
Kij (t ) = j 1 E [ eventos de tipo j a una distancia menor que t de un evento de tipo i arbitrario ]

(6)

Si el proceso no es homogneo se define la K-cross inhomognea de modo anlogo al caso univariante. Cuando
no hay interaccin entre los dos tipos de eventos se verifica que Kij ( t ) = t 2 independientemente del diseo
marginal de cada uno de los procesos. Esta propiedad sugiere la elaboracin de un contraste de independencia
basado en la funcin K-cross anlogo al K-test de CSR para procesos univariantes. En lugar de aplicar el test
basado en la K-cross es habitual utilizar la L-cross, Lij ( t ) = K ij ( t ) . Esta funcin verifica que bajo
independencia de los dos tipos de eventos Lij ( t ) = t , proporcionando un test grfico de interpretacin ms
sencilla que el basado en la K-funcin.
Para analizar la dependencia entre eventos en funcin del ao, se ha utilizado el L-ndice, definido por
Genton et al (2006), que nos permite presentar en un nico grfico el test para varios pares de aos. El L-ndice
es una aproximacin del rea entre Lij ( t ) y la lnea de referencia, esto es Lij ( t ) = t que se obtiene
sumando Lij ( t ) t , para distancias no demasiado grandes, en este caso se ha tomado t hasta 11 km. Este ndice
resulta de gran utilidad para comparar la evolucin del rea entre Lij ( t ) y t para una sucesin de pares de aos
situados a la misma distancia.
Se han calculado los L-ndices suponiendo tanto homogeneidad como intensidad no constante en cada
uno de los procesos marginales y se han simulado las envolturas superior e inferior. Si suponemos que ambos
procesos son homogneos de Poisson, se estiman las intensidades marginales i y j , se simula un proceso de
Poisson para cada una de las intensidades. Los puntos simulados con se etiquetan con la marca i y los
i

simulados con j con la marca j . Estos dos conjuntos de puntos se combinan para generar un nico proceso. Se
repite este procedimiento 100 veces y se calcula Lij ,k ( t ) para cada simulacin, el mximo y el mnimo de las 100
Lij ,k ( t ) sern, respectivamente, la envoltura superior e inferior. Si para el proceso observado Lij ( t ) es mayor

que la envoltura superior o menor que la inferior tendremos, respectivamente, atraccin o inhibicin entre los
dos tipos de eventos. Cuando el proceso no es homogneo, se aplica el mismo algoritmo sustituyendo el
estimador de la intensidad constante por el estimador no paramtrico de la intensidad variable tanto en el clculo
de Lij ( t ) como en las simulaciones para obtener las envolturas.
3. ANLISIS DE INCENDIOS
La base de datos consta de 4764 fuegos forestales registrados entre 1991 y 2008, clasificados segn su
causa (4153 fuegos intencionados, 279 provocados por causas naturales, 197 de origen desconocido y otras
categoras de menor peso) y tipo segn la superficie quemada. De acuerdo al PLADIGA 20008 se tienen 2909
conatos, menos de 1 ha total y ms de 0.5 ha de superficie forestal quemadas, 1169 quemas, menos de 0.5 ha de
superficie forestal quemadas, y 686 incendios, ms de 1 ha total y ms de 0.5 ha de superficie forestal
quemadas.
Tabla 1: Test Chi-cuadrado
Nmero 4x2
8x2
4764 821.2179 1060.203
Intencionado
4153 940.7118 1174.127
Causa Natural
279
38.8212 48.4056*
Desconocida
197
7.4746 24.5604*
Incendio
686 61.3163, 144.3209
Tipo Conato
2909 555.2473 660.7257
Quema
1169 308.5264 390.0507
(*) Valores esperados inferiores a 5, test no fiable.
Total

En la tabla 1 se muestran los resultados obtenidos al aplicar el test Chi-cuadrado a cada uno de los diseos
de inters. Se han realizado 2 divisiones verticales, por la forma irregular del rea de estudio, junto con 4 y 8
horizontales para analizar la homogeneidad global y local respectivamente. Si comparamos los resultados
2
2
obtenidos para cada uno de los patrones observados con los valores crticos 7,0.01
= 18.475 y 15,0.01
= 30, 578 ,
salvo en el caso de fuegos con causa desconocida, debemos rechazar la hiptesis de CSR. Los K-test
correspondientes a cada diseo confirman esto y dan claras evidencias de agregacin en todos ellos.
Tras rechazar la hiptesis de CSR, suponemos que nuestros datos corresponden a un Proceso
Inhomogneo de Poisson y estimamos su intensidad para posteriormente aplicar el test de CSR basado en la Kfuncin inhomognea. En la figura 1 se presentan los grficos correspondientes a los fuegos intencionados
registrados en el periodo 1991-2008, se ha aplicado el mtodo de seleccin de ventana para valores de entre 1
y 12 km obteniendo una ventana ptima de 3 km, en el grfico superior izquierdo vemos el MISE bootstrap
correspondiente a los distintos valores de . El estimador de la intensidad muestra que en gran parte del distrito
se han registrado al menos 1.5 fuegos por km2. Destaca por su conflictividad la zona sureste del distrito, formada
por los municipios de Navia de Suarna y Pedrafita do Cebreiro, donde se han alcanzado los 6 fuegos/km2. La
principal causa de estos fuegos es la conflictividad debida a las disputas de propiedad y gestin de la tierra al
haber sido catalogada gran cantidad de superficie de monte como Monte Vecinal en Mano Comn (mvmc) lo
cual es incorrecto, pues no se trata de montes vecinales sino de montes de baras o voces que es un tipo de monte
de proindiviso no reconocido hasta fechas recientes por la legislacin. Hay otro pico en el centro del distrito, que
corresponde a los montes que limitan entre los municipios de Baleira, Baralla, Becerre y Navia. En esta zona la
causalidad es en gran medida similar al caso anterior, con la incorporacin de un factor como es la ganadera
extensiva que aprovecha el monte durante algunas pocas del ao, sobre todo en verano, provocando los
incendios de primavera.
Respecto al K- test, como ya se ha comentado, vemos que si suponemos intensidad constante (izquierda)
la distancia entre la K-funcin emprica y la envoltura superior muestra claras evidencias de clustering. Al pasar
al caso inhomogneo esta distancia se reduce notablemente, confirmando que se estaba interpretando la
tendencia como interaccin, an as seguimos viendo indicios de clustering con radio aproximado de interaccin
de 4 km.
FUEGO INTENCIONADO, sigma=3000

4e06
3e06

4e04

1e04

1e06

2e04

2e06

3e04

MISE(h)

5e04

5e06

6e04

6e06

7e04

FUEGOS INTENCIONADOS: seleccin de ventana

2000

4000

6000

8000

10000

12000

FUEGOS INTENCIONADOS: Ktest inhomogneo

3.0e+08

Emprica
Terica
E. superior
E. inferior

K(r)

1.0e+08

2e+08
0e+00

0.0e+00

1e+08

K(r)

3e+08

4e+08

Emprica
Terica
E. superior
E. inferior

2.0e+08

5e+08

FUEGOS INTENCIONADOS Ktest

2000

4000

6000
r

8000

10000

2000

4000

6000

8000

10000

Figura 1: Grficos correspondientes al anlisis de los fuegos intencionados. Arriba: seleccin de ventana
y estimador no paramtrico de la intensidad. Abajo: K-test homogneo e inhomogneo. (h y r en metros)

En la figura 2 se presentan dos grficos correspondientes al anlisis de dependencia multitipo. En primer


lugar, aplicando el test basado en la K-cross hemos contrastado la interaccin entre incendios y conatos
registrados en 1992, nos hemos limitado a un nico ao por motivos de interpretacin. El grfico
correspondiente al K-test inhomogneo aplicado muestra dependencia positiva con radio de interaccin de 3 km,
confirmando la teora de que los pirmanos tratan de provocar reiteradamente un incendio en la misma zona
hasta que finalmente lo consiguen.
Por ltimo, dado que al observar la base de datos vemos que aos con muchos fuegos van seguidos de
aos con pocos y viceversa, parece razonable analizar si existe dependencia espacial entre los fuegos registrados
en distintos aos. El grfico correspondiente a los L-ndices para pares de aos consecutivos muestra que, en
cuanto se elimina la hiptesis de homogeneidad en los procesos marginales, no se observa dependencia entre la
localizacin de los fuegos en aos consecutivos.
INCENDIOCONATO 1992: Ktest NP

1e+06

HPP
IPP

Lindice

5e+05

0e+00

5e+05

3.0e+08
2.0e+08
0.0e+00

1e+06

1.0e+08

Kcross(r)

FUEGOS: Lndice aos consecutivos

Emprica
E. superior
E. inferior

1995
0

2000

4000

6000

8000

2000

2005

10000

Ao

Figura 2: K-cross inhomogneo incendios-conatos 1992, distancias en metros (izqda). L-ndice para aos
consecutivos (drcha)

3. CONCLUSIN
Los resultados expuestos en la seccin anterior muestran la utilidad de los procesos puntuales espaciales
en el anlisis y descripcin de la estructura espacial de los incendios. As hemos visto que el estimador no
paramtrico de la intensidad detecta correctamente las zonas ms conflictivas del distrito, aunque el K-test
inhomogneo indica que an existe cierta interaccin espacial que no estamos teniendo en cuenta. Por otra parte,
tambin se ha visto como los tests para procesos multitipo identifican la interaccin entre conatos e incendios
confirmando la teora existente respecto al comportamiento de los pirmanos. A raz de esta informacin el
prximo paso ser tratar de ajustar un modelo con interacciones tipo Neymann-Scott donde se refleje tanto la
inhomogeneidad como la relacin de dependencia entre distintos tipos de fuegos.
Por ltimo, debemos apuntar que en 2009 el distrito Fonsagrada-Ancares, en concreto las dos zonas que
sealbamos como ms conflictivas, han sido las de mayor incidencia de Galicia siguiendo el patrn
establecido, conatos o incendios pequeos seguidos de grandes incendios de hasta 120 ha en las proximidades de
los primeros.
AGRADECIMIENTOS
Este trabajo ha sido cofinanciado por el Grupo de Modelizacin e Inferencia Estadstica (MODES) de la
Universidade da Corua, autor 1, Ministerio de Ciencia e Innovacin (MTM2008-03010) Metodologas y
aplicaciones en estadstica semiparamtrica, funcional y espacio-temporal, autores 1 y 2, y por la Direccin
Xeral de Montes da Consellera de Medio Rural, autor 3.
REFERENCIAS
Baddeley, A.J., Moller, J., and Waagepetersen, R. (2000). Non and semi- parametric estimation of interactions
in inhomogeneous point patterns. Statistica Neerlandica, 54, 329-50.

Baddeley,A. and Turner,R. (2005). Spatstat: an R package for analyzing spatial point patterns. Journal of
Statistical Software 12: 6 1-42.www.jstatsoft.org.
Baddeley, A. Analysing Spatial Point Patterns in R. Workshop Notes. Published online by CSIRO, Australia, 10
february 2008.
Cowling, A., Hall, P. and Phillips, M.J. (1996). Bootstrap confidence regions for the intensity of a Poisson point
process, J. Amer. Statist. Assoc. 91, pp. 15161524.
Diggle, P.J. (2003). Statistical Analysis of Spatial Point Patterns. Oxford University Press.
Genton, M.G., Butry, D. T., Gumpertz, M. L., and Prestemon, J. P. (2006), "Spatio-temporal analysis of wildfire
ignitions in the St Johns River Water Management District, Florida," International Journal of Wildland Fire, 15,
87-97.
Hering, A.S., Bell, C.L., and Genton, M.G. (2009), "Modeling spatio-temporal wildfire ignition point patterns,"
Environmental and Ecological Statistics, Special Issue on Statistics for Wildfire Processes, 16, 225-250.
Mateu, J., Gregory P., Juan, P., Saura F. y Calle, A.. (2006). Modelos espacio-temporales para la evaluacin y
caracterizacin de ndices de riesgo de incendios forestales en la Comunidad Valenciana. Davalos-Fletcher.
ISBN: 84-689-7396-3. Depsito Legal: CS-85-2006.