Está en la página 1de 9

Introducción

1.1 Antecedentes

1.2 Planteamiento del problema

1.3 Justificación

Objetivos

General

Específicos

Hipótesis

1
Metodología

Área de estudio

El área de este estudio abarca gran parte del centro y sur de Sonora

Figura 1. Mapa de la distribución del bosque

2
2.2 Especie de estudio

2.2 Selección de los sitios de muestreo

Como información principal se utilizó la última iteración del Inventario Nacional Forestal y de
Suelo de México (INFyS) (2009 y 2014), este contiene alrededor de 26 000 parcelas a lo largo
del país y con una densidad de 2577 ha de superficie forestal por parcela. La INFyS clasifico la
vegetación en base a una Carta de Ordenamiento Territorial y Vegetación Serie III-IV a escala
elaborada por el INEGI.
Para el muestreo estratificado sistemático el INFyS utilizo unidades primarias de muestreo
denominadas conglomerados (CGL), los cuales se distribuyen en una red de puntos con una
separación de 10km en bosque seco tropical y comunidades semiáridas y de 5km para otros tipos
de bosques. Los CGL se valuaron en cuatro unidades secundarias de muestreo (UMS) ya que
eran circulares y contaban con un área de una hectárea de 56,42 m de radio. Cada UMS tenían un
área dispuesta en “Y” invertida, los cuales eran circulares para bosques templados y semiáridos y
rectangulares para bosques tropicales. Se categorizan según el tipo de bosque a nivel de CGL.
Mientras que los CGL sin arboles son descartados (que contenían estructuras humanas y caminos,
además zonas de impactos como minería o huracanes). En el caso de incendios y plagas, se
excluyeron los CGL catalogados como “grandes afectados”, siendo un mínimo de 66% de la
extensión afectada. También se excluye ciertas parcelas cuya baja área basal no alcanzaba el
umbral de 2 m2/ha, además de no ser bosque denso. Se utilizaron datos restringidos (2009-2012)
por falta de existencias de C (2013-2014). Al final se utilizó un estudio de 10 519 CGL que
incluía bosques de coníferas, de hoja ancha, mixtos, siempre tropical verde y semideciduo,
tropical seco y semiárido.

3
2.3 Determinación de variables

2.4 Análisis exploratorio de datos

Las variables bioclimáticas se derivan de los valores mensuales de temperatura y precipitación


para generar variables biológicamente más significativas. Estos se utilizan a menudo en el
modelado de distribución de especies y técnicas de modelado ecológico relacionadas. Las
variables bioclimáticas representan tendencias anuales (p. ej., temperatura media anual,
precipitación anual), estacionalidad (p. ej., rango anual de temperatura y precipitación) y
factores ambientales extremos o limitantes (p. ej., temperatura del mes más frío y cálido, y
precipitación de los meses húmedo y cálido). cuartos secos). Un trimestre es un período de tres
meses (1/4 del año)   (Referencia).

En el programa Rstudio corre la información de datos climatológicos en periodos de tiempo


provenientes de tablas de Excel con diferentes parámetros biológicos para obtener diferentes
interacciones que son de interés para estudio del clima de la región.

Se dividen los datos obtenidos en dos partes: El primero está relacionado a la temperatura y el
segundo en precipitación.

-      De la temperatura se retiró el parámetro Bio8 el cual representa la temperatura media del


trimestre más húmedo, en comparación con Bio10 el cual representa la temperatura media del
trimestre más cálido, estos dos se relacionan ya que el mes más cálido equivale al más húmedo
por la región. Se eligieron los parámetros trimestrales porque según (CONAGUA, 2021) cada
año se presenta el monzón de norteamérica que consiste en precipitaciones en regiones del
Noroeste de México en el caso de este estudio abarca el estado de Sonora y sus alrededores
como Chihuahua, Durango, Sinaloa, Suroeste de Estados Unidos, iniciando entre finales del
mes de junio y principio de julio hasta septiembre, por lo que teóricamente los trimestres de
datos compilados podrían complementar mejor con este fenómeno.

4
En primera instancia se usó del software libre R usando la interface de RStudio (v. 1.4.1106) para
realizar un análisis exploratorio de las 38 variables bióticas y abióticas que se obtuvieron
previamente.

El análisis partió con el desarrollo de un código, el cual compendió la creación de:


(1) histogramas de frecuencias, con los cuales se pudo observar la distribución de las variables
cuantitativas, (2) diagramas de dispersión y correlaciones, los cuales ayudaron a discernir si
existía alguna correlación entre las variables respuesta y las variables predictoras,
(3) modelos de regresión lineal simple, al progresar con el desarrollo del código se intentó
utilizar modelos de regresión pero debido a la cantidad de ceros que se encontraban presentes
en la base de datos, debido a que no en todas los sitios de muestreo se obtuvieron datos, usar
modelos de regresión lineal no fue lo ideal, por lo que se descartó del código final.
(4) Análisis de componentes principales o Principal Component Analysis (PCA), debido a que se
contaba con un gran número de variables cuantitativas posiblemente correlacionadas, se
decidió aplicar este método, el cual permitió reducir a un número menor de variables que
expliquen gran parte de la variabilidad en los datos. Con base a los resultados del PCA y de las
correlaciones, se seleccionaron a 13 variables (incluyendo el tipo de bosque como variable
categórica) para ser usadas en la modelación estadística para cumplir con los objetivos de este
estudio (ver Tabla 3). En el análisis exploratorio también se obtuvieron
(5) boxplots, esta herramienta permitió resumir las características principales de los datos e
identificar la presencia de valores atípicos mediante diagramas de cajas, de los cuales se
realizaron solo de las 4 variables respuesta por ser las de interés para cumplir con los objetivos
del estudio.
(6) Prueba Shapiro, mediante esta prueba se analizó la normalidad de las 4 variables respuesta.
(7) Análisis de Varianza (ANOVA), se utilizó para determinar diferencias estadísticamente
significativas entre las medias de las 4 variables predictoras.
(8) Prueba Tukey, se realizó el análisis post-hoc, lo que significa que se usa junto a un ANOVA, el
cual permite encontrar medias que son significativamente diferentes entre sí.
(9) Pruebas de correlación, la cual fue la última prueba que se realizó en el código, la cual ayudó
para evaluar la asociación entre las variables respuesta y las variables predictoras finales.
(10) Modelos predictivos, se seleccionaron con base en (1) el tipo de datos o información que se
obtuvo previamente en las bases de datos y (2) la información generada tras el análisis
exploratorio (ver sección 2.5 sobre la modelación final).

5
Tabla 3. Variables seleccionadas para la modelación

Data Factores Variables Resolución Fuente


(Espacial y Temporal
fid

ID
x

Slope
(deg)
Soil_d
[m]
Structural

Diversidad del bosque Tree

Stumps
[#]
ABG
[t/ha]
BGB
[t/ha]
Bt
[t/ha]
AGC
[t/ha]
BGC
[t/ha]
Ct
[t/ha]
Temp
[°C]
PTT
[mm]
DBH
[cm]
H
[m]
BIO1
Annual Mean Temperature
BIO2
Mean Diurnal Range (Mean of
monthly (max temp - min temp))
BIO3
Isothermality (BIO2/BIO7) (×100)
BIO4
Temperature Seasonality (standard
deviation ×100)
BIO5
Max Temperature of Warmest Month Worldclim
BIO6
Min Temperature of Coldest Month
BIO7
Temperature Annual Range (BIO5-
BIO6)
BIO8
Mean Temperature of Wettest
Quarter
BIO9
Mean Temperature of Driest Quarter
BIO10
Mean Temperature of Warmest
Quarter
BIO11
Mean Temperature of Coldest Quarter
BIO12

6
Annual Precipitation
BIO13
Precipitation of Wettest Month
BIO14
Precipitation of Driest Month
BIO15
Precipitation Seasonality (Coefficient
of Variation)
BIO16
Precipitation of Wettest Quarter
BIO17
Precipitation of Driest Quarter
BIO18
Precipitation of Warmest Quarter
BIO19
Precipitation of Coldest Quarter
Type
Tenure
Fires
Pests

7
2.5 Selección de mejores modelos para predecir las variables respuesta

Al término del análisis exploratorio se optó por utilizar Modelos Lineales Generalizados o GLM
(Generalized Linear Models).

En estos modelos se incluyeron como variables predictoras a SumBAcm2, SW, dba, lba, tba, ls,
ds, Elevación y Tip_de_bos, y a PercCmue, PercCReb, PercCdaño, Suma_Inds_Tot como
variables respuesta (ver Tabla 3 para los nombres completos de las variables).

Para cada variable respuesta se desarrolló un modelo general con variables predictoras que
estuvieran relacionadas con la variable respuesta, pero no correlacionadas entre sí. Posterior a
esto se usó la función stepAIC que desarrolla n iteraciones de modelos con base a las variables
predictoras del modelo general y selecciona un mejor modelo. Del conjunto de modelos, el
stepAIC selecciona el mejor modelo como aquel que minimiza el valor de AIC (Akaike
Information Criterion o Criterio de Información de Akaike).

8
9

También podría gustarte