Está en la página 1de 8

Funciones de volúmen local y generalizado

Escuela de Pregrado
Facultad de Ciencias Forestales
y Recursos Naturales
Autor: Leandro Chaura Mancilla
Profesor: Sr. Guillermo Trincado
Informe N°2: Funciones de volúmen
local y generalizado para IBOS-124.

Valdivia
2022
1. Introducción
Uno de los intereses en el área forestal es medir el volumen de un árbol en pie con el propósito de tener
una certeza de cuánta madera aprovechable es la que se obtendrá más adelante, las cuales se les dará distintos
usos como el aserrable, pulpable, generación de energía, paneles, etc. Al igual que la altura, el volumen se
puede predecir a través de un modelo, el cual necesita variables medidas, donde se puede considerar solo
el diámetro, o solo el DAP al cuadrado u otro más complejo que considere la altura total, diámetro a cierto
índice de utilización y el DAP a la vez.
A partir de cuántas variables se tienen que medir para generar el modelo, es que se pueden clasificar en
dos tipos de ecuaciones, las ecuaciones locales y las generales. La primera se caracteriza por utilizar una
sola variable, es decir, es un modelo más sencillo, ya que el uso está enfocado a situaciones de esa magnitud,
por ejemplo, un área de muestreo más acotado. Mientras que las ecuaciones generales considera la medición
de más de una variable, utilizándose en situaciones más complejas. En función de esto los objetivos de este
trabajo son los siguientes:

1. Ajustar modelos de ecuaciones locales (1 y 2) y generales (3, 4 y 5)

v = β0 + β1 d + β2 d 2 (1)

v = β0 + β1 g (2)

v = β0 d β1 hβ2 (3)

v = β0 + β1 d 2 h (4)

v = β0 + β1 d d5 h (5)

2. Calcular medidas de bondad de ajuste, estos son R2 y el error típico para cada modelo ajustado.

3. Calcular medidas de bondad de predicción, específicamente los que indican error probable y sesgo.

4. Seleccionar el modelo que mejor se ajuste a los datos.

1.1. Datos
Para poder ajustar los modelos y calcular las medidas de bondad de predicción, es que se utilizan dos
grupos de datos, donde se tienen un total de 60 individuos para el ajuste de los modelos y 40 para calcular el
error probable y el sesgo. Estos datos posee variables como el DAP, altura total (HT), diámetro a 5 metros
de altura (d5 ) y finalmente el volumen total (VT). Estos se resumen a través de estadística descriptiva en los
Cuadros 1 y 2:

1
Cuadro 1: Estadística descriptiva del diámetro a la altura del pecho (DAP) y altura total (HT)
DAP (cm) HT (m)
n Mín - Máx Media D.E C.V ( %) Mín - Máx Media D.E C.V ( %)
Ajuste 60 17,90 - 33,40 23,37 3,82 16,37 18,70 - 30,90 23,61 3,02 12,79
Validación 40 16,40 - 32,90 23,57 4,27 18,12 17,20 - 29,80 23,63 2,91 12,31

Cuadro 2: Estadística descriptiva del diámetro a 5 metros de altura (d5 ) y el volumen total (VT)
d5 (cm) VT (m3 )
n Mín - Máx Media D.E C.V ( %) Mín - Máx Media D.E C.V ( %)
Ajuste 60 15,50 - 27,30 20,07 2,89 14,39 0,25 - 1,07 0,51 0,20 39,04
Validación 40 14,80 - 26,80 20,12 3,55 17,64 0,22 - 1,07 0,52 0,22 43,25

2. Metodología
2.1. Ajuste de los modelos
Para el ajuste de los modelos se utilizó el método de mínimos cuadrados, el cual permitió estimar los
los parámetros del modelo, es decir, el intercepto (b0 ) y la/s pendiente/s (bn ) y al mismo tiempo obtener el
mínimo error del modelo. La forma que deben tener las funciones es una lineal, en este caso cuatro de las
cinco ecuaciones, posee esa forma, así que solo hay que linealizar en este caso el modelo número 3, el cual
se realizó de la siguiente forma:

v = β0 d β1 hβ2

v = β0 d β1 hβ2 / · ln

 
ln (v) = ln β0 + d β1 hβ2

ln (v) = ln β0 + β1 ln (d) + β2 ln (h) (6)

2.1.1. Cálculo de estimadores

Para la estimación de los parámetros, en el caso de los modelos 2, 4 y 5, que son modelos lineales
simples, es decir, que poseen una sola variable predictora. Se utilizaron las siguientes fórmulas:

b0 = y − b1 · x (7)

Donde y es el promedio del volumen total y x es el promedio de las variables predictoras.

∑ni=1 (xi − x) (yi − y)


b1 = 2
(8)
∑ni=1 (xi − x)

2
En que xi es cada dato que hay de la variable predictora, yi es cada dato de la variable que se quiere
predecir, en este caso es el volumen total. Finalmente x e y son la media de ambas variables.
Para los modelos 1 y 6 (linealizado del modelo 3) también se utilizó el método de mínimos cuadrados,
en estos casos para modelos lineales múltiples, o sea, aquellas funciones que poseen más de una variable
predictora. Por lo tanto, los estimadores de parámetros se calcularon de la siguiente manera:

−1 T
b = XT · X ·X ·y (9)

Donde b es la matriz que posee todos los estimadores, X es la matriz donde están todas las variables
predictoras con sus respectivos valores, XT es la transpuesta de X, y finalmente y es la matriz en que se
encuentran todos los datos de volumen total.

Una vez calculado el intercepto del modelo 6, a este se le aplicó la exponencial, y de esta forma obtener
el intercepto original del modelo 3.

2.2. Medidas de bondad de ajuste


2.2.1. Coeficiente de determinación (R2 )

La fórmula para el coeficiente de determinación que se usó para cada modelo es:

SCR
R2 = (10)
SCT
Donde SCR es la suma de cuadrados de la regresión y se obtiene de la siguiente forma:
n
∑ (VcTi −V T )2
i=1

SCT es la suma de cuadrados totales, que se calcula así:


n
∑ (V Ti −V T )2
i=1

2.2.2. Error típico

Para el cálculo del error típico se utilizó la siguiente fórmula:


s
SCE
sy.x = (11)
n− p
Donde SCE es la suma de cuadrados del error, n es el número de muestras y p es el número de parámetros
estimados. SCE se calculó como:
n
∑ (V Ti − VcTi )2
i=1

3
Siendo V Ti el volumen total observado, VcTi el volumen total predicha por el modelo, y V T es la media
del volumen total. Estos términos son los mismos según sea el caso para ambas medidas de bondad de ajuste.

2.3. Medidas de bondad de predicción


Luego de esto con los datos restantes se calcularon las siguientes medidas de predicción, donde las
expresiones señaladas son las mismas que las mencionadas anteriormente:

Medidas de error probable


2.3.1. Raíz del error medio cuadrático

s
1 n
REMC = Ti )2
· ∑ (V Ti − Vc (12)
n i=1

2.3.2. Error medio absoluto

1 n
EMA = · ∑ | V Ti − Vc
Ti | (13)
n i=1

Medidas de sesgo
2.3.3. Diferencia agregada

1 n
DIFA = · ∑ (V Ti − Vc
Ti ) (14)
n i=1
A cada uno de las medidas de predicción se le calculó la equivalencia en porcentaje dividiendo dichos
valores por el promedio y luego multiplicando por 100.

3. Resultados
3.1. Ajuste de los modelos
A partir de la metodología anterior, los estimadores de los parámetros por tipo de ecuación se muestran
en el Cuadro 3:

Cuadro 3: Estimadores de parámetros por tipo de ecuación para cada modelo linealizado.

4
Modelo b0 b1 b2
Ecuaciones locales
1 - 0,28 0,020 5,82 ·10−4
2 - 0,037 12,34 -
Ecuaciones generales
6 - 9,26 1,47 1,24
4 0,088 3,063 ·10−5 -
5 0,052 3,90 ·10−5 -

A partir del Cuadro 3 se obtuvieron los estimadores para los modelos originales (ver Cuadro 4), los que
se utilizaron para obtener las medidas de bondad de predicción.

Cuadro 4: Estimadores de los parámetros por tipo de ecuación para cada modelo.
Modelo b0 b1 b2
Ecuaciones locales
1 - 0,28 0,020 5,82 ·10−4
2 - 0,037 12,34 -
Ecuaciones generales
3 - 9,51 ·10−5 1,47 1,24
4 0,088 3,063 ·10 −5 -
5 0,052 3,90 ·10 −5 -

3.2. Medidas de bondad de ajuste


Las medidas de bondad de ajuste obtenidos son los siguientes:

Cuadro 5: Medidas de bondad de ajuste por tipo de ecuación para cada modelo.
Modelo R2 Error típico
Ecuaciones locales
1 0,89 0,067
2 0,89 0,067
Ecuaciones generales
3 0,95 0,081
4 0,95 0,044
5 0,98 0,026

A partir del Cuadro 5, el modelo que posee mejores medidas de bondad de ajuste, fue el 5, pues responde
a un 98 % de la variabilidad del volumen y es el que menos se escapa del volumen total observado.

5
3.3. Medidas de bondad de predicción
Medidas de error probable

Cuadro 6: Medidas de bondad de por tipo de ecuación para cada modelo


Modelo REMC EMA
Ecuaciones locales
1 0,069 0,048
2 0,070 0,050
Ecuaciones generales
3 0,044 0,033
4 0,050 0,041
5 0,026 0,023

Y a continuación estos valores son expresados en porcentajes, para observar la magnitud de los valores
del Cuadro 6.

14 13,23 13,37 8,50 9,58 5,01 9,25 9,52 6,32 7,83 4,46
10
12

10 8
Modelo Modelo
REMC (%)

1 1
EMA (%)

8
2 6 2
3 3
6
4 4
4
5 5
4

2
2

0 0

1 2 3 4 5 1 2 3 4 5
Modelo Modelo

(a) Raíz medio cuadrático por modelo en porcentaje. (b) Error medio absoluto por modelo en porcentaje.

Medidas de sesgo

Cuadro 7: Medidas de bondad de ajuste por tipo de ecuación para cada modelo.
Modelo DIFA
Ecuaciones locales
1 - 1,10 ·10−3
2 - 2,14 ·10−3
Ecuaciones generales
3 3,00 ·10−3
4 5,38 ·10−5
5 - 1,93 ·10−5

Finalmente en la Figura 1, se visualiza la magnitud del sesgo para cada modelo.

6
0.7 −0,21 −0,41 0,57 0,01 −0,003

0.5

0.3
Modelo
1

DIFA (%)
0.1
2
3
−0.1
4
5
−0.3

−0.5

−0.7

1 2 3 4 5
Modelo

Figura 1: Diferencia agregada por modelo expresado en porcentaje.

A partir de las medidas de bondad de predicción con datos diferentes a los del ajuste, nuevamente el
modelo que posee los valores más cercanos a 0 es el modelo 5. Por lo tanto el volumen predicho es el que
más se acerca al volumen observado.

4. Conclusión
Teniendo en cuenta las medidas de bondad de ajuste y de predicción, el modelo que mejor se ajusta a los
datos es el modelo 5, respondiendo a un 98 % de la variabilidad del volumen total, donde por cada unidad
de la variable DAP · d5 · HT , el volumen aumenta 0,0000390 m3 . Finalmente el modelo sobreestima en un
0,003 %.

También podría gustarte