Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRÁCTICOS DE INVENTARIOS
FORESTALES
I
El segundo capítulo hace una presentación del Muestreo Simple al Azar por ser la
base de los demás procesos de muestreo que para efectos prácticos se conciben
como variaciones de aquel. Cubre los elementos antecedentes para un muestreo
de este tipo, con las definiciones de error de muestreo, diversas propuestas para
el cálculo de las intensidades y tamaños de muestra, conceptos de premuestreo y
algunas consideraciones preliminares de logística para culminar con ejemplos
prácticos de su manejo.
El tercer capítulo aborda los muestreos de selección mecánica o sistemática de la
muestra, sus problemas y los acercamientos al cálculo de sus errores de
muestreo, enfatizando unidades de igual y desigual tamaño.
El cuarto aborda los muestreos estratificados, formas de división en
subpoblaciones cuando estas se dan en el bosque, premuestreo, tipos de acuerdo
a la superficie muestreada o la variación, conocidos como muestreos
estratificados por distribución proporcional y distribución óptima, ademas de
estratifiacación de acuerdo con los costos con sus características estadísticas
para poblaciones infinitas y finitas, y modos de repartición de las muestras,
culminando con el proceso de estratificación posterior al muestreo como remedio
a la no consecución de los niveles de error permitidos cuando se detectan a
posteriori subpoblaciones dentro del bosque.
El quinto capítulo trata de los muestreos con unidades desiguales en forma o
tamaño, algo no deseable estadísticamente pero que la dasometría resuelve con el
concepto de estimadores de la razón q y sus estadísticos para la varianza y error
estándar de estos, uno de los procedimientos más usados sobre todo en bosques
tropicales ante la aparición de parcelas de gran longitud con respecto a su ancho,
las fajas de desigual longitud. Se da también una visión al proceso Dawkins para
el muestreo en bloques iguales con división en fajas iguales, muy apto para los
bosques de gran extensión y al concepto del perímetro circunscrito a un bosque
para la homogeneización de las unidades de muestreo.
El sexto capítulo aborda los muestreos de atributos en poblaciones, y algunos
muestreos no convencionales para la regeneración natural. Se da una visión de
las distribuciones binomiales, estadística vital para los estudios de supervivencia
en plantaciones, principalmente, y estudio de características cualitativas de los
II
bosques. Se abordan también en este capítulo algunos tipos de muestreos de la
regeneración natural como los métodos de las distancias entre vecinos,
especialmente el método ordenado del sexto árbol y el método de cuadrantes con
el tercer árbol y por último el metodo de las parcelas cero con la distancia
esperada de plántulas conocida y desconocida, así como los elementos para
algunas pruebas diagnósticas.
El séptimo aborda los procesos de muestreo con probabilidades variables PPS,
basados en las propuestas de Bitterlich como el muestreo enlistado, los
convencionales PPS de Bitterlich y un inventario muy característico al comercio
forestal de árboles en pie, el muestreo de la triple predicción o 3P, importantes
como muestreos diagnósticos y con un poco más de elaboración como inventarios
completos del bosque.
El octavo capítulo hace un repaso de los muestreos multifásicos, recolección en
forma simultánea o sucesiva para información que requiera de ajustes
posteriores. Aborda principalmente los procesos bifásicos dependientes e
independientes y el muestreo bivariado con variable dependiente conocida y
desconocida, así como el doble muestreo aleatorio con regresión para grandes
áreas.
El capítulo 9 trata de los muestreos arracimados, cluster o polietápicos, para
grandes áreas, especialmente los de división homogénea con doble análisis de
varianza, así como los cluster con arranques sistemáticos y diversas medidas de
eficiencias de ellos.
El capítulo diez cubre lo más rigurosamente posible el muestreo continuo, con el
propósito del manejo sostenido con el uso de parcelas permanentes y temporales,
especialmente para cálculos del crecimiento y una mejor planificación de otras
actividades. Se da también una breve noción del muestreo secuencial, como
muestreo diagnóstico de situaciones que permiten eliminar el tiempo entre
muestras temporales para la toma de decisiones de manejo acerca de ciertas
situaciones de un bosque o rodal.
El último capítulo habla de la planificación y ejecución de los inventarios, un
breviario de los principales elementos para tener en cuenta al respecto y finaliza
con procesos de optimización tanto de muestreos como de los inventarios en sí.
III
Es importante aclarar que esta obra, que tiene su máximo propósito académico,
no podría surgir independientemente de la obra de Loetsch, Haller y Zoherer,
desarrollada entre 1964 y 1973, en dos tomos, cumbre al respecto, que podría
decirse que casi no deja campos en el tema sin cubrir. Acá se intenta una
presentación entre rigurosa y práctica como auxilio en las tareas de la
inventariación forestal, incluyendo y ampliando temas que a juicio del autor son
relevantes para un buen conocimiento de los métodos modernos de
inventariación.
Por último se presenta una bibliografía que reseña toda las obras consultadas
aun las no citadas en el texto como ayuda para el lector.
IV
1.REVISION DE CONCEPTOS BASICOS
1
al “rodal", conjunto de árboles, de área generalmente pequeña, por ejemplo en
Europa alcanza hasta unas 20 ha en bosques intensamente manejados; en
bosques tropicales y aun en plantaciones pueden alcanzar cientos de hectáreas
con características comunes, una especie o mezcla de ellas, correspondientes a
una edad, un sitio, lugar, quedando como concepto de unidad elemental de
manejo, pudiendo cambiar generalmente con el tiempo.
La siguiente unidad en orden es "el cuartel", compuesta de varios rodales,
división artificial marcada generalmente por accidentes geográficos como
caminos y ríos especialmente, se consideran unidades mas o menos constantes.
La unidad de orden mayor en inventarios es la "unidad de manejo", que depende
del objetivo principal de la explotación. Lógicamente los valores numéricos son
muy subjetivos y podrán variar hasta de país a país pues sólo deben ser un
referente que posibilite unas decisiones de manejo, último fin del inventario.
1.1.4 Unidad de evaluación. Superficie escogida como referente para los
cálculos. Generalmente es una extra o intrapolación de una hectárea (10.000
m2).
En resumen, un inventario forestal es una cuantificación real y satisfactoria de
las existencias de un bosque con respecto a algún parámetro silvicultural,
generalmente el volumen de la madera, relacionado con una unidad de
evaluación, por medio de algunas técnicas de recolección de información,
acompañadas de un dispositivo estadístico conceptual que garantice su
veracidad objetiva con unos límites de confianza, dentro de una probabilidad
escogida.
1.1.5 Aspectos económicos. Aunque el acto de medir un bosque, no cambia la
productividad de los árboles, la información recogida puede conducir a mejores
manejos que propicien esta situación. La recuperación del capital invertido en un
inventario sólo puede ser evaluado en términos del incremento en el
conocimiento que se tenga del bosque. La mayoría de los inventarios deberían
tener la firme convicción de que el valor ganado en información sea por lo menos
equiparable al costo invertido en ellos. En este sentido se deberá plantear una
indicación de la eficiencia como la máxima información necesaria al mínimo
costo así como el fortalecimiento de las evaluaciones económicas de la actividad.
2
1.2 Breve historia de la técnica de los inventarios forestales.
Inicialmente concebidos como la base de los planes de manejo, luego se
confundieron con ellos, y actualmente debido a los avances estadísticos como
una herramienta de apoyo para la ordenación y el manejo forestal, propiamente
dichos.
A finales de la edad media, la escasez de madera y el aumento adicional de la
población, obligó a la utilización de los bosques accesibles y cercanos a las
urbes, y con algunas incipientes formas de planificación. La primera referencia
de un inventario forestal como tal, viene de Francia a finales del siglo XVII,
cuando Colbert ordena la primera búsqueda de información planificada de que
se tenga noticia, acudiendo para ello a los tasadores con su apreciación subjetiva
de las existencias, (Lema, 1995).
Las informaciones preliminares fueron por área, lo que permitió la
implementación de los primeros mapas, sobre todo en Alemania, refinados
posteriormente con la aplicación de principios matemáticos que mejoraban la
dendrometría, de tal forma que para los albores del siglo XIX, ya existían algunos
muy precisos con registros excelentes para la mayoría de los bosques públicos y
privados del país. Casi idéntica situación se dio para la Europa central con la
información principal consistente en la producción total almacenada en ellos.
Esta se consideraba suficiente ya que en los siglos XVIII y XIX la mayor demanda
se concentraba en el combustible forestal más que en la madera de aserrío. El
bosque era dividido en "huertos forestales", que servían como unidad de
evaluación, para una estimación visual de la producción por hectárea,
apreciación o tasación confrontada contra la producción obtenida de unas pocas
áreas muestrales taladas para el caso.
La tasación fue entonces parte vital del entrenamiento para la evaluación de
áreas forestales, simple y barata y alcanzó hasta niveles inigualables en algunos
estados. El método fue contribuyendo a la idea de usar áreas más pequeñas
cada vez, como unidades últimas de evaluación, y propició estudios que
calculaban el sesgo y la posibilidad de usar los errores como método de ajuste
para la mejora de la estimación de donde surgieron propuestas como el manejo
de rodales combinados y la técnica de la compilación.
3
En el siglo XIX, mejoraron aceleradamente las condiciones de la medición del
árbol individual, apareciendo incipientemente las relaciones diámetro-altura,
factores de volumen y de forma, y los conceptos de tablas de volumen o tarifas
para especies individuales, (Lema, 1995).
La expansión de los sistemas de transporte y la industrialización de la Europa
central, volvió a privilegiar la madera sobre el combustible forestal, se hizo
insatisfactoria la tasación y empezó a manejarse el concepto de maderas
dimensionales así como de sus calidades, por lo cual se impuso la medición
árbol por árbol, técnica aun usada al 100% en muchos bosques suizos y
alemanes, aunque muy pronto se percataron de la necesidad de reducir costos.
Los primeros métodos de este tipo datan de finales del siglo XVIII. Ya en el siglo
XIX se dio inicio al muestreo para obtener estimados por rodal incluso con
parcelas circulares.
La introducción de sistemas de plantaciones de grandes bosques uniformes,
impuso las tablas de producción, con aparición de conceptos como la edad,
índice de sitio, densidad y cerramiento de copas, elementos discriminatorios
para una buena estimación y otros conceptos silviculturales que hicieron de la
actividad algo diferente del manejo total.
Durante casi todo el siglo XIX se fue desarrollando otra estrategia de inventarios
en Scandinavia con base en grandes unidades de evaluación, como los distritos
rurales y las provincias, luego de lo cual apareció el concepto de las fajas lineales
desarrollado por el sueco Ström, no muy preciso si el espaciamiento es grande,
pero suficiente cuando se trata de evaluaciones preliminares, y ajustable por
divisiones sucesivas en unidades más pequeñas y con muestreos mas detallados.
En este siglo también se enriquecen las propuestas con el desarrollo de técnicas
para inventarios de bosques tropicales. Alrededor de 1850, en Burma, se
propone para teca, por el Sir D. Brandis, el procedimiento en fajas, dentro de
cuarteles de tamaño considerable, separadas sistemáticamente y con
intensidades del 5%, ante las imposibilidades de la enumeración total, que llega
con ligeras modificaciones hasta nuestros días, como la propuesta de (Dawkins,
1958).
El siglo XX se llena de propuestas que revolucionan el campo de los inventarios,
4
como el método de los incrementos con dos mediciones sucesivas por período
dentro de cada cuartel, desarrollado por Gurnaud en Francia y Biolley en Suiza,
con medición además de la remoción de material en ellos, sentando las bases
para el inventario continuo, (Pardé, 1956), luego de lo cual se desarrolló la idea
del rodal medio" de Krenn en 1948, o la ingeniosa irrupción de Bitterlich con su
PPS, (Lema, 1995) y el refinamiento de las técnicas de muestreo. Estas son parte
indispensable para un buen inventario, lo que supone una buena comprensión
de los conceptos estadísticos.
A mediados del siglo XVIII, los estados europeos introducen la estadística,
especie de aritmética política, como parte de su acción gubernativa que se fue
ampliando, superando los conteos e inventarios y propiciando el análisis de la
información recogida. Uno de los primeros aritméticos políticos fue Malthus
(1776-1834), quien por observación dedujo que el incremento de la población era
una progresión geométrica, cuando el de la alimentación era aritmética, por lo
cual debía reducirse la población. Otros conceptos usados entonces ya tenían
antecedentes en matemáticas de probabilidades, que tuvieron su origen en la
teoría de juegos de Pascal (1623-1662), Bernoulli (1654-1705), Quetelet (1796-
1874) y Poisson (1781-1849).
Un hito fue el descubrimiento de la curva normal por de Moivre en Inglaterra, La
Place en Francia y Gauss en Alemania, por su influencia decisiva en el arte de la
inventariación que condujo al desarrollo de la estadística matemática,
fundamentalmente de los métodos del análisis de varianza y covarianza de Fisher
a partir de 1936, la posibilidad de los cálculos de errores y tamaños de muestra,
las posibilidades de la regresión que propician el uso intensivo de las tablas de
volumen (Lema, 1995), y el uso de las fotografías aéreas, originalmente en
Tharandt (Alemania) por Hugersdorff, pero sobre todo en USA, Africa y la
Comunidad Británica.
1.3 Objetivo del inventario.
El objetivo último del inventario es la descripción cuantitativa de una población
forestal, para obtener resultados útiles para efectos prácticos de su manejo, ya
como plantaciones o como bosques naturales. La Población, será entonces el
universo o espacio muestral S objeto de nuestro interés, con dos características
5
relevantes: la primera, que los individuos de ella, sean de forma similar y en
inventarios esto se refiere fundamentalmente a las parcelas en forma y área, o
que no existen, estadísticamente hablando poblaciones compuestas de unidades
de área de diferentes tamaños. Cuando ello se da, es necesario implemetar
nuevas propuestas de muestreo como los estimadores de la razón o los
muestreos PPS. Lógicamente los árboles como individuos de una población
también podrán ser entes individuales de ella, en otros tipos de muestreo. En
este caso la forma o concepto será el árbol, o cada individuo en particular.
La segunda que los individuos difieren con respecto a una característica física o
atributo, lo cual constituye su variación, ejemplo un volumen, un área basal (G),
un diámetro promedio, lo cual permite acercarse a ella a través de la estadística,
y especialmente del muestreo en todas las formas posibles.
Existen entonces diversos conceptos de población aun en un mismo bosque. El
forestal deberá definirla para lograr respuesta a los objetivos buscados, y al
mismo tiempo satisfacer unas condiciones óptimas, técnicas, económicas y
logísticas desde el punto de vista estadístico. El reconocimiento y distinción de la
población objetivo, es evidentemente el primer requisito para la planificación y
ejecución de un buen inventario.
Las características poblacionales pueden ser medidas cuantitativamente o
pueden ser descritas y contadas en ambos casos. Si el árbol individual es mirado
como una unidad, entonces se le miden sus parámetros dendrométricos como
diámetro y altura, el volumen no se mide directamente, pero puede calcularse
con base en ellos, surgiendo entonces informaciones directas e indirectas con
sus diversos tratamientos. Otras características, como la composición de
especies y la calidad de la madera, tampoco pueden medirse directamente pero
si ser descritas y, por medio de las distribuciones binomiales ser transformadas
a formas cuantitativas.
Se asume la mayoría de veces que en una población forestal las unidades de
áreas individuales son distribuidas al azar con respecto a una característica
particular, como el volumen, el peso u otras pero, sí en el bosque se dan altos o
bajos valores de ellos al mismo tiempo, solo se deberán al azar. Forestalmente
hablando existen muchas razones que impiden tal distribución aleatoria en los
6
bosques, como la calidad de los sitios, diversos microclimas, ciclos de
regeneración diferenciales, topografía, edades, efectos o influencias antrópicas,
que crean diferencias que conducen a tener subpoblaciones dentro del bosque.
1.4 Fundamentos para la teoría del muestreo en inventarios.
Conocer las características esenciales de un conjunto de medidas es difícil, por
ello se recurre a ciertas técnicas gráficas o numéricas para resumirlas, como un
histograma, por ejemplo, que permite algo de ello y además posibilita una
estimación empírica de la forma de la población. Una vez establecida una
distribución de frecuencias relativas es posible con argumentos probabilísticos
calcular medidas numéricas que resuman la información como la media, la
varianza, la desviación estándar, así como sus límites probables.
La experiencia de los autores más reconocidos en inventarios como (Loetsch y
Haller, 1964; Schumacher, 1943) entre otros, muestran que la forma más fácil
de comprender el muestreo, es a través de demostraciones empíricas y
comparaciones con una población conocida. Para ello se acudirá a una población
de 400 ha. varias veces modificada en diversos aspectos. Para ello se asumirá
cada valor de ella desconocido a menos que por azar salga seleccionado el punto
en el cual está inscrito, lo que equivale a hacer una muestra en un lugar
desconocido, Figura 1.1.
7
Por ejemplo, si la muestra hubiera caído en el cuadro 1, equivaldría a haber
encontrado un volumen en una parcela de 1/40 ha de 4.075 m 3/parcela o 163
Coordenadas A B C D
1-5 174,32 171,08 71,56 33,36
6-10 280,00 281,16 208,76 120,76
11-15 273,52 279,00 192,80 167,70
16-20 182,28 180,08 63,28 51,44
teniendo en cuenta que son 16 bloques, que difieren mucho por zonas de 25 has
cada uno.
A B C D
1 163 191 191 140 250 133 125 184 148 206 0 15 0 0 44 0 23 0 0 30
2 155 133 170 163 206 176 243 265 170 110 125 0 15 81 110 0 125 38 15 59
3 221 206 170 194 214 133 103 222 184 206 148 103 59 8 110 15 38 0 0 30 I
4 206 140 155 148 191 148 280 170 148 199 176 81 44 30 0 38 38 66 66 38
5 125 103 148 191 184 163 163 140 110 148 184 191 110 66 89 0 0 118 59 38
6 280 309 271 288 163 324 346 125 184 214 250 214 148 176 103 74 89 8 0 0
7 316 250 169 339 346 339 288 258 303 222 176 250 169 191 133 191 155 89 38 8
8 265 346 331 265 258 214 361 324 229 309 243 346 229 206 110 133 148 170 66 89 II
9 280 354 309 375 125 398 346 383 221 250 221 339 176 89 155 89 235 214 199 118
10 125 176 331 346 383 206 316 331 339 199 295 235 375 206 184 301 148 199 103 155
11 346 413 316 273 221 441 413 316 214 243 301 221 221 148 110 133 148 235 96 206
12 280 265 199 280 176 229 354 235 184 229 258 229 163 110 74 163 176 140 133 118
13 339 398 250 339 273 316 325 250 184 324 316 96 206 303 191 243 133 280 74 176 III
14 346 346 258 295 288 288 368 206 368 265 324 199 118 155 265 125 199 155 273 250
15 163 273 81 214 206 243 214 258 390 118 191 148 214 89 170 184 110 125 191 155
16 273 163 148 163 103 214 184 155 221 229 199 118 155 265 125 199 155 125 103 89
17 133 184 191 148 199 191 191 184 140 221 110 15 51 23 30 110 66 51 0 23
18 163 250 243 125 176 206 191 163 221 243 133 44 0 23 0 0 44 38 51 44 IV
19 96 206 199 199 229 148 155 155 118 199 89 0 125 23 8 8 0 0 0 38
20 235 229 221 163 118 191 59 235 140 148 23 23 0 0 0 15 0 38 74 15
a b c d e f g h i j k l m n o p q r s t
8
condición de un bosque natural maduro de cativo por ejemplo en el cual no se
han hecho intervenciones en los últimos años
A B C D
1 163 30 191 0 191 0 140 23 250 0 133 44 125 0 184 0 148 15 206 0
2 155 59 133 15 170 38 163 125 206 0 176 110 243 81 265 15 170 0 110 125
3 221 30 206 0 170 0 194 38 214 15 133 110 103 8 222 59 184 103 206 148 I
4 206 38 140 66 155 66 148 38 191 38 148 0 280 30 170 44 148 81 199 176
5 125 38 103 59 148 118 191 0 184 0 163 89 163 66 140 110 110 191 148 184
6 280 0 309 0 271 8 288 89 163 74 324 103 346 176 125 148 184 214 214 250
7 316 8 250 38 169 89 339 155 346 191 339 133 288 191 258 169 303 250 222 176
8 265 89 346 66 331 170 265 148 258 133 214 110 361 206 324 229 229 346 309 243 II
9 280 118 354 199 309 214 375 235 125 89 398 155 346 89 383 176 221 339 250 221
10 125 155 176 103 331 199 346 148 383 301 206 184 316 206 331 375 339 235 199 295
11 346 206 413 96 316 235 273 148 221 133 441 110 413 148 316 221 214 221 243 301
12 280 118 265 133 199 140 280 176 176 163 229 74 354 110 235 163 184 229 229 258
13 339 176 398 74 250 280 339 133 273 243 316 191 325 303 250 206 184 96 324 316 III
14 346 250 346 273 258 155 295 199 288 125 288 265 368 155 206 118 368 199 265 324
15 163 155 273 191 81 125 214 110 206 184 243 170 214 89 258 214 390 148 118 191
16 273 89 163 103 148 125 163 155 103 199 214 125 184 265 155 155 221 118 229 199
17 133 23 184 0 191 51 148 66 199 110 191 30 191 23 184 51 140 15 221 110
18 163 44 250 51 243 38 125 44 176 0 206 0 191 23 163 0 221 44 243 133 IV
19 96 38 206 0 199 0 199 0 229 8 148 8 155 23 155 125 118 0 199 89
20 235 15 229 74 221 38 163 0 118 15 191 0 59 0 235 0 140 23 148 23
a t b s c r d q e p f o g n h m i l j k
Coordenadas A B C D
1-5 112,48 95,20 127,44 115,20
6-10 195,52 205,24 244,48 245,44
11-15 237,80 204,56 242,84 228,96
16-20 134,84 98,88 124,76 118,60
9
volumen, a la manera de los bosques tropicales, con un volumen promedio
de 42.35 m3/ha.
I II III IV
1 30
2 59 0
3 163 30 15
4 191 155 38 0 0
5 101 133 221 38 66 38
6 140 140 206 206 0 59 0
7 250 163 170 140 125 8 0 66 23
8 206 155 155 103 280 89 38 118 125
9 133 125 184 148 206 0 0 15 0 44 0 A
10 76 243 265 170 110 125 0 15 81 110 0
11 214 133 103 221 184 206 148 103 59 8 110 15 38
12 148 191 148 280 170 148 199 176 81 44 30 0 38 38
13 148 191 184 163 163 140 110 148 184 191 110 66 89 0 0
14 309 271 288 163 224 346 125 184 214 250 214 148 176 103 74 89 8
15 316 250 339 169 346 346 288 258 303 221 176 250 169 191 133 192 155 89
16 265 346 331 265 258 214 361 324 229 309 243 346 229 206 110 133 148 170 66
17 280 354 309 395 125 398 346 383 221 250 24 339 176 89 155 89 235 214 199 118
18 125 176 331 346 383 207 316 331 339 199 295 235 375 206 184 301 148 199 103 155
19 346 413 346 273 221 491 413 316 214 243 301 221 221 148 110 133 148 235 96 206
20 280 265 199 280 176 229 354 235 184 229 257 229 163 110 94 163 176 140 133 118
21 339 398 250 339 273 316 325 250 184 324 316 96 206 303 191 243 133 280 74 176
22 346 346 258 295 288 288 368 206 368 265 324 199 118 155 265 125 199 155 273 250
23 163 273 81 214 206 243 214 258 390 118 191 148 214 170 89 184 110 125 191 155
24 163 148 163 103 184 155 221 229 199 118 155 265 125 199 155 125 118
25 184 191 148 199 163 140 221 110 15 51 23 30 110 66 51 0 B
26 243 125 243 133 44 0 23 0 0 44 38 51
27 199 199 89 0 125 23 8 8 0 89 0
28 221 148 23 23 0 0 0 15 191 23 74
29 250 214 273 184 191 44
30 206 191 133 155 155 38
31 229 206 163 235 59 15
32 148 96 221 199 0
33 191 235 118 163 38
34 140 176 103
35 29 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
10
11
conocidas como medidas de TC. Las más importantes son la media, la
mediana y la moda.
N
x i p x i x VA DISCRETAS
E x i 1 1.1
x f x dx
x VA CONTINUAS .
X 1 2 3 .... 6
En este caso la variable aleatoria jamás toma su E(x). Para una variable
aleatoria continua, sea Y una variable aleatoria que representa la vida útil de
un automóvil público en Colombia, cuya función de densidad se encontró
experimentalmente como f x 2.85 x 2 para valores de 1 x 30, x = el
1 30 2.85 30 2.85
EX x 2
dx x 2 dx dx 9.6434
3 x 1 x 1 x
la vida media útil de un carro público en Colombia oscila alrededor de los
9,6 años, siendo el modelo presentado el adecuado. La media aritmética o
simplemente promedio es la más adecuada de las tres medidas de
tendencia central para los inventarios forestales y la más conocida. En
general, una media poblacional, que es una esperanza, será denotada por
12
N
1 + X 2 .... + X N
Xi
= E (X) = X = i=1
1.2
N N
La media ocupa una posición particular importante entre otras cosas por
las siguientes:
N N
1) xi 0; 2) xi mínimo .
2
i 1 i 1
x
2
Sí m denota el valor que conduce a 2), entonces: la d i dm de
i 1
donde:
N
2 xi m 1 0; 2 xi Nm 0 , m .
i 1
Esto hace tan importante este parámetro como tipificador de una población.
Se dan otras presentaciones desde el cálculo para la media. Cuando en
todo punto de un plano cartesiano, es posible expresar un parámetro en
función de sus coordenadas (x,y), bajo una función del tipo g = h(x, y), se
puede obtener la media m(g) con la integral doble
h(x, y) dxdy
m(g) = g = D
1.3
dxdy
D
13
dS
Prob g h(x, y) g + dg = f(g) dg = 1.5
S
en la cual dS es la superficie en la cual la altura sobre el nivel escogido
queda comprendida entre g y g + dg, con dg infinitamente pequeño.
Entonces cualesquiera que sean g1 y g 2 , es posible tener:
m(g) = gg max
min
g f(g) dg 1.8
que conduce al ya conocido resultado de reemplazar la integral por la
sumatoria, y la probabilidad elemental por la frecuencia elemental de cada
observación, cuando no es posible conocer las funciones, asi:
N
1
m(g )est = g i 1.9
i=1 N
1.5.1.2 Media geométrica Cuando por intuición se aprecie que una
distribución o una población tiene comportamientos de progresiones
geométricas o exponenciales, el valor de equilibrio se puede estimar como
n
X g n xi 1.10
i 1
14
Tabla 1.3 Datos para cálculo de una media geométrica
n
XH n
1
1.11
i 1 x
3 3
XH 13.5 ' 14.33 '
1 10 1 15 1 18 0.222
z Me
f x dx 0.50; 0 f x dx 0.50 1.12 ,
o sea el valor de la variable aleatoria que tiene exactamente la mitad del área
bajo la función de densidad. Se define igual para VAD, como el valor de la VA
por debajo o por encima del cual se sitúa el 50% de los datos de una muestra.
Si x1, x2 ... xn representan en orden creciente la colocación de los datos de una
población.
15
X n 1 n es impar
2
X me X X 1.13
2
n
n 21
si n es par
2
Ejemplo: La X med de 3, 12, 4, 8, 5, 16, 24 3, 4, 5, 8, 12, 16, 24
n 1 7 1 89
el cuarto número. De 3, 4, 5, 8, 12, 16, 24, 27 8.5
2 2 2
Es una apropiada medida de tendencia central para variables aleatorias no
distribuidas simétricamente. En algunas variables es quizás mejor
16
momento crudo de la distribución o el k-ésimo momento alrededor de cero, o
quizás del origen.
1.5.2.1 Momento alrededor de la media. El k-ésimo momento alrededor de
la media o momento central:
x k f x dx
VAC
k E X 1 1.14
k 1
xi X1 p xi
k
VAD
x 2 f dx VAC
x
2 Var x E X 1 1.16
2 1
xi 1 p X i VAD
2
2 1
(Y )
2
V Y = E Y = = 1.17
2 i
2 i=1
N
A partir del concepto para la media desde el cálculo, es posible obtener la
varianza como la doble integral:
V(g) = 1.18
D dxdy
que se vuelve:
17
1 1
D h(x, y) - m(g) dxdy = gg max g - m(g) S f(g) dg
2 2
V(g) =
S S min
1.19
g - m(g)
g max 2
= g min
f(g) dg
i=1 N
la cual se torna insesgada introduciendo el concepto de grados de libertad:
1
(g) = g - m (g) 1.21
N 2
V estim e
N -1
i
i=1
3 E x 1 1.22
3
Una distribución unimodal (un solo punto de máxima) con 3 0 se dice que
es sesgada a derecha, o que tiene una cola a izquierda. La convención adopta
18
4 E x 1 1.24
4
La estandarizada 2
4 4 es una medida relativa de la Kurtosis. Valores
22
de 2 4 3 son de distribuciones más puntiagudas que la normal
(leptocúrticas), 2 3 platicúrticas y 2 3 mesocúrticas.
M m X m p(x ) 1.25
x
entonces E Y E f x f x p x .
1.5.3 Propiedades de la esperanza. Se dan algunas muy útiles sobre todo en
ciertas demostraciones:
1) Si K = constante E k k p x k p x k
2) E kX kx p x k x p x k E X
3) E k X E k E X k E X
4) E k bX k bE X
5) E X x E x E x 0
M 2 Var (x ) E X x p x .
2 2
1) Var X E X 0
2 2
x
3) Var k 0
19
4) Var k X Var X
volumen, tendrá una P(x = 25, Y = 1,25) = algún valor. Sus principales
propiedades son:
P xi, yj 0 ,
p x ,y 1 ,
j i
i j
F x , y
i j p r X x y Y
i
y j y, una muy importante la
Cov X , Y xy E X x Y y xi y x j y P xi , y j 1.26
j i
20
Figura 1.6. Elementos de una población (S) y de una muestra (S').
p X ,Y i j p X p Y
1 i 2 j
X Y en VAD
i j
f X ,Y f X f Y X Y en VAC
1 2
P x , y
P y x
i j
P x
j i
1 i
P x
j i 2 j
1 i
21
Similarmente g Y X f y 2 ( XY )
0
E h x , y
h x , y p x , y en VAD
i j
i j i j
2) E X x
3) E XY E X E Y x y
si X y Y son VA independientes
1.5.7.5 Funciones de variables aleatorias. Son las que se forman de modo que
una variable nueva aparezca como el resultado de aplicar una operación a otras.
De ellas las más conocidas son las famosas combinaciones lineales.
Sea X1, X2 ... Xn, una serie de variables aleatorias que pudieran reunirse en una
sola variable así:
k
Y a X a X
i 1 1 2 2
a X k k
... a X ; a cons tan te j j j
j 1
1) E Y Ei a X a E X
k
j 1
j j
k
j 1
j j
Por ejemplo: Y 2X 3X 4X E Y 2X 3X 4X
1 1 2 3 1 1 2 3
2) Y
a X a a X , X ; a ,a cons tantes
k k k
2 2
e j j i j i j j i
i i 1 j 1
por ejemplo:
22
Y a X a X Y
e 1 1 2 2
2
e a X a X a X a a X , X
2
1 1 2 2
2
1
2
1 1 2 1 2
aa 2 1
X , X a a
1 2 2 2
X a X 2a a X , X a X
2
2
2
1
2
1 1 2 1 2
2
2
2
2
Nótese que: X , X 1 1 X 2
1
3) Sí X1 independiente de X2 a X a X 2
1 1 2 2 a X
2
i
2
i
Y ,Y
k k
2
1 2
con Y a X ; Y b X
1 i i 2 i i
i 1 i 1
Y ,Y a X , b X a b X
k k k
2 2 2
1 2 i i i i i i i
i 1 i 1 i 1
Ejemplo. Y a X a X ; Y b X b X
1 1 1 2 2 2 1 1 2 2
Y ,Y a b X a b X
2
1 2 1 1
2
1 2 2
2
2
1.6 Teoría de la estimación. Surge de las inquietudes que plantea S,
constituido de los parámetros muestrales, al resolver dos preguntas: 1) Que
valor atribuirle a y a 2 (estimación puntual), 2) Entre que valores 1 y 2
23
probabilidades con 2 X finita, entonces a medida que aumenta n la tiende
X = E(X)
2
X , o, 2 2
(X) 1.27
n (X) =
n
sx2 s2
sx2 ; sx2 x 1- Nn 1.28
n n
con el uso del factor de corrección.
La figura 1.7, trata de mostrar intuitivamente el concepto de error estándar (o
estándar).
El concepto 2, permite encontrar medias por cada subespacio o parcela
muestral sk en cuyo caso:
X X
n n
Xi
2
i
X i 1
; s X2 i 1
1.29
k k 1
daría el error cuadrático de medias, o varianza de ellas. Pero otra cosa muy
diferente es cuando se toman muestras puntuales, como en 3), en cuyo caso
es donde se ve la importancia del teorema del límite central, que permite con
ellas encontrar (1.29).
1.6.3 Aleatoriedad. Con N cosas tomadas de a n se pueden formar A grupos
diferentes, de acuerdo con la combinatoria
N N!
= =A 1.30
n n! (N - n)!
Sí la probabilidad de selección de uno de ellos es 1/A, la muestra es aleatoria, o
sea que cualesquiera de ellos tiene igual oportunidad de ser seleccionado, este
supuesto resulta más importante incluso que el de la normalidad de la muestra.
24
Se dice que se logra cuando las observaciones se extraen independientemente de
una población común.
25
La hipótesis nula diría que cuando las observaciones son aleatorias el trazo
secuencial de las observaciones cruza la mediana con frecuencia, en el caso
contrario con menos frecuencia. Cuando n es impar, la mediana pasaría por una
observación que no es D o I y por lo tanto no se cuenta y se trabaja la muestra
par n-1. Por ejemplo en b) según estén a izquierda o derecha, se muestran los
cruzamientos de la mediana con barras, formando la secuencia
DDD / III / DDD / I , definiéndose un número de series S, como la cantidad de
bloques separados, con lo que a mayor encadenamiento menor núnero de series.
Para n observaciones, cuando la hipótesis nula, Ho: la muestra es aleatoria, es
cierta se asume que S se distribuye como una normal:
n
E S 1
n n 1 2
S 1; n n 2 n 1
1.31
2 4
Var S
4 n 1 4
E S
10
1 6 Var S
10 1 2.25 , al usar la aproximación normal.
2 4
Dado que se formaron 4 series entonces se plantea:
S S 46
Pr ob S 4 Pr ob Pr ob Z 1.333 0.0912 ,
S 2.25
o sea una bajísima probabilidad de que esa muestra fuera aleatoria.
Existe también la prueba de la diferencia medio cuadrática sucesiva, DMCS
que evalúa diferencias entre observaciones sucesivas mediante la siguiente
propuesta, sí Ho: la muestra es aleatoria, resulta verdadera:
s 2
i 1
26
pequeños valores de d, exigen el rechazo de la aleatoriedad. Ejemplo,
supóngase que la secuencia de las observaciones de b) hubiera sido 20, 22,
19, 16, 17, 15, 17, 21, 20, 22, 17. Entonces al calcular se tuvo
n
x x
2
i i 1
DMCS 77
d i 2
n
1.2794
x X
s2 2 60.1818
i
i 1
DMCS n2 9
E d E 2; Var d 0.0744
2 2
n 121
d d 1.2794 2
Pr ob Pr ob Z 2.6422 0.00411
d 0.0744
n
xi 1 n 1
E x E i 1 E xi n E x 0 1.33
n n i 1 n
27
n n
E ( X i - - X + )2 = E [( X i - ) - ( X - ) ] 2
i=1 i=1
2 n n 2
E xi - - 2 X - xi - + X -
n
i 1 i 1 i 1
n
i 1
2
n
i 1
n
2
E xi - - 2 X - xi - n + X -
i 1
n 2 1
n 2 - = 2 (n - 1) E ( s 2 ) = 2(n - 1) = 2
n (n - 1)
n
P(| T n - | i ) = 1
i 0
al reescribirse la última expresión como el límite de convergencia en
probabilidad, o dicho de otra forma, cuando n es muy grande T
1.6.6 Estimador suficiente. Dicho en una forma sencilla, es aquel que aporta
tanta información que la muestra por si misma ya casi no aporta nada más.
Una T = f(X1, X2,...,Xn) es suficiente si al afirmar T ya no se necesita saber más
de X1, X2,...,Xn. La media y la varianza muestral tienen esta propiedad.
1.6.7 Estimador eficiente. Se considera eficiente a un estimador T de un
28
parámetro poblacional , aquel que entre varios T1, T2,...,Tk insesgados,
presente la menor variación. Sean T1 y T2, insesgados, T3, sesgado, Figura 1.9.
X 1 + X 2 ; = X 1 + X 2 + ... + X 5
T 1= X 1 ; T 2 = T3
2 5
( + )
E ( T 1 ) = E ( X 1 ) = ; E ( T 2 ) = X 1 X 2 = 21 ( + ) = insesgados
2
; E ( T 3 )= 5 5 =
1
Las varianzas:
2 ( T 1 ) = 2 ( X 1 ) = 2 ; 2 ( T 2 ) = 21 2( X 1 + X 2 ) =
2
1
4 2 2 = 21 2 , 2 ( T 3 ) = 512 5 2 = 0.2 2
T 3
tiene casi todas las características deseables. Sea un nuevo estimador
definido como
x1 + 2 X 2 + X 3 + 2 X 4 + X 5 7
T4= _ E ( T 4 )= = ;
7 7
1
2 ( T 4 )= 11 2 = 0.225 2
49
29
Sigue siendo mejor estimador T por su menor varianza:
3
2 ( T 4 ) > 2 ( T 3 )
30
Para ello son de gran ayuda las fotografías aéreas. Sí, como sucede en muchos
bosques tropicales, solamente algunos rasgos son reconocidos, la simple
división del área en figuras regulares geométricas llamadas bloques podrían
producir el efecto deseado sobre la varianza total, Figura 1.11. No se sabe si
los bloques contendrán subpoblaciones homogéneas, pero puede asumirse
que bloques vecinos resultan más homogéneos que bloques distantes, si
existen diferencias entre las áreas que los sustentan. Esta es una forma un
poco artificial, pero muy válida, de eliminar cierta variación. Los procesos de
estratificación serán abordados en posteriores capítulos.
1.7.1 Estadística de poblaciones mezcladas. Considérese una población
consistente de M estratos y cada uno con N j individuos, Figura 1.10. Cada
individuo de la población será designado como Yij , que significa: observación
Y (Y -j)
2
ij ij
j = i=1 ; 2j = i=1
Nj Nj
31
El número de observaciones individuales en la población total se obtiene como
M
N = N 1 + N 2 + N 3 +.....+ N M = N j 1.38
j=1
M
N = N 1 + N 2 + N 3 +.....+ N M = N j 1.40
j=1
(Y -j)
2
M ij
M
1 M Nj
2
estr = P j* j
2
=N j
* i=1 = * * ( Y ij - j )
2
1.41
j=1 j=1 N Nj N j=1 i=1
muestra est
2
resultará menor. La siguiente inecuación, recoge ambos conceptos
M Nj
2 M Nj
N
2
= ( Y ij - ) N (Y ij
2
- j ) = N estr
2
1.42
j=1 i=1 j=1 i=1
La cual puede dejarse solo con el signo igual equilibrando el término de la
izquierda sumando y restado j
( Y ij - j + j - )2 = [( Y ij - j ) + ( j - ) ] 2 1.43
con lo cual se llega a la siguiente importante ecuación:
M Nj M Nj M
( Y ij - ) ( Y ij - j ) N ( j - )2
2 2
j
j=1 i=1
= j=1 i=1
+ j=1
1.44 ,
N N N
32
que también se puede reescribir como:
- )
M M
Nj
2 = estr
2
+ ( j - )2 = esrt
2
+ P j ( j 2
j=1 N j=1
A B C D
1 163 191 191 140 250 133 125 184 148 206 0 15 0 0 44 0 23 0 0 30
2 155 133 170 163 206 176 243 265 170 110 125 0 15 81 110 0 125 38 15 59
3 221 206 170 194 214 133 103 222 184 206 148 103 59 8 110 15 38 0 0 30 I
4 206 140 155 148 191 148 280 170 148 199 176 81 44 30 0 38 38 66 66 38
5 125 103 148 191 184 163 163 140 110 148 184 191 110 66 89 0 0 118 59 38
6 280 309 271 288 163 324 346 125 184 214 250 214 148 176 103 74 89 8 0 0
7 316 250 169 339 346 339 288 258 303 222 176 250 169 191 133 191 155 89 38 8
8 265 346 331 265 258 214 361 324 229 309 243 346 229 206 110 133 148 170 66 89 II
9 280 354 309 375 125 398 346 383 221 250 221 339 176 89 155 89 235 214 199 118
10 125 176 331 346 383 206 316 331 339 199 295 235 375 206 184 301 148 199 103 155
11 346 413 316 273 221 441 413 316 214 243 301 221 221 148 110 133 148 235 96 206
12 280 265 199 280 176 229 354 235 184 229 258 229 163 110 74 163 176 140 133 118
13 339 398 250 339 273 316 325 250 184 324 316 96 206 303 191 243 133 280 74 176 III
14 346 346 258 295 288 288 368 206 368 265 324 199 118 155 265 125 199 155 273 250
15 163 273 81 214 206 243 214 258 390 118 191 148 214 89 170 184 110 125 191 155
16 273 163 148 163 103 214 184 155 221 229 199 118 155 265 125 199 155 125 103 89
17 133 184 191 148 199 191 191 184 140 221 110 15 51 23 30 110 66 51 0 23
18 163 250 243 125 176 206 191 163 221 243 133 44 0 23 0 0 44 38 51 44 IV
19 96 206 199 199 229 148 155 155 118 199 89 0 125 23 8 8 0 0 0 38
20 235 229 221 163 118 191 59 235 140 148 23 23 0 0 0 15 0 38 74 15
a b c d e f g h i j k l m n o p q r s t
criterios: estrato I: volúmenes entre 000 - 125 m 3 /ha , estrato II: entre 126 -
33
Ello es posible hacerlo con base en fotografías aéreas, premuestreos de campo,
historia de los rodales, entre otros. Es necesario entender las dificultades que
surgen al respecto, como las de incluir lugares o áreas con características
diferentes a las generales del estrato, lo cual no cambia el espíritu del concepto.
También resulta complicado el establecimiento de los bordes por efecto de ciertas
transiciones graduales que generan dudas con respecto a su ubicación
subpoblacional.
Se anota que esos niveles de detalle están influidos por la escala de fotos y
mapas, por desconocimiento de muchas situaciones silviculturales, pero que en
términos generales se satisfacen las expectativas del proceso a pesar de muchas
de estas imprecisiones. La división de la variación total en componentes tiene un
gran significado en inventarios forestales, fundamentalmente en costos y
tiempos, y clave para comprender el papel desempeñado por los análisis de
varianza, en los diferentes diseños de muestreo.
34
pequeños y si son muy anchos pueden desaparecer características importantes
de la población.
Tabla 1.4 Distribuciones por clases y por estratos para la población # 5
35
También es posible hacer divisiones de frecuencias con clases diferentes, acá se
hizo con clases iguales, por ser fácil gráficamente así. También es posible
mostrar los polígonos con frecuencias relativas para acentuar la visualización de
los picos y se mejora a veces la percepción de los estratos. Otra presentación de
los datos se obtiene de los polígonos de frecuencias acumuladas, y relativas
acumuladas. que permiten estimación percentil, como se estudia en la
estadística descriptiva.
1.7.2 Efecto de tamaño de las unidades de muestreo. Las unidades de
muestreo son creadas artificialmente por lo cual carecen de dimensiones
naturales, como si las tiene el árbol por ejemplo, lo que posibilita infinitas
divisiones del bosque, de acuerdo con los tamaños elegidos. Para apreciar este
efecto, se pueden formar nuevas poblaciones juntando de a 2 parcelas, luego 4,
etc quedando poblaciones de 200 unidades, 100 unidades, etc. El proceso con de
a 2 unidades y1 j , y2 j , permite la formación de una nueva variable Z j como se
muestra a continuación:
Z j = Y 1j + Y 2j
haciendo L = N/2, por ejemplo en el caso de la población #1 L = 400/2; se tienen
los estadísticos:
L L L
Zj y1 j y 2j
Z j 1
j 1
j 1
y1 y2 1.47
L L L
L L
Z z
2
2
Y1 Y2 y y
j
j j 1 2
z2 j 1
j 1
L L
1.48
Y
L L
Y 2 2
1j
j 1
y1 2j y2
2 Y1j y1 Y2 j y2
j 1
L L
1.49
L L
y y ;
j 1
1j
j 1
2j Y1 Y2
36
1.50
L L N
sí y y y ; 2
j 1
1j
j 1
2j
ij 1
ij Y1 Y2 Y Z
2 2 2
L L N
L L N
y1 j y2 j yij
j 1 j 1 ij 1
y12j y22j yij2 ,
j 1 j 1 ij 1
y
L L N
1.51
L
( Y 1j - Y 1)( Y 2j - Y 2)
2z _ 2 Y2 +
j=1
L
compuesta de la varianza de Y2
de las unidades de área simple y la covarianza
de las áreas conjuntas, debido a diferencias aparecidas entre ellas, divididas por
L. Manipulando esta fórmula se puede llegar a que
2Z 4 Y2
dependiendo de la naturaleza de la población, con lo cual se encuentra que
Z% < Y %
Se asume como factor responsable para esa reducción de la variación al
incremento en el área de la parcela o unidad muestral, o sea a la covariación.
Una medida de ella es el llamado coeficiente de correlación, ya estudiada su
utilidad en otros contextos, el cual se presenta acá con la letra griega Rho (ρ) ya
que es parámetro poblacional y no estimado. Su numerador se conoce como
covariación.
L L
( Y 1j - Y 1)( Y 2j - Y 2) ( Y 1j - Y 1)( Y 2j - Y 2)
=
L
j=1
L
j=1
N N
1.55
( Y ( Y ( Y ( Y
2 2 2 2
1j - Y 1) 2j - Y 2) ij - Y ) ij - Y )
j=1 j=1 ij=1 ij=1
2 2
37
L
( Y 1j - Y 1)( Y 2j - Y 2)
= j=1
L L
( Y 1j - Y 1 ) ( Y 2j - Y 2 )
2 2
j=1 j=1
y 1j
y1 y2 j y2 1 L
j 1
1 2
L j 1
y1 j y1 y2 j y2 y2 1.58
y
2
por lo cual se podría escribir,
2Z _ 2 Y2 + 2 Y2 _ 2 Y2 (1 + )
Como el coeficiente de correlación de unidades de áreas adjuntas puede llegar a
situarse teóricamente entre -1 y +1, el máximo valor que 2
Z
puede alcanzar,
38
El coeficiente de variación de la población con unidades mayores resulta menor
que el de la población con las unidades simples, por lo cual se asume como
factor responsable de la situación a la covariación encontrada en la fórmula
(1.52). , evaluado como (1.55) dio un valor de 0.7. Pero importa rescatar, hasta
este instante, el efecto que sobre los parámetros estadísticos tienen los cambios
de unidad de área, situación digna de tenerse en cuenta al momento de la
decisión acerca del tamaño de las parcelas. De los otros parámetros es difícil ver
los cambios y su efecto ya que y están influidas por la media, que cambió.
2
1+
z% _ y% 1.60 .
2
1+
La reducción del coeficiente de variación de z% _ y% , por el efecto de
2
doblar las unidades de muestreo, es determinado por el factor radical de (1.60),
que permite las siguientes conclusiones: si fuera 1, situación que casi nunca
ocurrirá, los coeficientes serían similares. Pero prácticamente en todos los casos
1+
dará menor de +1, con lo cual se reducirá z% _ y% , es decir la
2
reducción se incrementa si el factor decrece, incluso a valores negativos. Por
ejemplo z % 0.5 y % cuando 0.5 . La desviación estándar y el
coeficiente de variación dependen entonces del área y de la orientación espacial
de las unidades muestrales, en contraste con la media que permanece constante,
otra de sus ventajas.
1.8 Conceptos intuitivos de probabilidad.
En estadística matemática el concepto se desarrolla con bases puramente
axiomáticas. Para nuestros propósitos son más constructivas algunas visiones de
su significado como las dadas por (Hahan y Shapiro, 1968). La interpretación
clásica (o igualmente probable) dice: Si un evento ocurre de N igualmente
posibles y diferentes formas, y si n de ellas tienen un atributo A, entonces la
ocurrencia de A, denotada como Pr (A), es definida como n/N. Esta definición se
39
queda corta para muchas situaciones. La interpretación con base en frecuencias
relativas (o empírica), dice que si se hace un experimento N veces, y un atributo
particular A ocurre n veces, entonces el límite de n/N, en la medida que N sea
grande, es definido como la probabilidad de A, denotado Pr (A). Por ejemplo la
probabilidad de extraer un 6 de una muestra de 10 juegos de cartulinas
numeradas del 0 al 9. Al intentar una respuesta, es posible pensar que dicha
probabilidad sería la misma que extraerlo de un solo juego de cartulinas,
además notando que hay un 10% de 0, 10% de 1, etc. Si denotamos cualquier
número deseado con Y y su probabilidad asociada como p(Y), se encontraría que
p(0) = p(1) = p(2) = .. = p(9) = 1/10 = 0.1. En este caso particular la probabilidad
la encontraríamos como un porcentaje pudiendo decirse que, si se sacan muchas
tarjetas, la frecuencia relativa de obtener cualesquiera de los números de ellas se
aproximará a 0.1. La interpretación subjetiva (del hombre de la calle), será que
la probabilidad Pr (A) es una medida del grado de convicción que uno tiene en
una proposición especificada (A).
1.8.1 Repaso del concepto de probabilidad con base en frecuencias. Es una
de las más utilizadas por los estadísticos modernos. Una definición simple de
probabilidad la sitúa como el limite de la frecuencia relativa así:
Pr (X) lim
n1
1.61
n
X cualquier resultado, por ejemplo un 0, un 1, etc. n número total de cartulinas,
n1 número de cartulinas extraídas con 0, 1, etc.
1.8.2 Propiedades elementales de la probabilidad. Los límites de las
frecuencias relativas, así como de su límite son
ni
0 1 y 0 Pr(X) < = 1 como además
n
n1 n 2 n
n1 + n 2 + ...+ n n = n ; + + ...+ n = 1
n n n
se obtiene la misma relación en el límite,
Pr( X 1 ) + Pr( X 2 ) + ...+ Pr( X n ) = 1
40
consignen los resultados no importa. Por ejemplo los sucesos { e1, e 2 .... e n } ;
41
resultado . (SSC), puede hacerse aplicando el concepto de frecuencia relativa,
suponiendo que muchas personas repitieron el experimento anterior: después del
primer lanzamiento sólo 1/3 de personas registraría S, después del 2do
lanzamiento, solo otro 1/3 de las anteriores registrarían S y después del 3er
lanzamiento, sólo 2/3 de las anteriores registrarían C, por lo tanto, el suceso
descrito tendría una probabilidad de 2/3 de 1/3 de 1/3 = 2/27, este resultado
es el que aparece en la última columna.
1.8.4 Los sucesos y sus probabilidades. Al indagar por el hecho de X = obtener
por lo menos dos caras, se mira en el árbol que este suceso incluye los
resultados s1, s2, s3 y s5, pudiendo decirse que el suceso X es la colección de los
puntos {s1, s2, s3 y s5}. Ello permite definir cualquier suceso o evento como un
subconjunto de resultados del conjunto S. La probabilidad de X, será entonces,
(1.60) se vuelve:
nx
Pr (X) = lim
n
en que n X frecuencia de X, y X acontece siempre que s1 , s2 , s3 , o s5 lo hagan, por
tanto
n1 n 2 n 3 n 5
n x = n1 n 2 n 3 n 5 y pr (X) = lim =
n
8 4 4 4 20
pr s1 pr s2 pr s3 pr s5 + + + =
27 27 27 27 27
que se puede generalizar así: la probabilidad de un suceso es la suma de las
probabilidades de todos los puntos o resultados incluidos en el, o de otra forma
Pr (X) = Pr ( si )
1.8.5 Combinación de sucesos. Un cálculo formal de probabilidades puede
desarrollarse en términos de teoría de conjuntos. Es posible del árbol de
resultados, averiguar por la probabilidad de un suceso como X = salir menos de
dos caras, o que todas la monedas exhiban el mismo resultado. Dándole nombre
a estos sucesos llamaríamos A = el suceso de salir menos de dos caras en tres
tiradas de una moneda; B = el suceso de que todas las monedas exhiban el
mismo resultado, presentado en otra forma es el evento:
A U B = S 4, S 6 , S 7 , S 8, S 1
42
que se define como el conjunto de puntos que están en A, en B o en ambos a la
vez. cuya probabilidad sería entonces de 5/9. Un suceso más restringido es
obtener menos de dos caras y que todas las monedas exhiban caras o sellos, o
sea los resultados que satisfagan tanto a A como a B. En este caso sólo .S8
satisfaría los requisitos. Dicho resultado se denota como A B = { S 8 } , con
probabilidad de 1/27. Para sucesos combinados que no tengan puntos en
común, llamados mutuamente excluyentes, se tiene:
pr A B = pr A + pr B 1.67
Si A Y B no son mutuamente excluyentes
Pr ( A B ) = Pr (A) + Pr (B) Se podría seguir con todo el proceso que tratan los
conjuntos y los diagramas de Venn, pero no es el objeto de este manual, sólo se
trata de mostrar lo simple que se pueden volver los conceptos razonados, de un
elemento que como las probabilidades son vitales en los inventarios forestales.
43
2
1 x
1
2
f x , , 2 e ; X ; ; 0
0, si no se cumple lo anterior
Para notar que una variable X sigue la distribución normal se usa la notación
cambiar y 2 .
1.9.1.1 Características de la distribución normal.1- Es continua y simétrica
alrededor de la media con dos puntos de inflexión a una distancia de .
Figura 1.15.
44
conservadores que los anteriores, por medio de la desigualdad de Tchebychev, la
cual establece que para cualquier distribución con media y varianza finitas, al
1
menos 1 veces del 100% de la probabilidad, estará en el rango k
k
2
7- difícil resolver F(X), por lo cual se acude a una curva prototípica que ayude a
desentrañar los demás miembros de la familia media y varianza respectivamente.
Y = a + bX , E(Y) = a + b E(X) = a + b ,
1.70 ,
var(Y) = 2(a + bX) = 0 + b 2 2(X) = b 2 2(X)
2) Si se tiene una serie X1, X2, X3,..., Xk, de variables aleatorias independiencaduna de ellas
siendo X ,
i
2
, la suma de ellas tendrá distribución normal. Propiedad
reproductiva,
k k
E X i E X i 1 2 k
i 1 i 1
1.71
2
k
X i X1 X 2 X k
2 2 2
i 1
X N E X E X
1 2 E X k ; V X1 X 2 X k 1.72
3) Si se divide una normal por una constante 0, sigue siendo normal.
45
4) Usando las propiedades anteriores, si X , i
2
y a cada X le restamos
x- x x- 1 2 2 =1
E = E - = - = 0 ; 2 = x - = 1.73
2
2
X -
Z = 0, 1 1.74
Normal estandarizada que tiene como función de densidad:
1 1 X
2 2
1 Z2
2
; si x z e = f Z ; - < Z < 1.75
f X = 2
e
2
0, de otra forma
Conocido este miembro de la familia se puede conocer cualquier otro X k. Para
ello existen las famosas tablas de Z, con sus respectivas probabilidades.
1.9.1.3 Muestra aleatoria y Suma muestral. Se había definido una muestra
aleatoria. Pero estadísticamente hablando, una muestra aleatoria simple es
aquella cuyas n observaciones X1, X2, ...Xn son independientes, la distribución de
cada Xi es la de la población P(x) con media y varianza 2. La única excepción a
lo anterior lo constituyen las muestras pequeñas y sin reemplazo.
1.9.1.3.1 Suma muestral. Al extraer una muestra aleatoria de una población
considérese la suma muestral de variables independientes S X1 + X2 + ... +Xn.
Esta también será una variable aleatoria, caracterizada por E(S) y 2(S), que se
espera se conserve de muestra en muestra. Es particularmente importante en la
normal.
E S E X X 1 2
X n n 1.76
Var S Var X X 1 2
X n Var X
1
Var X n 1.77
2
x x
2
2
x n 2
46
1 1 1 1
X X X ... X S E X E S
n n n n
1 2 n
1 1 1
Var X Var X X ... X Var S
2
n ; 2
1.79
n n n n
1 2 n
n
2 2 X
1
Sí se observa, Var X X X Var X , equivale a la de una población
n
1 2 n
de medias. A la desviación estándarde medias se le conoce como error estándar
de las medias, que conduce al teorema siguiente.
1.9.1.3.2 Teorema del límite central. A medida que aumenta el tamaño de una
muestra (n) de X1, X2, ...Xn variables aleatorias independientes que tienen a
X
X n 1.80
X2
E X ;
i
X i 1
2
n
Conceptos ya manejados antes.
1.9.2 Distribución binomial. Es otra de las distribuciones obligadas a manejar
en inventarios forestales, para muestreos de variables discretas, supervivencia o
atributos. Se aplican a un espacio muestral S en que la variable considerada solo
tiene uno de dos valores, éxito o fracaso, + o -, vivo o muerto, etc. Es una
distribución de experimentos Bernoulli cuyas características son: S = {E,F}, tal
que P{E} = p; P{F} = 1 - P{E} = 1 - p = q, con 0 p 1 . Cuando X(E) = 1 entonces
X(F) = 0, la función de probabilidades de X es Binomial puntual o Bernoulli.
Tabla 1.6. Experimento Bernoulli. Probabilidades
P(X = 0) = p 0 (1 - p )(1 - 0)
p x (1 - p )(1 - x) ... X = 0, 1
P(X = x) P(X = x) = 1.82
P(X = 1) = p
1
(1 - p )
(1 - 1)
0 en otros casos (x 0, x 1)
47
x E X xp x 0* p 0 1* p 1 p
x 0,1
x 0,1
p X = p x 1 p 1.84
n x
= p x q n x
El número posible de eventos que tiene x éxitos y n-x fracasos está dado por la
combinatoria de n, x particiones mutuamente excluyentes.
En resumen, si un ensayo binomial puede dar por resultado un éxito con
probabilidad p, y un fracaso con probabilidad q = 1 - p la distribución de
probabilidades para una variable aleatoria X del número de éxitos en n ensayos
48
de X será:
n
b (x, n, p) = p x q n-x ; x = 0, 1, ..., n ; 0 p 1 1.85
x
que se conoce como la Distribución binomial. Como es la unión de cierto
número de experimentos Bernoulli, cada uno independiente de los demás, se
posible obtener su media y varianza así:
15 5 4
c) P(X = 5) = 0.4 5 0.6 10 = 0.1849 = b(x,15,0.4) - b(x,15,0.4)
5 x=0 x=0
49
Se ha encontrado que cuando p = 0.5, b(X,n,p) tiende a la normal, cuando n
tiende a infinito. Para fines prácticos si npq = 15, b(X,n,p) se trabaja como
normal. Existen tablas que permiten efectuar con más facilidad los cálculos
anteriores.
1.10 Concepto de muestra.
Antes de estudiar el concepto es bueno tener una breve descripción de los tres
tipos básicos de muestreo: simple aleatorio, estratificado y cluster.
Una muestra simple aleatoria es seleccionada de una población en la cual:
1- cada individuo en la población tiene igual oportunidad de ser seleccionado
para la muestra; y,
2 cada individuo de la muestra es seleccionado independientemente, lo cual
conduce a que la muestra aleatoria simple provea una base válida para el
estimado del error de muestreo con estimados insesgados, consistentes y
suficientes, aunque frecuentemente ineficientes.
En el muestreo estratificado la población es dividida en un número de
suppoblaciones y una muestra aleatoria se toma en cada una de ellas. El
estimado de la media es insesgado y consistente, pero la eficiencia depende de la
estratificación, siendo eficiente cuando se ha logrado homogeneidad dentro de
los estratos.
El muestreo cluster se obtiene dividiendo la población en un número de grupos
distintos e identificables dentro de los cuales se toman muestras aleatorias. La
unidad de muestreo consiste de cierto número de individuos o elementos de la
población llamados cluster. Es bueno notar que en el muestreo anterior la
unidad de muestreo es el individuo o elemento de la población. Acá también se
produce una base para un buen estimador de la media y su error de muestreo,
insesgados y consistentes, pero la eficiencia depende de la varianza entre los
clusters. Estos tipos de muestreo serán desarrollados con más detalle en
capítulos posteriores, pero se requiere mantenerlos en mente pues serán
elementos básicos en nuestro estudio.
Después de lo anterior es bueno resaltar entonces que casi nunca, en inventarios
forestales, será factible conocer y 2 y aunque lo fuera, sólo lo sería, de
pronto, de la variable más fácil de medir, como el d, por ejemplo, quedando otras
50
como la altura, que solo se miden en una fracción de la población, y aun algunas
que apenas se estiman. Siempre que la enumeración o la medición de variables
no alcance a la población total, se hablará de muestra. La muestra se concibe
entonces como una representación a pequeña escala de la población total, de
modo que permita inferencias válidas acerca de ella. Cuando la población está
muy bien mezclada y tiene características similares casi no hay restricciones ni
condiciones al proceso selectivo de la muestra, pero ello no es lo usual, excepto
en pequeñas áreas o en plantaciones uniformes. Se deben observar dos
condiciones para la toma de la muestra:
1) La selección debe ser un proceso inconsciente, independiente de prejuicios
subjetivos. La violación a este principio puede derrumbar prácticamente la
posibilidad inferencial, por la cantidad de sesgos introducidos.
2) Por lo anterior los individuos inconvenientes no deben ser substituidos por
individuos a conveniencia. Esta es una mala práctica en inventarios forestales,
por dificultades de acceso, o dificultad para la determinación de algunas
variables.
Estas dos condiciones se expresan en una ley que debiera ser inviolable: la
muestra debe ser aleatoria, para eliminar la mayor cantidad de sesgos posibles.
Una muestra libre de sesgos no significa que la media muestral iguale a la
poblacional siempre, pues aun en muestreos muy rigurosos se darán algunas
diferencias, por ello se hace aun más evidente la necesidad del azar.
La probabilidad de ocurrencia de un suceso es determinada para una muestra
en dos formas: a) Cada individuo de la población tiene una oportunidad conocida
de ser muestreado. Ello sólo es posible dividiendo la población en unidades
iguales de muestreo, tales como áreas iguales, que sirvan como unidades de
muestreo.
b) El método de selección debe ser consistente con el anterior planteamiento, o
sea que las oportunidades de selección deben ser iguales, por lo cual existen los
métodos de selección aleatoria antes mencionados. Si se cambian estos criterios,
cambian las probabilidades, o no pueden ser definidas en la misma forma que lo
hace la estadística inferencial. Si se conservan es posible entonces, el cálculo de
los errores stándar, límites de confianza, etc. Lo anterior obliga a buscar
51
claramente la población objeto de nuestro inventario: volúmenes totales,
volúmenes por especies, volúmenes por clases diamétricas, por usos, de acuerdo
con un d, crecimientos en diámetro, en volumen, calidades de la madera, estado
de un árbol, etc. También es bueno resaltar que una misma información podría
obtenerse de varias poblaciones.
1.10.1 Unidades forestales de muestreo. Una muestra es efectiva si se tienen
claras las necesidades de la información buscada y las características de las
poblaciones que se intervienen con el muestreo. Es necesario, adicionalmente,
considerar el proceso de los datos. Por ello se habla de diferentes unidades de
muestreo, comunes para inventarios forestales como:
-Unidad última, esencial o fundamental, aquella que no puede soportar una
división posterior, ejemplo, un árbol, una rama, una especie, un volumen
comercial, etc.
-Unidad de registro, muestra o parte de ella para la cual el registro de la
información se hace separadamente. Los registros por conveniencia se separan
en formularios, módulos u hojas diferentes, especialmente para evitar pérdidas
totales de información. Por ejemplo con fajas, estas se dividen para el efecto en
unidades más pequeñas, quedando como partes de la gran parcela.
-Unidad de muestreo, estadísticamente es el elemento indivisible mínimo de
muestreo ejemplo, una parcela, una faja, un árbol en cierto tipo de muestreo,
etc. Puede coincidir con algunas de las anteriores.
-Unidad de evaluación, para la cual se requiere la información, por ejemplo un
rodal, un compartimento, un tipo de bosque, un cuartel, una provincia, etc.
1.10.2 Fracción de muestreo. En poblaciones grandes el hecho de reemplazar o
no un elemento no modifica sustancialmente los resultados, pues permanecen
casi invariantes las frecuencias relativas, no ocurre lo mismo con pequeñas
muestras. Aunque las fórmulas de sus parámetros siguen vigentes, aparece el
concepto de factor de reducción f r, con base en el tamaño de muestra n y el total
N -n n
N. f r = = 1 - = 1 - f 1.89
N -1 N
con f = n/N, conocido como fracción de muestreo. En particular X es un
52
estimador insesgado de y tiene una varianza que decrece a medida que se
incrementa el tamaño de la muestra n (Scheafler et al, 1986). Precisamente una
muestra irrestricta aleatoria seleccionada sin reemplazo de una población de
tamaño N tiene
E X = ; VAR X =
2x N - n
1.90
n N -1
La necesidad del factor de reducción se debe al efecto que sobre el error de
muestreo tiene la parte de la población no incluída en la muestra. En una
población (1-f) valdrá cero, (Schumacher y Chapman, 1954). Con base en
simulaciones y trabajos antecedentes se ha encontrado que una distribución de
debe presentar una distribución muy semejante a la normal sí n 20%N ,
especialmente cuando n 30 , (Scheaffer, Mendenhall y Ott, 1987).
1.10.3 Estadísticos muestrales. De ellos como se había anotado, se infieren las
características de la población. Las mediciones las denotaremos por ejemplo
como y1, y2,....yn. Las medidas descriptivas en muestras están dadas por
n
y y
2
n i
1
y= yi ; s 2 = i=1 n - 1
n i 1
; s = s2 1.91
ya estudiadas anteriormente.
1.10.4. Covariabilidad. Este concepto fue abordado al analizar el efecto del
tamaño de muestra en los parámetros estadísticos. También es útil cuando se
intuye la dependencia entre dos variables indicando que una de ellas crece o
decrece al hacerlo la otra en forma sistemática. Ejemplo: dos variables Y 1 y Y2
que crecen ambas (también una podría decrecer en forma sistemática al crecer la
otra y viceversa), se dicen covariables. La covarianza entre dos variables X y Y se
expresa como:
x y
COV X , Y = XY = x - x y - y p X,Y s XY = xi X yi Y / n 1.92
53
La covarianza queda mejor expresada en términos del coeficiente de correlación
simple lineal que, no depende de las unidades, como
y1 y 2
COV Y1 , Y2 y1 y 2 -
= o, r = n 1.94
1 2 2 2
sY 1 sY 2
y queda acotada entre +1 y -1
1.10.5 Estimación.. Un "estimador" es entonces una función de una o varias
variables aleatorias que se pueden observar junto con alguna o algunas
constantes conocidas para estimar un parámetro, así: Y estima a , que se
= Y Error 1.95
con un cierto nivel de confianza, así como una definición del grado de amplitud
del intervalo. Lo usual es elegir un intervalo de confianza del 95%, o sea un valor
estimado del intervalo que resulte correcto en 19 de cada 20 casos. Aunque la
distribución de probabilidades de Y depende de la forma de muestreo, del
tamaño de la muestra y de la población, al repasar la normal, se vio que en
muchas situaciones, la media tiende a presentar una distribución simétrica en
forma de campana, la normal, especialmente si n es grande, n 30 , (Scheafer et
al, 1987).
1.10.5.1 Concepto de error. Bajo este tema se presentan varias situaciones.
1.10.5.1.1 Error de muestreo. Es la diferencia entre el valor estimado y el
verdadero valor de la población. Se presenta en dos formas:
EY = Y - ; E 2 = s 2 - 2 1.96
que se originan por varias causas como mediciones defectuosas, observaciones o
registros incorrectos de los datos, o en un proceso defectuoso de ellos. Pero si no
se comete ninguno de los anteriores, la causa fundamental radica en el hecho de
no muestrear si no una parte de la población, lo cual impide que los valores
54
muestrales resulten idénticos a los poblacionales. El error de muestreo no es
determinable, de acuerdo con su definición, ya que nunca serán conocidos
y , por lo cual habrá que estimarlos.
2
Error = ˆ 1.97
Aunque no puede decirse a que distancia de queda el estimado ˆ , se puede
aproximar un límite L tal que
P ˆ L 1 1.98
para cualquier deseado. Por ejemplo si el estimado ˆ de tiene una
distribución normal o una t, entonces para un n grande
L = Z ˆ ; L = t 1 - , n - 1 s X 1.99
2 2
Si 1 0.95 Z 0.025 1.96 2
mostrado
1.10.5.1.4 Probabilidad de discrepancia entre Y y . Si se asume lo que ya
55
presentan dos casos:
s
y X
n
Z. Aparece entonces la distribución de W. S. Gosset
"student" quien suponiendo que las muestras eran tomadas de una población
normal, se comportaban parecidas a ella mediante una distribución conocida
X
n Z Z Z
= = , o ,t = 1.100
s n 2
s 2 2
n2
n n 1 n
2
. Su función de densidad es
2 n 1
n 1 n 1
t 2 2
f t = 1+
2
n -<t < 1.101
n 2 n
n
Se acostumbra representar con t al valor de t1 para el cual otro valor mayor que
el esta en un área . Ejemplo, el valor de t con 5 grados de libertad (2.571) que
56
permite encontrar un valor mayor que el, ocupa un área = 0.025. Como es
simétrica alrededor de 0, -tα es el valor a partir del cual hacia la izquierda hay un
área = 0.025, o sea t 1
t , o sea que para 5 grados de libertad, el valor de t
que permite encontrar un área = 1 - 0.025 es -2.571. Esto también significa que
el valor de t de una muestra aleatoria de tamaño 4, seleccionada de una
P ˆ L ˆ L 1 1.103
el intervalo de confianza para será entonces, ˆ L , ˆ L , con coeficiente de
confiabilidad 1 .
M y ij
1 Y = p jY j ; 2 Y j 1 i 1
1.104
j 1 n
57
De acuerdo además con las fórmulas (1.41) a (1.44) y especialmente esta última,
fue posible ver que la variación total se dividía en dos componentes que
conducen a una variación “entre” y otra “dentro”. Una partición similar de los
estimados correspondientes a una muestra es posible siempre y cuando se
tengan fracciones iguales de muestreo en todos los estratos y las varianzas no
presenten diferencias significativas. De acuerdo con lo anterior es posible acudir
al teorema de Cochran, (Lema, 1995), al separar en idéntica forma los
correspondientes grados de libertad. En resumen el Análisis de varianza consiste
en una partición de una suma de cuadrados totales y sus grados de libertad en
sumas parciales así:
SSTO SS dentro
SS entre
y Y y Y n Y Y
nj nj
1.104
M 2 M 2 M 2
ij ij j j j
j i j i j 1
n 1 n M M 1
La partición de los grados de libertad, corresponde con su definición como el
menor número de sumandos posibles para obtener el estadístico o el parámetro
respectivo, o también con el número de individuos menos el número de ellos que
se hayan utilizado para pasar por puntos obligados, así: los M medias de los M
bloques tienen hasta M grados de libertad y consecuentemente dejan disponibles
(n-M) para los grados de libertad dentro de los bloques. Los bloques representan
M individuos y un grado de libertad es necesario para la media entre bloques,
por lo cual (M-1) es necesario para la SS entre bloques. También es posible
expresarlos en términos de los números de individuos por bloque:
GL totales
GL dentro
GL entre
n 1
M
j 1
j n 1 M 1
M
j 1
j
58
y 1.20. La Figura 1.19 muestra 3 estratos en un bosque de coníferas y sus
comportamientos respecto del volumen promedio, zona A. Los volúmenes del
primer estrato superan todos la media, los del segundo se sitúan por debajo y los
del tercero oscilan alrededor de ella. En B se muestra un bosque tropical en el
cual es más difícil de apreciar el concepto. Al estratificar se obtienen las
respectivas medias por estrato, con el resultado obvio de desviaciones mucho
menores en patrones irregulares y con menores sumas de cuadrados dentro de
los estratos. Figura 1.20. Cuando se desarrolló la fórmula del error estándar, 1)
cada individuo quedaba constituido por dos componentes aditivos, y el error,
2) si ocurren diferencias sistemáticas tales como las del caso A de la Figura 1.16,
aparece un tercer componente debido al estrato o bloque:
1 Yi = i ; 2 Yij = j ij 1.106
j = Variable componente por bloque, ij = Variable componente por unidad en
cada bloque. De acuerdo con 2) de (1.106), es posible reescribir la media por
estrato como
nj nj nj nj
y ij ( + j + ij )
nj nj j ij ij
Y j=
i=1
= i=1
= + + i=1
j i 1 1.107
nj nj nj nj nj nj
59
Figura 16. Desviaciones de la media en cada estrato luego de la estratificación
nj
nj
ij ij
ij j
y Y j ij
j i 1
nj
i 1
ij
nj
1.108
solo quedan componentes por lo cual la varianza se deberá sólo a ellos. Sí los
bloques son de igual tamaño e igual número de unidades muestrales por bloque
entonces la media aritmética de la población total será:
nj
M ij
M
j 1
j i 1
nj
M M nj M M nj
y j j ij j ij
M j 1
Y
j 1
j 1 i 1
j 1
j 1 i 1
1.109 C
M M M M Mn j M Mn j
y ij Y :
M M nj
M
M nj
j ij j ij
yij Y j ij M
j 1 j 1 i 1
Mn j
j 1 j 1 i 1
j M
ij
Mn j
1.110
60
nj
nj M M
ij
j ij
Y j Y j n
i 1 j 1
M
j 1 i 1
Mn j
j
M
nj M nj
j ij ij
j j 1 i 1 j 1 i 1 1.111
M nj Mn j
De las ecuaciones anteriores es posible lograr los valores esperados de y .
Omitiendo algunos detalles, se llega a un estimado de la varianza dentro de los
bloques en términos de , así:
nj
y
M 2
i j - Yj
2
s dentro de los bloques =
j 1 i 1
2dentro de los bloques = 2 i s 2dentro = s 2 1.112
Mn j
El estimado de la varianza entre bloques, incluye los estimados de las varianzas
de ambos componentes, esto es
n y -Y
M 2
j j
2
s entre bloques =
j=1
2entre bloques = 2 + N j 2 s 2entre bloques = s 2 + n j s 2 1.113
M 1
que consiste de las varianzas de y un estimado de la varianza para el
obtener como:
nj
y Y
M
2
ij
s2 j 1 i 1
2 2 2 s 2 s2 s2 1.114
Mn j 1
Lo surgido es un poco complejo estadísticamente hablando, la varianza entre
bloques ya no podrá ser analizada, pues se trabaja con parámetros y no con
estimados, lo que no permite discutir la distribución de los grados de libertad,
por lo cual se deberá dividir la suma total de cuadrados por N. Similarmente,
para la varianza entre bloques se divide la suma de cuadrados de desviaciones
entre bloques por M, y también la varianza dentro, por (N-M). Se puede hablar
hasta de una nueva nomenclatura:
61
Nj
y j
M
2
ij
int2 j 1 i 1
2 1.115
N M
llamada varianza interna, por acudir a las medias por bloque y toda la muestra
de datos. Es entonces posible calcular
N
M
2
j j
entre
2
j 1
2 N j 2 1.116
M
obsérvese que Nj es constante en todo el proceso. Por último,
Nj
y
M
2
ij
2 j 1 i 1
2 2 1.117
N
en que puede también ser extraída tanto de , como de
2 2 2
entre
, así:
entre
2
int
2
1 2 2 int
2
; 2 2 1.118
Nj
s
2
1.119
Y
m mn j
62
llega a
m s n s
2 2
s 1 1
2
1.120
Y
M m N mn j
n s n s
2 2
s 1
2
1
int
1.121
Y
N mn j
N n
El análisis de varianza se constituirá además importante para estimar el error
estándarde los muestreos sistemáticos que se estudiarán posteriormente.
1.11 Clasificación de los diseños de muestreo.
Cualquier inventario forestal es básicamente uno de los siguientes 4 sistemas de
selección de las muestras:
a) Proceso simple aleatorio de escogencia de las unidades muestrales.
b) Proceso aleatorio restringido de escogencia de las unidades muestrales.
c) Proceso de escogencia en racimos (clusters) de las unidades muestrales.
d) Proceso de escogencia sistemática de las unidades muestrales.
Estos 4 procesos difieren principalmente en dos aspectos:
1) La selección de las unidades bien puede ser aleatoria o sistemática;
2) Las unidades seleccionadas son todas equivalentes (selección monoetápica) o
las unidades difieren y la escogencia de primarias, secundarias, etc se hace por
separado en cada etapa de selección (muestreos polietápicos).
Con respecto a 1, la selección de las unidades en a) y b) es regida por el azar y
cada unidad tendrá igual oportunidad de ser seleccionada. Sucede igual cosa en
c) si los clusters son aleatorios y vistos como unidades de muestreo, o si los
procesos de selección primaria tanto como la secundaria son aleatorios. Lo
anterior conduce a errores de muestreo estimados insesgados y suficientes. En
procesos sistemáticos ya no se cumple lo anterior.
Con respecto a 2, en procesos como el b), la población puede ser dividida en
estratos o en bloques de igual rango. Cada unidad primaria consta de N j
unidades de las cuales se seleccionarán n j. Si se tienen M bloques, cada uno
representa una unidad primaria de rango igual y cada uno de ellos es dividido en
63
Nj unidades secundarias de rango igual, pero estas son seleccionadas
separadamente para cada bloque o unidad primaria. En c) que es una forma de
muestreo bietápico o de submuestreo, la selección se hace independiente en
todas las etapas, por ejemplo en la primera etapa se seleccionan m de M, en una
segunda etapa nj de Nj. Un bietápico se usa a menudo cuando es necesario
estimar la altura de los árboles, que se hace en parcelas más pequeñas, o
muestreos por rangos de utilización, o tambien cuando se muestrean grandes
áreas.
Los métodos de selección no debieran ser afectados por la forma de las parcelas,
de tal modo que fajas iguales, conglomerados (parcelas en líneas) pueden
seleccionarse al azar o sistemáticamente, etc. La escogencia de uno de los 4
procesos de muestreo depende más de la estructura, del tamaño o de algunas
circunstancias de la población, como dificultades de acceso, personal disponible,
costos, tiempo, a veces, que de otras consideraciones. La selección de acuerdo
con alguno de los 4 procesos siempre producirá una muestra independiente del
número de etapas o patrones de selección. Sin embargo, a veces, la información
proviene no solo de una si no de varias muestras y aun tomadas en diferentes
épocas. Las muestras individuales podrán ser entonces independientes o
dependientes, el criterio crucial es que cada muestra individual supla parte de la
información requerida, como el volumen para ciertas dimensiones y especies
dentro de una determinada área. Es notorio además que algunas veces una
muestra proporciona las bases para la siguiente, en este caso cada muestra
representa una fase de la colección de la información buscada, hablándose de
muestreos multifásicos, a los cuales es posible aplicarles a), b), c) o d). La
independencia o dependencia de las muestras es necesario dilucidarla en cada
caso.
Por ejemplo un muestreo trifásico con fases dependientes se podría presentar
así: la primera fase, puede ser un fotomuestreo de puntos, con el fin de separar
el área forestal del área total, cada punto identificado como bosque o no bosque.
Figura 1.21. Cada punto se estableció como área forestal o no, luego se
delimitaron sus contornos. En la segunda fase, Figura 1.22, se seleccionó una
fracción de los fotopuntos con bosque, los cuales fueron transformados en
64
fotoparcelas de tamaño fijo. En estos se tomó la densidad de copas y la altura
promedia. En la tercera fase, fue seleccionada una relativamente pequeña
fracción de las fotoparcelas para medirla en el campo. La correlación entre las
fotomediciones y las mediciones de campo en las parcelas combinadas fue
investigada por análisis de regresión. La multiplicación del volumen
promedio/unidad de área por el área con bosque de la primera fase dio el
"volumen total".
Figura 1.21. Primera fase. Separación en fotos de área con bosque y sin bosque
65
Figura 1.22. Segunda fase, selección de parcelas y toma de densidades y
alturas promedias
Deben distinguirse claramente los conceptos anteriores. Una cosa es la división
de la población en unidades de ordenes diferentes (diseños mono o
multietápicos), lo cual es el resultado de los sistemas de selección de la muestra,
y otra la división introducida a través de las diferentes fases en un diseño
multifásico. En este último caso, cada fase representa una muestra separada y
consecuentemente con ello pude aplicarse cualquiera de los cuatro sistemas de
selección de la muestra en cada una de ellas, (Loetsch, et al, 1964).
1.12 Errores estándarde estimaciones combinadas.
Cuando se hacen estimaciones de variables sometidas a diversas operaciones,
como estadísticos por ejemplo de la suma o diferencia de muestras, etc, además
sabiendo que provienen de muestras independientes o dependientes, es
necesario conocer sus respectivos estadísticos sin duda. Por ello se presenta a
continuación los casos maás frecuentes.
1.12.1 Error estándarde sumas y diferencias.
1.12.1.1 Unidades muestrales mutuamente independientes. Sean dos
muestras de una población, con n1 y n 2 unidades muestrales, con medias Y y 1
Y sus desviaciones s
2 1
y s , en que se pueden mirar ambas muestras como
2
66
y Y
2 nj 2
nY n Y
1.122
ij 1,2
Y ; s j 1 i 1
1 1 2 2 2
n n
1,2 1,2 2
1 2
n 1
j 1
j
y Y y Y y Y
n1 n2 2 nj 2
2 2
nY n Y
1.123
i1 1 i2 2 ij j
Y ; 1 1 2 2
s 2 i 1 i 1
j 1 i 1
n n n 1 n 1 n 1
1,2 1,2 n1
1 2 1 2
j
i 1
y Y n 1 s
nj
1.124
2
2
ij j j j
i 1
n 1 s
2
n 1 s n 1 s
2
2 2
j j
s 2
1 1 2 2
j 1
1.125
n 1 n 1 n 1
1,2 2
1 2
j
j 1
s 2
;
1,2
s 2
1 1
1 2 1,2
1,2
1.126
Y1,2
n Y1,2
N n N n
Con estas fórmulas se obtiene también el error estándarde la diferencia de
medias.
67
n n n n
zi xi yi xi y i
zi xi yi Z i 1
i 1
i 1
i 1
=xy 1.127
n n n n
de acuerdo con estas, el estimado de la varianza se obtiene como
x y X Y
n n
z Z
2 2
i i i
sZ2 s2X Y xi i 1
i 1
n 1 n 1
n n n
xi X yi Y 2 xi X yi Y
2 2
i 1 i 1 i 1
1.128
n 1
Si se hace una estratificación por bloques , se obtendrá
nj
s 2
s
2
X Y int j 1 i 1 j 1 i 1 j 1 i 1
1.129
nM
Zint
s 2 sY2 2sXY x i X yi Y
s X
2
Z
; sXY i 1
;
n n
M nj
x ij X j yij Y j
sXYint
j 1 i 1
1.130
M n j 1
n n n n
di yi xi yi xi
di yi xi d i 1
i 1
i 1
i 1
Y X 1.131
n n n n
de acuerdo con estas, el estimado de la varianza se obtiene como
68
d d y x Y X
n 2 n 2
i i i
sd2 s2Y X i 1
i 1
n 1 n 1
n n n
1.132
x X y Y 2 xi X yi Y
2 2
i i
i 1 i 1 i 1
n 1
y el error estándarcuadrático de la diferencia de dos variables dependientes se
obtiene entonces como
n
sx2 s y2 2sxy x X y Y
i i
s
2
d
; con sxy i 1
1.133
n n
1.12.2 Error estándarde sumas y diferencias de medias en diferentes fases
de muestreo.
Cuando se desea estimar el error estándarde sumas o diferencias de medias en
diferentes fases de muestreo, el problema es bastante diferente, por ejemplo
cuando el área de bosque natural se ha estimado en fotografías aéreas y la de
plantaciones por trabajo de campo, y la información requerida es el área total.
En este caso se acude a la ley de propagación de los errores, ya mencionada en
la ecuación (1.105), desarrollada de acuerdo con el teorema de Taylor. Síi se
tienen dos medias Y y X , cada una con cierto error de muestreo y se desea
s X2 sY2
sZ Z 1.134
X2 Y2
cuyos cálculos se simplifican si se usan los errores estándarporcentuales así:
sZ
sX % sY % 1.135
2 2
sZ % 100%
Z
El método de propagación de los errores se aplica similarmente a la diferencia de
medias mutuamente independientes.
1.12.3 Error estándarde productos y cocientes.
1.12.3.1 Error estándarde productos en unidades dependientes. De nuevo
habrá que hacer la distinción entre dependencia e independencia de las
69
unidades muestrales. Por ejemplo si se seleccionan n árboles al azar y a cada
uno de ellos se le mide la altura y el área basal (G) por su factor mórfico f g , se
tienen dos poblaciones de variables: área basal mórfica (x) y alturas (y), pero las
unidades seleccionadas son idénticas. El producto conduce al volumen, ese sí
para cada unidad
n n
zi x y i i
zi xi yi Z i 1
i 1
Z XY 1.136
n n
La varianza de las z será entonces dada por:
2
n
xi yi
xi yi i 1
n n n
z Z x y Z
2 2 2
i i i
n
sZ2 i 1
i 1
i 1 1.137
n 1 n 1 n 1
sX % sY % 1.139
2 2
Z XY ; y s XY X 2 sY2 Y 2 s X2 ; y s XY
1.12.4 Error estándarde cocientes. Para los cálculos de los errores estándarde
cocientes de estimaciones combinadas surgen tres casos, de acuerdo con la
dependencia e independencia de las muestras y un tercer caso que sera
abordado en un capítulo posterior, conocido como estimador de la razón.
70
n n
yi
yi zi x
zi Z i 1
i 1 i
1.140 .
xi n n
z Z Z
2
i
i 1 xi i 1 xi n
sZ2 i 1
1.141 .
n 1 n 1 n 1
Por medio de coeficientes de correlación ya se tiene apenas una aproximación un
poco burda de este estimado, por lo cual se omite su presentación. Los
anteriores elementos constituyen la base primaria para abordar el tema de los
inventarios forestales, con cierta solvencia, especialmente los diferentes métodos
de muestreo.
f x f 0 f 1 f x
x 0
La sumatoria de
x
2 3 x
f x f x f 0 1 1
x 0 2 ! 3! x !
El término entre paréntesis es un famoso límite = e
x
1 x
x 0
f x f 0e 1 f 0 e f x
e
x!
e
Si x 0 f 1 1 f 0
Si x 1 f 2 f 1
2
2
f 2 f 0 f 0
f x 1 f x 0 2 1 2 1 1.142
x 1 3
Si x 2 f 3 f 2 f 0
3 3 2 1
Si x f f 0
A
!
72
2. MUESTREO SIMPLE AL AZAR
Para efectuarlo es preciso conocer algunos elementos, que se expondrán en más detalle
cuando se hable de la planificación:
2.1.1 Error de muestreo (E). Asignado por quien solicita el inventario. Son
usuales valores 15% . Depende además del valor económico del bosque.
Generalmente se da en porcentaje, o un valor en términos de este. Está
íntimamente ligado a la intensidad de muestreo pues se afectan mutuamente.
2.1.2 Intensidad de muestreo. Corresponde a la proporción del área
efectivamente muestreada y se obtiene como
n a
I % 100% 100% 2.1
N A
n = tamaño de muestra, N muestra total potencial, a, A áreas muestreada y total.
2.1.3 Nivel de probabilidades admitido. Generalmente se trabaja con el error
tipo I; 0,05 o nivel de probabilidades del 95%, para establecer los límites de
confianza y las pruebas estadísticas pertinentes.
73
2.1.4 Area de inventario. Para referenciar estimados totales, tamaño de
muestra y costos, sirve de base a la estimación de la intensidad de muestreo. Es
un parámetro obligado, y el gran complemento de la planificación de futuros
aprovechamientos.
2.1.5 Población referente. Espacio poblacional referente caracterizable a través
del muestreo, generalmente se trata de volumen total/ha, comercial/ha,
volúmenes por rangos de uso, áreas basales, números de árboles y muchos
otros. Aunque se contemplen otras informaciones susceptibles de muestrar, la
referente principal es la base para los cálculos del error, costos y límites de
confianza.
2.1.6 Información básica preliminar. Todos los aspectos dasométricos
necesarios para la cuantificación de los elementos pedidos, como ecuaciones de
volumen, conicidad, crecimiento, tablas de producción, factores de conversión,
relaciones dasométricas, o la forma de obtenerlas, así como toda la información
sobre el bosque, estado catastral, mapas, fotografías, accesos, localidades, clima,
posible mano de obra, comunicaciones, alojamientos e infraestructura cercana.
2.1.7 Forma y tamaño de la parcela. Decisión previa tomada de acuerdo con
criterios experimentales o tradicionales, por ejemplo son comunes en
plantaciones forestales parcelas circulares de 1/20 ha, 1/40 ha, dependiendo de
la densidad de la plantación y de la variabilidad interna de las muestras. En
inventarios de bosques tropicales se usan fajas, conglomerados de líneas sobre
parcelas, bloques, etc. En Colombia en una investigación con P. patula, se
encontró que las parcelas circulares de 1/40 ha dieron el tamaño más eficiente
con respecto a otras formas y tamaños, (Vélez, 1987), este tamaño suficiente
para la mayoría de coníferas plantadas en nuestro país. La investigación al
respecto es casi nula, se atiende más a una tradición, pero existen múltiples
criterios que podrían estimular esa búsqueda.
2.1.8 Instrumentos de medición. Usualmente se requieren brújulas de pié y de
mano, hipsómetros Blume-Leiss, Haga, Suunto, Relascopio, esteroscopios de
bolsillo, transportadores, reglas. En bosques tropicales no son despreciables
aparatos sencillos como el Christen, luego de someterse a regresión
personalizada. (Lema, 1995). Para leer diámetros: cintas diamétricas, métricas, o
74
forcípulas, y dependiendo de la precisión deseada y la calidad de la información
se puede acudir a prismas, pentaprisma de Wheeler, y aun a la varilla de
Biltmore, sometida al mismo proceso recomendado para el Christen. Un estudio
reciente para evaluar la calidad de estos instrumentos revela que en su orden
son mejores la cinta métrica, la diamétrica y la forcípula, (Lema, 1996).
2.1.9 Formularios de campo. Aspecto que requiere mas cuidado del que
usualmente recibe. Deben proporcionar toda la información posible y precisa del
proceso como lugar objeto del inventario, localidad, coordenadas, fecha,
responsables, equipos de medición, tiempo inicial y final de toma de la
información y las columnas características de acuerdo con las variables a tomar
en campo, d, altura, posición sociológica u otras observaciones de acuerdo con
las necesidades de quien solicita la información como: deformaciones, aspectos
sanitarios, estado del árbol y aun detalles del lugar. Se prueban en campo antes
de adoptarlos como definitivos, en el proceso de premuestreo.
2.2 Premuestreo.
75
n
y i
Y= i 1
; EY = Y - = t sY 2.2
n
en que: sY Error standard, calculable como:
s2 s2 n
sY2 = 1 f sY = 1 - 2.3
n n N
t 2 CV
2
t 2s2
1 n = ; 2 n = 2.5
t 2 s2 t 2 CV
2
E
2
2
E %
N N
1) Se usa cuando el error se da en las mismas unidades de la media por ejemplo
en m3 , forma poco común, pues la mayoría de las veces se prefiere en
porcentaje, la 2), acudiendo al coeficiente de variación CV, en porcentaje, ej.
15%.
Las fórmulas anteriores por la presencia de la t de student, dependen en un
círculo vicioso del tamaño que pretende calcular. Se acude entonces a una forma
práctica y a dos de las más clásicas reportadas por la literatura especializada en
inventarios forestales para resolver el problema del tamaño muestra, que
llamaremos: Método práctico (Loetsch y Haller, 1964), Método convencional,
reportado por (Scheaffer et al, 1987), o la alternativa a esta, el Método iterativo
de Freese (1970).
2.2.2.1 Método práctico. Un estimado máximo confiable de la desviación
76
standard de la población, propuesto por (Loetsch et al, 1964), puede obtenerse
con base en la ecuación (2.4). Se toma un valor arbitrario de t = 2, y se suma la
cantidad 2s al s del premuestreo, para obtener smc . Este será entonces el
77
estabilización. Los valores obtenidos fueron: n1 =148.42, n2 =75.4 y n f =77. Con
2 2 2
t s 100 CV t
n 1002 2.10
E% x E%
78
y al asumir una muestra relativamente grande al final, o sea con t = 2:
2
200 CV
n 2.10
E%
Para el premuestreo de la Tabla 2., se tiene entonces:
2
200 0.6709
n 80.01
15
si se aplica la corrección (2.8) se llegaría a 66 muestras.
= Y t sY 2.7
Tabla 2.2 Datos para el muestreo simple al azar de la población #1
VOL VOL VOL VOL VOL VOL VOL VOL VOL VOL VOL VOL
354 346 280 148 133 133 184 0 346 375 23 110
331 301 316 148 206 273 206 133 148 206 66 89
258 38 199 301 155 125 163 74 140 0 383 23
148 250 398 140 206 206 125 0 8 184 44 0
243 309 324 206 199 170 0 0 140 368 74 8
229 413 265 191 96 163 89 59 280 191 38 125
184 125 0 331
79
2.4 Muestreo aleatorio simple en variables discretas.
El conteo del número de elementos dentro de un espacio muestral, al caer dentro
de las variables discretas se asume diferente a las variables continuas,
pudiéndose lograr desde las distribuciones de frecuencia de Binomial, Poisson o
Binomial negativa, por sus diferentes propiedades estadísticas.
2.4.1 Tamaño muestral para proporciones y porcentajes de variables
contrastantes. Las proporciones de elementos con ciertas características
contrastantes como árboles para aserrío o no, sexo o sano y enfermo, entre otras,
tienen solo uno de los parámetros p o q ya estudiados en el numeral 1.9.2. Si se
t2 pˆ qˆ
n 2.11
E2
n=tamaño necesario para estimar la proporción.
E = error admisible para el estimado.
Ejemplo. Un premuestreo con 50 datos, encuentra que los árboles de aserrío en
una plantación son el 42%. Estimar el tamaño de muestra necesario para
t2 pˆ qˆ
n 2.12
E2
22 0.42 1 0.42
n 389.76 390
con lo cual 0.052 .
80
p̂1 = proporción de elementos con la característica deseada,
qˆ1 1 p
ˆ1
E2
v
t2 2
para 0.05 o 0.01 e infinitos grados de libertad.
n1 tamaño premuestral
2.4.2 Tamaño muestral para cualquier variable discreta que siga una
distribución de Poisson. Cuando la varianza iguala la media se tiene:
s x 1
CV 2.14
x x x
con lo cual:
2 2
200 CV 200 1
n 2.15
E% E% x
con una precisión de 5% (intervalo de confianza) debería tomarse una muestra
de
2
200 1
n 72.72 73
5 22
La ecuación (2.15) puede simplificarse para rangos normales de errores relativos
81
como:
400
n 2.16
Para 10% de precisión x
64
n 2.17
Para 25% de precisión x
x2
k 2.18
s2 x
conocido como cociente de agregación (Lema, 2002) y los errores en porcentaje y
niveles de probabilidad similares a los ya mencionados. Como la varianza de la
Distribución Binomial Negativa se da por
x2
s2 x 2.19
k
se llega al tamaño muestral
100 t
2
1 1
n 2.20
E %
2
x k
200
2
1 1
n 63.14
15
2
8.5 4.21
82
1 1
n 400 2.21
relativos como:Para 10% de precisión x k Para 25% de
1 1
n 64 2.22
precisión x k Con conceptos similares a los expresados para
distribuciones Poisson.
83
3. MUESTREOS SISTEMATICOS
85
se basa en la fracción de muestreo, o en prueba y errores alcanzados.
La selección sistemática se conoce también como sistema de selección mecánica
por la forma como se escogen las unidades de muestreo, de acuerdo con
esquemas rígidos o predeterminados, ya que su objetivo es cubrir la población lo
más uniformemente posible en todas sus partes con el arreglo más simple
posible. La medición o la disposición de las unidades muestrales, que son
difíciles y costosas a veces en un diseño completo al azar, se ven facilitadas con
estos procesos. Han sido muy utilizados siempre y quizás uno de los métodos de
selección preferidos por los inventariadores cuando falta información.
3.1 Procesos de selección de la muestra
Existen tres procesos de selección sistemática:
1-Procesos en fajas continuas,
2-Parcelas en líneas, conocidas como conglomerados,
3-Parcelas en rejilla, distancias iguales en retícula.
El 1- mencionado, consiste de unas fajas continuas, parcelas cuya longitud
supera cientos de veces su ancho, localizadas sobre líneas a igual distancia y
paralelas dentro del bosque. Se usa para ajustar áreas, similar al proceso de
Simpson, al conectar los puntos extremos de las líneas. Figura 3.1. Por fuera del
recuadro mostrado no se muestrea, pero si se recorre hasta los extremos del
bosque para efectos de mapificación.
87
búsquedas de área. También, como se verá luego, será posible el establecimiento
de conglomerados de diferentes longitudes sin destruir la filosofía del muestreo
sistemático.
El 3- por medio de una rejilla, generalmente usa una plantilla ortogonal
construida en acetato, papel albanene o dibujada sobre el mapa, en escala igual
a la de este, que se hace coincidir usualmente con las direcciones de las
coordenadas del mapa, teniendo cuidado de no producir efectos resonantes que
ubiquen las muestras en condiciones muy parecidas dejando de lado otras
circunstancias Figura 3.1. La elección de distancias y tamaño de muestra está
íntimamente ligado a la fracción de muestreo y no hay reglas específicas para
hacerlo. Este proceso se conoce también con el nombre de distribución
sistemática uniforme de las unidades muestrales. Es importante en bosques de
área pequeña para inventarios intensivos, o en condiciones de alta
homogeneidad en grandes bosques. Permite también arreglos triangulares
equiláteros de la muestra. Se acostumbra a veces como patrón que se tengan al
menos 1 - 2 unidades por hectárea, lo cual implica 100 o 70.7 m de distancia.
(Loetsch et al, 1964) Se hace énfasis en la numeración secuencial con el fin de
aplicar bien el concepto del cálculo del error de muestreo.
88
Además de lo anterior en casos de darse estratificaciones no intuidas antes del
proceso, es fácil ordenando las muestras descubrirlas y aplicarles muestreo con
estratificación posterior. Los diseños sistemáticos con fajas continuas o con
parcelas en líneas, se usan generalmente en grandes inventarios, o para
inventarios regionales, variando la distancia entre fajas o líneas, de acuerdo con
el tamaño y la estructura del bosque. En Suecia, se acostumbran inventarios con
distancias entre líneas hasta de 20 km, y para ciertas condiciones se han dado
distancias entre 200 y 1000 m, para áreas entre 5.000 y 50.000 ha. Ciertos tipos
de bosques tropicales caen en esta categoría.
3.1.1 Problemas del muestreo sistemático. Se ha enfatizado siempre la
necesidad de independencia así como de la aleatoriedad de las unidades
muestrales para garantizar igual oportunidad de selección a cada una de ellas.
Ello no ocurre en los procesos sistemáticos, por lo cual se impone por lo menos
la selección automática de la primera muestra que determinará la posición
inequívoca de las demás. Pruebas matemáticas indican que este tipo de
muestreos resultan insesgados y eficientes en la mayoría de los casos
(Sukhatme, 1954; Gautschi, 1957) reportados por (Sihue, 1960). Anota además
este autor que la consistencia para los estimados sistemáticos serán muy
probables a medida que el tamaño de la muestra se aumenta, lo cual no siempre
es dado. Todo ello induce a pensar en la aparición de sesgos en la estimación, de
lo cual se tienen opiniones encontradas.
En general estos muestreos no se adaptan a la teoría de muestreo: 1) por ser
solamente la primera muestra al azar, perdiendo la independencia de los demás
y dejando de ser entonces “grados de libertad”, por lo cual se hace imposible el
cálculo de la varianza; 2) porque ya seleccionado el primer elemento, los que no
entran al patrón tienen una probabilidad cero de salir seleccionados,
contrariando la teoría de muestreo; y 3) porque puede haber dependencia entre
los elementos cercanos del patrón, complicando de nuevo el cálculo de la
varianza y generando resonancias indeseadas entre los datos.
La experiencia práctica muestra en la mayoría de los casos estudiados,
estimados útiles y confiables tanto en volúmenes como en áreas para efectos de
producción y mapeo, con buenos registros de tiempo y costos. De otra parte,
89
para la mayoría de los estadísticos puros, solo se aceptan como insesgadas las
muestras aleatorias. Una primera inquietud surge al respecto: bajo que
circunstancias se espera que la selección de las unidades muestrales produzca
y yi
2
i 1
sY2 V Y i 1
3.2
2n n 1
(i+1)ésima e iésima.
Por tratarse además de una muestra finita se debe hacer uso del factor de
corrección (1-n/N):
n 1 n 1
n y
y yi yi
2 2
i 1 i 1
sY2 V Y 1 i 1
1 f i 1
3.3
N 2n n 1 2n n 1
Acá se hace consideración de una población dividida en (n-1) estratos que se
solapan cada uno con dos elementos de muestreo vecinos. Algunos autores
calculan el error de muestreo con uso de la t de student, pero con muchas
discrepancias acerca de los grados de libertad al respecto. Algunos proponen
como grados de libertad los de la muestra, y otros le dan más valor al concepto
de bloques con lo cual reducen el anterior a la mitad.
Cuando se tienen varias líneas paralelas equidistantes, con unidades de
muestreo, se puede considerar la estratificación de las líneas, cada una
perteneciente a un estrato cuyo tamaño resulta proporcional al número de
unidades de muestreo a lo largo de ellas (FAO, 1974). En este caso la media:
nj n
m Nj m Nj yij 1 m j
Y Yj n yij 3.4
j 1 N j 1 N i 1 j n j 1 i 1
92
m, el número de líneas, N j , número total de unidades en el estrato j,
correspondiente a la línea j, N el número de unidades de la población o
m Nj nj
superficie por inventariar: N N
j 1
j ,
N
, puede estimarse por
n
, en que n j y
N 2j n2j
V Y j V Y j
m m
s V Y
2
Y 3.6
j 1 N2 j 1 n2
El caso 2) se conoce también como estratificación con estratos no solapados con
4 unidades de muestreo en retícula, Figura 3.5, con dos elementos sobre una
línea dada y los otros dos sobre la siguiente paralela.
1 f 1 n 2 n
*
* i 3.7
2
s
Y
y 4 Y j2
n 3n i 1 j 1
n
Y j media del estrato j, n* el número de estratos: n* .
4
93
3.2.2.2 Unidades muestrales de igual tamaño. En general se aplica el metodo
de estratos solapados con dos unidades y el concepto de estimador de la razón,
ampliado en el capítulo 5. El estimado de la media sistemática por unidad de
superficie se da por:
n
y i
qˆsist i 1
n 3.8
xi 1
i
1 1 f n1 n 1 n 1
sq2ˆ¨ sist xi1 xi yi1 yi 3.9
2 2
y y ˆ
q 2
x x 2qˆ 2
X 2n n 1 i 1
2 i 1 i sist i 1 i sist
i 1 i 1
y
M nj
2
ij yi 1 j
sY2 1 f 3.10
j 1 i 1
2n n j 1
M
j 1
95
4. MUESTREOS ESTRATIFICADOS
89
Nj
pj 4.1
N
obtenible con planímetro o muestreos de puntos, por ejemplo. La media
aritmética para el estrato j se obtendrá como:
nj
y ij
Yj i 1
4.2
nj
La varianza para el estrato j, haciendo caso omiso de los grados de libertad, será:
nj
y Yj
2
ij
s 2j i 1
4.4
nj
El número de observaciones individuales posibles en la población N, así como el
tamaño de la muestra total n será:
M M
N N1 N 2 N M N j ; n n1 n2 nM n j 4.5 .
j 1 j 1
90
M s 2j
sY2estr p 2j 4.7
j 1 nj
4.3.2 Error estándar de la media total para poblaciones finitas. Usando el
factor de corrección:
M 2 s 2j n M 2 s 2j M 2 s 2j M 1 1
p j 1 j p j pj p 2j s 2j 4.8
n N
2
sYestr
nj N j
j 1 j 1 n j j 1 N j j 1 j j
91
ecuaciones de crecimiento.
4.4.2 Cálculo de la desviación estándar en los estratos. Similar al anterior se
puede lograr una buena estimación de la desviación estándar con la siguiente
aproximación:
y jmax y jmin
Yj 4.10 ,
4.5
al presuponer que la mayoría de los individuos en una población normal se
ubican entre 3 , o sea en un rango de 6 . Se fuerza un poco el
denominador por no saber si es normal la población y si son identificables los
verdaderos valores máximo y mínimo. El otro componente del error (1-n/N)
raramente tendrá validez dado que la fracción de muestreo será casi cero.
Si se quiere perfeccionar un poco el estimado anterior se puede acudir a la
siguiente tabla (Freese, 1960) para muestras simples al azar de tamaño n en
poblaciones normales, en caso de decidirse por un premuestreo más exigente en
cada estrato.
De acuerdo con la Tabla 4.1 entonces n RANGO VALORTABLA . Es posible ver
92
principalmente cuando algún estrato domina ampliamente por área, de modo
que sea más importante este concepto que la variación supuesta. En tal caso la
fracción de muestreo se dará igual en todas las subpoblaciones con lo cual el
número de muestras por estrato resultará proporcional al área. En efecto:
pj=
aj N j nj
= = 4.11
a N n
p j , proporción del estrato j con respecto al bosque completo, a, área total del
M 1 1 1 1 M 2 2
sY2estr p 2j s 2j
p n p N n N 4.12
pj sj
j 1 j j j 1
E
2
N
Por ejemplo, la información contenida en la Tabla 4.2 corresponde a un bosque
estratificado. Los datos conducen a los cálculos respectivos, con un error de
muestreo del 5%.
93
4 x 1547.4
n= = 42.03
4 x 1547.4
11.762 +
600
b) Usando 2M 1 grados de libertad para la t, dado que se trabajaron 3 estratos,
2.5712 x 1547.4
t = 2,571: n = 2 x 1547.4
= 66.42
2.571
11.76 2 +
600
Tabla 4.2 Datos de premuestreo de un bosque estratificado.
1 1 3
en: sY2estr p j s j y los datos sacados de la nueva muestra. El error de
2
42 600 j 1
t gl sY
muestreo será como en todos los procesos vistos: E 100% ,en que los
Y
grados de libertad, gl = n - 1, o en opinión de otros autores con sólo 2M, o aun
2M1-1.
4.6 Muestreo estratificado con distribución óptima.
4.6.1 Distribución óptima por variabilidad. En este muestreo se hace énfasis
en la variación dentro de los estratos, de modo que el de mayor variación tenga
una muestra mayor, considerando la proporción ocupada con respecto al área
total. Para responder a la necesidad de muestreo buscando el menor n j posible
94
óptima de las unidades muestrales" o "asignación de Neyman". Este problema se
resuelve matemáticamente buscando que el tamaño de muestra n sea un
mínimo. Como un ejemplo, sea una población de dos estratos (M = 2) con p1 y
n1
Sustituyendo (4.17) en (4.16) se obtiene:
ns 2
p s p s
2 2 2 2 p12 s12 p22 s22 n1
p22 s22 n1 n1sY2estr p12 s12
Yestr 1 1 2 2
n1 n s 2
1 Yestr p s2 2
1 1 n2
4.18
p12 s12 p22 s22
p12 s12 p22 s22 n1sY2estr p12 s12
n s 2
1 Yestr p s 2 2
1 1
con lo cual:
p12 s12 p22 s22
nsY2estr p22 s22 n1sY2estr 4.19
n1sY2estr p12 s12
El cálculo de la diferencial con respecto a n:
95
d nsY2estr 0 s 2
p12 s12 p22 s22 sY2estr
4.20
Yestr 2
dn1 n1sY2estr p12 s12
la cual da:
n s
d nsY2estr sY2estr
4.21
2
2
p12 s12 p12 s12 p22 s22
p s
2 1 Yestr
dn1 ns2 2 2
1 Yestr 1 1
p2 s2 p1s1 p2 s2
n2 4.23 .
sY2estr
M
pjsj pjsj
nj j 1
2 4.24
sYestr
p s p2 s2
2
n1 n2 n 1 1 4.25
sY2estr
o más generalmente:
2
M
pjsj
n
4.26 ,
j 1
2
sYestr
2
M
pjsj
4.27
j 1
de donde: sY2estr
n
Al entrar (4.27) en (4.24), se encuentra la forma de asignación de las muestras a
cada estrato:
96
M
n pjsj
nj pjsj pjsj 2
M
n 4.28
M
j 1
pjsj p s
j 1
j j
j 1
Multiplicando arriba y abajo la (4.26) por la t de Student al cuadrado se tiene
para el caso de poblaciones infinitas:
2 2
M M
t pjsj
2
t2 pjsj
n 2 2
4.29
j 1 j 1
t sYestr E2
j 1
4.30
j 1
sY2estr
n N
de la cual es posible despejar n, así:
2
M
t pjsj
2
j 1
n 4.31 .
M
t 2 p j s 2j
E2
j 1
N
Con los datos usados en el ejemplo anterior para t = 2, es posible ver que n = 41
muestras, los cuales se reparten mediante la fórmula (428), con lo cual se
asignan así: n1 8, n2 22, n3 12 . Es necesaria una prueba de
4.6.2 Distribución óptima de acuerdo con los costos. Desde el punto de vista
de los costos, la asignación óptima sucede si se pueden mantener constantes los
tiempos productivos e improductivos, o sea si los costos por unidad de muestreo
se pueden asumir iguales en los estratos. Obviamente este no es el caso general
y se darán diferencias por accesos, tiempos de marcha, etc. En tal caso la
asignación óptima deberá considerar tal variación. El costo total del muestreo de
campo se calcula como:
97
M
C n j c j n1c1 n2c2 nM cM 4.32 .
j 1
a) Cuantas unidades se necesitan para lograr una cierta precisión, de modo que
se logre el error concertado a un costo mínimo, y de que manera repartir la
muestra total en los estratos?.
b) Que asignación produce la máxima precisión a un costo dado?.
En a) la precisión se fija de antemano, en b) surge según costos. Ambos
problemas tienen su solución en el cálculo diferencial, el cual revela la siguiente
relación entre n j y n:
pjsj
cj
nj n 4.33
M pjsj
j 1
c j
1 M M p s
sY2estr p j s j c j 4.34
j j
n j 1 c
j 1 j
t2 M M p s
2 j j 4.35
n p s c
j j
E j 1
j
c
j 1 j
1 M M p s
1 M
sY2estr p j s j c j p j s 2j 4.36
j j
n j 1 c j N j 1
j 1
98
M M p s
t2 pjsj cj j j
j 1 cj
n
j 1
2 M 4.37
t
E 2 p j s 2j
N j 1
Los costos entran en la fórmula como su raíz cuadrada y solo cambian el número
obtenido del muestreo en el ejemplo anterior si los costos resultan
significativamente diferentes entre los estratos. Retomando el ejemplo ya
trabajado se asumirán los costos por parcela presentados en la Tabla 4.3, así
como los cálculos respectivos. Los otros datos se hallan en la tabla anterior.
99
reparte proporcional a la variación de los estratos, por ello:
pjsj
n1 6.61 7
cj
nj n n2 22.9 23 Que produce cambios de la muestra total
M pjsj n 11.48 11
c j
3
j 1
con respecto a la lograda anteriormente.
4.7 Estratificación posterior al muestreo.
Cuando se hubiera acudido previamente al muestreo simple aleatorio o
sistemático y la evidencia de campo o los procesos estadísticos como un análisis
de clusters revelan la presencia de subpoblaciones, es posible estratificar
después del trabajo de campo, aunque la muestra se hubiera tomado sin dicha
presunción. al hacerla evidente. Para ello, con base en la muestra simple al azar,
se hace la repartición para cada estrato, con lo cual se obtienen reducciones
sensibles del error. Figura 4.1.
4.7.1 Estimador de la media por elementos. Se usan las mismas ecuaciones
(4.1) y (4.5), buscando p j con base en el cálculo posterior que se haga de N j y
N Y j j
Yestrpost j 1
4.38
N
4.7.2 Estimado del error estándar con estratificación posterior. Se obtiene
por medio de la siguiente ecuación
1 f M Nj 1 M
Nj 2
sY2estr N s 2j
n2
1 s j 4.39
post
n j 1 j 1 N
muy diferentes entre si, y el tamaño de muestra sea bueno, el segundo término
de (4.39) puede resultar despreciable, comparado con el primero.
Como ejemplo se presenta el inventario de la población #1, efectuado en el
numeral 2.3 sometida a estratificación posterior como lo sugiere la población 5,
100
pero asumiendo que el trabajo de campo detectó la estratificación presentada.
Para ello, con base en ordenaciones de la muestra de los volúmenes del mayor al
menor, o viceversa, se asignaron al respectivo estrato y se procedió con los
estadísticos clásicos a encontrar media y varianza dentro de ellos. La proporción
respectiva de cada estrato se hallaría con planímetro, o por medio de lo
presentado en el ítem siguiente. Los resultados, Tabla 4.4, muestran que el
volumen promedio por hectárea con este proceso es de 179.614 m 3/ha, con lo
cual se incrementa el sesgo con respecto al verdadero valor poblacional, pero se
obtiene un estimador ponderado de la media, también mayor en este caso que lo
obtenido con el muestreo aleatorio simple, el valor obtenido para la primera
parte del lado derecho de la ecuación (4.39) fue de 22.197, y para la segunda de
0.6011, prácticamente despreciable con
101
Tabla 4.4 Organización de los datos para el muestreo con estratificación posterior.
Volumen Estrato Volumen Estrato Volumen Estrato
413 1 280 2 125 3
398 1 243 2 125 3
383 1 229 2 125 3
375 1 206 2 125 3
368 1 206 2 110 3
354 1 206 2 96 3
346 1 206 2 89 3
346 1 206 2 89 3
331 1 206 2 74 3
331 1 199 2 74 3
324 1 199 2 66 3
316 1 191 2 59 3
309 1 191 2 44 3
301 1 184 2 38 3
301 1 184 2 38 3
280 1 184 2 23 3
273 1 170 2 23 3
265 1 163 2 8 3
258 1 163 2 8 3
250 1 155 2 0 3
148 2 0 3
148 2 0 3
148 2 0 3
148 2 0 3
140 2 0 3
140 2 0
140 2
133 2
133 2
133 2
Sumaj 6.522,00 5.382,00 1.339,00
vol proj 326,10 179,40 51,50
Nj 930,00 2.010,00 1.060,00
sj 47,29 32,32 47,11
102
con lo cual se obtienen la media y el error estándar de acuerdo con sus
fracciones relativas rj así:
M M rj2 s 2j
rj Y j
j 1 n j
Yestrpos j 1
M
; sYest 2 4.40
M
r
post
j 1
j
rj
j 1
4.8 Error estándar en muestreo sistemático estratificado.
Otra forma de obtener una aproximación del error estándar, exclusiva al
muestreo sistemático en rejilla, acude a la división de la muestra en partes
independientes interpenetrables. Este es un tipo de muestreo "arracimado" o
"cluster", en el cual se seleccionan varias muestras en la población equivalentes
pero mutuamente independientes. Las unidades de cada parte muestral son por
regla distribuidas sistemáticamente, pero el arranque de de cada estrato o parte
muestral es aleatorio (Sihue, 1960), Sihue y John, 1962). El error estándar se
obtiene como:
Y Y
k
2
j
sY2 j 1
4.41
k 1
k, número de partes equivalentes de la muestra total, Y j , media de la parte
103
5. MUESTREO AL AZAR Y AL AZAR RESTRINGIDO CON FAJAS DE DESIGUAL
LONGITUD - ESTIMADORES DE LA RAZON.
113
5.1 Fajas en bosques tropicales.
La faja, de amplio uso sobre todo en inventarios de bosques tropicales, permite una
relación óptima entre tiempos de marcha y área efectiva muestreada, sobre todo con
accesos y orientaciones difíciles. Es común encontrar en la literatura anchos de faja
entre 10 y 25 m por longitudes desde 100 m hasta de 2 km y más.
114
análisis estructurales, seguramente pensando en el cambio de unidades muestrales.
5.1.2 Volumen y concepto de Y Media
El volumen podría configurarse de dos maneras ya que la forma irregular de los
bosques conduce a las fajas desiguales. Para superar esto se acude rectángulos
exteriores hipotéticos que conformarían fajas de igual longitud, pero con dos
estratos: el área con bosque y el área por fuera de este, Figura 5.2, que para efectos
prácticos se asumirá siempre sin bosque, lo que dará lugar a tener:
Y y i
q i 1
n 5.1
x
X
i
i 1
115
m3 unidad de area .
Se presentará en primer lugar la propuesta de Dawkins como un buen intento para
resolver el tamaño de muestra reducido
5.2.2 Error estándar de fajas iguales dentro de bloques de igual tamaño.
Propuesta aleatoria restringida de Dawkins. Para resolver el problema del
tamaño de muestra reducido y que las fajas a veces deberán atravesar varios
estratos diferentes del bosque, sin una localización óptima de las unidades
muestrales, se procede a una división del área del bosque en bloques de igual
tamaño con selección dentro de ellos de un predeterminado número de fajas en
forma aleatoria, con lo cual se acortan estas, se aumenta el número de muestras,
con casi la misma fracción de muestreo y además permite un análisis de varianza
que reduce el error estándar la mayoría de las veces.
Presenta como desventaja un aumento en los tiempos de marcha, lo que influye
necesariamente en costos, y en requerimientos estadísticos (Loetsch y Haller,1964).
Estadísticamente se requiere para la estratificación propuesta en bloques con fajas
dentro de ellos:
1- Que cada faja tenga una oportunidad igual de ser seleccionada.
2- Que el número de fajas 2 por bloque.
3- Que la fracción de muestreo sea igual en todos los bloques; y
4- Que el tamaño, forma (cuadrados o rectángulos) y disposición de los bloques
se tenga en cuenta para que las desigualdades entre ellos marquen la mayor
diferencia posible de la proporción de la varianza total.
Logísticamente se requiere: una escogencia adecuada de acceso a los puntos de
partida de las fajas, como caminos, quebradas o ríos, otras fajas o puntos
relevantes; reconocimiento aerofotogramétrico o cartográfico que permita eliminar
áreas sin bosque; y una selección adecuada de campamentos y subcampamentos
para eliminar tiempos innecesarios de marcha.
5.2.2.1 Selección aleatoria. El proceso de selección aleatoria de las fajas se ve
afectado por el ancho y el número de ellas en cada bloque. Para evitar ciertos
problemas de selección de las fajas, Dawkins propone una división del ancho del
bloque en diez partes iguales, con una subfaja central en cada una, y selección
116
aleatoria de dos partes por bloque, con lo cual se calcula el error estándar así:
M
x1 j x2 j y1 j y2 j
M M
2 2
2 x x y y 2
1 f q j 1 1j 2j 1j 2j
sq2in j 1 j 1 5.2
n2 X2 Y2 XY
en que: x1 j ,área con bosque de faja 1 en el bloque j, y1 j volumen de la faja 1 en el
bloque j, etc.
M 2
2 y1 j y2 j
1 f q j 1
sq2in 5.3
n2 Y2
5.2.3 Muestreo en fajas de igual longitud. Es el caso en que las fajas o los
transectos lineales de muestreo pueden asumirse como de igual longitud y que las
unidades de registro no coincidan con las unidades de muestreo.
118
Por ejemplo cuando se asume en la figura 5.1 que las fajas A, B,.., L, o 1, 2, .., 8
quedan de igual longitud al circunscribir el rectángulo adjunto al bosque, en cuyo
caso los transectos de igual longitud quedarán con una proporción de área no
boscosa, que precisa por tanto de otra variable: la longitud de las unidades de
muestreo lineal dentro del área boscosa en las cuales se hace el muestreo, (Loetsch
et al, 1964). Estas además pueden ser subdivididas en unidades de registro de
longitud constante, muy común de 50 m por ejemplo, resultando irrelevante para el
cálculo del error si se asumen continuas o intermitentes, mientras hagan parte de la
misma unidad de muestreo.
Lo anterior permite además segregar algunas con el fin de hacer estratificaciones de
acuerdo con algunas características del bosque, contrariando así algunas de las
opiniones contrarias a su uso. Aparecerán entonces dos variables simultáneas
diferentes para cada unidad de muestreo: xi , área del estrato con bosque en la
respectivo estrato boscoso por unidad de muestreo, que incluye Bosque y No bosque.
Por otra parte la forma irregular del área boscosa que conduce a fajas de desigual
longitud, lleva a encerrarla dentro del perímetro rectangular para reconstruir áreas
muestrales de igual forma y tamaño, volviendo más comprensible aun el uso de
(5.1). Todo lo anterior lleva a que el volumen total pueda entonces ser estimado de
las dos formas siguientes:
1) V a j q;
2) V NY 5.4
en que a j , área del estrato con bosque y q el estimador de la razón, N, número de
119
fajas de igual tamaño, forma y longitud. Para el cálculo de V, según 1) de (5.4), se
necesita la información adicional del área por estrato, la cual puede obtenerse de
fotografías aéreas o mapas. Si a j está libre de error el error estándar del volumen
total es:
sV a j2 sq2 5.5 .
Sí el área es un estimado, entonces su error estándar debería ser calculado como:
área X así:
s2 s 2 2s
sq2 q 2 x2 y2 xy
X 5.7 ,
Y XY
n n n
xi X yi Y
2 2
2 xi X yi Y 2
q
sq2 i 1 i 1 i 1 5.8 ,
n 1 X 2
Y 2
XY
la cual se resuelve y simplifica como:
n 2 n n
q i 1
2 x i yi
2
2 xi yi
sq
2
i 1
i 1
5.9
n 1 X 2 Y2 XY
o con posteriores reagrupamientos y simplificaciones como:
n n
q 2 yi qxi y qx
2 2
i i
sq2 i 1
; o como sq2 i 1
5.10
n 1 Y 2 n 1 X 2
5.2.3.2 Error estándar de q. Se calcula de varias formas, de acuerdo con un
muestreo aleatorio irrestricto de n fajas de N, Figura 5.4, o para el proceso en
120
Figura 5.4 Selección de n fajas aleatorias de N
bloques ya visto (Dawkins, 1958), o una de sus modificaciones que hace parte más
bien del proceso polietápico.
5.2.3.2.1 Error estándar de q para n fajas desiguales de N. Se obtiene de la
ecuación (5.9), incorporando el factor de corrección así:
n 2 n n
n 1 f q
2
s 2 2xi yi 2 xi yi
sq
2
1
q
i 1
i 1
i 1
5.11
n N n n 1 X 2 Y2 XY
Si se dan restricciones por estratificación, la varianza de los estratos llamada sq2in se
sx2 s y2 2sxyin
sq2in q 2 in2 in2
X 5.12
Y XY
1 f sq2
s
2
qin
in
5.13
n
Ejemplo, para muestrear la población #3, se eligieron por sorteo aleatorio las fajas
A3, A7, A15, A18, B23, y B26, con los siguientes datos: Tabla 5.1 para áreas (por
practicidad cada cuadro se asumirá como una ha), y los volúmenes de ellas.
121
Tabla 5.1 Datos para el muestreo de la población #3 con fajas desiguales.
sV N 2 sY2 5.14 :
Ambas versiones de volumen (calculadas por 5.4) difieren por la magnitud del error
estándar. En general sq % es considerablemente menor que sY % a pesar de que q
122
un error estándar evaluado con (5.10) = 10511.36, para un error de muestreo del
23.97%.
sx % s y % sX % sY % 5.15
2 2 2
sq % 200sxy % sq % 200sxy %
2
en que:
n
x X y Y
i i
1 f sxy %
sxy % i 1
100%; y sxy % 5.16
XY n
Si el área de los estratos está exenta de error, el error estándar en porcentaje,
evaluado con 1) (5.4) puede obtenerse como:
sV % sq % 5.17
y la del volumen de acuerdo con 2) (5.4) así:
sV % sY % 5.18 .
Con base en las anteriores fórmulas se puede apreciar con cual de las ecuaciones, 1)
o 2) de (5.4) queda mejor estimado el volumen acudiendo al coeficiente de
correlación expresado en términos de los coeficientes de variación:
sxy %
100% 5.19
sx % s y %
s % s % ,
2 2
simplemente indagando en que caso q y lo cual ocurre cuando
s % s %
2 2
q y 0 , lo que puede escribirse de (5.15) como:
s % 2 s % 2 200s % s % 2 0 sx %
2
200sxy % 5.20 .
x y xy
y
s % sx %
2 2
sx %
sxy % x 100 5.21 ,
200 200sx %s y % 2s y %
con lo cual los estimados 1) de (5.4 por medio de q y a j serán mas ajustados en los
debido a que sq % s y % , aunque q pueda resultar un poco sesgado, lo que en
V N Y b X* X 5.23 ,
en que b = coeficiente de regresión de y contra x, y X *
area con bosque . Como se
N
necesita alguna información adicional en el área de estratos, el error estándar de V
podría ser toscamente asimilado al de q en % y calculado como:
1 X * X 2
sV Nsxy n 5.24 ,
n 2
xi X
i 1
s la desviación estándar muestral de la línea de regresión, (Lema, 1995).
XY
V N Y b X * X 66.139,35 m3 ,
400
2
13.67
1 35 12506, 076 ,
sV 35 824.574
6 237.33
con lo cual se obtiene un error de muestreo del 48.61%, mayor que por el estimador
de la razón.
5.3 Ejemplo de un proceso tipo Dawkins modificado.
El bosque de la población # 4 (Anexo 4.1) se dividió en 16 bloques, se separó el área
y sin bosque como muestra el Anexo 5.1, dentro de los cuales se sortearon al azar 6
124
de ellos y dos fajas por cada uno, con el fin de mostrar un proceso Dawkins
modificado para apreciar algunas variantes de cálculo, no más. Los resultados se
muestran en la Tabla 5.2 . La t para este caso tiene m n j 1 = 6 grados de libertad,
o sea 2,447.
1770 2931
Y 12 391.75 m3
q 45.2
X 52 52 8.667 ha
12
M 2
2 y1 j y2 j 1
12 2
1 f q j 1 q 386.503, 0
160
sq2in 2
2
391, 752 2.33
n Y 144
2.447 2.33
Con lo cual el error de muestreo es igual a Em 100% 8.26% entre
45.2
m3
cuyos límites encontramos el verdadero valor de esa población 42.53 = 42.35 .
ha
125
126
6. MUESTREOS DE ATRIBUTOS EN POBLACIONES Y DE REGENERACION
NATURAL.
n
p xi p X xi p x q n x 6.1
x
n n!
En la cual: . En este caso se considera como unidad de muestreo al
x x ! n x !
127
mismo elemento natural sujeto de la investigación, por ejemplo un árbol.
Sí una población presenta N unidades, de las cuales M tienen la característica
esperada, la proporción de la población se define por p = M/N, como Y toma el valor
1 para esas M unidades en la población, entonces la media de ella coincide también
con p, con lo cual el problema de la estimación de la media se reduce a encontrar la
media de valores en que Y = 1. En grandes áreas se puede acudir al muestreo
conglomerado, a parcelas circulares, cuadradas, fajas, transectos y otros
6.2 Cálculo de la media en poblaciones y muestras de atributos.
A las unidades que posean una característica C se les dará un valor Yi 1 y a las
Yi Yi 2 Nc
i 1 i 1
6.2
y y
i 1
i
i 1
2
i nc 6.3
Y i
Nc
i 1
6.4 ,
N N
y para la muestra:
n
y i
nc
Y i 1
p 6.5
n n ,
en la cual y p representan la proporción de unidades con el atributo o
característica buscada c.
128
de atributos La varianza puede obtenerse en la forma acostumbrada, por
transformaciones de Y Y
i i
2
N , así:
N N
Yi Y N 2
2 2
i
N N 2
2 i 1
i 1
1 6.6 .
N N N
En el caso de la muestra, en forma similar a lo anterior:
n N
y p y np 2
2 2
i i
np np 2 np 1 p npq
s
2 i 1
i 1
6.7 .
n 1 n 1 n 1 n 1 n 1
p
s 2p pq pq
s 2
6.8
n 1 n
p
n
Esta última es en la práctica, la versión simplificada más reportada. Se nota que en
este proceso la media y la varianza no están afectadas ni por el tamaño de las
unidades de muestreo, ni por su distribución espacial.
6.4 Límites de confianza.
A menudo se calculan los límites de confianza de proporciones por medio del error
estándar y el valor de t como sí fuera una distribución normal. La fórmula de esta
aproximación, ya que el signo = podría ser <, o, >, es:
p t s p p 1.96 s p 6.9 ,
con la cual los errores no son relevantes si el tamaño de la muestra es
suficientemente grande. Estos deben ser mayores, mientras más pequeña sea la
proporción, por problemas de asimetría, acá no discutidos.
En caso de una muestra pequeña: existen tablas con límites para valores esperados
como los de Fisher y Yates, citados por (Loetsch-Haller, 1963). Se puede además
asumir la población como normal, con el criterio empírico de que nPq > 15.
Además de lo anterior, para el cálculo de los límites de confianza se requiere una
probabilidad de selección igual, es decir que la proporción de la población no cambie
por la escogencia de una unidad, lo que se consigue sólo en muestreos con
reemplazamiento. En pequeñas muestras sin este se deberá acudir a la distribución
hipergeométrica. Si la población es grande y la muestra pequeña, no se necesita el
129
reemplazamiento. Como regla general las poblaciones forestales son grandes y las
muestras de suficiente tamaño, de tal forma que en la mayoría de los casos la
aproximación por la normal permite el cálculo de los límites de confianza en forma
aceptable.
6.5 Muestreo de grupos para proporciones, cluster o arracimados.
El que un elemento presente o no una característica, lo vuelve una unidad de
muestreo en una población binomial. Sin embargo, en algunos casos, las unidades
observadas no pueden constituirse en unidades de muestreo al mismo tiempo, como
por ejemplo, cuando se desea conocer la proporción de árboles de determinada
especie/ha dentro de un grupo, los cuales deberán ser seleccionados dentro de las
parcelas de muestreo que se constituyen en las unidades muestrales.
6.5.1 Conglomerados en líneas o fajas. Se puede dar con igual o desigual número
de unidades observables.
6.5.1.1 con desigual número de unidades observables. Asúmase que en m
conglomerados, líneas o fajas, se observa una característica como la supervivencia
de los árboles plantados, o una especie en particular. sean: N i ; número de árboles,
n i
p i 1
m 6.10 ,
N
i 1
i
1 m 2 m m
2 i 6.11 ,
s 2p n p N 2
2 p ni Ni
m m 1 N i 1
i
i 1 i 1
130
m
en que N Ni m número promedio de elementos en las m muestras;
i 1
m
p pi m
i 1
131
en que: N 47.833; p 0.2636; n 12.667 ; y
2
1.092,0 0, 2637 2 15.515,0 2 0, 2637 4.108,0 6.28849 E 05 ,
1
s 2p
6 5 47.833
s p 0,00793
de donde , con lo cual los límites de confianza estarán entre 0,2841 y
0,2433.
6.5.1.2 Líneas o fajas con igual número de elementos. Si los conglomerados
poseen igual número de elementos (al decidir por ejemplo hacer los transectos hasta
muestrear siempre el mismo número de árboles, independiente de la longitud en que
este se consiga, porque el concepto de parcela deja de ser espacial) el análisis se
reduce a estimar el promedio de las proporciones y su varianza en la forma habitual.
Para poblaciones con un infinito número de líneas, su media y varianza se obtienen
como:
m
p i
1 m
p ; s 2p pi p 6.12 .
i 1 2
m m m 1 i 1
6.5.2 Muestreo de grupos con número finito de muestras. Este proceso es muy
lógico cuando sólo es posible tener un número limitado de muestras por tiempos,
costos, economía, pero se debe dar como referente a un área o espacio determinado.
Para ello considérese: m; número de grupos o racimos, ni ; número de unidades en el
m m
nci pn i i
p i 1
m
; o p i 1
m 6.13 ,
n
i 1
i n
i 1
i
dividida por el Número total de individuos en ella. En este caso el estimado del error
132
estándar se basa en el estimador de razón ya mencionado, y se puede obtener así:
1 f
m 2
n ci pni
s 2p i 1
6.14
2
n m
i m 1
cuya comprensión se facilita con el siguiente ejemplo tomado de (Lema, 1986) en
que se resalta la forma de disponer los datos para facilitar los cálculos
posteriores.
Se trata de un inventario con el objetivo de encontrar el grado de afección/ha en
una plantación de pino. Para ello se escogió el muestreo simple al azar en
parcelas de 1/20 de ha y se calificó cada árbol como sano o enfermo, con 0 y 1
respectivamente. Se ubicaron 10 parcelas en una plantación de 80 ha y se
obtuvo la información dada en el cuadro siguiente. Se dan dos formas de cálculo
de p y del error estándar, los cuales deberá consultar en caso de duda, de
acuerdo con la tabla 6.2
m m
Como conclusión queda que a menos que hubiera ocurrido un error de 1 en 20, la
media se encuentra entre 0.7989 y 0.7555 de los árboles/ha sufre la afección
estudiada suponiendo un tamaño adecuado de la muestra.
Npq Np 1 p
n 2
6.15 .
E E2
N 1 pq N 1 p 1 p
4 4
Para decidir que tan bueno fue el tamaño de muestra, usado en el ejemplo anterior
133
con un error admisible del 15%, se acude a (6.15) con el error calculado como
1 80 62 0.775 0.026
2 94 73 0.777 0.001
3 73 51 0.699 32.730
4 62 49 0.790 0.682
5 65 51 0.785 0.245
6 81 64 0.790 1.130
7 58 48 0.828 8.608
8 70 53 0.757 1.932
9 62 51 0.823 7.986
10 60 46 0.767 0.384
sumas 705 548 53.725
134
a. La clasificación, agrupación en clases de acuerdo con algún criterio, por
ejemplo plántulas menores o iguales a una determinada altura y de ser
posible la edad para lograr la supervivencia. Las clases avanzadas, deben
también tipificarse de acuerdo con postulados silviculturales, en consonancia
con estrategias de crecimiento o clasificación ecológica, para decidir en que
instante se considera un renuevo definitivo.
b. Mortandad, número promedio de plántulas que no superarán la primera
clase.
c. Frecuencia de especies. Identificación por medio de muestreos diagnósticos
de la mejor manera posible, la distribución espacial de la regeneración, con
énfasis en los posibles renuevos, de modo que conduzca a posibles
clasificaciones de acuerdo a la cantidad como rodales en regeneración,
recuperación o irrecuperables, que requiere otros criterios como: definición de
un índice de heterogeneidad, determinación de diagramas de parcelas cero;
con superficies relativas u otro con superficies mínimas absolutas en relación
con un espacio óptimo por árbol maderable logrado, o muchas otras
propuestas.
d. Por último se requiere la distribución especial de los renuevos y la estructura
de la especie estudiada o del rodal maderable según diámetros a la altura del
pecho y área basal óptima. En general esta propuesta es para bosques en
manejo que proporcione una información detallada de las necesidades y
medidas de mejoramiento, bien sea tipo plantaciones o en bosques tropicales.
El número de plantas por unidad de superficie y la distribución espacial de la
regeneración debe compararse con normas espaciales, bien sea por medio de la
experiencia o por investigaciones antecedentes al respecto. Como siempre es
necesario identificar entre el alto número de renuevos de diferentes especies la
población de interés, bien concebida de acuerdo con el propósito de manejo. Para
ello son adecuados dos componentes: el número de plántulas por unidad de
135
Existen muchas propuestas al respecto para su evaluación, de las cuales se dejarán
de lado las más conocidas por los silvicultores, como las de (Dawkins, 1958),
estudiables en otros contextos como los de la silvicultura, para concentrarnos en los
métodos por distancias.
6.7.1 Características de los diferentes esquemas de distribución espacial por
superficie. Con los términos de homogeneidad, si los individuos ocupan áreas
similares sobre el terreno y, heterogeneidad si estas varían, es posible definir las
condiciones que tipifican el área ocupada por los individuos con respecto a la
aglomeración de ellos y a los espacios vacíos. Así se hablará de:
a. absolutamente homogénea a una distribución sistemática ininterrumpida de
los individuos, en distribuciones cuadradas o rectangulares,
b. relativa homogéneo, cuando la distribución es al azar restringida, bloques
uniformes en los cuales se distribuye al azar una cantidad constante de
individuos, tanto más homogénea cuanto más pequeños sean los bloques y,
c. absolutamente al azar, que representa el límite entre la homogeneidad y la
heterogeneidad, según muchos autores, la condición deseable para los
bosques tropicales.
Se han hecho varios intentos para producir índices al respecto, entre los cuales el
más usado es el índice de aglomeración:
2 s2
IA q 6.16
Y
medido en parcelas de superficie constante, lo cual produce algunas inconsistencias
por depender del tamaño de las parcelas, especialmente cuando estas son más
pequeñas que las extensión de la aglomeración de los individuos.
En casos de distribuciones al azar, se alcanzan distribuciones tipo Poisson en las
cuales la media y la varianza coinciden en cuyo caso: q = 1, por debajo de este valor
se tiende a la homogeneidad, absoluta cuando es cero y por encima de él a altas
condiciones de heterogeneidad. Figura 6.2.
136
Figura 6.2 Algunas distribuciones de Cox: a) Sistemática con fallas, b) Restringida al azar, c)
Ligeramente aglomerada, d) Aglomeración en grupos pequeños, e) Aglomeración con grandes
vacíos grandes.
6.7.2 Parcelas de muestreo con tamaño fijo. Se cuentan los individuos de una
población predefinida, dando el valor estimado de , procedimiento muy laborioso
que ha dado origen al método de cuadrantes poblados, muy estudiados en la
silvicultura, con unas normas muy difíciles de satisfacer a veces, por lo cual se
acude a otras propuestas como las de distancias y las de parcelas cero.
6.7.2.1 Número de plántulas por distancias entre vecinos. El pionero de este
tipo de muestreos fue Köenig en 1865, citado por (Loetsch, et al, 1973). Las primeras
experiencias se hicieron con respecto al primero, segundo, tercer vecino próximo a
un árbol, para tratar de encontrar el número promedio de ellos por unidad de
superficie, con resultados casi siempre sesgados, sobre todo en poblaciones
heterogéneas al ignorar los claros. El primero en investigarlo rigurosamente fue Cox,
citado por (Loetsch et al, 1973), al darse cuenta que el sesgo se incrementaba con el
arracimamiento de los árboles en cluster. Este autor hizo numerosas simulaciones
con poblaciones desde estrictamente sistemáticas, homogéneas, hasta
extremadamente arracimadas, a las cuales aplicó especialmente dos propuestas de
métodos de distancia que llamo; “el método ordenado” y “el método de cuadrantes”.
Figura 6.3, a) y b).
137
Figura 6.3 a) Método de distancia ordenada. b) Distancias en cuadrantes
j 1! 2 j 1
4
c 10000 6.18 .
2 j 2 !
2
sexto vecino más cercano en orden creciente, Figura 6.3, a). Este método es bueno
para estructuras Poisson, pero estas no son tan frecuentes. Por ello, Cox trabajó el
método de los cuadrantes.
6.7.2.1.2 Método de distancias por cuadrantes para cálculo de número de
plántulas por ha. Permite un uso más amplio que el anterior. Encontró que la
distancia al tercer árbol producía los mejores estimadores y era aplicable a
distribuciones distintas a la Poisson. En este en cada cuadrante se lee r3i , distancia
138
al tercer vecino más cercano en orden creciente, Figura 6.3 b) y con ello:
2
N arb n
c 16 n 4 ; c 27.84 6.19
ha
1
i 1 k 1 r3ki
Pero, no satisfechas muchas de las inquietudes iniciales se acudió a otras
propuestas.
6.7.3 Métodos de distancia y parcelas cero. Delineados inicialmente en 1971 por
Cox, citado por (Loetsch et al, 1973 y Sachtler, 1976) en un intento por superar las
rigideces del tamaño fijo e incorporar la heterogeneidad como prueba tipo en otras
propuestas de distancias muy usadas en ecología. Se dividen en dos casos cuando
es o no conocido.
6.7.3.1 Métodos de parcelas cero cuando es conocido. Si se mide desde los
puntos de muestreo, ya sea en forma sistemática o al azar, las distancias a la
primera o segunda planta de interés y se convierten estas en radios de círculos de
diferentes tamaños, se obtienen las llamadas parcelas cero, círculos sin renuevos,
Figura 6.4.
Figura 6.4 Muestreo de parcelas cero con distribución sistemática de los puntos.
139
x e
p X x 6.20 ,
x!
convertible a:
p 0 100 e m 6.21
donde m, es una medida para el tamaño variable de parcelas cero; por ejemplo el
número de individuos que, basados en el promedio de la población, teóricamente
debería radicarse en tal parcela. En forma logarítmica base 10 se llega a:
Para el espacio relativo medio en m 2 necesarios para una planta se obtiene entonces
1
de acuerdo con lo anterior: r 2 , y m 1 . El par cartesiano (1, log
p(0)=1.57) tiene la particular significación de valor de control. Otro valor del tamaño
de las parcelas donde apenas el 5% están vacías puede también usarse al respecto.
A través de la ecuación básica se obtiene:
2 log 5
m 2.996 3 cuyo log p 0 0.699 , que permite encontrar la línea recta
0.4343
para la distribución de Poisson.
6.7.3.2 Indice de heterogeneidad de Cox. Cox desarrolló su índice de
heterogeneidad I c mediante el diagrama de parcelas cero, al definirlo como:
140
Ic a b k 6.24
en el cual a, números de la ordenada p 0 dividido por 100. (Para m = 1, a = 0.368
entonces:
1 1
k 0.907 6.25
ab 0.368 2.996
Figura 6.5 Construcción del índice de heterogeneidad relativa de Cox con escala relativa.
y a mayores valores que 1, mayor aglomeración en grupos. Cox obtuvo valores hasta
de 10 para sus pruebas simuladas y habla arracimamientos duros para I c 5 .
Para verificar una población con una muestra dada, se construye una “tabla de
frecuencias acumulativas decrecientes” , como las mostradas en la figura 6.4 al ser
llevadas al diagrama de parcelas cero (DPC), para lo cual deben cumplirse algunos
requisitos: debe ser obtenido bien sea con base en una plantación muestra o
141
planificada o como el número de árboles deseado por unidad de superficie, teniendo
en cuenta la mortalidad esperada. De igual manera debe suponerse la distribución
espacial esperada, varias versiones de condiciones de prueba, por ejemplo algunos
de los varios tipos de distribuciones definidas por I c . En otras pruebas Cox, propone
ejemplo en la gráfica las parcelas hipotéticas las cumplen, pero las etiqueteadas
con no. En este caso se puede ver que m para el 5% es 6, en cuyo caso
142
abscisas ya no están en valor relativo, y la prueba de Poisson ya no es posible, pero
si una verificación de situaciones de regeneración con base en un óptimo de op .
Por ejemplo asuma que se hubieran logrado tres rodales en las condiciones anotadas
al principio y que el rodal I hubiera dado 149 árboles/ha con DAP 20 cm , de los
cuales 82 fueran de una especie de interés. Entonces se supone un ideal de 120
árboles/ha para el aprovechamiento. Se supone una segunda condición: Que estos
árboles no estén distribuidos más irregularmente que una estructura Poisson.
Entonces la línea de control para un op 120 se obtiene de dos puntos: el primero,
definido por el espacio medio ocupado por un árbol adulto, x 10000 /120 83.3 m2 .
al m 3 del caso anterior sería 250, el cual se ubica sobre p 0 5% . Figura 6.5.
de acá se haría el análisis pertinente de lo sucedido en los rodales. Por ejemplo como
en el caso anterior suponga que la distribución decreciente marcada con (+) y la
marcada con se ubican en las posiciones mostradas. En este caso sólo las (+)
143
144
7. MUESTREOS CON PROBABILIDADES VARIABLES
137
de modo que la selección de las muestras se ligue a la medida asociada, por
ejemplo, su frecuencia acumulativa, cambiando las probabilidades de selección,
exploradas en una tabla de números aleatorios, de acuerdo con su dimensión. Este
acuerdo con su dimensión. Este muestreo es muy aplicable a censos catastrales por
número de propiedades/individuo, áreas de lotes, etc. Como ejemplo se presenta la
población # 2 que fue dividida por cuestiones de manejo en 19 rodales, Figura 7.1.
R2 R3
A B C D
1 163 30 191 0 191 0 140 23 250 0 133 44 125 0 184 0 148 15 206 0
R1 2 155 59 133 15 170 38 163 125 206 0 176 110 243 81 265 15 170 0 110 125
3 221 30 206 0 170 0 194 38 214 15 133 110 103 8 222 59 184 103 206 148 I
4 206 38 140 66 155 66 148 38 191 38 148 0 280 30 170 44 148 81 199 176
5 125 38 103 59 148 118 191 0 184 0 163 89 163 66 140 110 110 191 148 184
6 280 0 309 0 271 8 288 89 163 74 324 103 346 176 125 148 184 214 214 250 R7
R4 7 316 8 250 38 169 89 339 155 346 191 339 133 288 191 258 169 303 250 222 176
8 265 89 346 66 331 170 265 148 258 133 214 110 361 206 324 229 229 346 309 243 II
9 280 118 354 199 309 214 375 235 125 89 398 155 346 89 383 176 221 339 250 221
10 125 155 176 103 331 199 346 148 383 301 206 184 316 206 331 375 339 235 199 295
R8 11 346 206 413 96 316 235 273 148 221 133 441 110 413 148 316 221 214 221 243 301
12 280 118 265 133 199 140 280 176 176 163 229 74 354 110 235 163 184 229 229 258 R11
13 339 176 398 74 250 280 339 133 273 243 316 191 325 303 250 206 184 96 324 316 III
14 346 250 346 273 258 155 295 199 288 125 288 265 368 155 206 118 368 199 265 324
R12 15 163 155 273 191 81 125 214 110 206 184 243 170 214 89 258 214 390 148 118 191 R15
16 273 89 163 103 148 125 163 155 103 199 214 125 184 265 155 155 221 118 229 199
17 133 23 184 0 191 51 148 66 199 110 191 30 191 23 184 51 140 15 221 110
18 163 44 250 51 243 38 125 44 176 0 206 0 191 23 163 0 221 44 243 133 IV
R16 19 96 38 206 0 199 0 199 0 229 8 148 8 155 23 155 125 118 0 199 89 R19
20 235 15 229 74 221 38 163 0 118 15 191 0 59 0 235 0 140 23 148 23
a t b s c r d q e p f o g n h m i l j k
R17 R18
Se hará la evaluación del volumen/ha de acuerdo con el área de cada rodal, con la
esperanza de que los de mayor área queden mejor representados, pero con el
criterio subyacente de que la unidad de muestreo será el rodal. Para ello se asociará
a cada uno de ellos la dimensión de su área, de acuerdo con la Tabla 7.1, la cual
muestra el proceso de selección seguido. Debajo del título PARC se colocan
asteríscos de acuerdo con la escogencia del rodal de una tabla de números
aleatorios, luego de lo cual se escogieron los volúmenes dentro de ellos, también al
azar. El muestreo se trata como un estimador de la razón, por ser asumida como
unidad muestral el rodal, los cuales quedan con desigual tamaño muestral. Los
cálculos se basan en las siguientes fórmulas ya manejadas desde el capítulo 1:
138
1 n yi 1 n
r ri
n i 1 xi n i 1
7.1 ,
2
n
sr2 i 1 7.2
n n 1
en un manejo no muy ortodoxo estadísticamente hablando. El estimado del
volumen total Y, y su varianza, para la población se obtiene por:
139
en que X, como resulta obvio, será el área total. De acuerdo con lo anterior para
muestreo es muy aplicable a censos catastrales por número de
propiedades/individuo, áreas de lotes, etc. Como ejemplo se presenta en el
propuesto:
2.162,802
3 412.391, 67
2.162,80 m 13
r 166,37 ; sr2 336,98 ,
13 ha 13 12
lo que equivaldría a un error de muestreo del 24%.
fórmula equivalente a:
k
Yi Ft1Y1 Ft2 Y2 Ftk Yk Ft j Y j 7.5 ,
j 1
en las cuales:
Yi , promedio por hectárea en el centro punto i, para una característica buscada Y.
F = Factor de área basal, obtenible con relascopio, varilla o prisma.
Ft j , Factor de árbol j-ésimo en el centro punto de muestreo i.
140
j, índice de 1...k, k, número de árboles calificados en el punto i. Por ejemplo si el
valor buscado es el área basal/ha: G, entonces
F F F k
m2
Yi g1 g 2 g k F kF
g1 g2 gk j 1 ha
El valor estimado del parámetro por medir se obtiene por:
n
Y i
Y i 1
7.6 .
n
7.2.2 Area basal sin y con agrupamiento en clases diamétricas. El área basal
obtenida con el relascopio, varilla o prisma, se puede calcular por mero conteo así:
ki
Gi Fi kij ki Fi 7.7 .
j 1
ki número de árboles que califican en el punto censal i. El área basal promedio será
entonces:
n
G i
G i 1
7.8
n
Los datos de los censos puede agruparse en c clases para encontrar los parámetros
estadísticos correspondientes, como se muestra en el ejemplo, tabla 7.2 que trata de
obtener el estimado de área basal por hectárea G de un bosque de P. patula, con
relascopio usando la franja de unos, F =1, al agruparlos en 11 clases.
2
c
niYi
n Y 2 i 1
c
c i i c
niYi i 1
n i
G i 1
; s 2
c
i 1
7.9
n 1
n
i
i 1
141
procedimiento.
142
clase del "d" escogidas con cualquiera de los criterios de la estadística, (Lema,
1996). En este caso se tomaron clases de 5 cm. Los árboles contabilizados en cada
clase se apuntan siguiendo algún método como el de puntos y rayas o como lo
muestra la(s) columna(s) 5. El total se apunta en las columnas 6 y 7.
143
TABLA 7.3 FORMULARIO Y EJEMPLO DE MUESTREO PPS POR DIAMETROS Y ESPECIES
1* DIAM ARB VOL CIPR PATU CIPPAT TOTAL /Ha TOTAL /Ha
13 70 2,5984 11,09
14 75 2,2635 11,33
15 80 1,9894 12,2
El área basal media por árbol, se obtiene dividiendo el área basal por hectárea por
el número de árboles por hectárea así, para el ciprés 8.6/162.51 = 0.0529. El
diámetro del árbol de área basal promedia se obtiene así:
144
2
g 0.0529 m
dg arb 0.2596 m 25.96 cm
0.7854 0.7854
En la parte final del formulario se anotan para confirmación el volumen total y por
hectárea, debajo de las columnas por especie, que deben coincidir con la suma de
los valores de totales de la columna 6, lo mismo el número de árboles por hectárea y
totales, similar al anterior con la columna 7.
V Varbol medio
Gf HGf 7.11 ,
ha g arbol medio
V i 1
f
j 1 k ij
k i
m
F i 1
7.12 ,
k
ha n
i
i 1
V i 1 j 1
k ij ki F Vi
m
F i 1
i 1
m
k 7.13
k k
ha n
i i
i 1 i 1
145
En las ecuaciones anteriores puede observarse que los productos F(v/g), son
simplemente el producto FV
t equivalentes a sumas de factores de volumen. El
72.97 60 27 60 27 1 m2 5.8 m2 ha
V ha 2.7 5.8 15.66 m3 ha; G ha
27 15 15 ha
El inventario anterior es conveniente cuando el propósito es obtener información
sobre el bosque general, sin separar especies.
146
utilidad práctica inmediata al abordar el muestreo bietápico.
7.6 Muestreo 3-P.
Para cierto tipo de muestreos como la extracción de árboles con ciertas
características (ejemplo destinados a la venta), marcados en el campo, la necesidad
de hacer una lista antes del muestreo actúa como un freno en muchas aplicaciones
forestales, especialmente si los árboles individuales son potencialmente listables.
(Grossenbaugh, 1963), con base en los elementos del PPS adopta como criterio de
selección muestral el mismo estimado del volumen en el sitio de recolección de la
muestra, de donde surge el nombre del muestreo que se interpreta como "Muestreo
con probabilidad proporcional a la predicción", muy utilizado para la venta de
árboles en pie, en que cada árbol de la población (todos los seleccionados y
marcados para la venta) son evaluados en primera instancia con una estimación
burda de su volumen, bien sea una tasación visual, o la aplicación de un método
simple de cubicación como una tabla de una entrada, Pressler o la altura mórfica
relativa, y en una segunda instancia se selecciona una submuestra de ellos para su
óptima cubicación, por ejemplo con una tabla de doble entrada, o una buena
ecuación para ello. Una buena presentación del método se da por Mesavage, citado
por (Husch, Miller y Beer, 1982) así: "supóngase que se dispone un manojo de
cartas numeradas del 1 al 20. Si se estipula que el volumen predicho de un árbol
muestral debe ser igual o mayor que el número de una carta subsecuentemente
extraída al azar, el árbol con una predicción de 1, tendrá solamente 1 oportunidad
en 20 de calificar para ser digno de medición cuidadosa en su volumen, en tanto
que alguno con un valor predicho de 15, tendrá 15 oportunidades de 20. La
probabilidad de la selección aparece entonces proporcional a la predicción".
Los elementos para un muestreo 3P, se pueden seguir en la siguiente rutina de
trabajo:
1- Escoger un tamaño muestral n, número de árboles que deberán cubicarse
cuidadosamente, con algún buen proceso dasométrico, asumiendo una población
infinita, pero notando que la cifra del coeficiente de variación utilizada deberá
basarse en la razón del volumen medido con relación al estimado, que será definido
en el paso 8, usualmente más pequeño que el obtenido con el volumen de los
árboles, lo cual explica en parte la eficiencia de este método. Alternativamente
147
existen algunas propuestas para esta estimación del n, como 100 árboles para
personal calificado, o que se permitan ajustes por debajo del 1,5%, o 200 árboles,
por lo menos, para personal sin entrenamiento, etc. Se quiere hacer énfasis acá que
es la consistencia del apreciador, lo que conduce a un mejor ajuste del método,
incluso por encima de ciertos sesgos que presente la tabla usada, que pueden
resultar prácticamente despreciables.
2- Estimar la suma de volúmenes para los N árboles seleccionados para el efecto,
así:
N
Xˆ X i 7.14
i 1
que será usado como límite superior para un conjunto de enteros de 1 a k, que
actuarán como calificadores para decidir si un árbol debe cubicarse mejor o no. Es
importante resaltar acá la necesidad de escoger una unidad de cubicación que
permita una buena serie de números enteros, lo que no se lograría con m3 por
ejemplo. Se proponen unidades de cubicación parecidas a las del comercio final de
la madera, por ejemplo rastras 80 pies3 3m , o sea que un metro cúbico
aproximadamente iguala a 6,45 rastras), o el pie tablar cuya conversión da
4- Ajuste del número de enteros para asegurar una muestra próxima al tamaño
deseado, de acuerdo con:
Xˆ
n 7.15
kZ
n tamaño muestral esperado, X̂ volumen estimado del total de los árboles, Z,
número de elementos de rechazo, símbolos que se mezclan con el conjunto de
números del 1 a K.
148
Por ejemplo, supóngase que se necesita evaluar 500 árboles en un bosque para
venta en pie. Debido a que se hizo una primera aproximación de volúmenes con
o procedimiento dasométrico.
b. Se registra el volumen obtenido.
c. Se escoge un número (o elemento de rechazo) al azar del conjunto de enteros
entre 1 y K y los elementos o símbolos de rechazo mezclados.
6- Si el volumen X i el número aleatorio extraído, se mide el árbol lo mejor posible
para su cubicación, o se estima con una tabla de doble entrada, etc. Este volumen
es registrado como Yi volumen actualizado del pésimo árbol.
149
7- Si el volumen X i el número aleatorio extraído la aparición de un símbolo de
n Yi n
X Ri N
Y
ˆ
Y X i 1 i X i 1 ; X X i ; Ri i 7.17
n n i 1 Xi
siendo n número de árboles muestreados y medidos con precisión. Al terminar el
inventario debería tenerse que n n con alguna ligera variación.
Yi
en que sR2 es la varianza de las razones :
Xi
n
R R
2
i
sR2
sR2 i 1
sR2 7.19
n 1 n
150
8. ELEMENTOS DE MUESTREOS MULTIFASICOS
159
obviamente son independientes, y no sería fácil adoptar criterios para la segunda
con respecto a la primera, como la mejor disposición de las muestras en el campo.
Ello conduce con toda seguridad a un estimador de la razón en la segunda fase, ya
que ambos muestreos deberán ser proporcionales al área:
Yj
qj 8.1
Xj
6, su estimado tiene menor error estándar que el volumen promedio por estrato Y , a
pesar de muestras pequeñas. Sí el estimado del área puede obtenerse con menos
costo, con fotointerpretación por ejemplo, el volumen en el estrato j, V j puede
obtenerse del área del estrato j, a j y el volumen promedio por unidad de área en el
será:
Vj a j q j 8.2
obviamente ambas variables sujetas a errores de muestreo. El error estándar de tal
producto se obtiene con el método de propagación de los errores como
a 2j sq2j q 2j sa2j
s s
2
Vj
2
ajqj
a s q s
2 2
j qj
2 2
j aj 8.3
n k
en que n, número de muestras de campo para q j , y k número de fotomuestras para
fotomuestra.
Se dan entonces las dos alternativas posibles para determinar n y k, dependiendo sí
se desea el error estándar para un mínimo costo, o una segunda sí se acepta un
mínimo error estándar para un cierto costo concertado.
160
Lo anterior se resuelve desde el cálculo al diferenciar el producto Cse2 , en que se2 es
abC f abCc
a b
Cc Cf
n ; k 8.7
sV2j sV2j
En el segundo caso, se debe buscar que el error estándar sea un mínimo, en cuyo
caso con la metodología anterior se tendría:
aC bC
n ;y k 8.8
bCcC f aCc aCcC f bC f
sa j 1274 ; sa j % 70% .
sa j
Con estos datos y una probabilidad del 95%, a j t 1820 84.93 , con un error
k
de muestreo del 4.67%. Una muestra independiente de campo con n = 80 parcelas
de 1/20 de ha, dio el siguiente estimado de volumen promedio por ha,
3 3
q j 235.2 m ; sq j 122 m ; sq j % 52% . Con estos datos y una probabilidad
ha ha
sq j
del 95%, q j t 235.2 2 13.64 , con u error de muestreo del 11.59%. El
n
volumen total para el bosque se obtiene de las dos fases del muestreo al 95% de
probabilidades, como:
161
V j a j q j t a 2j sq2j q 2j sa2j 8.9
lo cual da: 428064,0 2 26758,84 m3 , o sea un error de muestreo del 12.5 %.
Asumiendo que la interpretación de una fotomuestra vale la centésima parte de una
unidad muestral de campo, también a manera de ejemplo, se podría escribir que
C f 1, con lo que Cc 100C f 100 , usando la ecuación (8.7) y la (8.3), se llega a un
cálculo de n = 78,15 y de k = 1054,58, lo que indica que se hubiera llegado a un
resultado equivalente, con 1054 fotomuestras y 78 medidas de campo. El costo
promedio de una parcela de campo en bosques tropicales puede asumirse cercano a
los $ 90.000, y para el ejemplo propuesto la fotointerpretación de una unidad sería
de $ 900, con lo cual el costo en el primer caso sería de $8'838.000, contra
$7'968.600, o sea una reducción del 9,9% en los costos, en el segundo caso.
Por ello se justifican los premuestreos, pues acá, se hubiera dejado de hacer 2
parcelas de campo, a costa de mas fotoparcelas, pero a menor costo.
8.1 Muestreo bifásico.
Este muestreo a veces diagnostico se aplica a poblaciones en las cuales es posible
conocer dos variables por unidad de muestreo. Existen dos modalidades principales:
con variable independiente totalmente conocida, como la que es posible extraer de
una ecuación de rendimientos por ejemplo o, con variable independiente estimada
en un submuestreo.
8.1.1 Muestreo bivariado con variable independiente conocida. Para este tipo de
muestreo se miden las variables dependiente e independiente en un número
determinado de parcelas al azar, preferiblemente > 30 en la primera fase, la segunda
fase conoce o mide solamente la variable independiente. Se acostumbra la regresión
lineal entre volumen y área basal, por ejemplo:
Yˆ b0 b1 X 8.10
El error estándar se calcula para el volumen de acuerdo con el de la regresión
modificada por el factor de corrección:
162
1 X r X 2
1
n
sY t t MSE n 8.11
n
xi X N
2
i 1
en que X r es el valor del área basal promedia real conocida y X el valor del área
basal obtenida en la muestra de la primera fase.
Figura 8.1 Población tipificada por área basal y volumen con 4 estratos
163
3
VC = volumen comercial m . Se estimó la relación de VC contra G, de
ha
acuerdo con el siguiente modelo de regresión lineal simple:
y sus
Estadisticos
Vc G
---------------------------------------
Muestra 14 14
Promedios 57,7 18,7714
Varianzas 978,582 128,351
Desv Standard 31,2823 11,3292
Error Standard 8,36054 3,02786
Minimo 15,0 2,6
Maximo 96,5 33,2
Coef de var 54,21% 60,35%
Sumas 807,8 262,8
---------------------------------------
m 3
con la cual se obtiene: Vˆ = 6.267 + 2.734×17.917 = 55.359
ha
164
m3
y Vˆ tot = 6.267 + 2.734×1.886,7 = 5.175,7
ha
sY t 0, 286076
100% 2.179 100% 2.11%
Y 55,359
8.1.2 doble muestreo bietápico. Se debe producir una estimación de ambas
variables, siendo más amplia la muestra para la variable independiente. Se puede,
con base en la fórmula conocida, calcular el tamaño de muestra de acuerdo con el
coeficiente de variación de la variable independiente y sólo cambia el error estándar
de estimación así:
1 X 1 X 2 n sy
2
1 1
n
sY s yx n
2
8.12 ,
n
xi X n1 n N
2
i 1
en que N = número de unidades muestrales de la población, n1 , número de
volumen.
8.2 Doble muestreo aleatorio con regresión para grandes áreas.
Fue propuesto inicialmente para bosques homogéneos de los grandes lagos del
Canadá. El sistema se cree aplicable a grandes extensiones de bosque homogéneo de
cualquier condición, incluido el bosque tropical, involucra un doble muestreo
sistemático, como se verá en el capítulo 10, con el uso de la regresión, pero con los
valores de arranque escogidos aleatoriamente, y con la ayuda de fotografías aéreas,
dada sus reducciones de costos sobre otros procesos similares de campo.
165
8.2.1 Manejo de las fotografías aéreas o sistemas de información geográfica
para el doble muestreo. Es necesaria la implementación de mediciones
volumétricas dentro de límites aceptables de precisión con el uso de los sistemas
mencionados, lo cual seguramente será producto de investigaciones al respecto.
Trochlil y Meyer citados por (Shiue y John, 1962) presentan datos de pruebas
realizadas a 11 intérpretes entrenados que logran valores dentro de la media de
25% un nivel del 99% de confianza y coeficientes de correlación desde 0,51 hasta
0,67 para 10 de ellos, con la connotación de que ni siquiera conocían el área de
estudio. Es claro además que el éxito de la fotointerpretación es inmensamente
dependiente de las habilidades individuales. Debería además tenerse información y
tablas de volumen de buena calidad, basadas en alturas de árboles y densidad o
diámetros de copa como las de (Avery y Meyer, 1959).
8.2.2 Doble muestreo. En este caso se trata de tomar una muestra de n individuos
de N. De esta muestra se toma otra submuestra de tamaño n1 , asumiendo por el
momento que ambas muestras son aleatorias. Cuando se usa el doble muestreo con
regresión las mismas variables se miden por diversos métodos en ambas muestras
con el fin de ajustar el modelo. El análisis de regresión propicia el método de
calibración para n, que en este caso podría ser una serie de parcelas establecidas en
fotografías aéreas o en procesos equivalentes en las cuales se posible estimar
volumen, alturas, diámetros de copa, densidades, etc. Esto posibilita un gran
número de parcelas a menor costo que los equivalentes de campo. Las n1 deberán
éxito del proceso depende también de la correlación entre las fotomedidas y las
medidas de campo tanto como las relaciones de los costos de ambos procesos.
Trabajando con unidades monetarias, cuando una parcela de campo puede alcanzar
entre nosotros un valor de aproximadamente 40.000 U (U: pesos, por ejemplo) , la
interpretación de una parcela en una fotografía aérea podría estar por los
alrededores de 700 U, o sea una relación de 1:57 y con coeficientes de correlación
esperados > 0.7. El doble muestreo llega a ser ventajoso siempre que se cumpla la
siguiente condición:
166
4 Cn1 Cn
2 8.13
C Cn
2
n1
en que Cn 0 y Cn y Cn1 son los costos de las fotoparcelas y del trabajo de campo.
El estimado del error estándar de la media con este método de diseño es dado según
(Cochran, 1953) como:
2
s yx s y2 s yx
2
sY 8.14 ,
n1 n
1 n1 n1
2
1 xi X 8.15
2
2
s yx y Y b 2
n1 2 i 1
i
i 1
desviaciones de los cuadrados medios de las regresiones, con las asunciones para
esta fórmula que tanto la muestra como la submuestra son aleatorias, que las
167
9. ARREGLO EN CLUSTER, MUESTREOS POLIETAPICOS
169
áreas, como los bosques tropicales, pues aunque se escogieran grandes unidades de
muestreo, estas podrían resultar con bajos volúmenes comerciales, o carecer de
especies importantes, como lo mostrado en la población # 4.
9.1 Muestreo bietápico de división homogénea.
Es de los polietápicos tal vez el más utilizado. Se llama de división homogénea
porque las unidades en cada etapa son iguales en tamaño y forma y se selecciona al
azar el mismo número de unidades secundarias por cada primaria, Figura 9.1. Se
basa en la descomposición de cada variable yij en los 3 componentes ya descritos en
las N j posibles dentro de cada primaria (j = 1, 2, ..., m). En sana lógica el subíndice
170
se trabaja en todos ellos. La nomenclatura usada será:
M, número de unidades primarias posibles para la población objeto del muestreo.
Generalmente bloques cuadrados, con las dimensiones que se reportan en el
capítulo I, de acuerdo con la superficie del bosque.
m, número de unidades primarias elegidas al azar de las M posibles.
N, número de unidades secundarias posibles en cada primaria (bloque).
n, número de unidades secundarias, elegidas al azar de las N posibles en cada
primaria.
yij , volumen de la iésima secundaria en la primaria j-ésima.
entre medias de las unidades primarias y sd2 como el estimado de la varianza dentro
n mn
se2 sd2
s2 9.5
n
en las que SSd o SCd , suma de cuadrados dentro y S e2 , es una varianza artificial
TOTAL mn-1
s s2
2
m mn j
sY2 1 1 9.6 ,
M m MN j mn j
de la cual salió la ecuación (9.2) en que s es reemplazado por sd y se suprimen los
cero, quedando pendiente solo de s2 o de sd2 , del factor de corrección y del número
172
nj
y Y
M
2
ij j
sd2 j 1 i 1
9.7
M n 1 j
por lo cual el error estándar del muestreo al azar restringido se evalúa como:
sd2
sY2 1 f 9.8
Mn j
como en un muestreo bietápico se eligen m < M bloques, entonces las relaciones:
2
m m s
1 0; y 1 0 9.9
M Mm
con lo cual el error estándar de un bietápico será mayor que el de un muestreo
aleatorio simple. Cuando todo el peso del error recae solamente en las unidades
secundarias, como en el caso de poblaciones que de pronto al final resultan muy
homogéneas, entonces s2 tiende a cero, por lo cual el sY2 en bloques se incrementa a
medida que estos sean más heterogéneos. Para que el componente bloque fuera = 0
se necesitaría que:
se2 sd2
0; o se2 sd2 9.10
n
lo que implicaría combinar un infinito número de unidades secundarias en una sola
primaria, sin incrementar el error estándar en comparación con el muestreo
estándar, el componente que lleva s2 puede eliminarse si este es cero o no difiere
sd2 s2
sd % 100%, s % 100% 9.12 .
Y Y
Con base en los anteriores se calcula la razón de variabilidad RV:
s %
RV 9.13 ,
sd %
que dan una vaga idea del porcentaje de ganancia obtenido al usar unidades
primarias, pues en la medida en que RV > 1, mejor sustentada la división
polietápica. De manera similar se produce el coeficiente de correlación entre
varianzas :
s2
9.14
sd2 s2
pues en la medida en que este tiende a cero, el error de muestreo tiende a
reducirse. Como ejemplo se presentará el inventario en bloques de la población
#1 con 11 bloques al azar y 7 muestras dentro de cada uno de ellos tomadas
aleatoriamente también, para tener una intensidad de muestreo semejante a la
174
del ejemplo mostrado en la sección 2.3, Tabla 9.2.
1 CII n7-m8-l9-m9-o9-m10-o10 191 229 339 176 155 375 184 1.649,0 433.325,0
2 DIII p11-s11-q12-t12-t13-p-14-t15 133 96 176 118 176 125 125 949,0 134.031,0
3 AIII b11-a12-b12-d12-a13-b13-d14 413 280 265 280 339 398 295 2.270,0 757.944,0
4 BII q6-h6-q7-i7-j7-f9-i10 346 125 288 303 222 398 339 2.021,0 632.703,0
5 DI r1-p2-q2-q3-r3-p4-r4 0 0 125 38 0 38 66 267,0 22.869,0
6 CI k1-n1-k3-l3-m3-o3-l4 0 0 148 103 59 110 81 501,0 54.655,0
7 CIII l11-m11-k12-o12-l13-m13-o15 221 221 258 74 96 206 170 1.246,0 250.274,0
8 AI a1-d1-d2-b3-a4-d4-d5 163 140 163 206 206 148 191 1.217,0 215.995,0
9 BI g1-i1-h2-j2-f4-h5-i5 125 148 265 110 148 140 110 1.046,0 173.458,0
10 BIII h11-i12-f13-i14-j14-i15 316 235 184 316 368 265 390 2.074,0 646.542,0
11 DIV s16-s17-t17-p19-q20-s20-t20 103 0 23 0 0 74 15 215,0 16.839,0
De la tabla se obtuvo:
SCd 245.084, 286; sd2 3713,398; SC 742.420,519; se2 74.242,052
s %
err 23,529; sd % 34,873%; s % 57, 443%; 1.647; F 19,993
sd %
0,731
Se ve que el promedio es casi igual en ambos procesos, pero además en este
muestreo se ve que el componente poblacional tiene una varianza muchísimo
mayor que el componente d.
La relación de ambos coeficientes de variación de 1.6472 muestra la gran variación
poblacional y la significancia de la diferencia de s con cero se hace obvia al ver el
175
estándar, de 12.88 contra 18.03 como era de esperarse por el efecto de los bloques.
9.1.3 Estimado del número de unidades. Todo diseño de muestreo debe
considerar una serie de circunstancias estadísticas y financieras, pero especialmente
el muestreo cluster, en que no solo se deberá juzgar la precisión, si no las economías
generadas al reducir tiempos de marcha y concentrar la toma de información, sobre
todo en áreas de difícil acceso. Ello conlleva por fuerza un aspecto financiero que es
necesario optimizar para lo cual deberá considerarse el costo total del trabajo de
campo desagregado en dos componentes: c1 , costo o tiempo para el acceso y
establecimiento de una unidad primaria, como traslado de campamentos, personal,
etc y los tiempos que ello conlleva. c2 , costos o tiempo para el establecimiento y
medición de una unidad secundaria, desde el campamento de la primaria. El costo
total será:
s2 sd2 c s2
Cs mc1 mnc2
2
c1s2 1 d nc2 s2 c2 sd2 9.16 .
Y m mn n
Derivando con respecto a n, se obtiene:
176
para una relación dada de variabilidades y costos, que coincide con la propuesta de
(Husch, 1982):
c1 sd2
n 9.18 .
c2 s2
Se pueden cambiar los ci por ti , en caso de conocerse los tiempos en vez de los
s2
t 2 s2 d
n
m 9.19 ,
t 2 sd2
2
E s
2
M N
177
3.173, 4
4 10.075,5
n
1´500.000 3.713, 4
4; m 4
13 .
35.000 10.075,5 4 3.173, 4
26, 21 10.075,5
2
16 1600
Los resultados surgen de la Tabla 9.3.
De la tabla se obtuvo:
SCd 63.681.5; sd2 1.632,859; SC 529.962, 269; se2 44.163,5224
s %
err 17,991; sd % 23, 721%; s % 60,53%; 2.551; F 27, 046
sd %
en los cuales se observa un menor sesgo con respecto al muestreo anterior y un
error de muestreo del 17.99%, muy cercano al propuesto, aunque el número de
unidades primarias debió estar más cercano a 14. Con estos resultados es posible
darse cuenta de la efectividad de estos muestreos.
9.1.3.3 Estimado práctico de los números de unidades. Como se vio en los
calcularlas, a menos que se haga un muestreo piloto que resulta bastante costoso,
178
aunque meritorio en grandes extensiones por las implicaciones económicas vistas.
De todos modos es la propuesta más acertada. Cuando ello no es posible, calcular la
primera de tales relaciones no es difícil, por ejemplo en las condiciones nuestras es
sd2 s2 son más o menos comunes valores de 0.3 a 0.4, que pueden servir de
referencia.
9.2 Muestreos sistemáticos cluster con arranques aleatorios múltiples.
Este es en realidad un caso especial de los muestreos cluster. Estrictamente
hablando el muestreo sistemático se asemeja siempre a uno de estos muestreos
(Sukhatme, 1954), equivalente a una muestra de 1 (un) cluster seleccionado de M de
ellos, de N elementos (tamaño del cluster) de acuerdo con la Tabla 9.4
179
los elementos del mismo cluster, en términos de las varianzas entre cluster, dentro de
ellos y la varianza total, de acuerdo con (Sukhatme, 1954), así:
M 1 2 1 2
sb sd
M N
MN 1 2
9.21
s
MN
N M 1 1
ER 9.22
MN 1 1 N 1
cuando los cluster son formados aleatoriamente, los valores esperados de sd2 y Nsb2
Si los clusters son formados por un patrón sistemático, ejemplo por grupos de
elementos mecánicamente espaciados distribuidos uniformemente sobre la
población objeto, la varianza dentro sd2 tiende a ser mayor que aquella entre clusters
Nsb2 , lo que conduce a valores negativos de , por lo cual la eficiencia relativa del
muestreo sistemático será mayor que la del aleatorio simple.
9.2.2 Indice g. (Smith, 1938; citado por Sihue, 1960) propuso un índice para
relacionar la varianza entre sb2 y la de la población total, así:
s2
s g
2
b 9.24
N
180
g < 1. Cuando el cluster es formado aleatoriamente g = 1. Para los clusters
s2
Nsb2 s 2 ; o sb2 s 2 9.25
N
o sea que si se desea retener la relación (9.24) entonces deberá resultar g > 1. Al
respecto la Tabla 9.5 tomada de (Shiue,1960), muestra los coeficientes de
correlación y de g de muestreos de cluster sistemáticos de diferentes tamaños,
para refrendar lo anterior de un estudio de caso:
9.2.3 Valor negativo de b. (Jessen, 1942) postulaba que la varianza dentro sd2 de
los cluster, es una función monotónica creciente del tamaño de ellos, dada por
sd2 aN b 9.26 ,
181
aleatorios y estratificados, dependiendo claro está de la población objeto. Sin
embargo (Gautschi, 1956; Sukhatme, 1954: citados por Siuhe 1960) muestran lo
siguiente con respecto a las esperanzas
1- Para muestreos aleatorios:
182
En resumen, por lo antes visto, el muestreo sistemático es insesgado, consistente y
eficiente cuando no se da la resonancia, pero no da suficiente información para el
cálculo de la varianza con una sola partida aleatoria.
9.2.5 Proceso de muestreo en sí. Para poblaciones que han sido sistemáticamente
agrupadas en clusters como las de la Tabla 9.4, se seleccionan varios números < M,
que serán escogidos como muestra. Ejemplo, sean los números seleccionados i, j, k,
entonces la muestra incluirá los individuos con las siguientes series:
Arranque aleatorio #1: i, i+M, i+2M.... i+(N-1)M
Arranque aleatorio #2: j, j+M, j+2M.... j+(N-1)M
Arranque aleatorio #3: k, k+M, k+2M.... k+(N-1)M
que constituyen una muestra sistemática con tres partidas aleatorias, y que se
asemeja a un muestreo cluster en el cual la varianza dentro de los grupos ha sido
maximizada al repartir los elementos uniformemente dentro de cada uno de ellos.
Para calcular los estimados de la media y varianza cada partida aleatoria es tratada
como un cluster, y se usan las fórmulas convencionales de ese tipo de muestreo
(teniendo en cuenta que para la se2 se tienen N-1 grados de libertad), excepto para
183
Figura 9.2 a) Muestreo cluster corriente, b) con partidas aleatorias
A B C D
1 163 191 191 140 250 133 125 184 148 206 0 15 0 0 44 0 23 0 0 30
2 155 133 170 163 206 176 243 265 170 110 125 0 15 81 110 0 125 38 15 59
3 221 206 170 194 214 133 103 222 184 206 148 103 59 8 110 15 38 0 0 30 I
4 206 140 155 148 191 148 280 170 148 199 176 81 44 30 0 38 38 66 66 38
5 125 103 148 191 184 163 163 140 110 148 184 191 110 66 89 0 0 118 59 38
6 280 309 271 288 163 324 346 125 184 214 250 214 148 176 103 74 89 8 0 0
7 316 250 169 339 346 339 288 258 303 222 176 250 169 191 133 191 155 89 38 8
8 265 346 331 265 258 214 361 324 229 309 243 346 229 206 110 133 148 170 66 89 II
9 280 354 309 375 125 398 346 383 221 250 221 339 176 89 155 89 235 214 199 118
10 125 176 331 346 383 206 316 331 339 199 295 235 375 206 184 301 148 199 103 155
11 346 413 316 273 221 441 413 316 214 243 301 221 221 148 110 133 148 235 96 206
12 280 265 199 280 176 229 354 235 184 229 258 229 163 110 74 163 176 140 133 118
13 339 398 250 339 273 316 325 250 184 324 316 96 206 303 191 243 133 280 74 176 III
14 346 346 258 295 288 288 368 206 368 265 324 199 118 155 265 125 199 155 273 250
15 163 273 81 214 206 243 214 258 390 118 191 148 214 89 170 184 110 125 191 155
16 273 163 148 163 103 214 184 155 221 229 199 118 155 265 125 199 155 125 103 89
17 133 184 191 148 199 191 191 184 140 221 110 15 51 23 30 110 66 51 0 23
18 163 250 243 125 176 206 191 163 221 243 133 44 0 23 0 0 44 38 51 44 IV
19 96 206 199 199 229 148 155 155 118 199 89 0 125 23 8 8 0 0 0 38
20 235 229 221 163 118 191 59 235 140 148 23 23 0 0 0 15 0 38 74 15
a b c d e f g h i j k l m n o p q r s t
185
9.3 Muestreo sistemático doble por regresión con partidas múltiples aleatorias.
Se presenta este método alternativo como una forma de disminuir costos y tiempo.
Cuando se combina doble muestreo, recordar capítulo 8, análisis de regresión y
partidas múltiples aleatorias, el diseño de muestreo para el propuesto inventario
será de la siguiente forma:
1- La población se divide en M partidas aleatorias cada una de las cuales contendrá
N elementos.
2- De esta población de M partidas aleatorias se selecionarán m1 partidas al azar,
3-De los m1 se toma otra muestra de m y los mN serán medidos en una muestra
las xij de las fotos y las yij de campo para cada parcela. En este procedimiento se
1 C1 P1 184 148 89 38 383 199 184 155 206 118 170 155 118 148 0 15 2.310 454.634
2 C2 P2 214 206 110 30 258 309 110 89 273 324 191 176 176 243 0 44 2.753 622.221
3 C3 P3 133 243 0 125 250 288 250 155 265 354 229 176 184 191 15 66 2.924 678.208
4 C4 P4 170 222 59 0 331 324 229 170 250 250 206 280 243 163 0 38 2.935 710.441
5 C5 P5 140 148 0 0 288 184 176 0 273 214 148 96 163 221 265 103 2.419 496.969
Yˆ Y b X X 9.30
en que Yˆ es la media poblacional estimada, y
m
Y i
Y i 1
9.31
m
media de medidas de campo para las m partidas aleatorias,
186
N
y ij
Yi j 1
9.32
N
media de las medidas de campo en la iésima partida aleatoria de la muestra m.
m1
X i
X i 1
9.33
m1
media de las fotopartidas aleatorias para la muestra m1 .
N
x ij
Xi j 1
9.34
N
media de las foto parcelas para la iesima partida aleatoria.
m
X i
X i 1
9.35
m
media de las fotopartidas aleatorias para la muestra m.
m
Y Y X
i i X
b i 1
m 9.36
X X
2
i
i 1
m 1 2 Cm
2 1 9.37 .
m1 Cm
Al sustituir los valores del fotomuestreo dejado planteado en el capítulo 8, con
0.7, Cm 700,0; Cm 40.000,0 , se obtiene una relación igual a 0.135, lo que
1
188
10. INVENTARIO FORESTAL CONTINUO Y MUESTREO SECUENCIAL.
189
la propuesta por (Loetsch y Haller,1964). De acuerdo con ella se llamará "período A",
al período inicial de medición, en el cual un atributo X, será medido o enumerado en
n A unidades de muestreo. En el período siguiente, "período B" el valor del mismo
atributo que por convención se llamará Y será medido o enumerado en nB unidades
n At
temporales.
determina el estadístico muestral Y que estimará al parámetro poblacional y , con
Yp np n
sus estimados, a partir de las permanentes y Yt de las Bt temporales, y los
y sy sy p s yt
estimados de , que serán , y Las regresiones de Y en X se calculan para
np xy
las parcelas , con lo cual se tiene un estimado de la covarianza y de su
E sxy xy ; y E r 10.2
190
10.2 Estimación del volumen establecido.
El volumen establecido, en pie o permanente, es también llamado el volumen
corriente, el volumen de las existencias presentes en los rodales o el bosque en el
momento de la medición, alguno de los momentos A o B ya definidos, o en
posteriores ocasiones. El volumen corriente promedio por ha, o el volumen presente
y
inventario continuo es entonces obtener el mejor estimado, eficiente de . En la
y
significa que es el mejor estimado buscado de . Lo más importante que subyace
detrás del inventario forestal continuo es la aplicación de técnicas de análisis de
regresión a muestreos sucesivos de muestras de un determinado tamaño y que
consecuente con ello los costos en la ocasión B se reduzcan al mínimo. Se pueden
resumir los objetivos de este tipo de muestreos (Lema, 1986) como:
- Estimar parámetros y características en un primer inventario,
- Repetir el suceso varias veces, para lo cual cada primer inventario es el del período
anterior, y
- Estimar los cambios del bosque entre los años extremos del período.
información que pueda mejorar este estimado, por lo cual acá, Yb Yt y el calculo del
191
error estándar será entonces:
s y2t y2
s
2
Yb
estima 10.3
nBt nBt
Puede definirse aca una regresión de Y en X, pero ninguna información adicional útil
se obtiene de x que permita mejorar los estimados, por lo cual se tiene entonces:
2
s yp y2
Yb Yp y, s 2
Yb
estima 10.4 .
np np
10.2.3 Estimación del volumen establecido midiendo parcelas permanentes y
temporales en A y sólo permanentes en B. Se pueden estimar X p , X t y Yp . Puede
n p X p nAt X t
X 10.5 ,
nA
la cual sustituida en la ecuación de regresión permite obtener:
Yb Yp bxy X X p 10.6 ,
en que bxy , es obviamente el coeficiente de regresión de Y en X. El error standard
1 r 2 r 2
sY2b s y2
np
10.7 .
nA
La otra forma, da un resultado idéntico sin necesidad de combinar X p y X t X ,
192
Yb aYp bX t cX p 10.8 ,
en que a, b, y c, son constantes. Como Yb y Yp son las esperanzas del mismo
y2 b2 x2 2b x y b2 x2
Y2b 10.11 ,
np nAt
2b
d Y2b 2
2b x y 2b x2 2 x
db np
x
np
nAt
n p nAt
b x nAt y nAt b x n p 10.12
la cual igualada a cero da:
y nAt y nAt
b x nAt n p y nAt 0 b
x nAt n p
x nA
10.13
Por las propiedades de la regresión se puede ver que para las dadas entre Y en X y
entre X en Y se tienen los coeficientes:
y x
yx ; y xy 10.14
x y
por lo que la constante b de (10.13) es idéntica a
n At
b yx 10.15
nA
193
y2 nA2t 2 y2 nA2t 2 y2 2 2 y2 nAt
Y2b 10.16
np nA2 n p nA2 nA n p
reescribible como:
y2
Y2b 2
n np
n 2
A nA2t 2 nA2t n p 2 2nA nA2t 2 10.17
A
1
2
2
Y2b y2 10.18 ,
np
nA
ecuación igual a la ya obtenida (10.7). Entonces, el mejor estimado de y se obtiene
calculando:
nAt
Yb Yp byx X X p Yp byx X t X p 10.19 , en que
nA
np
x i X p yi Y p
byx i 1
np 10.20
x Xp
2
i
i 1
período A entonces:
nAt
1 fA Yb Yp 1 f A byx X t X p 10.21 , y:
nA
1 r r
2
2
s s
2
Yb
2
yp 10.22
np nA
cuyo resultado significa que el estimado de Yb es suficientemente preciso sí en el
194
10.2.4 Estimación del volumen establecido midiendo parcelas permanentes y
Yb a X t X p cYp 1 c Yt 10.24 ,
con varianza para Yb dada por:
1 1 c y 2ac x y 1 c y
2 2 2
Y2b a 2 x2
nA n p n p
10.25 .
t np nBt
a 2 x2 a 2 x2 c y y 2c y c y 2ac x y
2 2 2 2 2 2
2
Yb
10.26 .
nAt np np nBt nBt nBt np
d Y2b 2 x
d a nAt n p
n p x2 nAt a x nAt c y 10.27
d Y2b 2 y
d c nAt n p
n Bt c y n p y n p c y nBt a x 10.28
de las cuales se obtienen a y c así
y n pn A n pn At
a t
; c 10.29 .
x n An B n A n B 2
t t
n n
A B n At n Bt 2
y
El mejor estimado de será entonces (10.24), con
195
sy n pn At n pn At
a r ; y c 10.30 .
sx n An B n At n Bt r 2
n n
A B n At n Bt r 2
El error standard de b, se puede obtener como:
c 2 1 c 2acrsx s y
2
1 1
s a s
2
s y2
2 2
nA n p np 10.31 .
nBt
Yb x
t np
denominará :
y x, b Yb X b 10.32 .
Como en el muestreo anterior se dan las cuatro situaciones ya anotadas.
10.3.1 Estimación de las diferencias del volumen midiendo únicamente
nAt Xt .
parcelas temporales en A y en B. En el período A se miden nAt y se obtiene
nAt nBt
En el período siguiente B se miden independientes de las anteriores, , y se
obtiene
Yt . El estimado de puede obtenerse como:
b Yt X t 10.33 ,
b
sin que pueda estimarse alguna covarianza, por lo que únicamente la varianza de
podrá obtenerse como:
y2 x2
2
b 10.34
nBt nAt
yi xi yi xi i
b Yp X p i 1 i 1
i 1
i 1
10.35
np np np
Esta diferencia puede obtenerse de las medias muestrales o de las observaciones
2 y2 2 xy x2
2
b 10.36
np np
2 y2 2 x y x2
2
b 10.37 ,
np np
en que se debería obtener un error standard considerablemente mas pequeño que el
error del numeral 10.3.1, en caso que la correlación resulte significativa.
y2 2b x y b2 x2 1 b x2
2
b 10.40 .
np nAt
197
d 2b 2b 2
x 2 x y
2b x2 2 x2
10.41
d b np np
que es igual a:
d 2b 2 x
d b n p nAt
nAt b x nAt y n pb x n p x 10.42
la cual igualada a cero da:
d 2b 0 b
d b
x
nAt n p nAt y n p x 10.43 ,
de donde:
nAt y n p x
b 10.44
nA x
np
Si se escribe f A en vez de para la fracción de parcelas permanentes en el
nA
período A entonces
b 1 f A yx f A f A yx yx f A 10.45
El mejor estimado de será entonces:
198
permita otro buen estimado para x :
b Yb X b 10.48 .
Para Yb ya se habían presentado las ecuaciones (10.24) y (10.30) para las cuales
X b ax Yt Yp cx X p 1 cx X t 10.50
La varianza de
X b , calculada por método diferencial de propagación de los errores
se obtiene como:
y2 y2 cx2 x2 2ac x y 1 cx x2
2
Xb
a
nB n p n p
2
x 10.51 .
t n p nAt
Con ayuda del cálculo diferencial de esta ecuación pueden eliminarse a x y c x así:
x n pn B n pn Bt
ax t
; cx 10.52
y n An B n A n B 2
t t
n n
A B n At n Bt 2
x
en que: xy con las cuales se puede derivar:
y
b Yt 1 ax cy X t 1 ay cx Yp ax cy X p a y cx 10.54
Si se denotan:
A ax c y ; y B a y c x 10.55 ,
se puede escribir (10.54) como:
b AYp BX p 1 A Yt 1 B X t 10.56 ,
en que A y B también son
199
A
n p xyn Bt n A ; B
n p xyn At n B 10.57 .
n n
A B n At n Bt 2
n n
A B n At n Bt 2
La fórmula para la varianza de Δb, también por medio del método diferencial de
propagación de los errores se obtiene como:
A2 y2 2 AB x y B 2 x2 1 A y2 1 B x2
2
b 10.58 .
np nBt nAt
200
temporales de períodos anteriores, etc. Quizás lo que más influye sería lo relativo a
los costos, sus relaciones entre temporales y permanentes y los de mantenimiento.
10.4 Costos en inventarios continuos.
El diseño del inventario continuo es laborioso. Existen propuestas como las de
funciones de Lagrange que permitiría acercarse algo a los diseños óptimos. Como el
tema es complejo se puede acudir a un estudio de (Ware y Cunia, 1962), para
resolver algunas inquietudes al respecto, basadas en la razón de costos con respecto
a la estimación del volumen promedio de las existencias en el segundo período,
C nBt ct n pc p 10.58 ,
en que c t , costo por parcela temporal, c p costo por parcela permanente. Las
nA 1
2
c y2 n A c t 1 2
np
2
t
cp 1 ;
2
n Bt 2 2 1
Y cp
10.59 ,
b
en que Yb , es la precisión exigida del estimado del volumen en la ocasión B. La
2
np 1
2
c
fA
nA
2
t
cp 1 10.60 ,
2
que se considera una buena opción ya que el único valor extraño es el coeficiente de
correlación, lo cual permite cálculos para varios de ellos o hacer un premuestreo que
nos de su valor probable.
10.5 muestreo secuencial.
Está constituido, como en el caso anterior, por una serie de muestras cada una de
las cuales incluye todas las unidades de muestreo anterior, pudiéndose despreciar el
tiempo transcurrido entre dos muestras sucesivas o considerarlas simultáneas. Este
tipo de muestreos es de carácter decisorio acerca de ciertos fenómenos de una
población con una muestra relativamente reducida. (FAO, 1974) reporta el siguiente
201
ejemplo que da una idea del proceso. Supóngase que es necesario decidir entre
limpiar o no una plantación de maleza. Se divide la plantación en líneas iguales de a
20 plantas. Las líneas se seleccionan al azar constituyendo las muestras sucesivas
en cada una de las cuales se registra el número total de plantas sin maleza. Cada
muestra extraída, incluye las de la muestra anterior y algunas adicionales, y así
sucesivamente. En un plano cartesiano se coloca en las abscisas el número de
árboles observados por muestra y en el de las ordenadas el número de árboles libres
de maleza en cada muestra. Además se incluyen en dicho gráfico dos líneas
paralelas que dividen el plano en tres regiones que permitan decidir sobre limpia
innecesaria, continúa el muestreo o limpia necesaria, Figura 10.1.
202
11. PLANIFICACION Y EJECUCION DE LOS INVENTARIOS
203
11.1.1 Preparación del inventario. Como parte dominante de la rutina total,
debiera involucrar a todos los especialistas que esperan la información, acá se puede
definir la naturaleza y complejidad del inventario. Cuando no es posible lo anterior o
haya vacíos entre quienes manejarían los resultados, o no fuera posible contactar a
los especialistas, o queden dudas acerca de los verdaderos objetivos pretendidos, la
utilización de otros inventarios realizados podría subsanar en parte el procedimiento.
Aunque los objetivos pueden evolucionar durante el proceso, se debe dejar acabada
en un alto porcentaje su filosofía, especialmente en eventos de cierta complejidad. La
preparación del inventario debe entonces priorizar ciertas etapas, iniciando con los
objetivos.
11.1.2 Prioridad de los objetivos. Esta prioridad debe responder a las siguientes
preguntas: ¿Qué y cómo se busca la información?. A veces aparecen objetivos
paralelos, lo que implica reforzar ambas facetas pero recalcando que la naturaleza
misma de cada una de estas actividades puede ser fundamental, y que el logro de
una de ellas, puede abaratar (o encarecer) y mejorar (o deteriorar) el otro objetivo.
Una buena técnica sería una encuesta metódica en la que no sobre ninguna
pregunta y quizás en que sea más el "descarte" que la suma de elementos,
configurando un especie de inventario de inquietudes, enmarcados casi siempre
criterios de cuantificación y/o reconocimiento.
La cuantificación busca generalmente aquellos indicadores importantes a la
silvicultura y a la economía: volumen/ha, área basal/ha, número de árboles/ha,
volúmenes comerciales. El reconocimiento puede buscar especies, su repartición,
estado sanitario, posición sociológica, estado del bosque, posibilidades económicas,
aspectos científicos, naturaleza del bosque, tipos de suelos, aspectos sociales,
técnicos o políticos. De esta fuente informativa deben salir claramente definidos los
objetivos básicos del inventario, teniendo en cuenta que cualquier información
adicional solicitada con posterioridad puede perturbar y encarecer el proceso a
límites insospechados. Es necesario recordar que prioridad y economía van
estrechamente ligadas en el proceso. No definir las prioridades en el contexto
económico puede traer repercusiones multiplicativas de toda índole, hasta volver
ineficiente el proceso.
204
11.1.3 Prioridades externas o concomitantes. Son aquellas generalmente
temporales, económicas y procedimentales que acompañan la labor. Las temporales,
hacen referencia a la disponibilidad de tiempo para recabar la información,
constituyéndose casi en una prioridad tipo uno, debido a su costo, por las muchas
implicaciones que este genera en equipos, instrumentos, mano de obra y capitales,
si se manejara el concepto de lucro cesante. Es necesario un cronograma más o
menos rígido que defina la temporalidad de las labores, sin mucha oportunidad de
cambios improvisados.
Las prioridades económicas, rigen en gran parte la marcha futura del proceso, y
algunas veces lo definen y lo controlan tanto, que pasando por encima de las
necesidades básicas lo manejan totalmente como el capital disponible. Un capital fijo
atenúa las exigencias que puedan hacerse acerca de la precisión.
Las prioridades procedimentales, salen a flote en varias etapas del proceso. Son las
que surgen precisamente de una buena planificación, como toma de decisiones
sobre el diseño más apropiado, tamaño de parcelas y configuración de los equipos.
11.1.4 Información adicional. Por la naturaleza económica y logística misma del
proceso, los costos generados para la recolección de cierta información adicional se
vuelven insignificantes, como la simple observación rutinaria volcable a un
formulario sin detenimiento de los tiempos de marcha, sobre todo en áreas sin
inventariación previa. Otro tipo de información, puede ocasionar por el contrario
grandes insumos de tiempo y gastos y si es necesaria deberá programarse con sus
respectivos costos en el esquema total.
Entre la información adicional fácil de tomar está: la pendiente, obstáculos en el
terreno, forma aproximada del bosque, áreas con pantanos, lagunas, estado del
suelo con respecto a posibles vías de extracción, presencia o ausencia de
regeneración natural. En resumen, la que pueda dar un conocimiento primario del
bosque.
11.2 Información característica para el logro de los objetivos. Cada inventario
requiere de una información específica que soporte y sustente las etapas posteriores,
después de definir lo que se busca, y como se busca.
11.2.1 Area de inventariación. Debe quedar totalmente definida, antes de abordar
205
el proceso. Cuando no es posible se debe acudir a métodos económicos para
lograrla, aunque sea una primera aproximación. Es necesaria toda la información
gráfica posible: mapas, fotografías aéreas y planos existentes. El área controla gran
parte de los cálculos futuros del inventario.
11.2.2 Definición de áreas secundarias. Es necesario llegar con cierto grado de
precisión a definir áreas importantes dentro del área total como los estratos. Esto
puede hacerse por condiciones ecológicas, edad, uso de la tierra ordenación y
manejo y topografía, con base en visitas de campo o con ayuda de sensores remotos.
11.2.3 Características específicas de las ayudas gráficas. De acuerdo con los
objetivos es preciso definir escalas para mapas y fotos.
En cuanto a los mapas es deseable ampliarlos, las fotos aéreas deben seleccionarse
de acuerdo con unas condiciones previas: tamaño, economía y necesidades del
bosque y de quien solicita la información. Cartográficamente es indispensable un
buen plano del bosque que indique: escala, orientación y límites de los estratos o
parcelas trazadas con el máximo de precisión, a escala siguiera entre 1:2000 a
1:10.000, de acuerdo con la extensión del bosque, con el fin de ser utilizados por
cada equipo de inventario, o por lo menos su área correspondiente. Estos planos
deberán tener elementos auxiliares, rejilla kilométrica y otros detalles
suplementarios que ayuden a encontrar lo más fácilmente posible las parcelas.
11.2.4 Definición de precisión. De acuerdo con la finalidad última o con otras
necesidades, es prioritario definir, a un nivel dado de probabilidad, la precisión con
la cual se esperan los estimados.
Generalmente se asume el error de muestreo como el parámetro más importante de
ser determinado antes de iniciar la labor, pues controla en gran parte el proceso,
sobre todo en lo referente al número de muestras necesarias para satisfacerlo.
Generalmente se trabaja con el 95% de confianza estadística.
Es común en inventarios referirse sólo al error de muestreo, que es solo una parte
del error total y calculado con base en los datos de los parámetros medidos en las
unidades de muestreo. Este mide apenas la precisión en sentido estadístico. Pero la
otra parte, el sesgo, que puede resultar de los procedimientos de muestreo en sí
(tamaño de parcelas, equipos humanos y técnicas utilizadas, descuido o mal manejo
206
de la toma de información, etc.), pocas veces es evaluado, llegando a ser el concepto
menos estudiado, como se abordará sucintamente más adelante. El error debe
manejarse con concepciones éticas del proceso. En la medida que el trabajo sea
efectuado con unos patrones de comportamientos rigurosos en cuanto a la toma de
la información, será disminuido hasta los límites posibles físicos esta parte del error
total. A veces, es más necesario controlar esta parte del proceso que la misma
precisión estadística. Podría presumirse que los patrones regulares de
comportamiento para la toma de la información, en la medida que se sistematizan
así sea no muy técnicamente, reducen los errores de muestreo.Con respecto a la
definición y concertación de la precisión y error total debe quedar constancia de
ambas instancias.
El error total, debe quedar claro, hasta en forma contractual. Es vital esta parte del
proceso y debe definirse de antemano ya que ciertos errores, cuantitativos y
cualitativos obligarán a reparar aquellas parcelas en las cuales sean detectados. Por
ejemplo con respecto al área de la unidad, elementos faltantes o sobrantes en ella,
errores groseros en la toma de la información.
Con respecto a la definición de la precisión, debe referirse a la población principal
objeto del inventario, ya que no es lo mismo calcularla para el volumen total (que
generalmente la gobierna), que para el volumen de determinadas especies u otras
características, como los rangos de utilización. Por ello, debe quedar definido el
concepto poblacional que sea soporte del error. No obstante lo anterior, en caso de
entregar otros parámetros, se deben acompañar de sus respectivos errores, para no
utilizar información que supere ciertos límites de confianza.
11.3 Información general.
Orienta el proceso a cualquiera que deba tomar parte en él o en etapas posteriores a
las mencionadas: funciones, labores y otros informes enmarcables en un esquema
simple.
11.3.1 Responsabilidad del Proceso. Es necesario definir la autoridad del
proceso, así como una división del trabajo y repartición de responsabilidades: un
director general, coordinadores de área para manejo de equipos, entrenamiento,
consecución de personal, material y de procesos logísticos físicos de manejo de la
207
información. A lo sumo dos ó tres personas de acuerdo con una red diseñada de
funciones y tiempos.
11.3.2 Información básica. Toda la información necesaria que posibilite el proceso,
desde apoyos logísticos, gráficos, estudios e informes anteriores, que puedan
subsanar alguna carencia informativa como la sociología de la zona, disponibilidad
de mano de obra, grado cultural, salarios medios, estado de vías, costos de acceso,
facilidades de transporte, climatología, grados de dificultad posibles, etc.
11.3.3 Recursos disponibles. Lista de elementos como transporte, personal,
equipos de medición, tablas auxiliares (de altimetrías, conicidad, y volumen
especialmente) y de otros equipos (de campaña, oficina, etc.)
11.3.4 Redacción resumida del proyecto. Para evitar malas adaptaciones o
interpretaciones debe redactarse el proyecto, con una introducción, descripción del
bosque y los planteamientos esenciales del inventario, los objetivos, fichas para el
terreno, convenciones que permitan escribir lo menos posible en el campo para
especies, parámetros necesarios, y todos los elementos que al ignorarlos perturben el
normal desarrollo de la actividad.
11.4 Diseño del muestreo. Consideraciones Generales.
Se hará énfasis que es la parte vital del proceso de muestreo.
11.4.1 Premuestreo o muestreo piloto. Sin exagerar, por encima de muchas
consideraciones técnicas, este da las claves precisas para un buen inventario. Sería
una fase obligatoria por su primer efecto de tipo económico. Por ser un muestreo a
pequeña escala, una vez confirmado puede reproducirse a niveles macro. Las
decisiones salidas de él tienen carácter lo más estable posible sin fuertes
transformaciones posteriores, por sus efectos financieros y logísticos. Su primera
labor es verificadora en múltiples instancias y correctora en otras y sobre todo
fijador de las pautas estadísticas con un buen nivel de aproximación. De él se espera
la información global que cubra desde el tamaño, forma y número de las unidades
de muestreo, hasta dejar funcionando lo más perfectamente posible los formularios y
equipos de personal y de campo, así como estimadores insesgados, dentro de lo
posible, de los parámetros del bosque.
11.4.1.1 Tamaño y forma de las parcelas. Dado que los estadísticos pueden ser
208
obtenidos con parcelas de cualquier tamaño y forma, aunque la precisión y costos
puedan variar significativamente, se debe tener en cuenta que las unidades
pequeñas de muestreo pueden resultar más eficientes que otras mayores para una
misma intensidad, aunque hay un límite para ello, de acuerdo con lo estudiado en el
capítulo 1 con respecto al aumento del coeficiente de variación, sobre todo cuando
su número es grande ya que se aumentan los grados de libertad. Existe un óptimo
tamaño aunque difícil de hallar, que será abordado al final del capítulo.
Se puede generalizar que la mejor parcela es aquella que reúna un número
representativo de árboles de modo que su tiempo de medición sea un mínimo. (Spur,
1953) recomienda que el tamaño mínimo de una parcela debe contener unos 20
elementos para rodales densos de pequeños árboles para que puedan funcionar
perfectamente. Una forma práctica de operar consiste en establecer series
concéntricas de parcelas de diferentes tamaños, contabilizando de acuerdo con la
magnitud de las características mensurables como se aprecia en la Figura 11.1
aunque realmente no existen criterios definidos acerca del tamaño y forma de ellas.
209
desde el premuestreo pues cambios posteriores tendrían una incidencia marcada en
costos, por tiempos residuales que detienen la labor fundamental.
Un buen formulario de campo no necesita mucha explicación. Sin embargo, cada
uno debe quedar descrito en el proyecto de modo que se eviten dudas en el campo,
ante la ausencia del responsable. Debe ser claro, normativo, secuencial y permitir
una manipulación fácil y efectiva de la información, sobre todo en la fase final de
cálculos. Por contener la información de primera fuente, se vuelven intocables una
vez concluida la labor. En lo posible, deben reportar los errores y no permitir
enmendaduras. Los datos equivocados deben adoptar una convención para no
tenerlos en cuenta. No deben ser traslados a limpio.
Se deben calificar en el premuestreo, o sea desarrollar toda una labor evaluativa que
abarca todo el lapso desde su concepción, hasta su uso final con ensayos
generalmente de prueba y error, en que debe participar desde el director del proceso
hasta los operativos que los manejarán en el campo.
11.4.1.4 Entrenamiento de los equipos. Otra labor importante que vuelve valioso
el premuestreo, pues busca calificar a los operarios en toda la actividad secuencial.
Debe cumplir varias fases importantes como: dar a conocer las decisiones
importantes acerca de las técnicas de muestreo a utilizar y la forma de hacerlo
eficientemente, calificación de la destreza adquirida en la ubicación de sitios por
medio del manejo de brújulas, mapas y fotos aéreas, equipos de medición,
formularios, habilidad de orientación, y por último, generar una normatividad para
acciones de último momento o que cambien bruscamente, sin que se altere la
secuencia fundamental ni el espíritu del muestreo.
Un equipo normalmente estará compuesto por tres o cuatro personas, de las cuales
una se encarga de la dirección de la toma de muestra y de la supervisión de la
calidad del trabajo efectuado. Habitualmente el jefe hace de apuntador. Las otras
personas hacen de orientadoras (dirección de las líneas, distancia entre parcelas,
etc.) y el operador quien toma medidas, pinta árboles, ayuda en la determinación de
las parcelas, además de un trabajador de campo.
Es imposible dar un estimativo del número de parcelas logradas/equipo/día, pues
ello depende de la dificultad de acceso al bosque, distancia entre parcelas,
210
vegetación, además de lo complejo o no de las medidas a tomar, y de la capacidad
personal de los integrantes. Se podría fijar un poco, un límite de rendimiento por
día, de acuerdo con el premuestreo. En condiciones de topografía accidentada difícil
es posible lograr unas 2 a 3 parcelas de 1/40 de ha. En condiciones cómodas hasta
4- 5 parcelas día, aunque esto pueda resultar bastante relativo. El premuestreo
colabora en esta decisión.
11.4.1.5 Decisiones lógico matemática y cálculos. En el premuestreo se puede
detectar una serie de problemas acerca de la conveniencia e inconveniencia de
ciertos procesos matemáticos, que no pueden dejarse para la fase efectiva del
proceso, ya que conducirán a la cuantificación final de los datos. Concluido el
premuestreo, deberán quedar tomadas las decisiones acerca de las tablas de
volumen, tipos de instrumentos, unidades, relaciones a utilizar, norma final de los
procedimientos de cálculo y la forma de lograrlos, programas de computadora, etc.
11.4.1.6 Mérito fundamental del premuestreo. Bien concebido, es el instrumento
logístico-estadístico que permite dar el veredicto de la forma más eficiente del método
de muestreo, del número de muestras necesarias a partir de coeficientes de variación
y de los errores obtenidos en primera instancia. Se puede afirmar entonces que es en
pequeña escala el proceso global y que requiere, guardadas las proporciones, el
mismo cuidado del proceso total.
11.5 Diseño de muestreo en sí.
Una vez analizada suficientemente la etapa anterior, que no debiera eliminarse
nunca, se busca corrección a los desajustes encontrados y afinar completamente las
diferentes bases estructuradas en cronogramas o diagramas de Pert, que conduzcan
a un manejo integral del proceso. Al final, se dará sintéticamente una lista de
actividades que podrían ser base para abordar cualquier proceso, ya que bastará
repetir lo enunciado para el premuestreo. La labor tiene mucho de técnica, de
ciencia, pero sobre todo una parte experimental e intuitiva que irá acrecentándose
con el tiempo. Se quiere dejar constancia que es una labor de equipo más que de
personas individuales cuando se superan ciertas extensiones y objetivos.
11.6 Labores esquemáticas para un inventario.
Más que unos conceptos es una lista de ellas con algunos comentarios.
211
11.6.1 Personal especializado. En lo posible el personal debe ser especializado en
todas las acciones que requiera el inventario (Ingenieros Forestales, otros
profesionales, personal de computador).
11.6.2 Definición de objetivos. Priorización de ellos. Objetivos básico vs
necesidades fundamentales de información. Objetivos secundarios- Información
adicional.
11.6.3 Información básica de soporte. Superficie. Posibles estratos. Mapas.
Fotografías aéreas u otros sensores remotos. Visitas de campo previas. Informes
preliminares o antecedentes
11.6.4 Definiciones acerca de la presentación de la información. Concertación
entre contratante y equipo técnico sobre lo que se espera de la información y su
presentación posterior.
11.6.5 Definición de la precisión. Error de muestreo. Elemento vital por su
incidencia económica, estadística y legal.
11.6.6 Generalidades. Responsable del proceso. Director. Funciones del personal
especializado. Asesoría- Otros datos adicionales del área sujeta al proceso. Tipología
de bosques. Condiciones ecológicas. Usos de la tierra. Variaciones paramétricas
obtenibles de estudios anteriores, fuentes de comparación. Condiciones topográficas.
Localización global. Accesibilidad y formas de transporte. Estado de las vías.
Proyecciones de aprovechamiento. Costos generales.
11.6.7 Recursos disponibles. Transporte- Personal- Equipos de toda índole
(medición y campaña).
11.6.8 Procedimientos de medición. Manejo, delimitación y ubicación de las
parcelas.- División técnica del trabajo de campo. Asignación de funciones Definición
de responsabilidades.- Instrucciones precisas para localización, cambio, replanteo de
elementos de muestreo, datos importantes, otras informaciones.
11.6.9 Soporte logístico. Personal de la zona, búsqueda y contratación (cocina,
guías, trocheros, reconocedores), lugar de acampada. Decisiones de campamento.
Comunicaciones. Generación de convenciones útiles. Provisiones (alojamiento,
alimentación, botiquín). transporte interno. Auxilios.
11.6.10 Cálculos definitivos. Instrucciones de proceso, en campo, en oficina, otras
212
formas y tiempos. Almacén lógico. Conjunto de fórmulas y alternativas para diversas
situaciones. Tablas estadísticas. Cálculo de errores. Fórmulas y otros para
verificación.
11.6.11 Análisis de la información de campo Verificación por sorteo de alguna
información. Toma de decisiones. Errores físicos de muestreo (Físico en toma de
datos). Replanteamientos y repetición de procesos.
11.6.12 Presupuesto Desglosado por ítem intentando agotar temas.
11.6.13 Cronograma exacto de actividades. Diagrama de flujo, barras o PERT.
11.6.14 Informe final. Plan general (puede contener todos, algunos u otros de los
ítem anteriores). Tiempo de labores (desde la planificación hasta la entrega del
informe). Correcciones de forma y fondo. Forma de publicación- Distribución-
Análisis de costos- Análisis y entrega de la información final.
11.7. Realización del inventario.
Puesta en práctica de todo lo planificado. Se da una lista de actividades comunes,
que a pesar de haberse planificado necesitan de la ayuda de los equipos ya
configurados o de un personal entrenado para llevar lo planificado a la práctica.
11.7.1 Preparación de los documentos de campo. Cada equipo debe manejar
sobre el terreno: un paquete de formularios, unas ayudas y códigos, el plan del
inventario, una serie de tablas para ayudas eventuales, como las de corrección, muy
útiles en casos excepcionales. Estas son de dos tipos: para corregir longitudes entre
parcelas cuando la pendiente del terreno supera los 4o (7%) y para corregir árboles
límites de parcelas en similares condiciones. El uso del primer tipo de corrección es
obligatorio. La segunda es de acuerdo con la ubicación de la parcelas y el lugar
mismo, sobre todo en casos de duda (sólo en parcelas muy densas se presenta esta
situación).
11.7.1.1 Corrección de distancias por pendiente. Las distancias entre parcelas se
conciben en inventarios en proyección horizontal, pero en el campo varían de
situación. Ello precisa una corrección, sobre todo en el muestreo tipo conglomerado,
o en el de fajas continuas si se esperan estimadores de la razón insesgados. La
siguiente ecuación permite el cálculo de la corrección relativa en función de la
pendiente entre dos parcelas (y no del terreno) en grados:
213
do
d 11.1
cos
distancia L de más, sobre los 50 m iniciales: L = 50×13,257 100 = 6,63 m., o sea, que
en el terreno, de acuerdo con el corrector de la tabla, corr se deberá medir 56,63 m
entre esas parcelas.
corr
d do 1 11.3
100
11.7.1.2 Regla de corrección para parcelas en terreno inclinado. Cuando se
trabaja con cintas métricas y parcelas circulares y se desea una superficie S, se
214
puede corregir el radio en el terreno de la siguiente manera:
S R
R ; Rcorr 11.4
cos
11.7.2.1 Línea madre. Pica principal. Es una línea real que debe trazarse en el
campo para servir de referencia no sólo a la líneas secundarias, sino como auxiliar
para desplazamientos en el bosque. Tiene dos versiones: La línea recta que se
localiza aproximadamente en el centro del bosque, la cual se traza y se acota
siquiera cada 50 m, para funciones de apoyo, y la que sigue un accidente geográfico,
como cursos de agua, caminos de herradura en las cimas de las montañas u otros
que sean mas fácilmente referenciables y acotables que la definida antes. Para las
demarcaciones se acostumbra generalmente el uso de estacas con marcas en papel
de aluminio y cintas plásticas de diversos colores.
11.7.2.2 Picas Secundarias-Picas. Líneas que sorteadas al azar contendrán las
unidades muestrales. Se acotan también cada cierto número de metros y a la vez
sirven como sustento de muestra y ayudan para los desplazamientos. La
preparación del trayecto debe ser precisa y lo mas ágil posible, en la repartición de
áreas entre los equipos y en la determinación secuencial de cubrir la zona asignada.
Para ello se deben estudiar los mínimos recorridos en tiempo y espacio.
11.7.3 Establecimiento de las parcelas. Las parcelas se ubican con centro en las
picas. En primer lugar se marcan los árboles límite de modo que garanticen las
áreas escogidas, con las marcas hacia el centro de parcela. Luego se procede a
marcar secuencialmente los árboles, a medida que se van midiendo.
Al que genere duda como sujeto de medición para una parcela, se adopta por
convención que si su centro queda dentro de ella se asume completo. En caso de
216
duda, se puede tomar como medio árbol, y se acepta también que pueda tomarse
una decisión sorteada al azar para tomarlo y dejarlo, Figura 11.3.
11.7.4 Parcela límite. Son aquellas parcelas cuyo centro se encuentra muy cerca
de la frontera del bosque.
217
Es la medida determinante y la que por descuido puede arrastrar más errores. La
altura, siempre es un parámetro difícil de estimar. Se recomienda tomar un
porcentaje de árboles por parcela con todo el cuidado posible representativo de las
clases diamétricas para luego entrar a establecer regresiones por parcela, o
generales dependiendo del ajuste obtenido
218
11.8 Sesgos y errores de medida.
El concepto de sesgo estadístico se estudió en el capítulo I. Pero esTe término se
refiere también a otras estimaciones obtenidas para una muestra y a veces a las del
error de muestreo (FAO, 1974). Por ejemplo si el área basal de los árboles se mide
con una cinta que lee 25 cm en vez de 24, sin más fuentes de error. Cada árbol
E gˆ de la media de todas las muestras será g 1,08506 g con lo cual el sesgo que
muy convencionalmente se le denomina B, será:
B g g g r 1 r1 g 11.5
r, la razón entre las mediciones defectuosa y la verdadera y r1 r 1.
Otros sesgos se dan al usar parcelas de diferentes tamaños como sucede con el
n n
estimador de la razón N: q yi
i 1
x
i 1
i ya conocido. En este caso se trata de un
219
diseños eficientes es algo complicado por la gran cantidad de circunstancias que
rodean el concepto, como la imposibilidad de considerar todos los diseños cuando
se selecciona alguno. En términos generales como se vio en los diferentes capítulos
muchas decisiones se hacen de antemano, con base en experiencias previas.
Es posible que exista un diseño óptimo para cada conjunto de características, pero
son casi impensables, por lo cual la mayoría de las veces el inventariador se
contenta con lograr siquiera el número adecuado de parcelas.
Quedaría entonces por estimar los sesgos y errores de medida y además, queda el
problema que lo óptimo para un parámetro puede no serlo para otro, por ejemplo
para volumen total, diferente al volumen comercial. Por ello la definición del error se
hará con base en la población objeto principal.
Por último el error de muestreo depende de la variabilidad de los parámetros, por lo
cual se obtienen en general de muestreos piloto, que no necesariamente coinciden
con la realidad total, apareciendo un nuevo sesgo. De todos modos es posible una
formulación matemática para logra un diseño eficiente.-
11.9.1 Formulación matemática para la optimización. Si se expresa la precisión
del muestreo por el error standard (SE) como el elemento más representativo para
ello y los costos por C, estas variables son funciones de las características del
diseño, como el número de parcelas, el tamaño, la forma de ellas, etc.
Sea entonces X X1 , X 2 , , X p una serie de tales características, por ejemplo en un
SE f1 X 1 , X 2 , , X p f1 X
11.6
C f2 X1 , X 2 , , X p f2 X
Se pueden hacer varias suposiciones.
11.9.1 1 Formulación para costo fijo. Asúmase que el costo fijo es C 0 . Se trata
f1 X 1 , X 2 , , X p min cuando
11.7
f2 X1, X 2 , , X p C0
Esto es solucionable con multiplicadores de Lagrange, resolviendo el siguiente
220
, X p,
sistema de p 1 ecuaciones con los p i valores desconocidos: 1 2
X,X ,
,
X 1 0 , X 2 0 , , X p 0 ,
que daría: :
f1 X f X
2 0
X1 X1
f1 X f2 X
0
X 2 X 2
11.8
f1 X f X
2 0
X p X p
f 2 X 1, X 2 , , X p C 0 0
f1 X f 2 X
en que y son las derivadas parciales del error estándar y costos
X i X i
con respecto a una característica dada.
11.9.1 2 Formulación para una precisión deseada. Asúmase que el SE es fijo.
Se trata entonces de minimizar el C , o sea tener:
221
f1 X f X
2 0
X1 X1
f1 X f X
2 0
X 2 X 2
11.10
f1 X f X
2 0
X p X p
f 1 X 1, X 2 , , X p SE 0 0
Por ejemplo asúmase que se ha encontrado con base en un premuestreo, en
forma empírica que:
a log S b
SE y C c1 c 2n c 3nS 11.11
nS
con S, área de la parcela, n, tamaño muestral, a y b, obtenibles de regresión,
c1, c 2 y c 3 costo fijo, costo de acceso a una parcela y costo de medición,
por (11.8):
f1 X f X
2 0
S S
f1 X f2 X
0 11.12
n n
c1 c 2n c 3nS C 0 0
Al eliminar de las dos primeras ecuaciones, se tiene:
f1 X f 2 X f1 X f 2 X
0 11.13
S n n S
y al reemplazar estas derivadas por sus valores en (11.13), después de
simplificar se encuentra la solución que optimiza el tamaño de la parcela
muestral, como:
222
c b
log S0 2 1 2 0 11.14
c2 a
que gráficamente se halla en forma sencilla como la abscisa S del punto donde
se cortan las funciones :
c1 b
Y log S ; contra Y 2 S 2 11.15
c2 a
C0 c1
c1 c 2n 0 c 3n 0S0 C0 n0 11.12
c 2 c 3S0
11.9.2 Optimización de un diseño de inventario. Ya se había expresado que
un diseño se considera eficiente cuando da un error de muestreo muy pequeño
para un costo dado, o el más barato para un error permisible. Surgen las
mismas inquietudes que para diseñar los muestreos pero aumentadas además,
pues un inventario puede contener varios procesos de muestreo, diferentes
incluso entre sí, como sería el caso de los muestreos polifásicos o polietápicos
por ejemplo, en que entra el muestreo de áreas basales por un lado y volúmenes
por el otro. También se dan dudas sobre elegir entre parcelas de tamaño fijo
contra las de este variable, que en plantaciones podrían ser mas eficientes. Por
otro lado la eficiencia de un muestreo casi siempre sólo es medible a posteriori.
Quedan muchos elementos subjetivos alrededor de este tema, por lo cual se
acepta, para la mayoría de estos procesos, por lo menos una buena estimación
del costo general y del tamaño de la muestra.
11.9.3 Tamaño y forma de los elementos de muestreo.
11.9.3.1 tamaño. En el capítulo 1 se mostró la relación entre el tamaño de las
parcelas y el coeficiente de variación. Se ha encontrado (FAO, 1974) que una
posible relación empírica los ligaría así:
y
CV CV ka c log log k c log a 11.13
Y
en que y desviación promedia de los valores del parámetro buscado, a,
223
Cuando la distribución de los valores es aleatoria por parcela, c= 0,5, como en la
distribución de Poisson. Resulta interesante comparar los diferentes tamaños de
elementos de muestreo, con la misma intensidad de él, para un muestreo
aleatorio simple, en cuyo caso para n parcelas na , sería constante. En este caso
el error típico relativo de la media sería:
Y2 Y
e
Y
Y
n
k a k a 0,5c 11.14 .
Para la mayoría de los parámetros buscados en bosques tropicales naturales
c 0,5 (FAO, 1974). De acuerdo con esta última expresión, dentro de ciertos
límites, cuanto menor sean las unidades de muestra mejor la precisión para una
determinada intensidad.
Acá se presenta un interesante discusión, afirman muchos inventariadores que
una parcela de muestreo debería reflejar el comportamiento a pequeña escala del
bosque, para lo cual hablan de parcelas de tamaño razonable, llegando a
proponer como solución más o menos adecuada parcelas entre 0,4 y 0,5 ha para
el bosque tropical. Es claro que se trata de algo complicado estadísticamente
hablando, pero cuando se identifica un espacio muestral se espera que la
esperanza de algún parámetro se conserve dentro de ciertos límites, pues si no
fuera así se trataría de otro espacio muestral en cuyo caso se debería estratificar.
Surgen otros elementos, a pesar de lo anterior, parcelas muy pequeñas en
bosque natural aumentan los errores de borde para la muestra total comparada
con las parcelas grandes, por el factor de área. Entonces se precisaría de alguna
manera para cierto tipo de inventarios acudir a la optimización que ayude a la
solución de estas inquietudes.
En Colombia, el costo de muestreo haría impracticable el uso de del tamaño
razonable que recomienda (FAO, 1974). Muchas experiencias de trabajos en
bosques tropicales en el país han mostrado buenos resultados con parcelas de
1/10 de ha, incluso hasta de 1/20, para bosques no muy disturbados, de 1/40
para rastrojos altos, y hasta de 1/100 para rastrojos bajos. En plantaciones
forestales de coníferas, (Vélez, 1985) encontró para P, patula, que con parcelas
224
circulares de 235 m2 se alcanzaban muestreos óptimos, por lo cual no es extraño
sb2
sY2 11.15
nM
225
con
sb2 varianza entre conglomerados, obtenida con las sumas de los valores de
El valor de
sw2 , se da empíricamente luego de muchas simulaciones como:
sw2 M 11.17 .
Con y constantes positivas independientes de M. Si se tiene una función de
costos parecida a la de un muestreo bietápico:
s 2 M 1 M 1
sY2 11.19
n ,
para un costo total dado:
C nC1 nMC2 C0 11.20 .
Aplicando los procedimientos vistos de optimización, se puede encontrar que el
M0
valor óptimo de M se da aproximadamente por la siguiente expresión:
226
12. REALIZACION DEL INVENTARIO
Los documentos de campo que cada equipo debe manejar sobre el terreno son: un paquete
de formularios, unas ayudas, códigos para ciertas labores o variables, el plan del inventario,
una serie de tablas para ayudas eventuales, sobre todo de correcciones de pendientes o de
radios de parcelas. De estas ya se esbozó su estructura en el numeral anterior. falta
mencionar algunas tablas de corrección que serán muy útiles en casos excepcionales.
Estas tablas son de dos tipos: para corregir longitudes entre parcelas cuando el terreno
presenta pendientes pronunciadas y tablas para corregir árboles límites de parcelas cuando
estas quedan en pendiente fuerte.
El uso del primer tipo de corrección es obligatorio cuando la pendiente supera los 4o, un 7%
de pendiente, La segunda es de acuerdo con la ubicación de la parcelas y el lugar mismo,
sobre todo en casos de duda (sólo en parcelas muy densas se presenta esta situación.
Las distancias entre parcelas se conciben en inventarios en proyección horizontal, pero sus
medidas en el campo varían de acuerdo con ciertas situaciones. Para ello se precisa una
corrección, sobre todo en el muestreo tipo conglomerado, o en el de fajas continuas si se
esperan estimadores de la razón insesgados. La siguiente ecuación permite el cálculo de la
corrección de las distancias horizontales (dh) a las distancias inclinadas (di) en función de la
pendiente entre dos parcelas, y no del terreno, en grados así:
dh
di=
cos
lo cual se materializa en la tabla 33, para dicha corrección. Por ejemplo, si se detecta una
pendiente entre parcelas (en un mapa, foto, o en campo se mide una pendiente promedia en
el terreno
una distancia L = 1.13257*50 = 56.62 m sobre la pendiente.
Tabla de factores para corrección por pendientes.
4 1.002442 31 1.166633
5 1.00382 32 1.179178
6 1.005508 33 1.192363
7 1.00751 34 1.206218
8 1.009828 35 1.220775
9 1.012465 36 1.236068
10 1.015427 37 1.252136
11 1.018717 38 1.269018
12 1.022341 39 1.28676
13 1.026304 40 1.305407
14 1.030614 41 1.325013
15 1.035276 42 1.345633
16 1.040299 43 1.367327
17 1.045692 44 1.390164
18 1.051462 45 1.414214
19 1.057621 46 1.439557
20 1.064178 47 1.466279
21 1.071145 48 1.494477
22 1.078535 49 1.524253
23 1.08636 50 1.555724
24 1.094636 51 1.589016
25 1.103378 52 1.624269
26 1.112602 53 1.66164
27 1.122326 54 1.701302
28 1.13257 55 1.743447
29 1.143354 56 1.788292
30 1.154701 57 1.836078
Cuando se trabaja con cintas métricas y parcelas circulares y se desea una superficie S, se
puede corregir el radio en el terreno de la siguiente manera:
S
R=
S
; R= 2
cos
S = Superficie de la parcela, tabla xxx. Si las pendientes varían en diferentes direcciones se
puede utilizar la Tabla para aplicarla en tres o cuatro direcciones.
La preparación del trayecto coincide con la ubicación en los mapas de los lugares posibles
de muestreo: para ello se parte de una línea madre (pica principal) y líneas auxiliares (picas)
los cuales se escogen sistemáticamente o al azar de acuerdo con el diseño escogido. Tanto la
línea madre como las picas deberán identificarse por número y el rumbo que deben seguir.
La preparación del trayecto debe ser precisa y lo mas ágil posible, ya que permite, en primer
lugar repartición de áreas entre los equipos y en segundo lugar determinar secuencialmente
la forma de cubrir la zona asignada. Para ello se deben estudiar los mínimos recorridos en
tiempo y espacio.
La línea madre, es una línea real que debe trazarse en el campo y la cual sirve de referencia
no sólo a la líneas secundarias, sino que es una buena auxiliar para los desplazamientos en
el bosque. Tiene dos versiones:
1- La línea recta que se localiza aproximadamente en el centro del bosque, la cual se traza y
se acota cada 50 m, o cada que por visualización lo exija la topografía, dejándola estacada
para funciones de apoyo.
Para las demarcaciones se acostumbra generalmente el uso de estacas con marcas en papel
de aluminio y cintas plásticas de diversos colores, que deben flotar al viento.
Son las líneas que sorteadas al azar contendrán las unidades muestrales. Se acotan
tambien cada cierto número de metros y a la vez sirven como sustento de muestra, ayudan
al desplazamiento de los equipos.
Las parcelas se ubican con centro en las picas. En primer lugar se deben marcar los árboles
límite por fuera de ellas, de modo que se garanticen las áreas/parcela escogidas. Las
marcas deben mirar al centro de la parcela. Luego se procede a marcar secuencialmente los
árboles, a medida que se van midiendo. Si el terreno es pendiente, dependiendo del tamaño
de la parcela y de la pendiente en varias direcciones se hacen las correcciones sugeridas.
Se denomina árbol límite al que genere duda en cuanto a entrar o no en una parcela. Se
estima por convención que si su centro queda al interior de la parcela, este árbol se localiza
en ella. En caso de duda, se puede tomar como medio árbol, y se acepta también que pueda
tomarse una decisión sorteada al azar para tomarlo y dejarlo.
Son aquellas parcelas cuyo centro se encuentra muy cerca de la frontera del bosque. Se
presentan varias situaciones. Si el límite es interno, separador de dos parcelas o bloques,
etc. que hacen parte de una unidad de inventario, se reporta la parcela como normal,
cuando su centro se localiza internamente en el bloque o estrato. Cuando el límite cruza la
parcela, es necesario considerar la ubicación del centro de la parcela:
- Si el centro coincide (cosa muy rara) se podría definir por sorteo al azar, si se considera o
dentro o afuera.
- Si el centro queda interior, a veces se acostumbra correr la parcela hasta una posición
tangente a la frontera. Esta teoría que condujo a producir estimadores de razón, sigue
utilizándose sobre todo en muestreos simples al azar y en conglomerados de parcelas sobre
líneas en fajas, ya se sabe que utiliza el criterio del estimador. (Acetato 13)
Las medidas sobre las parcelas serán todas aquellas que generen los formularios, los cuales
habrán de estudiarse por equipo antes de emprender la toma de la muestra. Se hará énfasis
en la toma de diámetros y alturas.
El diámetro se tomará a todas las unidades de la parcela, bien sea como tal, siguiendo las
normas que tiene la IUFRO para árboles en diversas circunstancias (como bambas,
divididos, con engrosamientos, etc.) o con base en circunferencia a la altura del pecho. Es la
medida determinante y la que por descuido puede arrastrar mas errores.
Las demás observaciones que no impliquen recargos de tiempo y costos deberán tomarse
cuando se juzguen importantes por parte del jefe de equipo.
Se quiere recalcar que el éxito final de un inventario radica en la bondad de los datos de
campo y que no existen procedimientos compensatorios diferentes a la repetición cuando
estos se pueden poner en duda, lo cual incidirá notablemente en el costo económico final.
Es una buena práctica sobre todo para aquellos inventarios que por sus características
requieren comprobación posterior sobre un porcentaje de líneas tomadas al azar. Cada
legislación-país, debe tener un acuerdo que defina el sesgo tolerable entre la información
anotada en un formulario y la encontrada en la etapa final de verificación, debiendo quedar
constancia de esta situación en el contrato que liga a la empresa o entidad contratante y la
inventariadora.