Documentos de Académico
Documentos de Profesional
Documentos de Cultura
net/publication/262443478
Article in Investigaciones Geograficas : Boletin - Instituto de Geografia, Universidad Nacional, Autonoma de Mexico · August 2003
CITATIONS READS
67 1,748
3 authors, including:
Some of the authors of this publication are also working on these related projects:
Dinámica del uso del suelo y cambio climático en la planeación sistemática para la conservación : un caso de estudio en la cuenca Grijalva-Usumacinta
View project
All content following this page was uploaded by Jean François Mas on 15 August 2014.
Resumen. Antes de ser utilizados para tomar decisiones, los mapas temáticos, las bases de datos cartográficos y las
imágenes clasificadas, deben ser evaluados para conocer su confiabilidad. Este artículo presenta una revisión de la
literatura especializada sobre el proceso de evaluación de la confiabilidad temática y puede ser utilizado como guía
práctica para llevar a cabo este tipo de evaluaciones.
*Instituto de Geografía-UNAM, Sede Morelia, Aquiles Serdán 382, Colonia Centro Histórico, CP 58000, Morelia,
Michoacán. E-mail: jfmas@igiris.igeograf.unam.mx
Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega
los pixeles. Estos dos tipos de error están fusiones que presenta (Congalton y Green,
estrechamente ligados y es difícil separarlos 1993). El proceso de evaluación de la confia-
(Chrtsman, 1989). Aspinall y Pearson (1995) bilidad temática se divide en tres etapas
distinguen un tercer componente de error (Stehman y Czaplewski,1998).
potencial en los mapas temáticos, el cual se
atribuye a la heterogeneidad dentro de un a) El diseño del muestreo que consiste en la
polígono. selección de las unidades de muestreo.
1. Muestreo aleatorio
2. Aleatorio estratificado
3. Sistemático
4. Sistemático no alineado
5. Por conglomerados
Figura 3. Tamaño de muestra necesario para alcanzar un error estándar de 0.05 en función del tamaño
de la población (tomado de Stehman, 2001). El tamaño de la población está representado en escala
logarítmica log10(N).
filas y las columnas. Este proceso modifica la confiabilidad de cada una de las clases
los valores de la diagonal y permite calcular de la leyenda como: a) la confiabilidad del
un valor de confiabilidad global normalizado usuario, que puede interpretarse como la
que representa mejor la calidad del mapa, probabilidad que un sitio clasificado como A
porque incorpora información de los elemen- y aleatoriamente seleccionado sea realmente
tos fuera de la diagonal. Según Congalton, la A en el terreno, y b) la confiabilidad del pro-
normalización de la matriz permite una com- ductor, que es la proporción de sitios de veri-
paración más objetiva entre matrices deriva- ficación de la clase A que están represen-
das de diferentes procesos de evaluación. tados en el mapa o en la base de datos
Sin embargo, Stehman (1997) está en desa- como tal (Janssen y van der Wel, 1994). Los
cuerdo con esta normalización, porque no valores de confiabilidad del usuario y del
permite obtener estimaciones consistentes. productor están relacionadas respectiva-
Se entiende por consistencia que la estima- mente con los errores de comisión y omisión.
ción de algún parámetro con base en una Aronoff (1982) define el riesgo del productor
muestra se vuelve exactamente igual al valor como el hecho de rechazar un mapa acep-
del parámetro en la población cuando la table y el riesgo del usuario, aceptar un ma-
muestra es igual a la población (n = N). pa no confiable.
Stehman (1997) demuestra que las estima-
ciones de confiabilidad derivadas de una La confiabilidad promedio es el promedio de
matriz normalizada no son consistentes con los valores de confianza de cada categoría.
las derivadas de una matriz basada en toda
Es, por lo tanto, un índice de confiabilidad
la población y recomienda no usar matrices
que da el mismo peso a todas las categorías
normalizadas.
independientemente de la superficie que
cubren.
Con base en la matriz de confusión, se
desarrollaron varios índices de confiabilidad A continuación se presenta un mapa para
(Stehman y Czaplewski, 1998) que se des- el cual se verificaron en campo 15 sitios
criben a continuación: de verificación seleccionados con base en
un muestreo aleatorio (Figura 4). La com-
Si el diseño de muestreo es aleatorio simple, paración entre los mapas y la información
la confiabilidad global {proporción de los si- de campo permitió elaborar la matriz de
tios de verificación correctamente clasifica- confusión y calcular los índices de confia-
dos en la base cartográfica) se obtiene bilidad (Tabla 2), en este ejemplo, la con-
dividiendo los elementos de la diagonal con fiabilidad global es de 67% (10 sitios co-
el número total de sitios de verificación. Este rrectamente identificados de un total de 15).
valor representa la probabilidad para cual-
quier sitio en el mapa de ser correctamente Los índices de confiabilidad descritos ante-
clasificado. En el caso de muestreo aleatorio riormente no toman en cuenta los elementos
estratificado, el número de sitios por cate- fuera de la diagonal de la matriz (Rosenfield
goría ya no es proporcional a la superficie y Fitzpatrick-Lins, 1986). Por esta razón, se
cubierta por cada categoría y el valor ob- generalizó el uso del coeficiente de Kappa,
tenido no se puede interpretar de esta que utiliza las sumas marginales de la matriz
manera. Por ello se tienen que hacer y da cuenta de la contribución del azar en la
las correcciones necesarias con base en las confiabilidad del mapa. Para los cálculos que
probabilidades de inclusión del muestreo se describen a continuación, es conveniente
(Card, 1982). expresar los valores de la matriz en pro-
porción del número total de sitios (Tabla 3).
Existen también índices que dan cuenta de
Mapa
A 2 2 0 0 50.0 50.0
B 1 2 0 0 33.3 66.7
C 0 0 2 2 50.0 50.0
D 0 0 0 4 0.0 100.0
Error Omis.: error de omisión, Error Com.: error de comisión, Conf. prod. confia-
bilidad del productor, Conf. us.: confiabilidad del usuario.
cíente de Kappa, se evalúa primero la apor- importa que cierta proporción del mapa esté
tación del azar Pc que es igual a la suma de correcta debido al azar (Turk, 1979). Por
los productos de las sumas marginales de la tanto, no es lógico restar la contribución
matriz. Para la matriz de la tabla 4, Pc = 0.2 * del azar a la calidad del mapa, por lo cual
0.27 + 0.27 * 0.20 + 0.13 * 0.27 + 0.4 * 0.27 Stehman (1997) considera que el índice de
= 0.25 y el coeficiente de Kappa K - (0.67- Kappa no es un buen índice de la calidad
0.25)/(1-0.25) = 0.56. de un mapa y es más apropiado cuando se
pretende evaluar diferentes métodos de
Un coeficiente de Kappa de 0.56 significa clasificación.
que la clasificación es 56% mejor que la con-
fiabilidad esperada, asignando aleatoria- Todos los índices descritos anteriormente,
mente una categoría de cobertura a los polí- menos los derivados del enfoque difuso,
gonos (Dicks y Lo, 1990). Muchos autores no consideran de la misma manera todos los
están de acuerdo con la manera de estimar errores. Sin embargo, ciertos errores son
la contribución del azar y existen algunas más perjudiciales que otros según el objetivo
variantes en el cálculo del índice de de esfuerzo cartográfico; por ejemplo, si se
Kappa, que utilizan otras formas de evaluarla utiliza un mapa de uso del suelo y vege-
(Foody, 1992; Ma y Redmond, 1995; tación para calcular la superficie boscosa
Stehman, 1997). El coeficiente de Kappa es de una región, la confusión entre bosque de
válido para un muestreo aleatorio simple encino y bosque mesófilo es menos grave
(Congalton, 1988b). Stehman (1996) pro- que entre bosque de encino y pastizal. Si el
pone un método para calcular el valor de objetivo es cartografiar el hábitat de un orga-
Kappa y su varianza para los muestreos nismo que se circunscribe al bosque mesófi-
aleatorios estratificados. El índice de Kappa lo, este mismo error se vuelve más crítico.
resta la contribución teórica del azar a la Naesset (1996) desarrolla índices que toman
confiabilidad y da un resultado siempre infe-
en cuenta la gravedad del error en el cálculo
rior o igual a la confiabilidad global. Sin em-
de los índices de confiabilidad.
bargo, para el usuario de un mapa no
Mapa
Ref. A B C D Total Conf. prod. Kappa
A 0.13 0.13 0.00 0.00 0.27 0.50 0.38
B 0.07 0.13 0.00 0.00 0.20 0.67 0.58
C 0.00 0.00 0.13 0.13 0.27 0.50 0.38
D 0.00 0.00 0.00 0.27 0.27 1.00 1.00
Total 0-20 0.27 0.13 0.40
Conf. us.o 0.67 0.50 1.00 0.67
Kappa 0.55 0.32 1.00 0.55
Conf. prod.: confiabilidad del productor; Conf. us.: confiabilidad del usuario.
Figura 5. Muestreo aleatorio simple (ocho sitios al azar) y aleatorio estratificado (cuatro sitios al azar por
categoría). Este último permite una mejor repartición de los sitios de verificación entre las diferentes
categorías del mapa.
do. Otro ejemplo de evaluación basada en el de muestreo más importante en las clases
supuesto anterior es la utilización de líneas forestales, lo que permite una precisión ma-
de vuelo de fotografías aéreas o de video- yor y un esfuerzo menor en las demás cate-
grafía que cruzan el área cartografiada y gorías, resultando en una precisión menor en
conforman una cobertura parcial de esta la estimación de la confiabilidad de estas
última, como fue el caso del Inventario Fo- categorías.
restal Nacional 2000 (Peralta-Higuera et al.,
2001; Mas et al., 2001; Figura 6). En todo Con el fin de utilizar el número de sitios de
rigor, la evaluación de la confiabilidad que se muestreo mínimo para obtener la precisión
deriva de estas fotografías es únicamente deseada, se puede utilizar un método iterati-
válida para el área cubierta por las líneas de vo (Sánchez-Colón, comunicación personal).
vuelo. Sin embargo, estas líneas de vuelo En una primera etapa se determina el
cubren el territorio nacional de manera ho- número de sitios de muestreo para tener
mogénea y sistemática, por lo que se puede un nivel de confianza aceptable (por ejemplo
formular la hipótesis de que no existe sesgo, * < 10%) con un nivel de confiabilidad alto
esto es, que la porción del territorio que (80 o 90%). Para las clases que presentan
corresponde a las líneas de vuelo es repre- un nivel de confiabilidad bajo, el intervalo de
sentativa del conjunto del territorio y, por confianza será muy grande y se analizarán
tanto, los resultados obtenidos son también sitios adicionales para reducir este intervalo.
válidos para la parte no cubierta por las fotos Por ejemplo, se evalúa la confiabilidad de
aéreas (Mas et al., 2002). 3 clases con 50 unidades de muestreo por
clase. Para 2 de ellas se obtiene 96% ± 5.4
Con el fin de reducir el número de sitios de y 10% ± 8.3 respectivamente, para la tercera
verificación, se puede manejar una precisión se obtiene 48% ± 13.8. Se necesita un es-
variable según el interés que el usuario fuerzo de muestreo adicional para esta
tenga para las diferentes categorías. Por última clase, con el fin de reducir el intervalo
ejemplo, la evaluación de un mapa de uso de confianza por debajo de 10%. Con 50
del suelo y vegetación para un usuario fo- unidades de muestreo adicionales se obtiene
restal se debe llevar a cabo con un esfuerzo finalmente 56% ± 9.7 (Tabla 5).
Tabla 5. Ejemplo numérico del método iterativo Para la clase C, se necesitaron 50 sitios adicionales
para obtener un intervalo de confianza más pequeño (C*)
Clase
A 6 C C*
Núm. de aciertos 48 5 24 56
% aciertos 96 10 48 56
gias y esfuerzos de muestreo diferentes para reporte de los resultados; ya que los objeti-
las categorías de cambio y de no cambio. vos de la cartografía y de la evaluación de la
confiabilidad, así como las condiciones para
CONCLUSIÓN llevarlos a cabo, pueden ser muy distintas
(Foody, 2002). Sin embargo, todos concuer-
Con base en los resultados de la evaluación dan en que la evaluación de la confiabilidad
de la confiabilidad, es necesario considerar no se puede resumir en un solo índice y que
las diferentes medidas, que permiten mejorar es muy importante incorporar en el reporte
la información contenida en un mapa temá- información sobre el muestreo, así como la
tico y los productos que se deriven del mis- matriz "bruta", para que se pueda llevar a
mo. En el proceso de evaluación de la con- cabo el cálculo de otros índices que no fue-
fiabilidad, las categorías que más se confun- ron contemplados por los autores (Stehman,
den pueden ser objeto de un esfuerzo adi- 1997).
cional, con base en un exhaustivo trabajo de
campo, por ejemplo, que permita mejorar El valor de los datos geográficos depende de
la calidad de su representatividad en la la calidad de su sistema de clasificación y su
cartografía. Otra opción más económica que confiabilidad. Con base en los insumos co-
ayuda a resolver esta disyuntiva consiste en múnmente utilizados para la cartografía (imá-
reagrupar las categorías confundidas en una genes de percepción remota) y por la natura-
sola, con el fin de absorber las confusiones. leza misma del objeto de estudio, como por
En este caso, se pierde detalle en el ejemplo, la vegetación que presenta una dis-
mapa, pero se incrementa su confiabilidad tribución a veces difusa, es difícil obtener
(Congalton, 1988a; Janssen y Van der Wel, una representación cartográfica totalmente
1994). libre de error o de ambigüedades. Es, por
tanto, muy importante realizar una evalua-
La matriz de confusión indica las clases que ción de la confiabilidad de estos datos, ya
tienden a ser sub o sobre-representadas en que, de manera cada vez más frecuente son
el mapa y, por consecuencia, cuya superficie utilizados como insumo para la evaluación
está sub o sobre-estimada. Existen diversos de tierras, el ordenamiento territorial, el
métodos para llevar a cabo correcciones de cálculo de emisión o secuestro de CO2, el di-
las estadísticas de superficie con base en seño de políticas para la conservación de la
el análisis de esta matriz (Hay, 1988; Jupp, biodiversidad, entre otros.
1989; Dymond, 1992; Czaplewski y Catts,
1992; Card, 1982 y Conese y Maselli, 1992). AGRADECIMIENTOS
Cochran, W. G. (1980), Técnicas de muestreo, Foody, G. (2002), "Status of land cover classi-
CECSA, México. fication accuracy assessment", Remote Sensing
of Environment, 80:185-201.
Conese, C. y F. Maselli (1992), "Use error
matrices to improve área estimates with máximum Friedl, M. A., C. Woodcock, S. Gopal, D.
likelihood classification procedures", Remote Sen- Muchoney, A. H. Strahler y C, Barker-Schaaf
sing ofthe Environment, 40:113-124. (2000), "A note on procedures used for accuracy
assessment in land cover maps derived from
Congalton, R. G. (1988a), "Using spatial auto- AVHRR data", International Journal Remote
correlation analysis to explore the errors in maps Sensing, 21(5):1073-1077.