Evaluacion de La Confiabilidad Tematica de Mapas o

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/262443478
Evaluación de la conﬁabilidad temática de mapas o de imágenes

clasiﬁcadas: una revisión
Article in Investigaciones Geograficas : Boletin - Instituto de Geografia, Universidad Nacional, Autonoma de Mexico · August 2003
CITATIONS READS
67 1,748
3 authors, including:
Jean François Mas Azucena Pérez Vega

Universidad Nacional Autónoma de México Universidad de Guanajuato
251 PUBLICATIONS 8,466 CITATIONS 17 PUBLICATIONS 753 CITATIONS
SEE PROFILE SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Dinámica del uso del suelo y cambio climático en la planeación sistemática para la conservación : un caso de estudio en la cuenca Grijalva-Usumacinta
View project
Geografía Ambiental View project
All content following this page was uploaded by Jean François Mas on 15 August 2014.
The user has requested enhancement of the downloaded file.

Investigaciones Geográficas, Boletín del Instituto de Geografía, UNAM
Núm. 51, 2003, pp. 53-72
Evaluación de la confiabilidad temática de mapas o de

imágenes clasificadas: una revisión
Jean François Mas* Recibido: 7 de mayo de 2003
José Reyes Díaz-Gallegos* Aceptado en versión final: 11 de febrero de 2003
Azucena Pérez Vega*
Resumen. Antes de ser utilizados para tomar decisiones, los mapas temáticos, las bases de datos cartográficos y las
imágenes clasificadas, deben ser evaluados para conocer su confiabilidad. Este artículo presenta una revisión de la
literatura especializada sobre el proceso de evaluación de la confiabilidad temática y puede ser utilizado como guía
práctica para llevar a cabo este tipo de evaluaciones.
Palabras claves: Evaluación de la confiabilidad, cartografía, clasificación de imágenes, SIG.
Assessment of the thematic reliability of maps and

classified images: a review
Abstract. Before their use as a decision-making tool, thematic maps, geographical databases and classified images
should be assessed for accuracy. This paper presents a review of the specialized literature on thematic accuracy
assessment, which can be used as a practical guide for carrying out this type of assessments.
Key words: Reliability assessment, cartography, image classification, GIS
INTRODUCCIÓN palmente, de la calidad de los insumos y de

la metodología adoptada para su elabora-
Uno de los insumos más importantes para ción. Se pueden producir varios errores en
definir políticas de aprovechamiento y de las diferentes etapas del proceso de elabora-
conservación de los recursos naturales son ción de un mapa: a) la corrección geométrica
los mapas temáticos, tales como los mapas de las imágenes; b) el análisis de las imá-
de uso del suelo y vegetación y de suelos, genes, que depende de la experiencia del
entre otros. Estos mapas se presentan en intérprete, de la calidad de los insumos utili-
formato impreso o integrados en un sistema zados (fotografías aéreas, imágenes de sa-
de información geográfica (SIG). Durante las télite, observaciones de campo, entre otros)
tres últimas décadas, se incrementó notable- y del sistema clasificatorio; c) la captura
mente el uso de imágenes de satélite para (digitalización por ejemplo), y d) la represen-
generar este tipo de información (Millington y tación de los datos en el mapa.
Alexander, 2000).
Generalmente se considera que existen
En muchos casos se aceptaba que los dos tipos de error en los mapas o en las
mapas temáticos eran confiables y no se imágenes clasificadas (Chrisman, 1989;
cuestionaba la calidad de su información. Goodchild et al, 1992; Janssen y Van der
Por ejemplo, las principales bases de datos Wel, 1994; Pontius, 2000 y 2002; Carmel et
cartográficas del país no se someten a una al., 2000); los errores temáticos, que se
evaluación de su confiabilidad. Sin embargo, refieren a errores de atributo (etiqueta), y los
toda base de datos geográfica presenta un errores geométricos (de posición) en la deli-
grado de incertidumbre que depende, princi- mitación de los polígonos o la ubicación de
*Instituto de Geografía-UNAM, Sede Morelia, Aquiles Serdán 382, Colonia Centro Histórico, CP 58000, Morelia,
Michoacán. E-mail: jfmas@igiris.igeograf.unam.mx
Jean François Mas, José Reyes Díaz Gallegos y Azucena Pérez Vega
los pixeles. Estos dos tipos de error están fusiones que presenta (Congalton y Green,
estrechamente ligados y es difícil separarlos 1993). El proceso de evaluación de la confia-
(Chrtsman, 1989). Aspinall y Pearson (1995) bilidad temática se divide en tres etapas
distinguen un tercer componente de error (Stehman y Czaplewski,1998).
potencial en los mapas temáticos, el cual se
atribuye a la heterogeneidad dentro de un a) El diseño del muestreo que consiste en la
polígono. selección de las unidades de muestreo.
La evaluación de la confiabilidad de los ma- b) La evaluación del sitio de verificación, que

pas y de las bases digitales geográficas es permite obtener la clase correspondiente a
un tema que está cobrando mucho interés; cada unidad de muestreo.
en gran medida, por el rápido desarrollo y
aplicación de los SIG. Cuantificar la con- c) El análisis de los datos, que consiste ge-
fiabilidad de un producto cartográfico, permi- neralmente en la elaboración de una matriz
te a los usuarios del mapa valorar su ajuste de confusión y et cálculo de índices de con-
con la realidad y, así, asumir el riesgo de fiabilidad.
tomar decisiones con base en esta infor-
mación cartográfica; además, ayuda también Existe un gran número de publicaciones so-
a conocer y modelar el error que resulte del bre la evaluación de la confiabilidad de
cruce de varias capas con cierto grado de mapas temáticos o de imágenes clasificadas
error en un SIG (Burrough, 1994; Goodchild en revistas especializadas en percepción
et al., 1992; Luneta et al., 1991, Walsh et al., remota y sistemas de información geográfi-
1987). ca, muchas veces expresando opiniones
contradictorias. En este artículo se hace una
La evaluación de la confiabilidad temática revisión de esta literatura para proporcionar,
consiste en comparar la información del a los lectores y especialistas en cartografía,
mapa con información de referencia consi un panorama sintético de la aplicación e
derada muy confiable. Generalmente se ba- importancia de la evaluación de la confia-
sa en un muestreo de sitios de verificación, bilidad de mapas, que pueda servirles de
cuya clasificación se obtiene a partir de ob- guía práctica para llevar a cabo este tipo
servaciones de campo o del análisis de imá- de análisis. La primera parte del artículo se
genes más detalladas (con mejor resolu- organiza con base en las tres etapas de
ción), que aquellas utilizadas para generar el la evaluación descritas por Stehman y
mapa. Por ejemplo, se utilizan fotografías Czaplewski (1998); a) diseño del muestreo,
aéreas para verificar mapas generados a b) evaluación de los sitios de verificación y
partir de imágenes de satélite de alta resolu- c) análisis de los datos. Luego, se discuten
ción como Landsat o SPOT (Peralta-Higuera algunos aspectos operativos de la evalua-
ef al., 2001; Mas et al., 2001; Vogelmann et ción. Se puede encontrar material adicional
al., 2001). sobre este tema a través de Internet, en la
dirección http://indy2.igeograf.unam.mx/dote/
La confrontación entre las clases cartogra- confiabilidad.htm.
fiadas y las clases determinadas en las foto-
grafías aéreas o en el campo para los sitios DISEÑO DEL MUESTREO
de verificación se basa en el supuesto de
que la información de referencia es alta- El diseño de muestreo contempla la determi-
mente confiable y representa "la verdad"; por nación del tipo de unidades de muestreo, del
lo que esta confrontación permite evaluar la método de selección de las mismas, así
confiabilidad del mapa y conocer las con- como del número de unidades de muestreo
54 Investigaciones Geográficas, Boletín 51, 2003

Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión
necesarias (tamaño de muestra). las clasificaciones digitales píxel a píxel.
Las unidades de muestreo En el caso de mapas en formato vectorial, el

uso de los polígonos como unidades de
La unidad de muestreo permite relacionar la muestreo permite una correspondencia di-
localización de la información del mapa y del recta entre éstas y el mapa. Sin embargo,
terreno. Puede ser un punto, un píxel, un al modificar el mapa (actualización o agrega-
grupo de píxeles, un polígono del mapa o ción de clases de un sistema clasificatorio je-
una unidad de superficie con formas pre- rárquico) esta correspondencia desaparece.
determinadas, por ejemplo, un cuadro o un
círculo de una hectárea. No existe un con- En el caso de unidades de superficie prede-
senso definitivo sobre la unidad de muestreo terminadas, la superficie que debe cubrir el
más adecuada (Chuvieco, 1996); su elección sitio de muestreo es también delicada de
depende en mucho de los objetivos de determinar, un sitio de verificación grande
la evaluación, del proceso de mapeo, de la puede incluir varias porciones de polígonos
estructura del paisaje y de las categorías que en el mapa y varios tipos de cubierta en el
más le interesan al usuario. Si la unidad de terreno o en la imagen de referencia, lo que
muestreo es un punto, se compara la cla- genera ambigüedades al confrontar la infor-
sificación del mapa con relación a este punto mación del sitio de verificación con la del
con la misma localización en el terreno; en la mapa. Al contrario, un sitio de verificación
práctica, lo que se evalúa es una superficie pequeño puede coincidir con una unidad del
alrededor del punto. Janssen y Van der Wel paisaje no representada en el mapa por ser
(1994) recomiendan el uso de pixeles indi- más pequeña que el mínimo cartografiable
viduales como unidades de muestreo para del mismo (Figura 1).
Figura 1. Unidades de muestreo puntual de diferentes superficies y formas.
Investigaciones Geográficas, Boletín 51, 2003 55

Durante el análisis de la unidad de muestreo, valos regulares a partir de un punto selec-

se sugiere tener en cuenta su entorno. cionado de manera aleatoria, pero puede ori-
ginar algún error cuando existe algún patrón
El método de muestreo periódico en el área estudiada (Chuviéco,
1996).
Sirve para seleccionar una pequeña muestra
del área cartografiada, de tal forma que sea Sistemático no alineado. La muestra se dis-
representativa de la totalidad del mapa. En tribuye de manera regular, pero con un cierto
un diseño de muestreo probabilista, todas las grado de libertad y permite representar todo
unidades de muestreo presentes en el mapa el territorio.
tienen una probabilidad conocida superior a
cero de ser seleccionadas, a esta probabili- Por conglomerados. Se selecciona un sitio
dad de selección se le denomina probabi- aleatoriamente y se toman varias muestras
lidad de inclusión. Asimismo, durante la se- vecinas de acuerdo con un esquema pre-
lección de las unidades de muestreo no deteminado. Por ejemplo, se seleccionan
se deben descartar sitios que presenten cier- otros dos sitios, siguiendo una forma de L
tas características; como por ejemplo, estar a cierta distancia del sitio seleccionado alea-
localizados en regiones con poca accesibili- toriamente (Figura 2).
dad o en terrenos privados. Las técnicas de
muestreo más empleadas en el proceso Los muéstreos aleatorio simple, sistemático,
de evaluación de la conftabilidad temática sistemático no alineado y por conglomerados
son: aleatorio simple, aleatorio estratificado, son probabilistas y resultan en probabili-
sistemático, sistemático no alineado y por dades de inclusión, iguales para todas las
conglomerados (Figura 2). unidades de muestreo. Los muéstreos estra-
tificados, como el estratificado aleatorio, con
Aleatorio simple. Los sitios de verificación se un número igual de unidades de muestreo
eligen de tal forma, que todos tienen la mis- por estrato, conduce a probabilidades de
ma probabilidad de ser seleccionados. El inclusión diferentes según el estrato. Eso no
problema con este tipo de muestreo es que constituye ningún problema en el análisis de
las categorías del mapa que presentan una los resultados, siempre y cuando estas pro-
superficie reducida son muy poco represen- babilidades de inclusión sean conocidas y
tadas o inclusive ausente de la muestra. Esta utilizadas para ponderar las observaciones
selección genera sitios de muestreo disper- derivadas de cada estrato (Stehman, 2000).
Estudios comparativos de estos diferentes
sos en todo el territorio, lo que implica asumir
esquemas de muestreo pueden encontrarse
los costos de traslado (Congalton, 1988b,
en Congalton (1988b); Fítzpatrick-Lins (1981)
Fitzpatrick-Lins, 1981).
y Stehman (1992 y 1999).
Aleatorio estratificado. La muestra se realiza
dividiendo a la población en estratos, con Existen numerosos ejemplos de diseños ses-
base en una variable auxiliar (altitud, región gados que no se pueden considerar como
ecológica, división administrativa, facilidad estadísticamente robustos, debido a que la
de acceso, clase en el mapa, entre otros), lo muestra no es representativa del conjunto
que permite tener cierto control sobre la dis- del mapa. Por ejemplo, la selección de sitios
tribución de los sitios de muestreo y obtener de verificación ubicados en el centro de los
información sobre subconjuntos de la pobla- polígonos de los mapas conduce a una eva-
ción. luación optimista de la confiabilidad del ma-
pa, ya que los errores son más frecuentes
Sistemático. La muestra se distribuye a inter- en las zonas de transición entre diferentes

Evaluación de la confíabilidad temática de mapas o de imágenes clasificadas: una revisión
1. Muestreo aleatorio
2. Aleatorio estratificado
3. Sistemático
4. Sistemático no alineado
5. Por conglomerados
Figura 2. Esquemas de muestreo probabilistas más aplicados en la evaluación de la confíabilidad

de mapas temáticos (modificado de Chuvieco, 1996).

tipos de cobertura (límites entre polígonos;

Hammond y Verbyla, 1996). De la misma
manera, la selección de sitios de muestreo,
ubicados cerca de carreteras para facilitar el
acceso durante la verificación de campo, donde CTP es la desviación estándar de la es-
tiende a seleccionar sitios de verificación lo- timación de la confiabilidad, N es el tamaño
calizados en regiones mejor conocidas {por de la población, n es el tamaño de la mues-
ejemplo, por los foto-intérpretes y, en conse- tra (número de unidades de muestreo) y p la
cuencia, mejor interpretadas) y por lo regular contabilidad de la muestra.
corresponde a tipos de vegetación más per-
turbados. Otro ejemplo de evaluación sesga- En la Figura 3 se representa el tamaño de la
da, es la utilización de los campos de en- muestra n en función del tamaño de la po-
trenamiento o de pixeles correlacionados con blación N con base en la ecuación (1) para el
estos campos para evaluar la confiabilidad caso en el cual la confabilidad p es de 0.5
de clasificaciones digitales (Friedl et al., (la mitad de los sitios de verificación está
2000; Stehman y Czaplewski, 1998). correctamente identificada en el mapa) y la
desviación estándar es de 0.05 (es decir
El tamaño de la muestra se evalúa la confiabilidad del mapa con un
error razonablemente pequeño). Se puede
El tamaño de la muestra se refiere al número observar que el tamaño de muestra nece-
de sitios de verificación utilizados para esti- sario aumenta con el tamaño de la población
mar la confiabilidad del mapa. Entre más y alcanza un máximo de 100 para una pobla-
grande sea el tamaño de la muestra, ción de 10 000 aproximadamente. Las po-
más precisa será la evaluación; sin embargo, blaciones superiores a 10 000 no necesitan
por razones de costo y tiempo, es con- un tamaño de muestra más importante para
veniente determinar el tamaño de muestra alcanzar una estimación de la confiabilidad
mínimo, para alcanzar los objetivos de la con una desviación estándar inferior o igual a
evaluación. 0.05.
Congalton (1988b) sugiere muestrear una En la evaluación de la confiabilidad de

superficie aproximada al 1% de la superficie mapas o de imágenes de satélite clasificadas
cartografiada. En otra publicación (1991), el se manejan, generalmente, poblaciones muy
mismo autor recomienda verificar por lo grandes; por ejemplo, un mapa escala
menos 50 sitios por categoría, y de 75 1:250 000 del INEGI, cubre una superficie
a 100 si el área en estudio es superior a de más de 20 000 km2 y contiene, por lo tan-
400 000 ha o si hay más de 12 categorías. to, más de 2 000 000 de unidades de mues-
treo de 100 x 100 m. Una imagen de satélite
La confiabilidad pues la proporción de sitios Landsat TM tiene decenas de millones de
de verificación correctamente identificados pixeles. Como se mostró en la Figura 3, las
en el mapa. En estadística tradicional la des poblaciones grandes no necesitan un tama-
viación estándar de la estimación de una ño de muestra más grande para obtener una
proporción depende del tamaño de la mues- evaluación de la confiabilidad precisa. En
tra, del tamaño de la población estudiada y consecuencia, no es necesario que el tama-
de la proporción (Cochran, 1980; Wonnacott ño de la muestra sea un porcentaje de la
y Wonnacott, 1991; Stehman, 2001; ecua- población total como lo proponen Congalton
ción 1). (1988b) y Stehman (1997).

La aproximación normal permite determinar 0.05 (en otras palabras, la probabilidad de

que tanto la confiabilidad p medida en la que el valor real de la confiabilidad del mapa
muestra permite una estimación precisa P esté fuera del intervalo de confianza es de
de la confiabilidad del mapa P. Con base 5%), n es el número de unidades de mues-
en esta aproximación, se puede emplear la treo y N el tamaño de la población.
ecuación siguiente, derivada de la ecuación
(1), para relacionar la confiabilidad p, la pre- Para fines prácticos, cuando N es grande,
cisión con la cual p estima la confiabilidad una primera aproximación de * y de n es
del mapa (medio-intervalo de confianza *) como sigue (Cochran, 1980; Fitzpatrick-Lins,
y el tamaño de la muestra y de la población 1981;DicksyLo, 1990):
(Cochran, 1980; Wannacott y Wannacott,
1991).
Figura 3. Tamaño de muestra necesario para alcanzar un error estándar de 0.05 en función del tamaño
de la población (tomado de Stehman, 2001). El tamaño de la población está representado en escala
logarítmica log10(N).

Como se puede observar en la ecuación en cada estrato, la ecuación (3a) no aplica

(3b), el intervalo de confianza del estimado cuando se calcula el intervalo para toda
de la confiabilidad depende de: la población, reagrupando los estratos
(Stehman, 2000). La autocorrelación espa-
o El número de unidades de muestreo. cial, que se puede definir por el hecho de
Entre más grande sea el tamaño de que el error no se distribuye de manera
la muestra, más pequeño es el inter- homogénea en el mapa, pero que tiende a
valo de confianza; por lo tanto, más agregarse, también afecta las estimaciones
precisa es la estimación de la con- del intervalo de confianza de la confiabilidad
fiabilidad; por ejemplo, con 50 unida- (pero no influye en la confiabilidad). El tipo
des de muestreo, una confiabilidad de muestreo más afectado es por conglo-
de 80% (p=0.8) presenta un medio merados, los muéstreos sistemáticos y alea-
intervalo de confianza * de 11%, es torios estratificados son los menos sensibles.
En este tipo de muéstreos se utilizan las mis-
decir que, en realidad, la confiabili-
mas ecuaciones para el cálculo de la confia-
dad puede variar entre 69 y 91%,
bilidad y la precisión de la estimación, pero
pero con 250 unidades de muestreo
se debe tomar en cuenta que el intervalo de
el intervalo de confianza se reduce
confianza es en realidad más grande que el
a ±5%. calculado (Stehman, 2000).
o La confiabilidad. Con el mismo nú-
mero de unidades de muestreo, la LA EVALUACIÓN DE LOS SITIOS DE
confiabilidad se estima con menos VERIFICACIÓN
precisión si se acerca a 50%. Por
ejemplo, con 100 unidades de mues- Este paso consiste en la caracterización del
treo, una confiabilidad de 50% tiene sitio de verificación para asociarlo a una o
un intervalo de confianza de ± 9.8% varias clases de la leyenda del mapa que se
y una de 90%, ± 5.9%. evalúa. En la práctica, la evaluación de la
unidad de muestreo, en particular si es un
La tabla presentada a continuación indica el punto o un pixel, se lleva a cabo con base en
tamaño de muestra necesario para dife- el análisis de una cierta área alrededor del
rentes valores de confiabilidad y precisión de mismo.
la evaluación.
Comúnmente, esta evaluación conduce a
Tabla 1. Tamaño de la muestra por clase en asociar el sitio de verificación a una sola
función de p y d categoría de la leyenda del mapa. Sin
embargo, no es siempre posible ni conve-
p
niente limitarse a una clase única para carac-
* 90% 80% 70% 60% 50% terizar el sitio de verificación, porque este
2.5% 553 983 1291 1475 1537 ejercicio puede ser muy subjetivo (Hord y
Brooner, 1976). Esta subjetividad se debe a
5.0% 138 246 323 369 384 que el sitio puede localizarse en una zona
10.0% 35 61 81 92 96 de transición progresiva entre dos tipos de
vegetación (por ejemplo, un bosque de pino
P : confiabilidad estimada de la clase y un bosque de pino-encino) o en un área
* : medio intervalo de confianza fragmentada donde se encuentran varias
clases. Puede también corresponder a un
Para los muéstreos aleatorios estratificados estadio de transición temporal entre tipos de
con un número de unidades igual y pequeño vegetación (por ejemplo, la vegetación se-

cundaria, particularmente en los trópicos). lo que se observa en la fotografía, pero es

Otra fuente de ambigüedad son los errores aceptable", "esta categoría no define correc-
en la localización del sitio de verificación en tamente la fotografía" o bien "esta categoría
el mapa (Khorram et al., 2000). no puede aplicarse a lo que se observa en
la fotografía". Cada expresión se asocia con
Todas estas fuentes de errores llevan gene- un grado de pertenencia. Estos autores pro-
ralmente a subestimar la confiabilidad del ponen un método para el cálculo de índices
mapa y varios autores han propuesto diver- de confiabilidad utilizando este enfoque
sos mecanismos para aminorarlos. Khorram difuso (Gopal y Woodcock, 1994; Gopal et
et al. (2000) caracterizan el sitio de verifica- al., 1999).
ción con una clase principal y una adicional.
En la confrontación entre el mapa y la in- ANÁLISIS DE LOS DATOS
formación de referencia; en caso de que
la clase principal no corresponda con el El análisis de los datos de confiabilidad se
mapa se da una "segunda oportunidad" con hace generalmente a través de una matriz
la clase adicional. Otros autores caracterizan de confusión, que permite confrontar la in-
de manera cuantitativa el sitio de verifica- formación de los sitios de verificación con
ción, tanto en el mapa como en la infor- aquella de la base cartográfica que se pre-
mación de referencia, utilizando las propor- tende evaluar. En la matriz de confusión, las
ciones de la superficie representada por filas representan generalmente las clases de
cada clase de cubierta. referencia y las columnas las clases del
mapa. La diagonal de la matriz expresa el
Woodcock y Gopal (2000) utilizan un enfo- número de sitios de verificación para los
que difuso para calificar los sitios de verifica- cuales hay concordancia entre el mapa y
ción. En este enfoque, la pertenencia de un los datos de referencia, mientras los margi-
elemento a una clase se expresa a través de nales indican errores de asignación.
un grado de pertenencia, que es una varía-
ble que toma cualquier valor entre 0 y 1 para La proporción de puntos correctamente asig-
expresar la pertenencia parcial a diferentes nados (diagonal) expresa la confiabilidad del
conjuntos. Por ejemplo, en el caso de dos mapa. Se distinguen dos tipos de error se-
categorías basadas en la cubierta de la copa gún si la lectura de la matriz se hace con
de los árboles (vegetación "abierta" si la base en las líneas o en las columnas. El
cubierta es entre 10 y 40%; vegetación error de comisión representa la proporción
"cerrada" cuando la cubierta de las copas es de sitios de verificación cartografía da en una
superior a 40%), un sitio de verificación, con cierta clase, pero que en realidad pertenece
40% de cubierta, presenta 0.5 de pertenen- a otra categoría. El error de omisión se refie
cia en ambas categorías (cerrada y abierta). re a la proporción de sitios de verificación
En el enfoque booleano, el intérprete tendría correspondiente a una categoría que fue car-
que clasificarlo en una de las dos categorías. tografiada en otra (Aronoff, 1982; Chuvieco,
Woodcock y Gopal (2000) desarrollaron un 1996).
método de caracterización del sitio de verifi-
cación basado en una escala lingüística que Congalton (1991) sugiere llevar a cabo una
asocia cada sitio con una categoría a través normalización o estandarización de la matriz
de una calificación que expresa la adecua- de confusión. Ésta se realiza llevando a cabo
ción de la clase con el sitio, como por ejem- un ajuste iterativo para que las columnas y
plo, "esta categoría define perfectamente lo las filas de la matriz sumen 1 y argumenta
que se observa en la fotografía", "esta que esta normalización permite ajustar los
categoría no es la más adecuada para definir valores de la matriz tomando en cuenta las

filas y las columnas. Este proceso modifica la confiabilidad de cada una de las clases
los valores de la diagonal y permite calcular de la leyenda como: a) la confiabilidad del
un valor de confiabilidad global normalizado usuario, que puede interpretarse como la
que representa mejor la calidad del mapa, probabilidad que un sitio clasificado como A
porque incorpora información de los elemen- y aleatoriamente seleccionado sea realmente
tos fuera de la diagonal. Según Congalton, la A en el terreno, y b) la confiabilidad del pro-
normalización de la matriz permite una com- ductor, que es la proporción de sitios de veri-
paración más objetiva entre matrices deriva- ficación de la clase A que están represen-
das de diferentes procesos de evaluación. tados en el mapa o en la base de datos
Sin embargo, Stehman (1997) está en desa- como tal (Janssen y van der Wel, 1994). Los
cuerdo con esta normalización, porque no valores de confiabilidad del usuario y del
permite obtener estimaciones consistentes. productor están relacionadas respectiva-
Se entiende por consistencia que la estima- mente con los errores de comisión y omisión.
ción de algún parámetro con base en una Aronoff (1982) define el riesgo del productor
muestra se vuelve exactamente igual al valor como el hecho de rechazar un mapa acep-
del parámetro en la población cuando la table y el riesgo del usuario, aceptar un ma-
muestra es igual a la población (n = N). pa no confiable.
Stehman (1997) demuestra que las estima-
ciones de confiabilidad derivadas de una La confiabilidad promedio es el promedio de
matriz normalizada no son consistentes con los valores de confianza de cada categoría.
las derivadas de una matriz basada en toda
Es, por lo tanto, un índice de confiabilidad
la población y recomienda no usar matrices
que da el mismo peso a todas las categorías
normalizadas.
independientemente de la superficie que
cubren.
Con base en la matriz de confusión, se
desarrollaron varios índices de confiabilidad A continuación se presenta un mapa para
(Stehman y Czaplewski, 1998) que se des- el cual se verificaron en campo 15 sitios
criben a continuación: de verificación seleccionados con base en
un muestreo aleatorio (Figura 4). La com-
Si el diseño de muestreo es aleatorio simple, paración entre los mapas y la información
la confiabilidad global {proporción de los si- de campo permitió elaborar la matriz de
tios de verificación correctamente clasifica- confusión y calcular los índices de confia-
dos en la base cartográfica) se obtiene bilidad (Tabla 2), en este ejemplo, la con-
dividiendo los elementos de la diagonal con fiabilidad global es de 67% (10 sitios co-
el número total de sitios de verificación. Este rrectamente identificados de un total de 15).
valor representa la probabilidad para cual-
quier sitio en el mapa de ser correctamente Los índices de confiabilidad descritos ante-
clasificado. En el caso de muestreo aleatorio riormente no toman en cuenta los elementos
estratificado, el número de sitios por cate- fuera de la diagonal de la matriz (Rosenfield
goría ya no es proporcional a la superficie y Fitzpatrick-Lins, 1986). Por esta razón, se
cubierta por cada categoría y el valor ob- generalizó el uso del coeficiente de Kappa,
tenido no se puede interpretar de esta que utiliza las sumas marginales de la matriz
manera. Por ello se tienen que hacer y da cuenta de la contribución del azar en la
las correcciones necesarias con base en las confiabilidad del mapa. Para los cálculos que
probabilidades de inclusión del muestreo se describen a continuación, es conveniente
(Card, 1982). expresar los valores de la matriz en pro-
porción del número total de sitios (Tabla 3).
Existen también índices que dan cuenta de

Tabla 2. Matriz de confusión derivada de la figura 4
Mapa
Ref. A B C D Error Omis. Conf. prod.
A 2 2 0 0 50.0 50.0
B 1 2 0 0 33.3 66.7
C 0 0 2 2 50.0 50.0
D 0 0 0 4 0.0 100.0
Error Com. % 33.3 50.0 0.0 33.3
Conf. us. 66.7 50.0 100.0 66.7
Error Omis.: error de omisión, Error Com.: error de comisión, Conf. prod. confia-
bilidad del productor, Conf. us.: confiabilidad del usuario.

Tabla 3. Matriz de confusión expresada en proporción. Las mismas anotaciones

se utilizan en las ecuaciones a continuación
müar al cálculo de la confiabilidad del usuario

y del productor.
El coeficiente de Kappa para la categoría

(fila) /se calcula según;
donde K es el índice de Kappa, Po la pro-
porción de área correctamente clasificada
(confiabilidad global) y Pc la confiabilidad re-
sultante del azar.
Po se obtiene sumando los elementos de la

diagonal: El coeficiente de Kappa para la categoría
(columna); se obtiene según:
Pc se calcula sumando el producto de las

sumas marginales :
En la Tabla 4 se presentan la matriz expre-
sada en proporción y los valores de estos
índices de confiabilidad calculados a partir
de la matriz presentada en la Tabla 2.
La suma de la diagonal que expresa la

El coeficiente de Kappa se puede calcular confiabilidad global del mapa (proporción de
para cada categoría, con base en las filas o sitios correctamente clasificados) es igual a
en las columnas de la matriz, de manera si- 0.67 (67%). Para calcular el valor del coefi-

cíente de Kappa, se evalúa primero la apor- importa que cierta proporción del mapa esté
tación del azar Pc que es igual a la suma de correcta debido al azar (Turk, 1979). Por
los productos de las sumas marginales de la tanto, no es lógico restar la contribución
matriz. Para la matriz de la tabla 4, Pc = 0.2 * del azar a la calidad del mapa, por lo cual
0.27 + 0.27 * 0.20 + 0.13 * 0.27 + 0.4 * 0.27 Stehman (1997) considera que el índice de
= 0.25 y el coeficiente de Kappa K - (0.67- Kappa no es un buen índice de la calidad
0.25)/(1-0.25) = 0.56. de un mapa y es más apropiado cuando se
pretende evaluar diferentes métodos de
Un coeficiente de Kappa de 0.56 significa clasificación.
que la clasificación es 56% mejor que la con-
fiabilidad esperada, asignando aleatoria- Todos los índices descritos anteriormente,
mente una categoría de cobertura a los polí- menos los derivados del enfoque difuso,
gonos (Dicks y Lo, 1990). Muchos autores no consideran de la misma manera todos los
están de acuerdo con la manera de estimar errores. Sin embargo, ciertos errores son
la contribución del azar y existen algunas más perjudiciales que otros según el objetivo
variantes en el cálculo del índice de de esfuerzo cartográfico; por ejemplo, si se
Kappa, que utilizan otras formas de evaluarla utiliza un mapa de uso del suelo y vege-
(Foody, 1992; Ma y Redmond, 1995; tación para calcular la superficie boscosa
Stehman, 1997). El coeficiente de Kappa es de una región, la confusión entre bosque de
válido para un muestreo aleatorio simple encino y bosque mesófilo es menos grave
(Congalton, 1988b). Stehman (1996) pro- que entre bosque de encino y pastizal. Si el
pone un método para calcular el valor de objetivo es cartografiar el hábitat de un orga-
Kappa y su varianza para los muestreos nismo que se circunscribe al bosque mesófi-
aleatorios estratificados. El índice de Kappa lo, este mismo error se vuelve más crítico.
resta la contribución teórica del azar a la Naesset (1996) desarrolla índices que toman
confiabilidad y da un resultado siempre infe-
en cuenta la gravedad del error en el cálculo
rior o igual a la confiabilidad global. Sin em-
de los índices de confiabilidad.
bargo, para el usuario de un mapa no
Tabla 4. Matriz de confusión expresada en proporción derivada de la Tabla 2
Mapa
Ref. A B C D Total Conf. prod. Kappa
A 0.13 0.13 0.00 0.00 0.27 0.50 0.38
B 0.07 0.13 0.00 0.00 0.20 0.67 0.58
C 0.00 0.00 0.13 0.13 0.27 0.50 0.38
D 0.00 0.00 0.00 0.27 0.27 1.00 1.00
Total 0-20 0.27 0.13 0.40
Conf. us.o 0.67 0.50 1.00 0.67
Kappa 0.55 0.32 1.00 0.55
Conf. prod.: confiabilidad del productor; Conf. us.: confiabilidad del usuario.

DISCUSIÓN La estratificación consiste en repartir el

esfuerzo de muestreo con base en estratos
Se presentaron los métodos para llevar a geográficos como regiones ecológicas o enti-
cabo la evaluación de la confiabilidad de ma- dades administrativas, entre otros. Permite
pas o de imágenes clasificadas. A continua- distribuir el esfuerzo de muestreo, con proba-
ción se discuten algunos aspectos prácticos bilidades de muestreo más bajas, por ejem-
de estas evaluaciones, como la conciliación plo, en regiones menos accesibles. La estra-
de los requisitos estadísticos y considera- tificación con base en las categorías del
ciones logísticas, así como el problema de la mapa permite garantizar que no se sobre-
veracidad de los datos de referencia. Por muestreen las categorías con mayor exten-
último, se aborda el caso de la evaluación de sión a expensas de las de menor superficie
mapas de cambio. (Card, 1982; Figura 5).
Algunos mecanismos para reducir costos La evaluación de la confiabilidad se puede

llevar a cabo para una parte del área carto-
En la evaluación de la confiabilidad cartografiada con base en la hipótesis de que
gráfica, un problema crucial es la conciliación ésta es representativa del conjunto del ma-
de los requisitos estadísticos, que permiten pa. Por ejemplo, el mapa de uso del suelo y
una evaluación objetiva y científicamente de- vegetación de un estado de la República se
fendible con las consideraciones logísticas podría evaluar únicamente en algunos muni-
que toman en cuenta los problemas de costo cipios que representan la variedad de tipos
y de acceso para recolectar la información de vegetación que se pueden encontrar en el
de los sitios de verificación. Existen diferen- estado y los resultados se generalizan para
tes mecanismos que permiten aminorar los toda la entidad. Sin embargo, es necesario
problemas prácticos relacionados con el nú- estar seguro que otros parámetros no in-
mero y la selección de los sitios de verifica- fluyeron en la calidad del mapa para estos
ción sin perder rigor estadístico. municipios y que realmente los resultados
obtenidos son extrapolares a todo el esta-
Figura 5. Muestreo aleatorio simple (ocho sitios al azar) y aleatorio estratificado (cuatro sitios al azar por
categoría). Este último permite una mejor repartición de los sitios de verificación entre las diferentes
categorías del mapa.

do. Otro ejemplo de evaluación basada en el de muestreo más importante en las clases
supuesto anterior es la utilización de líneas forestales, lo que permite una precisión ma-
de vuelo de fotografías aéreas o de video- yor y un esfuerzo menor en las demás cate-
grafía que cruzan el área cartografiada y gorías, resultando en una precisión menor en
conforman una cobertura parcial de esta la estimación de la confiabilidad de estas
última, como fue el caso del Inventario Fo- categorías.
restal Nacional 2000 (Peralta-Higuera et al.,
2001; Mas et al., 2001; Figura 6). En todo Con el fin de utilizar el número de sitios de
rigor, la evaluación de la confiabilidad que se muestreo mínimo para obtener la precisión
deriva de estas fotografías es únicamente deseada, se puede utilizar un método iterati-
válida para el área cubierta por las líneas de vo (Sánchez-Colón, comunicación personal).
vuelo. Sin embargo, estas líneas de vuelo En una primera etapa se determina el
cubren el territorio nacional de manera ho- número de sitios de muestreo para tener
mogénea y sistemática, por lo que se puede un nivel de confianza aceptable (por ejemplo
formular la hipótesis de que no existe sesgo, * < 10%) con un nivel de confiabilidad alto
esto es, que la porción del territorio que (80 o 90%). Para las clases que presentan
corresponde a las líneas de vuelo es repre- un nivel de confiabilidad bajo, el intervalo de
sentativa del conjunto del territorio y, por confianza será muy grande y se analizarán
tanto, los resultados obtenidos son también sitios adicionales para reducir este intervalo.
válidos para la parte no cubierta por las fotos Por ejemplo, se evalúa la confiabilidad de
aéreas (Mas et al., 2002). 3 clases con 50 unidades de muestreo por
clase. Para 2 de ellas se obtiene 96% ± 5.4
Con el fin de reducir el número de sitios de y 10% ± 8.3 respectivamente, para la tercera
verificación, se puede manejar una precisión se obtiene 48% ± 13.8. Se necesita un es-
variable según el interés que el usuario fuerzo de muestreo adicional para esta
tenga para las diferentes categorías. Por última clase, con el fin de reducir el intervalo
ejemplo, la evaluación de un mapa de uso de confianza por debajo de 10%. Con 50
del suelo y vegetación para un usuario fo- unidades de muestreo adicionales se obtiene
restal se debe llevar a cabo con un esfuerzo finalmente 56% ± 9.7 (Tabla 5).

Tabla 5. Ejemplo numérico del método iterativo Para la clase C, se necesitaron 50 sitios adicionales
para obtener un intervalo de confianza más pequeño (C*)
Clase
A 6 C C*
Núm. de sitios de verificación 50 50 50 100
Núm. de aciertos 48 5 24 56
% aciertos 96 10 48 56
Medio intervalo de confianza 5.4 8.3 13.8 9.7
El problema de la confiabilidad de los particular de la evaluación de un mapa temá-

datos "verdad" tico. Existe una gran variedad de métodos de
detección de cambio, que permiten generar
La evaluación de la confiabilidad se hace información sobre los cambios de cobertura
bajo el supuesto de que los datos de con base en el análisis de mapas o de imá-
referencia son totalmente correctos, lo que genes de diferentes fechas. Algunos méto-
no resulta cierto en muchos casos, en par- dos permiten solamente generar mapas bi-
ticular cuando la clase correspondiente a los narios que indican si hubo cambio o no
sitios de verificación se determina con base (categorías "cambio" y "no cambio"), otros
en el análisis de fotografías aéreas (Biging permiten caracterizar más precisamente el
et al., 1994; Congalton, 1991). Por ejemplo, tipo de cambio e indican la combinación de
Congalton y Green (1993) reportan que en el clases para las dos fechas involucradas
ejercicio de la evaluación de un mapa de (por ejemplo, "selva/pastizal" o "zona urbana/
bosques con base en la interpretación de fo- zona urbana"; Singh, 1989; Mas, 2000).
tografías aéreas, en 4 1 % de los sitios de Generalmente, los mapas de cambio son
verificación, la fotointerpretación proporcionó muy sensibles a la calidad geométrica de los
una clase distinta según el fotointérprete. insumos (corrección geométrica de las imá-
Además, las verificaciones en campo permi- genes, precisión en la delimitación de los
tieron determinar que en el 20% de los ca- polígonos; Aspinall y Pearson, 1995; Green y
sos, la categoría obtenida por fotointerpre- Hartley, 2000). Otras características que
tación era errónea y el 23% de los sitios no deben tomarse en cuenta para la evaluación
presentaba el mismo tipo de cobertura, de estos mapas de cambio son: a; el gran
debido al cambio de uso del suelo entre las número de categorías, ya que resultan de la
fechas de toma de las imágenes que se combinación entre las categorías de las
usaron para la elaboración del mapa y su diferentes fechas; b) la imposibilidad de reali-
evaluación. zar verificación de campo, por lo menos para
la fecha más antigua, y c) el hecho de que
La evaluación de mapas de cambio las categorías de cambio representan gene-
ralmente una pequeña proporción del área
La evaluación de la confiabilidad de mapas o cartografiada. Debido a esta última caracte-
de imágenes de cambio es un caso un poco rística, Khorram (1999) recomienda estrate-

Evaluación de la confiabilidad temática de mapas o de imágenes clasifícadas: una revisión
gias y esfuerzos de muestreo diferentes para reporte de los resultados; ya que los objeti-
las categorías de cambio y de no cambio. vos de la cartografía y de la evaluación de la
confiabilidad, así como las condiciones para
CONCLUSIÓN llevarlos a cabo, pueden ser muy distintas
(Foody, 2002). Sin embargo, todos concuer-
Con base en los resultados de la evaluación dan en que la evaluación de la confiabilidad
de la confiabilidad, es necesario considerar no se puede resumir en un solo índice y que
las diferentes medidas, que permiten mejorar es muy importante incorporar en el reporte
la información contenida en un mapa temá- información sobre el muestreo, así como la
tico y los productos que se deriven del mis- matriz "bruta", para que se pueda llevar a
mo. En el proceso de evaluación de la con- cabo el cálculo de otros índices que no fue-
fiabilidad, las categorías que más se confun- ron contemplados por los autores (Stehman,
den pueden ser objeto de un esfuerzo adi- 1997).
cional, con base en un exhaustivo trabajo de
campo, por ejemplo, que permita mejorar El valor de los datos geográficos depende de
la calidad de su representatividad en la la calidad de su sistema de clasificación y su
cartografía. Otra opción más económica que confiabilidad. Con base en los insumos co-
ayuda a resolver esta disyuntiva consiste en múnmente utilizados para la cartografía (imá-
reagrupar las categorías confundidas en una genes de percepción remota) y por la natura-
sola, con el fin de absorber las confusiones. leza misma del objeto de estudio, como por
En este caso, se pierde detalle en el ejemplo, la vegetación que presenta una dis-
mapa, pero se incrementa su confiabilidad tribución a veces difusa, es difícil obtener
(Congalton, 1988a; Janssen y Van der Wel, una representación cartográfica totalmente
1994). libre de error o de ambigüedades. Es, por
tanto, muy importante realizar una evalua-
La matriz de confusión indica las clases que ción de la confiabilidad de estos datos, ya
tienden a ser sub o sobre-representadas en que, de manera cada vez más frecuente son
el mapa y, por consecuencia, cuya superficie utilizados como insumo para la evaluación
está sub o sobre-estimada. Existen diversos de tierras, el ordenamiento territorial, el
métodos para llevar a cabo correcciones de cálculo de emisión o secuestro de CO2, el di-
las estadísticas de superficie con base en seño de políticas para la conservación de la
el análisis de esta matriz (Hay, 1988; Jupp, biodiversidad, entre otros.
1989; Dymond, 1992; Czaplewski y Catts,
1992; Card, 1982 y Conese y Maselli, 1992). AGRADECIMIENTOS
Los resultados de la evaluación de la confia- Se agradece a S. Sánchez-Cotón, a S.

bilidad están reportados de manera muy Stehman y a dos revisores anónimos por sus
heterogénea en la literatura. Además, los au- comentarios. Este artículo se elaboró en el
tores utilizan diferentes índices que vuelven ámbito del proyecto "Desarrollo de un
las comparaciones entre estos estudios aún método de evaluación de la confiabilidad de
más difíciles. En muchos casos, faltan datos mapas de vegetación y uso del suelo,
importantes, como una descripción del dise- mediante el enfoque difuso (Fuzzy)" apoyado
ño de muestreo, lo que puede modificar la por el CONACyT (proyecto 38965-T). El
interpretación de los resultados. Varios au- segundo autor agradece al CONACyT, por
tores abogan por una estandarización del otorgarle la beca-crédito de doctorado pe-
método de evaluación de la confiabilidad; riodo 2001-2003, con el número de cuenta
otros argumentan que sería perjudicial impo- 124650.
ner un esquema único de evaluación y de

REFERENCIAS generated from remotely sensed data", Photo-

grammetric Engineering and Remote Sensing, 54
Aronoff, S. (1982), "Classification accuracy: (5):587-592.
a user approach", Photogrammetric Engineering
and Remote Sensing, 48(8):1299-1307. Congalton, R. G. (1988b), "A comparison of
sampling scheme use in generating error matrices
Aspinall, R. y D. M. Pearson (1995), for assessing the accuracy of maps generated
"Describing and managing uncertainty of cate- from remotlely sensed data", Photogrammetric
gorical maps in GIS", Fisher, P. (ed.), Innovations Engineering and Remote Sensing, 54(5):593-600.
in GIS 2, Taylor & Francis, London, pp. 71-83.
Congalton, R. G. (1991), "A review of asse-
Biging, G. S., R. Congalton y E. Murphy ssing the accuracy of classifications of remotely
(1994), "A comparison of photointerpretation and sensed data", Remote Sensing of the Environ-
ground measurements of forest structure", ment, 37:35-46.
Fenstermaker, L. (ed), Remote Sensing Thematic
Accuracy Assessment: a Compendíum, American Congalton, R. G.. y K. Green (1993), "A
Society for Photogrammetry and Remote Sensing, practical look at the sources of confusión in error
pp. 148-157. matrix generation", Photogrammetric Engineering
and Remote Sensing, 59(5):641-644.
Burrough, P. A. (1994), "Accuracy and error
GIS", Green, D. R. y D. Rix (eds.), The AGÍ Sour- Czaplewski, R. y G. Catts (1992), "Calibration
cebook for Geographic Information Systems 1995, of remotely sensed proportion or área estimates
AGÍ, London, pp. 87-91. for misclassification error", Remote Sensing ofthe
Environment, 39:29.43.
Card, H. D. (1982), "Using known map ca-
tegory marginal frequencies to improve estimates Dicks, S. E. y T. H. C. Lo (1990), "Evaluation
of thematic map accuracy", Photogrammetric of thematic map accuracy in a land-use and land-
Engineering and Remote Sensing, 48 (3):431-439 cover mapping program", Photogrammetric Engi-
neering and Remote Sensing, 56(9): 1247-1252.
Carmel, Y., D. J. Dean y H. F. Curtís (2001),
"Combining location ancl classification error Dymond, J. R. (1992), "How accurately do
sources for estimating multi-temporal datábase image classifiers estímate área?", International
accuracy", Photogrammetric Engineering and Re- Journal Remote Sensing 13(9):1735-1742.
mote Sensing 67(7):865-872.
Fitzpatrick-Lins, K., (1981), "Comparison of
Chrisman, N R., (1989), "Modeling error in sampling procedures and data analysis for a land-
overlaid categorical maps" trie accuracy of spatial use and land-cover map", Photogrammetric Engi-
databases, Goodchild, M. y Gopal, S. (eds), neering and Remote Sensing, 47:343-351.
Chapter 2, Taylor & Francis, London, pp. 21-34.
Foody, G. M. (1992), "On the compensation for
Chuvieco, E. (1996), Fundamentos de telede- chance agreement in image classification accur-
tección espacial, 3ra. ed., Ediciones RIALP, acy assesmenf, Photogrammetric Engineering
Madrid, España. and Remote Sensing, 58{ 10): 1459-1460.
Cochran, W. G. (1980), Técnicas de muestreo, Foody, G. (2002), "Status of land cover classi-
CECSA, México. fication accuracy assessment", Remote Sensing
of Environment, 80:185-201.
Conese, C. y F. Maselli (1992), "Use error
matrices to improve área estimates with máximum Friedl, M. A., C. Woodcock, S. Gopal, D.
likelihood classification procedures", Remote Sen- Muchoney, A. H. Strahler y C, Barker-Schaaf
sing ofthe Environment, 40:113-124. (2000), "A note on procedures used for accuracy
assessment in land cover maps derived from
Congalton, R. G. (1988a), "Using spatial auto- AVHRR data", International Journal Remote
correlation analysis to explore the errors in maps Sensing, 21(5):1073-1077.

Evaluación de la confíabilidad temática de mapas o de imágenes clasificadas; una revisión
Goodchild, M. F., S. Gouquing y Y. Shiren dings of the ASPRS Symposium, Washington,

(1992), "Development and test of an error model USA.
for categórica! data", International Journal of
Geographical Information Systems, 6:87-104. Luneta, R., R. G. Congalton, L K.
Fnstermaker, J. R. Jensen, K. C. McGw y L. R.
Gopal, S., C. E. Woodcock y A. Strahler Tinney (1991), "Remote sensing and geographic
(1999), "Fuzzy neural network classification of ¡nformation systems data integration: error
global land cover from a 1o AVHRR Data Set", sources and research issues", Photogrammetric
Remote Sensing Environment, Elsevier Science Engineering and Remote Sensing, 57(6): 677-687.
Inc., New York, 67:203-243.
Ma, Z. y R. L Redmond (1995), "Tau coeffi-
Gopal, S., y C. E. Woodcock (1994), "Accuracy cients for accuracy assessment of classification of
of thematic maps using fuzzy sets I: theory remote sensing data", Photogrammetric Enginee-
and methods", Photogrammetric Engineering and ring and Remote Sensing, 61:435-439.
RemoteSensing, 58:35-46.
Mas, J. F., (2000), "Une revue des techniques
Green, D. R. y S. Hartley (2000), "Integrating et méthodes de télédétection du changement",
photointerpretation and GIS for vegetation Canadian Journal of Remote Sensing I Journal
mapping: some issues of error", Alexander, R. Canadien de télédétection, vol. 26(4):349-369.
y A. C. Millington (eds.), Vegetation Mapping:
From Patch to Planet, John Wiley & Sons Ltd., Mas, J. F., J. L. Palacio, A. Velázquez y
pp. 103-134. G. Boceo (2001), "Evaluación de ¡a confiabilidad
temática de bases de datos cartográficas",
Hammond, T. O. y D. L Verbyla (1996), Memoria Digital CD interactivo, ler. Congreso
"Optimistic bias in classification accuracy assess- Nacional de Geomática, Guanajuato, 26-28 de
ment", International Journal Remote Sensing, 17 septiembre de 2001, http://indy2.igeograf.unam.
(6):1261-1266. mx/dote/publicaciones/evalconf_congreso.htm
Hay, A. M. (1988), "The derivation of global Mas, J. F., A. Velázquez, J. L. Palacio-Prieto,

estimates from a confusión matrix", International G. Boceo, A. Peralta y J. Prado (2002),
Journal Remote Sensing, 9(8):1395-1398. "Assessing forest resources in México: Wall-to-
wall land use/cover mapping", Photogrammetric
tU Hord, R. M. y W. Brooner (1976), "Land-use Engineering and Remote Sensing 68(10):966-968.
map accuracy criteria", Photogrammetric Engi- http://asprs.org/asprs/publications/
neering and Remote Sensing, 42(5):671-677. pe&rs/2002journal/october/high!ighthtml.
Janssen, L. F. y F. J. van der Wel (1994), Millington, A.C. y R. W. Alexander (2000),

"Accuracy assessment of satellite derived land- "Vegetation mapping in the last three decades of
cover data, a review", Photogrammetric Engi- the twentieth century", Millington, A. C y R W
neering and Remote Sensing, 60(4):419-426. Alexander (eds.), Vegetation Mapping, John Wiley
& Sons, Chochester, England, pp. 321-331.
Jupp, D. (1989), "The stabtüty of global esti-
mates from confusión matrices", International Naeseet, E. (1996), "Use of the weighted
Journal Remote Sensing, 10(9):1563-1569. Kappa coefficient in classification error asse-
ssment of thematic maps", International Journal
Khorram, S. (1999), "Accuracy assessment of Geographical Information Systems 10(5):591-604.
remote sensing-derived change detection", Photo-
grammetric Engineering and Remote Sensing. Peralta-Higuera, A., J. L Palacio, G. Boceo, J,
Monograph Series. F. Mas, A. Velázquez, A. Victoria, R. Bermúdez,
U. Martínez y J. Prado (2001), "Nationwide sam-
Khorram, S , J Knight, H. Cakir, H. Yan, Z pling of México with airborne digital cameras:
Mao y X. Dai (2000), "Improving estimates of the an image datábase to valídate the interpretaron
accuracy of thematic maps when using aerial of satellite data", American Society for Photo-
photos as the ground reference source", Procee- grammetry and Remote Sensing, 18th Biennal

Workshop on Color Photography & Videography Stehman, S. V. (1999), "Basic probability

in Resource Assessment. Amherst, Mass., USA, sampling designs for thematic map accuracy",
mayo 16-18, pp. 1-9. International Journal Remote Sensing 20
(12):2423-2441.
Pontius R.G. (2000), "Quantification error
versus location error in comparison of categorical Stehman, S. V. (2000), "Practical implications
maps", Photogrammethc Engineeríng and Remote of design-based sampling inference for thematic
Sensing, 66(8)1011-1016. map accuracy assessment", Remote Sensing of
Environment, 72:35-45.
Pontius R. G. (2002), "Statistical methods to
partition of quantity and location during compari- Stehman, S. V. (2001), "Statistical rigor and
son of categorical maps at múltiple resolutions", practical utility in thematic map accuracy
Photogrammetric Engineering and Remote Sen- assessment", Photogrammetric Engineering and
sing, 68(10):1041-1049. Remote Sensing, 67(6): 727-734.
Rosenfield, G. H. y K. Fitzpatrick-Lins (1986), Turk, G. T. (1979), "GT Índex: a measure

"A coefficient of agreement as a measure of of the success of prediction", Remote Sensing
thematic classification accuracy", Photogramme- Environment, 8:65-75.
thc Engineering and Remote Sensing, 52(2):223-
227. Vogelmann, J. E., S. M. Howard, L Yang, C.
R. Larson, B. K. Wylie y N. Van Driel (2001),
Singh, A. (1989), "Digital change detection "Completion of the 1990s National Land Cover
techniques using remotely-sensed data", Inter- Data Set for the Conterminous United States from
national Journal of Remote Sensing, 10(6):989- Landsat Thematic Mapper Data and Ancillary
1003. Data Sources", Photogrammetric Engineering and
Remote Sensing, 67(6): 650-662.
Stehman, S. V. y R. L. Czaplewski (1998),
"Design and analysis for thematic map accuracy Walsh, J. E., D. R. Lightfoot y D. R. Buttler
assessment: fundamental principies", Remote (1987), "Recognitíon and assessment of error
Sensing Environment, 64:331-344. in geographic informatíon systems", Photo-
grammetric Engineering and Remote Sensing, 53
Stehman, S. V. (1992), "Comparison of syste- (10):1423-1430.
matic and random sampling for estimating the
accuracy of maps generated from remotely Wonnacott, T. H. y R. J. Wonnacott (1991),
sensed data", Photogrammetric Engineering and Statistiques, Ed. Económica, 4a edición.
Remote Sensing, 58(9):1342-1350.
Woodcock, C. y S. Gopal (2000), "Accuracy
Stehman, S. V. (1996), "Estimating the kappa assessment and área estimates using fuzzy sets".
coefficient and its variance under stratified random International Journal of Geographical Information
sampling", International Journal Remote Sensing, Science. 14(2): 153-172.
62:401-407.
Stehman, S. V. (1997), "Selecting and inter-

preting measures of thematic classification accu-
racy", Remote Sensing, Environment, 62:77-89.
View publication stats

Evaluacion de La Confiabilidad Tematica de Mapas o

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Evaluacion de La Confiabilidad Tematica de Mapas o

Cargado por

Copyright:

Formatos disponibles

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Evaluación de la conﬁabilidad temática de mapas o de imágenes

Jean François Mas Azucena Pérez Vega

SEE PROFILE SEE PROFILE

Geografía Ambiental View project

The user has requested enhancement of the downloaded file.

Evaluación de la confiabilidad temática de mapas o de

Palabras claves: Evaluación de la confiabilidad, cartografía, clasificación de imágenes, SIG.

Assessment of the thematic reliability of maps and

Key words: Reliability assessment, cartography, image classification, GIS

INTRODUCCIÓN palmente, de la calidad de los insumos y de

La evaluación de la confiabilidad de los ma- b) La evaluación del sitio de verificación, que

54 Investigaciones Geográficas, Boletín 51, 2003

necesarias (tamaño de muestra). las clasificaciones digitales píxel a píxel.

Las unidades de muestreo En el caso de mapas en formato vectorial, el

Figura 1. Unidades de muestreo puntual de diferentes superficies y formas.

Investigaciones Geográficas, Boletín 51, 2003 55

Durante el análisis de la unidad de muestreo, valos regulares a partir de un punto selec-

56 Investigaciones Geográficas, Boletín 51, 2003

Figura 2. Esquemas de muestreo probabilistas más aplicados en la evaluación de la confíabilidad

Investigaciones Geográficas, Boletín 51, 2003 57

tipos de cobertura (límites entre polígonos;

Congalton (1988b) sugiere muestrear una En la evaluación de la confiabilidad de

58 Investigaciones Geográficas, Boletín 51, 2003

La aproximación normal permite determinar 0.05 (en otras palabras, la probabilidad de

Investigaciones Geográficas, Boletín 51, 2003 59

Como se puede observar en la ecuación en cada estrato, la ecuación (3a) no aplica

60 Investigaciones Geográficas, Boletín 51, 2003

cundaria, particularmente en los trópicos). lo que se observa en la fotografía, pero es

Investigaciones Geográficas, Boletín 51, 2003 61

62 Investigaciones Geográficas, Boletín 51, 2003

Tabla 2. Matriz de confusión derivada de la figura 4

Ref. A B C D Error Omis. Conf. prod.

Error Com. % 33.3 50.0 0.0 33.3

Conf. us. 66.7 50.0 100.0 66.7

Investigaciones Geográficas, Boletín 51, 2003 63

Tabla 3. Matriz de confusión expresada en proporción. Las mismas anotaciones

müar al cálculo de la confiabilidad del usuario

El coeficiente de Kappa para la categoría

Po se obtiene sumando los elementos de la

Pc se calcula sumando el producto de las

La suma de la diagonal que expresa la

64 Investigaciones Geográficas, Boletín 51, 2003

Tabla 4. Matriz de confusión expresada en proporción derivada de la Tabla 2

Investigaciones Geográficas, Boletín 51, 2003 65

DISCUSIÓN La estratificación consiste en repartir el

Algunos mecanismos para reducir costos La evaluación de la confiabilidad se puede

66 Investigaciones Geográficas, Boletín 51, 2003

Investigaciones Geográficas, Boletín 51, 2003 67

Núm. de sitios de verificación 50 50 50 100

Medio intervalo de confianza 5.4 8.3 13.8 9.7

El problema de la confiabilidad de los particular de la evaluación de un mapa temá-

68 Investigaciones Geográficas, Boletín 51, 2003

Los resultados de la evaluación de la confia- Se agradece a S. Sánchez-Cotón, a S.

Investigaciones Geográficas, Boletín 51, 2003 69

REFERENCIAS generated from remotely sensed data", Photo-

70 Investigaciones Geográficas, Boletín 51, 2003

Goodchild, M. F., S. Gouquing y Y. Shiren dings of the ASPRS Symposium, Washington,

Hay, A. M. (1988), "The derivation of global Mas, J. F., A. Velázquez, J. L. Palacio-Prieto,

Janssen, L. F. y F. J. van der Wel (1994), Millington, A.C. y R. W. Alexander (2000),

Investigaciones Geográficas, Boletín 51, 2003 71

Workshop on Color Photography & Videography Stehman, S. V. (1999), "Basic probability

Rosenfield, G. H. y K. Fitzpatrick-Lins (1986), Turk, G. T. (1979), "GT Índex: a measure