Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guia Metodologica para El Diseño de Indicadores
Guia Metodologica para El Diseño de Indicadores
Este documento fue preparado por Andrs Schuschny y Humberto Soto, funcionarios de la Divisin de Desarrollo Sostenible y Asentamientos Humanos (DDSAH) de la CEPAL. El trabajo ha sido revisado y supervisado por Carlos de Miguel, oficial de asuntos ambientales de esa Divisin, y cont con las valiosas observaciones y sugerencias de Xavier Mancero, Salvador Marconi y Kristina Taboulchanas, funcionarios de la Divisin de Estadstica y Proyecciones Econmicas de la CEPAL, y de Gilberto Gallopn, experto internacional en temas de ecologa e indicadores de desarrollo sostenible. La investigacin responde a una solicitud de los Gobiernos de Amrica Latina y el Caribe y se ha desarrollado en el contexto del Programa de Cooperacin entre el Ministerio Federal de Cooperacin Econmica y Desarrollo de Alemania (BMZ), a travs de la Sociedad Alemana de Cooperacin Tcnica (GTZ) y la CEPAL, llamado Globalizacin II Componente 2: Desarrollo sostenible, gestin integral de recursos naturales y manejo del cambio climtico (GER/08/005), coordinado por Jos Javier Gmez de la DDSAH de CEPAL. Las opiniones expresadas en este documento, que no ha sido sometido a revisin editorial, son de exclusiva responsabilidad del autor y pueden no coincidir con las de la Organizacin.
LC/W.255 Copyright Naciones Unidas, mayo de 2009. Todos los derechos reservados Impreso en Naciones Unidas, Santiago de Chile La autorizacin para reproducir total o parcialmente esta obra debe solicitarse al Secretario de la Junta de Publicaciones, Sede de las Naciones Unidas, Nueva York, N. Y. 10017, Estados Unidos. Los Estados miembros y sus instituciones gubernamentales pueden reproducir esta obra sin autorizacin previa. Slo se les solicita que mencionen la fuente e informen a las Naciones Unidas de tal reproduccin.
ndice
Resumen
...................................................................................................................................7
Introduccin ...................................................................................................................................9 I. Consideraciones preliminares sobre los indicadores compuestos .......................................13 Definicin y objetivos ....................................................................................................13 Ventajas ........................................................................................................................14 Limitaciones y desventajas ...........................................................................................14 Requerimientos tcnicos ................................................................................................15 Breve comentario sobre la naturaleza de la medicin en el contexto de la evaluacin de la sostenibilidad.......................................................................................16 II. Tipos de indicadores compuestos de desarrollo sostenible ..................................................17 Indicadores basados exclusivamente en las ciencias naturales .......................................17 Indicadores de desempeo de polticas .........................................................................18 Indicadores basados en criterios contables .....................................................................18 Indicadores sinpticos ....................................................................................................18 III. Metodologa de construccin de indicadores compuestos ..................................................21 Construccin por etapas ..................................................................................................21 IV. Desarrollo de un marco conceptual ......................................................................................23 Marcos conceptuales en el contexto de la sostenibilidad del desarrollo ........................23 Los pilares del concepto de sostenibilidad del desarrollo ...............................................24 V. Seleccin de los indicadores ....................................................................................................27 Propuestas de Estadsticas e Indicadores de Desarrollo Sostenible ................................28 Indicadores CDS .............................................................................................................28 Indicadores ODM............................................................................................................31 Estadsticas de BADEIMA .............................................................................................34 Indicadores propuestos por ESALC................................................................................36 Indicadores propuestos por ILAC ...................................................................................39 VI. Anlisis multivariado descriptivo .........................................................................................41 Anlisis de relaciones entre variables.....................................................................................42
3
Anlisis de Componentes Principales (ACP)..................................................................42 Anlisis Factorial ............................................................................................................45 Coeficientes Alfa de Cronbach .......................................................................................46 Estudio de relaciones entre unidades de anlisis ...................................................................46 Anlisis de conglomerados (Clustering anlisis) ............................................................46 VII. Imputacin de datos perdidos .............................................................................................51 Imputacin simple de datos perdidos......................................................................................52 Modelizacin implcita ...................................................................................................52 Modelizacin explcita....................................................................................................52 Imputacin mltiple de datos perdidos...................................................................................53 VIII. Normalizacin de los datos .................................................................................................55 Identificacin de valores atpicos ..........................................................................................55 Transformaciones de escala y correccin de asimetras .........................................................56 Mtodos de normalizacin......................................................................................................57 Empleo de tasas o porcentajes de variacin....................................................................58 Ordenamiento de indicadores entre unidades de anlisis................................................58 Estandarizacin (z-score)................................................................................................58 Re-escalamiento ..............................................................................................................58 Distancia a una unidad de anlisis de referencia.............................................................59 Categorizacin de escalas ...............................................................................................59 Categorizacin de valores por encima o debajo del promedio........................................60 IX. Ponderacin de la informacin normalizada .......................................................................61 Metodologas usualmente adoptadas ......................................................................................62 Establecimiento de pesos equiproporcionales.................................................................62 Mtodos participativos de ponderacin ..........................................................................62 Ponderacin a travs del clculo de la distancia a objetivos planteados.........................62 Ponderacin mediante clculos de regresin ..................................................................63 Anlisis de componentes principales ..............................................................................63 Anlisis envolvente de datos...........................................................................................64 Modelos de componentes no observados........................................................................65 Ponderacin usando procesos de Jerarqua Analtica .....................................................66 Anlisis Conjunto............................................................................................................68 X. Mtodos de agregacin ............................................................................................................71 Descripcin de las diferentes opciones...................................................................................71 Suma de rankings ............................................................................................................71 Conteo de las variables que superan o exceden una referencia dada ..............................71 Media aritmtica ponderada............................................................................................72 Promedio geomtrico ponderado ....................................................................................72 Comparacin entre ambas aproximaciones.....................................................................73 Aproximaciones multi-criterio ........................................................................................73 XI. Robustez y anlisis de sensibilidad .......................................................................................77 Anlisis de incerteza ...............................................................................................................77 Anlisis de sensibilidad a partir del uso de la varianza ..........................................................79 XII. Algunas propuestas existentes de indicadores compuestos para evaluar la sostenibilidad del desarrollo ................................................................................................81 Indicadores basados exclusivamente en las ciencias naturales...............................................81 ndice de Planeta Vivo ...................................................................................................81 Indicadores de desempeo de polticas .................................................................................82
4
ndice Metropolitano de la Calidad del Aire ..................................................................82 Indicadores de tipo contable ...................................................................................................83 ndice de Ahorro Genuino...............................................................................................83 ndice de Bienestar Econmico Sostenible y el ndice de Progreso Genuino.................84 Huella Ecolgica .............................................................................................................84 Indicadores de tipo sinptico ..................................................................................................84 ndice de Desarrollo Humano (IDH) ..............................................................................84 ndice de Desempeo Ambiental (Environmental Performance Index (EPI))................86 ndice de Sostenibilidad Ambiental (Environmental Sustainability Index (ESI)) ..........92 XIII. Presentacin, visualizacin y diseminacin del indicador ...............................................97 Formatos de presentacin .......................................................................................................97 Presentacin en Tablas....................................................................................................97 Grficos de barras ...........................................................................................................98 Listado del ordenamiento o ranking................................................................................98 Grficos de lneas............................................................................................................98 Seales de trfico ............................................................................................................98 Pictogramas.....................................................................................................................99 Grficos de radar o telearaa ..........................................................................................99 Diseo de informacin..........................................................................................................100 Bases conceptuales para su definicin ..........................................................................100 Algunos ejemplos..........................................................................................................102 Conclusiones y consideraciones finales .....................................................................................105 Bibliografa..................................................................................................................................107
ndice de recuadros
Recuadro 1 Anlisis de componentes principales ..........................................................................43 Recuadro 2 Coeficiente Alfa de Cronbach .....................................................................................46 Recuadro 3 Definiciones de distancias...........................................................................................49 Recuadro 4 Regresiones lineales ....................................................................................................52 Recuadro 5 Algoritmo de expectacin-maximizacin (EM)..........................................................53 Recuadro 6 Transformaciones de box-cox .....................................................................................57 Recuadro 7 Alternativas de reescalamiento....................................................................................59 Recuadro 8 Anlisis conjunto.........................................................................................................68
ndice de grficos
Grfico 1 Estructura de BADESALC.............................................................................................37 Grfico 2 Ejemplos diagramticos del anlisis de agrupamiento jerrquico (izquierda) y no jerrquico (derecha)................................................................................................47 Grfico 3 Ejemplo de rango intercuarlco ......................................................................................56 Grfico 4 Ejemplo diagramtico del anlisis envolvente de datos .................................................64 Grfico 5 Sustainable Project Appraisal Routine (SPeAR).........................................................99 Grfico 6 Jerarquas de los saberes .............................................................................................100 Grfico 7 Algunas herramientas para el Diseo de Informacin ................................................101 Grfico 8 El Trendalyzer de Gapminder .....................................................................................103 Grfico 9 Ejemplo de diseo de informacin en formato grfico ...............................................104
ndice de cuadros
Cuadro 1 Indicadores de Desarrollo Sostenible de la CDS ............................................................28 Cuadro 2 Indicadores de los Objetivos de Desarrollo del Milenio.................................................31 Cuadro 3 Estadsticas e Indicadores de BADEIMA.......................................................................34 Cuadro 4 Indicadores de BADESALC...........................................................................................38 Cuadro 5 Indicadores de ILAC.......................................................................................................39 Cuadro 6 Indicadores para el ndice de Desarrollo Humano (IDH)...............................................85 Cuadro 7 Indicadores y pesos para el ndice de Desarrollo Humano (IDH) ..................................85 Cuadro 8 Indicadores para el ndice de Desempeo Ambiental (EPI)...........................................87 Cuadro 9 Descripcin de los indicadores para el ndice de Desempeo Ambiental (EPI) ............88 Cuadro 10 Fuentes de los indicadores para el ndice de Desempeo Ambiental (EPI) .................89 Cuadro 11 Metas de los indicadores para el ndice de Desempeo Ambiental (EPI) ....................90 Cuadro 12 Factores de Peso de los indicadores para el ndice de Desempeo Ambiental (EPI) ...91 Cuadro 13 Indicadores y variables para el ndice de Sostenibilidad Ambiental (ESI)...................94 Cuadro 14 Resumen de las principales caractersticas de los indicadores compuestos relacionados con el medio ambiente y la sostenibilidad.............................................105
Resumen
Este documento trata de poner en conocimiento al lector, de las bases conceptuales y de las herramientas metodolgicas aplicables al proceso de diseo, clculo y anlisis de un indicador compuesto de desarrollo sostenible definido a nivel de una unidad de anlisis (por ejemplo, a nivel de pases). Se resalta, a lo largo del texto, la necesidad de clarificar los objetivos y el contexto en el que se construir el indicador compuesto para darle sustento conceptual, as como de disponer de informacin de calidad que le de validez. Se destaca tambin la importancia de utilizar las herramientas metodologas con rigurosidad en cada etapa del proceso de construccin, con el fin de obtener un indicador compuesto con sustento tcnico. Estos tres elementos se consideran indispensables para que el indicador compuesto sea til y efectivo para el fin para el que sea construido. La primera parte del documento se enfoca al sustento conceptual del indicador compuesto. En el captulo I se presenta una descripcin general de los indicadores compuestos, las ventajas y desventajas ms importantes a considerar detallndose los requerimientos tcnicos que deben cumplir, y ya en el contexto del desarrollo sostenible, se incluye un comentario sobre la naturaleza de la medicin. El captulo II exponen los distintos tipos de indicadores compuestos de desarrollo sostenible que se pueden construir, incluidos los que se basan exclusivamente en las ciencias naturales, los que se construyen con fines particulares para evaluar una poltica, los que se basan en conceptos contables y los de tipo sinptico. En el captulo III se exponen las etapas del proceso de construccin de un indicador compuesto en general, y se hace una breve descripcin de cada una de ellas. En el captulo IV se profundiza en la definicin del marco conceptual, presentndose algunos de los marcos conceptuales que han sido utilizados en el contexto del desarrollo sostenible. Se resalta la importancia de tener claridad tanto en la definicin como en los objetivos que se pretenden alcanzar por medio del indicador compuesto a construir, as como el tener presente que se busca realizar una medicin de un concepto multidimensional en una dimensin, lo cual implica un alto nivel de complejidad. En la segunda parte del documento, con enfoque en los elementos de validez y sustento tcnico, se consideran los aspectos metodolgicos involucrados en las siguientes etapas de construccin de los indicadores compuestos, incluyendo el proceso de seleccin de indicadores, anlisis multivariado descriptivo, manejo de los valores perdidos, normalizacin y agregacin de las variables que componen un indicador compuesto, as como su posterior presentacin. Aqu se trata de considerar todos los sutiles detalles implicados en el proceso de diseo metodolgico que yace tras la construccin de un indicador compuesto. En el captulo V se describe la etapa de seleccin de indicadores con nfasis en la necesidad de disponer datos de calidad, y se presentan algunas de las iniciativas sobre sistemas de estadsticas e indicadores de desarrollo sostenible que se han planteado tanto a nivel internacional como en el mbito 7
regional de Amrica Latina y el Caribe. En el contexto internacional se incluyen el listado de Indicadores de Desarrollo Sostenible propuesto por la Comisin de Desarrollo Sostenible (CDS) y el listado de indicadores de monitoreo de los Objetivos de Desarrollo del Milenio, ambos de de Naciones Unidas. A escala regional se enlistan los indicadores ambientales de la Base de Datos de Indicadores Ambientales (BADEIMA) y los de la Base de Datos de Indicadores de Desarrollo Sostenible en Amrica Latina y el Caribe (BADESALC), ambas actualizadas continuamente por la Comisin Econmica para Amrica Latina y el Caribe. Se presenta tambin el listado de Indicadores Ambientales y de Desarrollo Sostenible propuestos por la Iniciativa Latinoamericana y Caribea para el Desarrollo Sostenible (ILAC). En el captulo VI se analiza la etapa de anlisis multivariado descriptivo haciendo nfasis en la necesidad de realizar una exploracin de la informacin disponible, previo a la construccin del indicador compuesto, con el objetivo de detectar vacos de informacin as como de establecer, por medio de herramientas de estadstica multivariada, posibles relaciones entre individuos o entre variables que permitan tener una visin a priori de los resultados probables a obtener al construir el indicador compuesto, as como descartar informacin redundante. En caso de encontrar vacos de informacin es necesario pasar por la etapa del manejo de valores perdidos, para lo cual en el captulo VII se presentan algunas tcnicas de imputacin de datos faltantes, tanto de imputacin simple como de imputacin mltiple, y se hace una reflexin sobre las limitaciones de dichas imputaciones. Para la etapa de normalizacin se incluye, en el captulo VIII, la descripcin sobre metodologas que permiten homologar las escalas de medicin de las distintas variables a utilizar, a fin de poder hacerlas comparables a partir de distintas propuestas de transformacin, estandarizacin o reescalamiento, haciendo nfasis en el estudio de los valores atpicos. La etapa de agregacin presentada en el captulo IX se destaca como uno de los pasos cruciales en el diseo metodolgico del indicador compuesto. Se hace una reflexin sobre las alternativas para asignar pesos a las variables, ya sea por medio del juicio de expertos o por herramientas estadsticas, presentndose algunas de ellas que permiten, a partir de un sustento metodolgico, asignar ponderaciones y realizar las agregaciones de las variables. Para validar la robustez del mtodo de construccin, se incluye en el captulo X una descripcin sobre tcnicas de anlisis de sensibilidad que permiten determinar si pequeas variaciones en las variables de insumo, conducen efectivamente a variaciones menores en el valor del indicador compuesto. Se incluye la descripcin de los anlisis de incerteza y de sensibilidad a travs del estudio de la varianza. La tercera parte del documento se centra en aspectos de aplicabilidad de los indicadores compuestos de desarrollo sostenible, para lo cual se presentan en el captulo XI las principales iniciativas realizadas en materia de indicadores compuestos agregados, con particular nfasis en las experiencias relacionadas con la definicin de indicadores compuestos que evalan la sostenibilidad del desarrollo de los pases y aquellos casos que se aplicaron al anlisis y tratamiento integrado del medio ambiente, tratando de destacar sus ventajas de aplicacin, as como sus limitaciones tanto metodolgicas como de interpretacin. Finalmente se presentan en el Captulo XII alternativas sobre presentacin, visualizacin y diseminacin de los indicadores compuestos, haciendo una reflexin sobre la posibilidad de, alternativa o paralelamente a la construccin de indicadores compuestos, presentar visualmente los subcomponentes de dichos indicadores compuestos.
Introduccin
Durante los ltimos aos, tanto los tomadores de decisiones como los grupos de inters (stakeholders) y los medios de comunicacin, han manifestado un inters creciente en realizar esfuerzos por disear mecanismos o herramientas tiles para evaluar la sostenibilidad del desarrollo en los pases, ello derivado de los consensos internacionales que han destacado la relevancia del tema. Esto qued claramente expresado en la Declaracin de Ro sobre el Medio Ambiente y el Desarrollo (Naciones Unidas, 1992). En el principio 10 de dicha de declaracin se expresa que: El mejor modo de tratar las cuestiones ambientales es con la participacin de todos los ciudadanos interesados, en el nivel que corresponda. En el plano nacional, toda persona deber tener acceso adecuado a la informacin sobre el medio ambiente de que dispongan las autoridades pblicas, incluida la informacin sobre los materiales y las actividades que encierran peligro en sus comunidades, as como la oportunidad de participar en los procesos de adopcin de decisiones. Los Estados debern facilitar y fomentar la sensibilizacin y la participacin de la poblacin poniendo la informacin a disposicin de todos. Deber proporcionarse acceso efectivo a los procedimientos judiciales y administrativos, entre stos el resarcimiento de daos y los recursos pertinentes. En el transcurso de los aos siguientes a la Declaracin de Ro se reiter la necesidad de generar conjuntos de indicadores de monitoreo al desarrollo sostenible en el seno de las primeras reuniones de la Comisin de Desarrollo Sostenible (CDS), la cual aprob en 1995 el programa de trabajo en indicadores de desarrollo sostenible que tuvo como finalidad la generacin de un listado de indicadores de desarrollo sostenible concensuados a nivel internacional, y cuyo resultado qued plasmado en el documento Indicadores de Desarrollo Sostenible. Marco y Metodologas (1996), que incluy un listado de indicadores que fueron reevaluados posteriormente por varios pases, entre ellos algunos de Amrica Latina y el Caribe, concluyendo esa reevaluacin con una segunda edicin del referido documento, publicada en 2001. La revisin posterior se ha realizado en forma continua, y una tercera edicin del documento se public en 2007. En el transcurso de esas revisiones se ha difundido ampliamente la necesidad de generar indicadores de desarrollo sostenible a nivel nacional. Por tal motivo la mayora de los pases de la regin de Amrica Latina y el Caribe, se han visto motivados a fomentar iniciativas que faciliten la construccin de sistemas de Indicadores de Desarrollo Sostenible (IDS), incluyendo esfuerzos por generar informacin sobre temas ambientales para los cuales existen pocos datos, as como a procurar estrategias de difusin que pongan a disposicin de la manera ms amigable y accesible posible dicha informacin para facilitar, tanto a los gobiernos como a los grupos de inters, la evaluacin de los progresos en pro de la sostenibilidad del desarrollo. En particular, los indicadores de desarrollo sostenible han mostrado ser una herramienta de utilidad en el trabajo de diseo y evaluacin de desempeo de las polticas pblicas en el marco de un anlisis 9
integrador. En Quiroga (2007), por ejemplo, se explicita la vasta diversidad de iniciativas realizadas en esta direccin. Uno de los objetivos planteados por la Divisin de Desarrollo Sostenible y Asentamientos Humanos de la CEPAL, ha sido el facilitarle a los pases de metodologas y herramientas de trabajo que permitan realizar esta compleja labor y proveerlos de las mejores o ms notables experiencias realizadas en otras regiones. En el contexto de los Indicadores de Desarrollo Sostenible, la Divisin llev a cabo en aos anteriores el proyecto de Evaluacin de la Sostenibilidad en Amrica Latina, que contempl la definicin del concepto de Desarrollo Sostenible en un enfoque sistmico, a partir del la cual se defini un listado de indicadores agrupados en torno a cuatro subsistemas (econmico, social, ambiental e institucional) y sus interrelaciones. Este proyecto foment la generacin de sistemas de Indicadores de Desarrollo Sostenible en los pases de Amrica Latina, poniendo nfasis en aspectos metodolgicos como la generacin de fichas tcnicas estandarizadas, as como en aspectos prcticos, como el uso de los indicadores para generar perfiles de desarrollo sostenible para los pases, utilizando herramientas de georreferenciacin y explorando la posibilidad de construir indicadores compuestos cualitativos (Gallopn, 2006b). Uno de los aportes principales del proyecto fue el de plantear la importancia de integrar los indicadores en diferentes reas, haciendo nfasis en el estudio de las interrelaciones inherentes a los sistemas de indicadores. Recientemente, los indicadores compuestos o sintticos que resumen la informacin contenida en los sistemas de indicadores, han ganado un creciente inters como una herramienta eficaz que contribuye a la formulacin y el anlisis de polticas pblicas as como a su evaluacin y comunicacin. Por su capacidad de sntesis, los indicadores compuestos permiten atraer la atencin de la comunidad, dar lugar a la creacin de narrativas convincentes y ayudar a enfocar los debates de las polticas integradas que promuevan el desarrollo orientado a la sostenibilidad. La construccin de indicadores compuestos con el fin de analizar y evaluar el desempeo de los pases, suele realizarse en mltiples reas de la gestin pblica tales como la Economa y sus diversos sectores (industria, agricultura, servicios, etc.) el desarrollo social y el anlisis integrado del medio ambiente y su interaccin con el desarrollo econmico, sectorial y social. Estos indicadores compuestos tambin suelen aplicarse en la formulacin de polticas de promocin de la innovacin y la investigacin cientfica. La Unin Europea y la Organizacin para la Cooperacin y el Desarrollo Econmicos han sido pioneras en el desarrollo de iniciativas relacionadas con estos conceptos, generando un acervo de documentacin que puede servir de punto de partida para su estudio. Para Amrica Latina y el Caribe se conocen algunas experiencias con el uso de estos indicadores compuestos en distintas reas, principalmente en los mbitos econmicos (ndices de productividad, de eficiencia, etc.) y sociales (ndices de pobreza, de vulnerabilidad, etc.), sin embargo en el contexto del desarrollo sostenible solo se conocen las experiencias derivadas de los ndices que se han construido a nivel global para todos los pases, entre los cuales se incluye a los de la regin. Estas experiencias han surgido en algunos casos de organismos internacionales, como por ejemplo el Indice de Desarrollo Humano del Programa de Naciones Unidas para el Desarrollo. En otros casos como en el ndice de Sosteniblilidad Ambiental (ESI), han sido universidades (Columbia-Yale) las que han planteado las propuestas. Se conocen pocos casos de uso a partir de instituciones pblicas en la regin, casos aislados como el ndice Metropolitano de la Calidad del Aire (IMECA) utilizado por el gobierno de Mxico. Los indicadores compuestos suelen ser empleados para establecer comparaciones acerca del desempeo de las unidades de anlisis a partir de las cuales se calculan. Se suele argir que el uso de indicadores compuestos facilita la interpretacin de los escenarios que deben considerar los tomadores de decisiones y que son una herramienta de suma utilidad para evaluar el desempeo de los pases mediante los ejercicios de comparacin (benchmark). Sin embargo, el descuido metodolgico durante su diseo, la falta de informacin y el uso de datos inconsistentes pueden dar lugar a conclusiones, si no errneas, demasiado simplificadas. Es por ello que hemos considerado pertinente realizar el presente documento, con un objetivo primordial, el mostrar una gua sobre los aspectos metodolgicos concernientes al diseo y construccin de indicadores compuestos, destacando la necesidad de seguir un conjunto de reglas y principios que permitan combinar distintas fuentes de informacin en un solo valor 10
que queda resumido en el indicador compuesto propiamente dicho. A lo largo del documento hemos ilustrado las principales cuestiones que hay detrs del diseo e implementacin de los mismos. Nos hemos basado en metodologas ya planteadas por otras instituciones procurando mostrar los casos existentes ms relevantes. Adems hemos incluido un apartado donde se presentan los esfuerzos que en materia de ndices compuestos o sintticos se han desarrollado a nivel internacional, mostrando los ms connotados o utilizados hasta ahora. Se ha buscando sealar a lo largo del documento tanto las ventajas como las desventajas y limitaciones del uso, tanto en el mbito general referido a los indicadores compuestos, como en el caso particular de los indicadores compuestos de desarrollo sostenible haciendo nfasis en la aplicabilidad de los mismos en el contexto de la regin de Amrica Latina y el Caribe.
11
I.
Definicin y objetivos
Un indicador compuesto es una representacin simplificada que busca resumir un concepto multidimensional en un ndice simple (unidimensional) con base en un modelo conceptual subyacente. Puede ser de carcter cuantitativo o cualitativo segn los requerimientos del analista. En trminos tcnicos, un indicador se define como una funcin de una o ms variables, que conjuntamente miden una caracterstica o atributo de los individuos en estudio. Para efectos del presente documento se denotar como indicador compuesto al que se construye como funcin de dos o ms variables, en cuyo caso se estn midiendo caractersticas multidimensionales (e. g. calidad ambiental, salud humana, etc.). La construccin de un indicador compuesto requiere de dos condiciones bsicas, a saber: i) la definicin clara del atributo que se desea medir y ii) la existencia de informacin confiable para poder realizar la medicin. Estas condiciones son indispensables para poder plantearse la posibilidad de construir un indicador compuesto, la satisfaccin de la primera condicin dar al indicador compuesto un sustento conceptual, mientras que la segunda le otorgar validez. Ambas condiciones deben validarse antes de considerar los aspectos metodolgicos de la construccin del indicador compuesto. Un requerimiento adicional para la construccin de un indicador compuesto es la definicin de un objetivo claro por el cual se est creando. En la mayora de los casos, los indicadores compuestos se construyen con el objetivo de medir el desempeo de una unidad de anlisis1 en un rea o tema determinado, lo que puede ser utilizado como punto de partida para el estudio de la situacin de la misma ya que proporciona informacin acerca de una cuestin de relevancia y permite percibir una tendencia o fenmeno,
En el contexto de los indicadores compuestos considerados en este artculo y con la finalidad de facilitar la comparabilidad a nivel internacional, la unidad de anlisis se referir aqu a los pases. Sin embargo, no se excluye que en un pas determinado se pueda construir un indicador compuesto basado en unidades de anlisis a niveles inferiores (subnacionales), por ejemplo, estados, provincias o municipios, o incluso unidades de anlisis a nivel de microdatos considerando los hogares o individuos.
13
no directamente detectable. La caracterstica ms relevante que se le puede atribuir a los indicadores compuestos es la de resumir, en un valor, numerosos aspectos que pueden estar interrelacionados. Cuando se pretende utilizar un indicador compuesto, se deben tener presentes las ventajas y desventajas o limitantes que tienen este tipo de indicadores, en particular, buscando reducir las limitantes por medio de una construccin metodolgicamente adecuada.
Ventajas
Al poder integrar un amplio conjunto de puntos de vista o subsistemas de una unidad de anlisis considerada, los indicadores compuestos permiten reducir la complejidad de la informacin que deviene de las mltiples perspectivas que, de otra forma, pudieran percibirse en mutuo conflicto. Cabe destacar, que la construccin de un indicador compuesto a menudo supone una implementacin por fases partiendo del clculo de indicadores compuestos referidos a los sub-sistemas que intervienen. Entre las principales ventajas del uso de los indicadores compuestos se puede afirmar que, en primera instancia, integran y resumen diferentes dimensiones de un tema, por eso permiten disponer de una imagen de contexto y son fciles de interpretar por su capacidad de sntesis al reducir el tamao de la lista de indicadores a tratar en el anlisis; por otro lado, atraen el inters pblico por su capacidad de facilitar una comparabilidad entre unidades de anlisis y su evolucin. Esto es particularmente importante puesto que facilita la evaluacin de la eficacia de las polticas y la rendicin de cuentas (accountability) por parte de los representantes del gobierno.
Limitaciones y desventajas
El uso de indicadores compuestos de cualquier tipo, no est exento de limitaciones y desventajas generales, ya que puede proveer mensajes confusos y no robustos si los indicadores estn mal construidos o interpretados. Ello obliga a que durante su proceso de construccin se realicen anlisis de sensibilidad y robustez. Por otro lado, reducir la complejidad de un tema en un valor que, supuestamente, lo mide todo, puede dar lugar a sesgos de percepcin y/o confirmacin2 o a la simplificacin excesiva. Por eso, la alternativa ms viable al momento de disear indicadores compuestos puede ser considerar el clculo de sub-indicadores que representen el comportamiento de los distintos subsistemas que componen la representacin que se desea estudiar. Es justamente aqu, donde comienzan a aparecer las complicaciones ya que la agregacin ponderada de mltiples contenidos de informacin estadstica puede acarrear crecientes niveles de incertidumbre asociados a la integracin de las diversas escalas y dimensiones que el indicador compuesto intenta sintetizar. Ello obliga a procurar evitar la redundancia al momento de seleccionar la informacin que formar parte del indicador compuesto. Adems, el diseo del indicador debe realizarse a partir de un conjunto de informacin medible, i.e. que los datos con que se alimentan estn ampliamente disponibles y sus frecuencias de muestreo respondan a un calendario razonable en relacin a los objetivos que se plantean al momento de disear el indicador y que las unidades de anlisis hayan consensuado un tolerable nivel de armonizacin sobre las estadsticas e indicadores a utilizar. Ciertamente esto abre un debate acerca de la calidad y comparabilidad de las estadsticas que se utilizan, el cual escapa al contenido de este estudio. Asimismo, la eleccin del uso de un indicador compuesto se realiza a partir de su relevancia poltica, es decir que su diseo debe necesariamente contribuir a la toma de decisiones informadas tanto como a potenciar la resonancia comunicacional que este produce con relacin al fenmeno bajo anlisis.
2
Los sesgos de confirmacin son aquellos que tienen lugar cuando se buscan e interpretan resultados que verifican hiptesis y teoras preexistentes en desmedro de aquellos que las refuten. Ello puede ocurrir cuando resulta complicado evaluar la representatividad del indicador y la bondad de ajuste con relacin a la realidad que el indicador intenta explicar.
14
No se debe desconocer que toda iniciativa que busque disear un indicador compuesto deber estar orientada por una demanda potencial puesta de manifiesto por los actores sociales que pudieran estar involucrados en el rea bajo anlisis. Es por ello que durante el proceso de construccin de un indicador compuesto la interaccin con pares y expertos es esencial para lograr la mutua aceptacin del indicador, el cual debe concebirse como una herramienta til de investigacin y comparacin sobre la base del consenso. Sin embargo, a pesar de basarse en el juicio experto, la eleccin del indicador requiere la aplicacin minuciosa de principios estadsticamente fundamentados y procedimientos cuantitativos transparentes ya que, por ejemplo, puede haber conflicto con las escalas de medicin y anlisis: lo que es pertinente a nivel local, puede no serlo a nivel nacional. Muchas pueden ser las crticas que se realicen sobre el uso de indicadores compuestos y los problemas que conlleva su clculo. La correcta seleccin de las variables que lo compondrn, la comparabilidad del indicador compuesto en situaciones diversas, la generalizacin excesiva, el contrapeso que se produce entre variables de naturalezas muy diversas son algunos ejemplos. Koopmans (1947) critica abiertamente la construccin de indicadores compuestos que no tienen una adecuada base terica a partir de la cual iniciar el anlisis. Sin embargo, stricto sensu, las principales crticas se centran en el incumplimiento de alguna de estas hiptesis de partida. Si no se realiza una seleccin correcta de las variables que formarn parte del indicador sinttico, o si sta no abarca las principales dimensiones del objeto de estudio, difcilmente el indicador desarrollado mostrar algo representativo acerca de la cuestin que se desea estudiar.
Requerimientos tcnicos
Siguiendo a Castro Bonao (2002), es vlido definir algunas condiciones tcnicas que a priori deberan exigirse a un indicador compuesto: Existencia y determinacin: La funcin matemtica que define el indicador debe existir y tener solucin perfectamente determinada. Exhaustividad: El indicador compuesto debe ser tal que aproveche al mximo, sin redundancia y en forma til la informacin suministrada por los indicadores y variables que lo componen. Monotona: El indicador ha de responder positivamente al cambio positivo de las componentes y viceversa. Ello obliga, en algunos casos, a cambiar el signo de las variables que lo componen cuyas correlaciones pudieran estar invertidas. Unicidad: El indicador compuesto ha de ser nico para una situacin dada. Invariancia: El indicador debe ser invariante frente a cambios de origen o de escala de sus componentes. Homogeneidad: La funcin matemtica que define al indicador compuesto: debera ser homognea de grado 1, es decir debera cumplirse que: Transitividad: Si (a), (b) y (c) son tres situaciones distintas que dan lugar a tres indicadores, debera verificarse que:
15
16
II.
En el mundo actual de enorme complejidad, se destaca el poder de sntesis que los indicadores compuestos tienen, especialmente cuando se trata de vincular y comunicar entre s a muchos actores o grupos de inters (stakeholders) diversos y dispersos. Ello es particularmente relevante cuando se intenta sintetizar en forma manejable los objetivos e ideas manados del concepto de sostenibilidad del desarrollo. Diferentes visiones sobre el concepto de sostenibilidad del desarrollo han conducido a distintos tipos de indicadores compuestos en el tema. Por un lado, la visin de construir sistemas de informacin que permitan hacer mediciones de una manera relacional, han conducido a la generacin de ndices sintticos basados en sistemas de indicadores de desarrollo sostenible de una manera agregada, en lo que ha sido llamado el enfoque sistmico. Por otro lado, la visin que se basa en la idea de cuantificar el desarrollo monetariamente por medio de medidas de bienestar ha planteado otro esquema para generar ndices, denominado enfoque conmensuralista. Otras visiones ms particulares enfocadas a un solo tema o a un proyecto de poltica aislado han conducido tambin a la construccin de indicadores sintticos, stas ltimas en ocasiones no se encuentran basadas en un enfoque particular. Una descripcin con mayor detalle de estos aspectos se encuentra en Quiroga (2007). La combinacin de informacin de mltiples variables o fuentes en un indicador supone un universo de posibilidades que, a grandes rasgos, puede ser categorizada en cuatro grandes grupos (OECD, 2002):
Algunos ndices de construccin ms elaborada tambin pueden clasificarse en este tipo. Un ejemplo de este tipo de indicadores es el ndice de Planeta Vivo (Worldwide fund for Nature, 2006), que consiste en una medida del bienestar natural de los bosques, los ecosistemas hdricos, los ocanos y las costas del planeta.
Indicadores sinpticos
Se trata de los indicadores que intentan proveer una mirada contextual a una cuestin inherentemente compleja. Se construyen a partir de la agregacin ponderada bajo cierto criterio, de la informacin que se considera relevante sobre el tema a describir. Los indicadores compuestos del tipo sinptico buscan resumir la informacin de un conjunto de caractersticas o variables de inters en un ndice, que si bien es interpretable de modo comparativo entre periodos o entre individuos de estudio, no tiene una interpretacin en trminos de una unidad de medida como lo tienen los ndices basados en criterios contables, cuyo valor se puede asociar directamente a una medida ya sea de tipo monetario o de cualquier otro. Es esa la principal diferencia entre ambos tipos de indicadores. La utilidad que tenga un indicador compuesto se basa en la comparabilidad que dicho indicador pueda tener, ya sea con respecto al tiempo, midiendo su evolucin, o con respecto a valores de referencia.
18
Estos elementos de subjetividad pueden acarrear crticas en su utilizacin, por ello, el rigor metodolgico con que se construyan tiene una gran importancia en trminos de su credibilidad y confiabilidad. Ejemplos de este tipo de indicadores son los ndices de desarrollo humano del Programa de Naciones Unidas para el Desarrollo, as como algunos indicadores propuestos por instituciones acadmicas o foros internacionales como el ndice de Sostenibilidad Ambiental o el ndice de Desempeo ambiental desarrollados en la Universidad de Yale.
19
La construccin de un indicador compuesto, con rigor metodolgico, requiere el anlisis de distintas cuestiones, las cuales sern detalladas en los captulos siguientes partiendo de la base de un esquema de construccin por etapas que a continuacin se enumeran.
Desarrollo de un marco conceptual Seleccin de los indicadores Anlisis multivariado Imputacin de datos perdidos Normalizacin de los datos Ponderacin de la informacin Agregacin de la informacin Anlisis de robustez y sensibilidad
El desarrollo de un marco es fundamental puesto que sustenta de manera conceptual la generacin del indicador compuesto. Es a partir de ese marco que se justifica la construccin del indicador, dando pertinencia y razn de ser a los valores que posteriormente sern analizados. Una vez definido el marco conceptual, es necesario evaluar los indicadores que se desea sintetizar. Esta etapa debe remitirse a un proceso previo de generacin de indicadores, el cual es bsico para la construccin de indicadores compuestos. Este proceso previo consiste en una bsqueda de los indicadores que, dentro del marco conceptual definido, puedan ser construidos o utilizados si es que ya existen, para posteriormente ser incorporados en un indicador compuesto.
21
Cuando se han elegido los indicadores y variables que formarn parte del indicador compuesto, un proceso de anlisis exploratorio es til para evaluar si efectivamente los datos con la informacin seleccionada, estn en concordancia con las ideas que dieron lugar a su eleccin. Este es un primer proceso de validacin de la utilidad de los indicadores seleccionados, en el cual pueden manifestarse problemas de ausencia parcial de informacin. Ello puede conducir a problemas en posteriores etapas, dado que puede generar errores en los anlisis que conduzcan al final a conclusiones incorrectas, lo que hace necesario recurrir a las metodologas de imputacin de datos perdidos o faltantes. Los indicadores y variables seleccionados para la construccin del indicador compuesto, generalmente estarn medidos en distintas escalas, por lo cual se hace necesario normalizarlos para que puedan ser agregados de manera comparable. Una vez hecho esto, es necesario definir el factor de peso que cada indicador o variable tendr en la agregacin, para finalmente generar el agregado y construir los valores del indicador compuesto. Finalizado el proceso de construccin del indicador compuesto, ser necesario presentarlo en un formato claro y entendible, ya sea de manera grfica o tabular. No se debe descuidar el aspecto de la validacin final por medio de un anlisis de sensibilidad, consistente en evaluar si pequeas variaciones en los datos contenidos en los indicadores y variables que se incluyen en la agregacin, conducen efectivamente a pequeas variaciones en el valor del indicador compuesto, lo cual no est garantizado, pero es requerido como un elemento de robustez. Todas las etapas que se han descrito anteriormente pueden ser realizadas de distintos modos, por lo que en los captulos subsecuentes se hacen descripciones de alternativas metodolgicas para cada caso. Cabe destacar que si bien no en todas las etapas se requerir hacer uso de alguna metodologa (si no hay datos faltantes no se requerir imputacin de datos por ejemplo), es importante considerarlas.
22
El diseo de un indicador compuesto requiere partir de un marco conceptual desde el que se realice la seleccin de los indicadores y se establezca la manera en que estos se combinarn entre s, por ejemplo, a travs de la definicin de los distintos sub-sistemas que intervienen. Cuanto ms entendible y detallado sea el marco metodolgico mejor quedar definido el indicador ya que es, desde all, que quedarn claramente determinados los vnculos entre las diversas variables que componen el indicador. Para ello, es necesario tener categorizado, en forma amplia, el contexto de anlisis y tener comprensin del fenmeno a medir. Esta afirmacin parece obvia, sin embargo, debe quedar claro que lo que queda mal definido, ser errneamente medido (Nardo et al, 2005). Conceptos multidimensionales, como el de la sostenibilidad del desarrollo por ejemplo, deberan subdividirse, como se ha dicho, en subgrupos a travs de una estructura jerrquica o anidada. Estos subgrupos, no necesariamente deben ser estadsticamente independientes entre s, ya que bien podra ocurrir que la consistencia lgica en relacin con los fenmenos considerados amerite favorecer la organizacin conceptual a la puramente estadstica. Finalmente, en esta etapa incipiente es necesario tener claramente identificados los criterios sobre los cuales se seleccionarn los indicadores fuente y documentar todo el proceso.
Es por ello que el estudio del Desarrollo Sostenible ha sido planteado desde distintos puntos de partida o marcos conceptuales, que pueden consistir en estructuras temticas bsicas que ordenan a los indicadores de acuerdo con temas de inters, los cuales pueden corresponden a las temticas
23
Social, Econmico, Ambiental e Institucional, que a su vez tienen subdivisiones o sub-temas que abordan los distintos rubros con mayor grado de detalle. El empleo de un marco conceptual determinado supone el posicionamiento de una visin acerca de los componentes y las interacciones que se dan entre el medio ambiente natural y la sociedad. Existen, por lo tanto, diversos marcos referenciales posibles. La adopcin de alguno de ellos depender de las necesidades, la disponibilidad de informacin y los preconceptos asumidos por los analistas. Los marcos conceptuales pueden o bien dar cuenta de los componentes ambientales considerados, o bien basarse en criterios ms amplios en los que se procura relacionar los aspectos econmicos, sociales, ambientales e institucionales (desarrollo sostenible propiamente dicho) o incluso en marcos contables basados en la cuantificacin del capital natural, por ejemplo. Con todo, debe tenerse claro que el concepto de sostenibilidad involucra la interaccin de mltiples elementos, con fuerzas, simultaneidades y reacciones mutuas que no pueden ser capturadas si no se utiliza un enfoque sistmico que intente representar, aunque sea parcialmente, la complejidad inherente de vnculo entre la naturaleza y la sociedad. Un marco de referencia que ha sido utilizado de manera recurrente es el correspondiente al Modelo de Presin, Estado, Respuesta (PSR por sus siglas en ingls), y sus derivaciones que incorporan algunos elementos adicionales como el Modelo de Presin, Estado, Impacto, Respuesta (PSIR), el Modelo de Fuerzas Rectoras, Estado, Respuesta (DSR), el Modelo de Fuerzas Rectoras, Presin, Estado, Impacto, Respuesta (DPSIR), o el Modelo de Fuerzas Rectoras, Presin, Estado, Exposicin, Efecto y Acciones (DPSEEA). Este marco ha sido aplicado en los diseos de indicadores de la Comisin de Desarrollo Sustentable de Naciones Unidas y de la Organizacin para la Cooperacin y el Desarrollo Econmico, OCDE, que son extensamente detallados en Quiroga (2007). Otro tipo de marcos de referencia utilizados estn orientados a representar el bienestar humano/ecosistmico, planteando las interrelaciones entre las diferentes temticas en un esquema sistmico. Un marco ecosistmico fue utilizado en la definicin de los indicadores de desarrollo sostenible derivados del proyecto de Evaluacin de la Sostenibilidad en Amrica Latina desarrollado desde la Divisin de Desarrollo Sostenible y Asentamientos Humanos de la CEPAL, mismo que ha servido de gua a algunos pases de la regin que han generado su sistema de Indicadores de Desarrollo Sostenible bajo dicho marco conceptual. Mayor detalle al respecto puede encontrarse en Gallopn (2006).
Debido a la importancia otorgada a la medicin del crecimiento econmico, una gran cantidad de informacin al respecto se encuentra disponible. El desarrollo de las cuentas nacionales, en el contexto del sistema vigente actualmente, el SCN2008 o los Sistemas de Contabilidad Ambiental y Econmica Integrada (SCAEI), como el Sistema de Cuentas Econmicas y Ecolgicas de Mxico (SCEEM) o el Sistema de Contabilidad Econmico-Ambiental Integrado de Colombia (COLSCEA), generan mrgenes favorables de confiabilidad en la calidad de la informacin, lo que ha dado lugar a la produccin de estadsticas e indicadores fundamentalmente vinculados al mbito econmico con relativa calidad.
24
El tema social ha sido considerado tambin de importancia clave para el abordaje integrado de polticas de promocin del desarrollo econmico con equidad. La medicin de la pobreza y sus determinantes ha sido una prioridad en numerosas agendas nacionales e internacionales. Ejemplo de ello son los Objetivos de Desarrollo del Milenio (ODM) adoptados por todos los pases miembros del sistema de Naciones Unidas. Es por ello que existe tambin cuantiosa informacin confiable relacionada con el tema, que puede incluir otros aspectos como la salud y el bienestar, la movilidad demogrfica, la equidad de gnero, la pobreza y desigualdad, y el acceso a servicios bsicos. Debido a que el tema ambiental ha tomado importancia de manera relativamente reciente, no existe gran cantidad de informacin relacionada con el mismo. Por otro lado, las frecuencias de medicin se vinculan a evoluciones de ms largo plazo a que suelen estar sometidos los sistemas ambientales. Con todo, es importante reconocer los esfuerzos realizados por los pases de la regin en la construccin de sistemas de estadsticas ambientales a escala nacional. En la ltima dcada se observa un avance significativo que merece ser mencionado pero al mismo tiempo reconociendo que es un rea emergente y que aun existen muchos desafos que enfrentar. Cabe mencionar el diagnstico sobre el estado de las estadsticas ambientales realizado por la Divisin de Estadstica y Proyecciones Econmicas de la CEPAL y sus propuestas reflejadas en el banco de datos denominado BADEIMA (Base de Datos de Estadsticas e Indicadores de Medio Ambiente desarrollada por la CEPAL), as como la constitucin de un grupo de trabajo en el contexto de la Conferencia Estadstica de las Amricas cuyo objetivo es la bsqueda de homologacin de definiciones, estndares y continuidad en la medicin de estadsticas ambientales. La creciente preocupacin por los efectos del Calentamiento Global, lo que ha sido llamado Cambio Climtico, y sus repercusiones en el mbito econmico han incrementado el inters por poner el tema ambiental en el mismo nivel de importancia y prioridad que el econmico o el social. Los indicadores relacionados al tema de gestin institucional adquieren gran relevancia principalmente cuando se requiere establecer medidas que incentiven o coercionen el comportamiento de los individuos en pro de la sustentabilidad, con miras a atender la situacin y las necesidades de las futuras generaciones y respetar la biodiversidad del planeta.
25
La fortaleza (o debilidad) de un indicador compuesto recae en la calidad de las variables que lo definen. Por eso la seleccin de cada una debe realizarse sobre la base de su relevancia, su calidad, la frecuencia con que se muestrea y su disponibilidad al dominio pblico. Debe debatirse acerca de la pertinencia de cada variable elegida. Muchas veces y particularmente en la regin de Amrica Latina y el Caribe, la eleccin de los indicadores se ve limitada por la escasez de informacin estadstica y la imposibilidad de que parte de la informacin disponible est armonizada a partir de estndares internacionales. Esto limita la posibilidad de establecer comparaciones entre pases. Asimismo, es importante prestar atencin a aquellos indicadores que dependen de medidas de tamao, como puede el tamao de la economa (el valor del PIB), la poblacin o la superficie total del pas. Por eso, para establecer una comparabilidad entre pases que sea realista es necesario en estos casos ajustar las escalas y trabajar con medidas relativas que pueden estar expresadas por unidad de PIB o en trminos per cpita o por hectreas, por ejemplo. El proceso de seleccin de las variables que compondr el indicador compuesto debe ser documentado mediante la construccin de meta datos donde se especifiquen las caractersticas de la variable, su disponibilidad, las fuentes responsables de calcularla, el tipo de variable, las unidades de medida con que es expresada, etc. Un punto importante a tomar en cuenta en el proceso de seleccin es el objetivo o uso que se dar al indicador compuesto que se construya posteriormente, ya que la seleccin deber ser enfocada de manera particular dependiendo de si el objetivo es de diagnstico, de evaluacin de desempeo o de pronstico sobre escenarios futuros. Por otro lado, es importante destacar una gran limitacin que se presenta al momento de realizar el ejercicio de diseo del indicador compuesto y que consiste en la probable ausencia de informacin estadstica bsica con la que alimentar el indicador a proponer. Si bien existen, como veremos, mtodos para imputar datos perdidos, es muy factible que en el caso de algunas variables ni siquiera se disponga de la informacin bsica mnima necesaria. Como se mencion en la seccin anterior, la tradicin de recabar, armonizar y agregar informacin estadstica de los distintos sistemas ambientales se encuentra en su primera infancia y por ello, an no se han estandarizado procedimientos sistemticos que den lugar a conjuntos de informacin ms o menos comparables. En la actualidad, las tecnologas de informacin y comunicacin pueden contribuir a subsanar este inconveniente. Sin embargo, las perturbaciones econmicas que han sufrido numerosos pases de la regin y que impiden la constitucin de verdaderas polticas de estado de largo plazo y la incipiente toma de 27
conciencia sobre temas ambientales por parte de los tomadores de decisiones ha dado lugar a limitados esfuerzos prcticos en la generacin de informacin ambiental. Ello ha supuesto la aparicin de problemas de aplicabilidad tcnica debida a la ausencia de datos o a la disponibilidad de datos inconsistentes o poco confiables. En Amrica Latina y el Caribe queda mucho trecho por recorrer, se debe trabajar en mltiples niveles y reas temticas. Los pases de la regin se enfrentan hoy al sugestivo desafo por crear conjuntos de informacin cada vez ms completos, consistentes y comparables. Ello, por cierto, contribuir a desarrollar mejores estrategias y planes de accin de mediano y largo plazo, que permitan encaminar el rumbo de los pases hacia una senda de desarrollo verdaderamente sostenible.
Indicadores CDS
En el marco de la Comisin de Desarrollo Sostenible se gener una propuesta de indicadores que ha sido revisada desde su creacin en 1995, a partir de la retroalimentacin proveniente de los pases que han probado su construccin. En este sentido, si bien este listado no est asociado de manera directa a metadatos ni a bases de datos, s existe la posibilidad de revisar los ejercicios de los pases, particularmente en lo que respecta tanto a los metadatos como a sus bases de datos, as como a su experiencia con los mismos. A continuacin se presenta la ltima revisin disponible de los indicadores propuestos.
CUADRO 1 INDICADORES DE DESARROLLO SOSTENIBLE DE LA CDS
Tema Subtema Pobreza de ingreso (monetaria) Desigualdad de ingreso Indicador central Proporcin de la poblacin con ingresos menores a la lnea de pobreza nacional Relacin entre el porcentaje de ingresos del quintil de ingresos ms alto y el quintil ms bajo Proporcin de la poblacin usando instalaciones mejoradas de servicio sanitario Proporcin de la poblacin con acceso a una fuente mejorada de agua Proporcin de hogares sin electricidad u otro servicio moderno de energa Proporcin de la poblacin viviendo en tugurios Porcentaje de la poblacin que ha pagado sobornos Nmero de homicidios intencionales por 100,000 habitantes Otro Indicador Proporcin de la poblacin con ingresos menores a US$1 por da
(Contina)
28
Salud
Indicador central Tasa de mortalidad en menores de Mortalidad cinco aos Esperanza de vida al nacer Porcentaje de la poblacin con Oferta de servicios de acceso a servicios bsicos de salud salud Inmunizacin contra enfermedades infantiles infecciosas Estado nutricional Estado nutricional de los nios Morbilidad de enfermedades mayores como VIH/SIDA, malaria, Estado de salud y riesgos tuberculosis
Subtema
Otro Indicador
Tasa de suicidios Tasa de permanencia hasta el ltimo Aprendizaje de largo plazo grado de educacin primaria Tasa de inscripcin neta en Nivel educativo educacin primaria Educacin Nivel escolar alcanzado en educacin secundaria (terciaria) de los adultos Alfabetismo Tasa de alfabetismo en adultos Tasa de crecimiento de la poblacin Tasa global de fecundidad Poblacin Razn de dependencia Demografa Razn entre residentes locales y Turismo turistas en las mayores regiones y destinos tursticos Vulnerabilidad a riesgos Porcentaje de la poblacin viviendo naturales en reas propensas a riesgos Riesgos naturales Prevencin y respuesta a Prdidas humanas y econmicas desastres debidas a desastres naturales Emisiones de gases de efecto Cambio Climtico Emisiones de Dixido de Carbono invernadero Agotamiento de la capa Consumo de sustancias de Atmsfera de ozono agotamiento de ozono Concentracin en el ambiente de Calidad del aire contaminantes en zonas urbanas Porcentaje de la poblacin viviendo Zona de costas Calidad del agua de las playas en reas costeras Proporcin de existencias de peces Pesqueras dentro de lmites biolgicos seguros Ocanos, costas Proporcin de reas marinas y mares ndice trfico marino protegidas Ambiente marino Superficie de ecosistemas de arrecifes de coral y porcentaje de vida cubierta Cambio en el uso de suelos Estado y uso de suelos Degradacin del suelo Desertificacin Tierra afectada por desertificacin rea de cultivo arable y Eficiencia en el uso de fertilizantes permanente Agricultura Suelos Uso de pesticidas agrcolas rea bajo cultivo orgnico Proporcin del suelo cubierto de Porcentaje de rboles de bosque bosques daados por defoliacin Bosques rea de bosques bajo manejo Sostenible Proporcin del total de recursos utilizados Cantidad de agua Intensidad del uso de agua por Agua dulce actividad econmica Presencia de residuos fecales en Demanda bioqumica de oxgeno Calidad de agua agua dulce en acuferos Tratamiento de aguas residuales (Contina)
29
Ecosistemas Biodiversidad
Indicador central Proporcin de reas terrestres protegidas, del total y por regin ecolgica
Otro Indicador Efectividad en el manejo de zonas protegidas rea de ecosistemas clave seleccionados Fragmentacin de hbitat Abundancia de especies clave seleccionadas Abundancia de especies aliengenas invasivas Ahorro bruto Ahorro neto ajustado como porcentaje del ingreso nacional bruto Tasa de inflacin
Especies
Producto interno bruto (PIB) per cpita Desempeo macroeconmico Parte proporcional de inversin en el PIB Razn entre Deuda e Ingreso Nacional Bruto Tasa de empleo de la poblacin Productividad laboral y costos unitarios laborales Proporcin de mujeres en empleos remunerados en el sector no agrcola Usuarios de internet por cada 100 habitantes
Empleo vulnerable
Desarrollo Econmico
Empleo
Lneas telefnicas fijas por cada 100 habitantes Suscriptores de telfonos celulares mviles por cada 100 habitantes Gasto interno bruto en Investigacin y Desarrollo como porcentaje del PIB Proporcin de importaciones desde pases en desarrollo y desde pases subdesarrollados Promedio de barreras tarifarias impuestas a las exportaciones de pases en desarrollo y subdesarrollados Flujo al interior y al exterior de inversin extranjera directa como porcentaje del PIB Transferencias como porcentaje del Ingreso Nacional Bruto
Contribucin del turismo al PIB Dficit en cuenta corriente como porcentaje del PIB
Asistencia oficial neta para el Desarrollo (ODA) dada o recibida como porcentaje del Ingreso Nacional Bruto
Consumo de Material
Intensidad de uso de material en la economa Consumo anual de energa. Total y por principales categoras de usuarios Intensidad del uso de energa, total y por actividad econmica Generacin de residuos peligrosos Tratamiento y eliminacin de desechos Distribucin del transporte de pasajeros por modalidad
Consumo interno de materiales Proporcin de fuentes renovables de energa en el uso total de energa
Generacin de desechos Manejo de desechos radiactivos Distribucin del transporte de carga por modalidad Intensidad energtica del transporte
30
Este listado de indicadores incorpora en su revisin el conocimiento y la experiencia acumulada en la construccin de indicadores de desarrollo sostenible, de pases y organizaciones en sus esfuerzos por medir el progreso, as como la visin propuesta por los Objetivos de Desarrollo del Milenio.
Indicadores ODM
Si bien los Objetivos de Desarrollo del Milenio no estn asociados particularmente al Desarrollo Sostenible, s incluyen muchos indicadores que pueden considerarse relativos al tema, no solo en la meta 7 correspondiente a la sostenibilidad, sino en algunas otras metas planteadas. Es importante destacar el esfuerzo que se ha realizado por obtener la informacin sobre los indicadores de monitoreo del progreso de los objetivos, trascendiendo particularmente la generacin de datos relacionados a los mismos as como la posibilidad de acceder a ellos por medio del repositorio generado para dicho fin en la pgina de la Divisin de Estadstica de Naciones Unidas. Tambin se puede consultar la pgina relacionada con Metas del Milenio de la CEPAL en http://www.eclac.cl/mdg/. A continuacin se presenta el listado de todos los indicadores de monitoreo de acuerdo con la ltima actualizacin disponible.
CUADRO 2 INDICADORES DE LOS OBJETIVOS DE DESARROLLO DEL MILENIO
Objetivos y metas extrados de la Declaracin del Milenio Objetivo 1: Erradicar la pobreza extrema y el hambre Meta 1.A: Reducir a la mitad, entre 1990 y 2015, el porcentaje de personas cuyos ingresos sean inferiores a 1 dlar por da Indicadores para el seguimiento de los progresos 1.1 Proporcin de la poblacin con ingresos inferiores a 1 dlar PPA (paridad del poder adquisitivo) por da 1.2 Coeficiente de la brecha de pobreza 1.3 Proporcin del consumo nacional que corresponde al quintil ms pobre de la poblacin 1.4 Tasa de crecimiento del PIB por persona empleada 1.5 Relacin empleo-poblacin 1.6 Proporcin de la poblacin ocupada con ingresos inferiores a 1 dlar PPA por da 1.7 Proporcin de la poblacin ocupada que trabaja por cuenta propia o en una empresa familiar 1.8 Proporcin de nios menores de 5 aos con insuficiencia ponderal 1.9 Proporcin de la poblacin por debajo del nivel mnimo de consumo de energa alimentaria
Meta 1.B: Lograr empleo pleno y productivo, y trabajo decente para todos, incluyendo mujeres y jvenes
Meta 1.C: Reducir a la mitad, entre 1990 y 2015, el porcentaje de personas que padecen hambre
Objetivo 2: Lograr la enseanza primaria universal Meta 2.A: Asegurar que, para el ao 2015, los nios y nias de todo el mundo puedan terminar un ciclo completo de enseanza primaria
2.1 Tasa neta de matriculacin en la enseanza primaria 2.2 Proporcin de alumnos que comienzan el primer grado y llegan al ltimo grado de enseanza primaria 2.3 Tasa de alfabetizacin de las personas de 15 a 24 aos, mujeres y hombres Objetivo 3: Promover la igualdad de gnero y el empoderamiento de la mujer Meta 3.A: Eliminar las desigualdades entre los sexos en la 3.1 Relacin entre nias y nios en la enseanza primaria, enseanza primaria y secundaria, preferiblemente para el secundaria y superior ao 2005, y en todos los niveles de la enseanza para el 3.2 Proporcin de mujeres entre los empleados ao 2015 remunerados en el sector no agrcola 3.3 Proporcin de escaos ocupados por mujeres en los parlamentos nacionales Objetivo 4: Reducir la mortalidad de los nios menores de 5 aos Meta 4.A: Reducir en dos terceras partes, entre 1990 y 4.1 Tasa de mortalidad de nios menores de 5 aos 2015, la mortalidad de los nios menores de 5 aos 4.2 Tasa de mortalidad infantil 4.3 Proporcin de nios de 1 ao vacunados contra el sarampin (Contina)
31
Objetivos y metas extrados de la Declaracin del Milenio Objetivo 5: Mejorar la salud materna Meta 5.A: Reducir, entre 1990 y 2015, la mortalidad materna en tres cuartas partes
5.1 Tasa de mortalidad materna 5.2 Proporcin de partos con asistencia de personal sanitario especializado Meta 5.B: Lograr, para el ao 2015, el acceso universal a la 5.3 Tasa de uso de anticonceptivos salud reproductiva 5.4 Tasa de natalidad entre las adolescentes 5.5 Cobertura de atencin prenatal (al menos una consulta y al menos cuatro consultas) 5.6 Necesidades insatisfechas en materia de planificacin familiar Objetivo 6: Combatir el VIH/SIDA, el paludismo y otras enfermedades Meta 6.A: Haber detenido y comenzado a reducir, para el ao 2015, la propagacin del VIH/SIDA 6.1 Prevalencia del VIH entre las personas de 15 a 24 aos 6.2 Uso de preservativos en la ltima relacin sexual de alto riesgo 6.3 Proporcin de la poblacin de 15 a 24 aos que tiene conocimientos amplios y correctos sobre el VIH/SIDA 6.4 Relacin entre la asistencia escolar de nios hurfanos y la de nios no hurfanos de 10 a 14 aos Meta 6.B: Lograr, para el ao 2010, el acceso universal altratamiento del VIH/SIDA de todas las personas que lo necesiten Meta 6.C: Haber detenido y comenzado a reducir, para el ao 2015, la incidencia del paludismo y otras enfermedades graves 6.5 Proporcin de la poblacin portadora del VIH con infeccin avanzada que tiene acceso a medicamentos antirretrovirales 6.6 Tasas de incidencia y mortalidad asociadas al paludismo 6.7 Proporcin de nios menores de 5 aos que duermen protegidos por mosquiteros impregnados de insecticida 6.8 Proporcin de nios menores de 5 aos con fiebre que reciben tratamiento con los medicamentos adecuados contra el paludismo 6.9 Tasas de incidencia, prevalencia y mortalidad asociadas a la tuberculosis 6.10 Proporcin de casos de tuberculosis detectados y curados con el tratamiento breve bajo observacin directa Objetivo 7: Garantizar la sostenibilidad del medio ambiente Meta 7.A: Incorporar los principios del desarrollo sostenible en las polticas y los programas nacionales e invertir la prdida de recursos del medio ambiente 7.1 Proporcin de la superficie cubierta por bosques 7.2 Emisiones de dixido de carbono (total, per cpita y por cada dlar PPA del PIB) 7.3 Consumo de sustancias que agotan la capa de ozono Meta 7.B: Reducir la prdida de biodiversidad, alcanzando, para el ao 2010, una reduccin significativa de la tasa de prdida 7.4 Proporcin de poblaciones de peces que estn dentro de lmites biolgicos seguros 7.5 Proporcin del total de recursos hdricos utilizada 7.6 Proporcin de las reas terrestres y marinas protegidas Meta 7.C: Reducir a la mitad, para el ao 2015, el porcentaje de personas sin acceso sostenible al agua potable y a servicios bsicos de saneamiento Meta 7.D: Haber mejorado considerablemente, para el ao 2020, la vida de por lo menos 100 millones de habitantes de tugurios 7.7 Proporcin de especies en peligro de extincin 7.8 Proporcin de la poblacin con acceso a fuentes mejoradas de abastecimiento de agua potable 7.9 Proporcin de la poblacin con acceso a servicios de saneamiento mejorados 7.10 Proporcin de la poblacin urbana que vive en tugurios
(Contina)
32
Objetivos y metas Indicadores para el seguimiento de los progresos extrados de la Declaracin del Milenio Objetivo 8: Fomentar una alianza mundial para el desarrollo Meta 8.A: Desarrollar an ms un sistema comercial y Asistencia oficial para el desarrollo (AOD) financiero abierto, basado en normas, previsible y no 8.1 AOD neta, total y para los pases menos discriminatorio Incluye el compromiso de lograr una buena adelantados, en porcentaje del ingreso nacional bruto de gestin de los asuntos pblicos, el desarrollo y la reduccin los pases donantes del Comit de Asistencia para el de la pobreza, en los planos nacional e internacional Desarrollo (CAD) de la OCDE 8.2 Proporcin de la AOD total bilateral y por sectores que los donantes del CAD de la OCDE destinan a servicios sociales bsicos (enseanza bsica, atencin primaria de la salud, nutricin, abastecimiento de agua potable y servicios de saneamiento) Meta 8.B: Atender las necesidades especiales de los pases 8.3 Proporcin de la AOD bilateral de los donantes del menos adelantados Incluye el acceso libre de aranceles y CAD de la OCDE que no est condicionada cupos de las exportaciones de los pases menos 8.4 AOD recibida por los pases en desarrollo sin litoral adelantados; el programa mejorado de alivio de la deuda de como proporcin de su ingreso nacional bruto los pases pobres muy endeudados (PPME) y la cancelacin 8.5 AOD recibida en los pequeos Estados insulares en de la deuda bilateral oficial, y la concesin de una asistencia AOD recibida por los pequeos Estados insulares en oficial para el desarrollo ms generosa a los pases que desarrollo como proporcin de su ingreso nacional bruto hayan expresado su determinacin de reducir la pobreza Acceso a los mercados 8.6. Proporcin del total de importaciones de los pases desarrollados (por su valor y sin incluir armamentos) procedentes de pases en desarrollo y pases menos adelantados, admitidas libres de derechos 8.7 Aranceles medios aplicados por pases desarrollados a los productos agrcolas y textiles, y a las prendas de vestir procedentes de pases en desarrollo Meta 8.C: Atender las necesidades especiales de los pases 8.8 Estimacin de la ayuda agrcola en pases de la OCDE en desarrollo sin litoral y de los pequeos Estados insulares en como porcentaje de su producto interno bruto desarrollo (mediante el Programa de Accin para el desarrollo 8.9 Proporcin de la AOD destinada a fomentar la sostenible de los pequeos Estados insulares en desarrollo y capacidad comercial las decisiones adoptadas en el vigsimo segundo perodo extraordinario de sesiones de la Asamblea General) Sostenibilidad de la deuda Meta 8.D: Abordar en todas sus dimensiones los problemas 8.10 Nmero total de pases que han alcanzado el punto de la deuda de los pases en desarrollo con medidas de decisin y nmero total de pases que han alcanzado el nacionales e internacionales a fin de hacer la deuda punto de culminacin en la Iniciativa para la reduccin de sostenible a largo plazo la deuda de los pases pobres muy endeudados (PPME) (acumulativo) 8.11 Alivio de la deuda comprometido conforme a la Iniciativa para la reduccin de la deuda de los pases pobres muy endeudados y la Iniciativa para el alivio de la deuda multilateral 8.12 Servicio de la deuda como porcentaje de las exportaciones de bienes y servicios Meta 8.E: En cooperacin con las empresas farmacuticas, 8.13 Proporcin de la poblacin con acceso sostenible a proporcionar acceso a medicamentos esenciales en los medicamentos esenciales a precios asequibles pases en desarrollo a precios asequibles Meta 8.F: En colaboracin con el sector privado, dar acceso 8.14 Lneas de telfono fijo por cada 100 habitantes a los beneficios de las nuevas tecnologas, en particular los 8.15 Abonados a telfonos celulares por cada 100 de las tecnologas de la informacin y de las comunicaciones habitantes 8.16 Usuarios de Internet por cada 100 habitantes
Fuente: Official list of MDG Indicators, Effective 15 january 2008, DESA / UN. Los datos de los indicadores de los objetivos de desarrollo del milenio estn disponibles en la pgina: http://unstats.un.org/unsd/mdg/ de la Divisin de Estadstica de Naciones Unidas.
33
Estadsticas de BADEIMA
En el mbito regional de Amrica Latina se han desarrollado esfuerzos por fomentar que los pases generen sus propias estadsticas relacionadas con el desarrollo sostenible, particularmente con el medio ambiente, de las que en general se dispone de poca informacin. Uno de estos esfuerzos corresponde a la Base de Datos de Estadsticas e Indicadores Ambientales (BADEIMA) que mantiene la Divisin de Estadstica y Proyecciones Econmicas de la Comisin Econmica para Amrica Latina (CEPAL). A continuacin se presenta un listado de dichas estadsticas e indicadores.
Aire
Agua
Tierras y suelos
34
Biota
Energa
Desastres
Gestin medioambiental
Variable Superficie total de reas protegidas Porcentaje de reas protegidas Nmero de reas marinas protegidas reas protegidas Superficie de reas marinas protegidas Nmero de reas terrestres protegidas Superficie de reas terrestres protegidas Especies de flora existentes Flora Especies de flora amenazadas Especies endmicas de flora Especies de fauna existentes Fauna Especies de fauna amenazadas Especies endmicas de fauna Produccin de energa primaria total Produccin de energa secundaria total Consumo de energa primaria Consumo de energa secundaria Produccin y consumo Consumo total de energa (oferta y demanda) Oferta energtica total Oferta energtica renovable total Intensidad energtica del PIB Consumo de hidrocarburos por habitante Nmero de viviendas conectadas a la red elctrica Porcentaje de viviendas conectadas a la red elctrica Consumo de energa elctrica por habitante Cobertura de red elctrica Energa hidroelctrica como proporcin de la generacin de electricidad Capacidad instalada para producir energa elctrica Porcentaje de viviendas conectadas a la red elctrica Inundaciones Deslizamientos Sequas Desastres naturales Huracanes Terremotos Erupcin volcnica Maremotos/tsunami Tamao del parque automotriz Longitud de la red de carreteras Longitud de la red ferroviaria Transporte Trfico areo: pasajeros-kilmetros Trfico areo: kilmetros volados Trfico areo: toneladas - kilmetros de carga Poblacin con acceso sostenible a mejores fuentes de abastecimiento de agua potable, por rea urbana y rural Asentamientos humanos Poblacin con acceso a servicios de saneamiento mejorados, por rea urbana y rural Poblacin que vive en tugurios Generacin de desechos slidos Disposicin de desechos slidos Desechos Nmero de viviendas con servicios de recoleccin de desechos slidos Porcentaje de viviendas con servicios de recoleccin de desechos slidos Empresas certificadas con ISO 14.001 Empresas con certificacin ISO 14001 por c/ mil millones de dlares de PIB Acuerdos multilaterales ambientales
Area Temtica
Se puede tener acceso a los datos por medio de la pgina: www.eclac.org/deype/badeima. Es importante destacar que del conjunto de estadsticas e indicadores Ambientales contenidos en Badeima, se dispone de fichas metodolgicas (metadatos) que clarifican el contenido de la informacin.
35
36
SOSTENIBILIDAD
DESARROLLO
iNSTITUCIONAL
DE LO ECONMICO A LO INSTITUCIONAL
DE LO ECONMICO A LO AMBIENTAL
DE LO SOCIAL A LO ECONMICO
DE LO INSTITUCIONAL A LO AMBIENTAL
DE LO AMBIENTAL A LO ECONMICO
DE LO AMBIENTAL A LO SOCIAL
37
SOCIAL
SOSTENIBILIDAD DESARROLLO
DE LO ECONMICO A LO SOCIAL
ECONMICO
A continuacin se enlistan los indicadores definidos para cada uno de los subsistemas.
De lo Ambiental a lo Econmico
De lo Ambiental a lo Social
De lo Social a lo Econmico
38
CEPAL Coleccin Documentos de proyectos Cuadro 4 (conclusin) rea De lo Social a lo Institucional De lo Institucional a lo Social De lo Institucional a lo Ambiental Intensidades o Eficiencias Econmicas
Indicador ndice de gobernabilidad Gasto pblico social (% del PIB) Gasto pblico social (% del GPT) rea protegida Emisiones de CO2 Intensidad del uso de energa Tierras arables y permanentes per capita Emisiones (CO2) per capita Consumo final per capita por hogares Consumo total de energa per capita Recursos renovables hdricos actuales per capita
Fuente: CEPAL / BADESALC (2008). Los indicadores de Badesalc tienen fichas metodolgicas, y los datos se actualizan peridicamente. Estos se pueden consultar en la pgina http://websie.eclac.cl/sisgen/Badesalc.asp.
39
Meta orientadora Ordenamiento territorial reas afectadas por procesos de degradacin Contaminacin del aire
Indicadores Porcentaje de municipios con planes de ordenamiento territorial en ejecucin Cambio de uso del suelo Porcentaje de reas degradadas Cambio en la densidad en la flota de vehculos de motor Emisiones de Co2 % de la poblacin con acceso a agua potable % de la poblacin con acceso a saneamiento % de la poblacin con acceso a la recoleccin de desechos Generacin de desechos slidos Desechos recogidos y dispuestos adecuadamente Existencia de comisiones nacionales de emergencia o de grupos de respuesta inmediata. Sin indicador propuesto Tasa de morbilidad atribuible a enfermedades respiratorias agudas AVPD (Desorden de evasin de la realidad) por enfermedades de origen hdrico. Morbilidad VIH Has de reas verdes urbanas respecto a la poblacin urbana Sin indicador propuesto Porcentaje de la poblacin con ingresos inferiores a US $1.00 dlar PPA Proporcin de hogares con derecho a ttulos de propiedad. ndice de crecimiento del nmero de pequeas empresas Gasto social como % del PIB Uso de energa por US $1000 del PIB PPA Porcentaje de poblacin que usa combustibles slidos Porcentaje de energa consumida de fuentes renovables con respecto al total de energa consumida Consumo de CFCs que agotan la capa de ozono Nmero de compaas con certificacin ISO14000 Instrumentos econmicos que se aplican Total de horas de enseanza de la ciencia ambiental en la educacin primaria (ND) Tasa neta de matriculacin en la enseanza primara Informes de estado del ambiente y Sistema Estadstico Ambiental Existencia de consejos nacionales de desarrollo sostenible
Desechos slidos Vulnerabilidad ante los desastres antropognicos y aquellos causados por fenmenos naturales Vulnerabilidad y manejo de riesgos
Salud y ambiente
Pobreza e inequidad
Aspectos econmicos, incluidos la competitividad, el comercio y los patrones de produccin y consumo (energa)
Energa
Aspectos institucionales
Fuente: Informe sobre la Iniciativa Latinoamericana y Caribea para el Desarrollo Sostenible (ILAC) a cinco aos de su adopcin (2008).
40
Es fundamental que la seleccin de los indicadores y variables que compondrn el indicador compuesto sea realizada respetando no slo los criterios conceptuales, basados en el marco considerado, sino tambin los estadsticos. La naturaleza subyacente de los datos y la relacin que pudiera haber entre ellos deben ser cuidadosamente analizadas antes de proceder a integrar toda la informacin en un solo indicador. Para ello se puede recurrir a diversos mtodos de sntesis estadstica. El anlisis combinado de la informacin puede realizarse sobre la base de dos criterios, a saber: (i) Anlisis de relaciones entre variables: agrupando las variables en sub-indicadores, definiendo una estructura anidada y determinando si la seleccin de stas, resulta apropiada para describir el fenmeno en cuestin. Para ello es posible recurrir a tcnicas estadsticas como el anlisis de componentes principales (ACP) que se presenta a continuacin y que permite estudiar cmo se interrelacionan estadsticamente las dimensiones del fenmeno estadstico que contemplar en indicador compuesto. Estudio de relaciones entre unidades de anlisis: estableciendo grupos de unidades de anlisis vinculadas por su similitud: Para ello se puede recurrir al anlisis de conglomerados (o cluster analysis).
(ii)
El uso de las tcnicas de anlisis multivariado que se describen a continuacin es sumamente til para obtener una idea aproximada acerca de la estructura de los datos que compondrn el indicador sinttico. No obstante, se deber tener en cuenta que si la muestra de informacin que contienen las variables (nmero de datos) es pequea en comparacin con el nmero de variables seleccionadas, se debera evitar emplear estas tcnicas ya que los resultados no sern, por cierto, representativos. En este ltimo caso se puede recurrir a anlisis exploratorios simples, contemplando tablas de frecuencias y de promedios simples, as como tablas de coeficientes de correlacin o grficos de dos y tres dimensiones, as como herramientas grficas de anlisis multivariado descriptivo como las caritas de Chernoff o las estrellas de Andrews (Johnson & Wichern, 2007). Las metodologas que se presentan en este, as como en algunos captulos subsecuentes, se analizan con un detalle tcnico que incluye aspectos matemticos de mayor nivel tcnico, los cuales son incluidos en recuadros para dar fluidez a la lectura sin dejar de mostrar el rigor metodolgico que requiere la aplicacin de dichas herramientas.
41
42
Que no haya datos atpicos (outliers). Como en el caso de otras tcnicas estadsticas, la presencia de datos atpicos puede afectar las interpretaciones que devienen de un anlisis de componentes principales. Linealidad: El anlisis de componentes principales es una tcnica basada en el uso del lgebra lineal y por eso es claramente conveniente que la relacin entre las variables sea lineal. Normalidad multivariada: este supuesto es conveniente de validar si se busca realizar pruebas de contraste estadstico. Si se supone que las variables estn distribuidas a partir de funciones de distribucin diferentes, ser ms complicado hacer dichas pruebas pues generalmente las herramientas de software slo contemplan las basadas en el supuesto de normalidad.
RECUADRO 1 ANLISIS DE COMPONENTES PRINCIPALES Las Componentes Principales son combinaciones lineales de las variables originales que pueden ser ordenadas en forma decreciente de acuerdo a la cantidad de varianza que ellas contribuyen a computar a partir de los datos originales. Por lo general, la mayor parte de la variabilidad de los datos originales queda condensada en las primeras componentes (las principales). Formalmente, se parte de p variables, muestreadas sobre n (unidades de anlisis) casos, esto es: . Esta informacin puede expresarse matricialmente como:
(2) Por otro lado, partiendo de X se puede calcular la matriz muestral de correlaciones R. Las componentes principales pueden ser estimadas tanto a partir de la matriz de covarianza como la de correlacin. Estas matrices nos brindan informacin acerca de la concomitancia en la variabilidad observada en las variables cuando son tomadas de a pares. Las variables que muestran una baja correlacin sern candidatas a ser eliminadas del anlisis:
(3) Las componentes principales son un conjunto de variables ortogonales entre s (no correlacionadas), que surgen de una transformacin lineal de las variables originales, con la propiedad de contener en conjunto la misma varianza total que el conjunto original. La primer componente se construye de modo que contenga la mxima proporcin posible de la varianza de los xs, la segunda, la mxima de la varianza restante y as sucesivamente. Esto significa que las componentes quedan ordenadas con base en la informacin estadsticamente relevante que contienen, expresada por el porcentaje de varianza total explicada por cada una. La primera componente principal se expresar como la combinacin lineal:
(5)
(Contina)
43
sujeta a la restriccin de que la suma de los ponderadores al cuadrado sea igual a uno (condicin de ortogonalidad), i.e.: (6) Si las variables estn normalizadas, la expresin entre corchetes de (5) es la matriz de correlaciones. Si las variables estn slo expresadas como desviaciones alrededor de la media, de acuerdo a (2), tenemos que tal expresin es la matriz de covarianza. Sin prdida de generalidad, supongamos esta ltima situacin, entonces: (7) Para maximizar (7) sujeta a la restriccin (6), se procede usualmente construyendo el lagrangiano: (8) Cuya condicin de primer orden es: (9) dado que es un vector no nulo, tenemos que autovector ( ). es el autovalor de la matriz de covarianzas y su
El resto de las componentes se obtienen de la misma manera, con la salvedad de que hay que introducir una restriccin de ortogonalidad (no correlatividad) respecto de la primera: , y as se sigue sucesivamente, de manera tal que la j-sima componente: deber restringirse a satisfacer en la maximizacin la ortogonalidad respecto a todas las anteriores componentes: (10) Entonces, es posible ordenar las componentes de mayor a menor variabilidad explicada, la cual queda expresada en la magnitud de cada autovalor puesto que como: , la varianza de es precisamente , i.e.: (11) El autovector de ponderacin de la componente est asociado al autovalor . Asimismo, puesto que se obtuvo una base ortogonal, la variabilidad total observada en las variables originales puede definirse como la suma de sus varianzas, es decir la traza de la matriz , o equivalentemente: (12) Por consiguiente, el componente variabilidad total, esto es: cuyo autovalor correspondiente es explica una fraccin de la
(13)
Fuente: Uriel, 1995.
Una de las principales desventajas del ACP es que las correlaciones que son la base de su clculo pueden no necesariamente representar la influencia real de las componentes sobre el fenmeno que quiere medirse, sino un efecto estadstico espurio. Asimismo, los resultados obtenidos del ACP pueden ser sensibles a la modificacin de la muestra de datos o, como ya se dijo, a la presencia de datos atpicos (outliers). Sobre la base de la informacin obtenida de los p autovalores calculados segn las indicaciones del recuadro se plantean diversos criterios para decidir el nmero razonable de componentes que permita
44
condensar de mejor manera la estructura de los datos y posibilite su posterior interpretacin. Los criterios ms relevantes son: Criterio de Kaiser (Kaiser, 1958). Consiste en eliminar todas las componentes cuyos autovalores sean inferiores a la unidad. La justificacin de este criterio es que no tiene sentido agregar una componente que explique menos varianza que la contenida en una variable. El criterio de Jolliffe toma como lmite inferior el valor 0.7. Otra posibilidad es seleccionar el nmero de factores explicativos cuya raz caracterstica supere el valor medio de todas las races caractersticas. Contraste de cada (Cattell, 1965). Este criterio parte de graficar los autovalores de manera decreciente (grfico de sedimentacin), escogindose aquellas componentes hasta el punto en que la curva decreciente converge a una lnea horizontal, lo que indica que a partir de all la varianza explicada adicional no aporta mucho ms. Porcentaje de la varianza explicada. Consiste en acumular con los autovalores de mayor valor un porcentaje de la varianza explicada hasta alcanzar un nivel mnimo aceptable (por ejemplo entre 70 y 80%). Criterios de comprensibilidad. Cuando la construccin de las componentes da lugar a algn tipo de interpretacin que sea entendible en trminos de las clases que se constituyen. Una vez determinadas las componentes principales ms significativas se puede crear con stas una medida compuesta como la media aritmtica simple, es decir una suma usualmente ponderada con el mismo peso a cada una de ellas. Otra alternativa puede ser la agregacin directa de las primeras componentes ponderadas, por ejemplo, por la desviacin estndar de cada una (Peters y Butler, 1970). Sea cual sea el procedimiento elegido, ser conveniente realizar un anlisis posterior de la correlacin entre las variables originales y las componentes seleccionadas para validar la bondad de los resultados. El paso final sera la valoracin de la necesidad de cambios en el anlisis realizado; ello puede llevar a la eliminacin de variables o el empleo de otros mtodos de seleccin de componentes. Uriel (1995) recomienda el uso de variables expresadas en forma de razones (ratios) puesto que eliminan el problema de magnitud o escala que puede enmascarar otras caractersticas relevantes de la informacin disponible. No obstante, esta prctica acarrea otro tipo de problemtica ya que se modifica la forma de la distribucin y atribuyndoles demasiada importancia a los casos que, en trminos absolutos, estaran localizados en las colas de la distribucin de cada variable. Existen numerosas metodologas alternativas al ACP. Se har una breve referencia al anlisis de factores o anlisis factorial y al uso de los coeficientes alfa de Cronbach (1951).
Anlisis Factorial
El anlisis factorial es una tcnica estadstica de modelacin de datos usada para explicar la variabilidad entre las variables observadas en trminos de un nmero menor de variables no observadas llamadas factores. Las variables observadas se modelan como combinaciones lineales de factores ms expresiones de error. Se puede distinguir entre el Anlisis Factorial Exploratorio, donde los factores no se conocen a priori, y el Anlisis Factorial Confirmatorio donde se propone un modelo, segn el cual hay unos factores que representan a las variables originales, siendo el nmero de estos superior al de aquellas, y se somete a comprobacin. Para que el anlisis factorial tenga sentido deberan cumplirse dos condiciones bsicas: la parsimonia y la interpretabilidad. Segn el principio de parsimonia los fenmenos deben explicarse con el menor nmero de elementos posibles. Una buena solucin factorial ser aquella que es sencilla e interpretable. Si bien el anlisis factorial y el ACP estn muy relacionados, en este ltimo se trata de hallar componentes (factores) que sucesivamente expliquen la mayor parte de la varianza total; mientras que en el anlisis factorial se buscan aquellos factores que expliquen la mayor parte de la varianza comn. La varianza comn es la parte de la variacin de cada variable que es compartida con las dems. Asimismo, mientras que el ACP busca combinaciones lineales de las variables originales que expliquen la mayor parte de la variabilidad total, el anlisis factorial pretende hallar un nuevo conjunto de variables, menor
45
en nmero que las variables originales, que exprese lo que es comn a esas variables. Ms detalles sobre esta tcnica pueden encontrarse en Kim y Mueller (1978) y Comrey (1985).
RECUADRO 2 COEFICIENTE ALFA DE CRONBACH El coeficiente alfa de Cronbach se puede calcular como:
donde es la varianza del indicador y es la de cada una de las p variables. Para construir este estimador, se supone que el indicador se calcula como la suma simple de todos los sub-indicadores; as mismo, vale estimar el coeficiente para cada unidad de anlisis. El estimador mide la fraccin de la variabilidad total de la muestra de variables debido a su correlacin. Si no hay correlacin y las variables son independientes entre s, su valor es nulo, mientras que cuando la correlacin es total, valdr la unidad. Por eso, un valor cercano a uno nos indicar que las variables consideradas miden correctamente el fenmeno latente que se desea representar.
Fuente: Cronbach (1951).
Un ejercicio interesante puede ser calcular el coeficiente alfa excluyendo una variable o componente por vez. Si su valor se incrementa con la exclusin, se puede afirmar que la variable no esta muy correlacionada con el resto.
Un mtodo estadstico de agregacin de indicadores, Una herramienta de diagnstico para explorar cada eleccin de distintas alternativas al momento de construir el indicador compuesto, Un procedimiento para agrupar unidades de anlisis por su similitud y a partir de all imputarle a algunos de ellos datos perdidos con el fin de disminuir la dispersin de la informacin, Una tcnica de anlisis de los resultados El anlisis puede ser jerrquico, dando lugar a una estructura en forma anidada de rbol, o no jerrquico si se establece un nmero de clases predeterminado. Esto se esquematiza en el grfico 2 que muestra una representacin en el espacio de las variables y donde cada punto corresponde a una unidad de anlisis, por ejemplo un pas. En el primer caso, el anlisis genera, a distintos niveles de semejanza, distintas soluciones de agrupamiento entre los elementos, mientras que en el segundo caso, la solucin se obtiene una vez fijado un cierto nivel de semejanza.
GRFICO 2 EJEMPLOS DIAGRAMTICOS DEL ANLISIS DE AGRUPAMIENTO JERRQUICO (IZQUIERDA) Y NO JERRQUICO (DERECHA)
La principal ventaja de los mtodos jerrquicos es la facilidad de interpretacin del rbol taxonmico que resulta. Para realizar un anlisis de agrupamientos es necesario definir una distancia. Toda definicin de distancia debe satisfacer ciertas condiciones definidas en un espacio mtrico. Sean x, y & z tres vectores definidos en el espacio de las p variables. Entonces la distancia entre ellos es un nmero real que debe satisfacer las condiciones de: 1. 2. 3. No negatividad: Conmutatividad: Desigualdad triangular:
Existen numerosas medidas de distancia que satisfacen estas condiciones. Se presentan algunas de ellas en el recuadro 3. Una vez tomada la decisin acerca de qu medida de distancia entre elementos utilizar, de las que hemos mostrado tan slo algunas definiciones, se debe elegir el tipo de algoritmo que se utilizar para realizar el anlisis de agrupamiento. Esto significa que se debe determinar una metodologa de clculo de la distancia entre grupos, propiamente dicha. Siguiendo a Spath (1980), las ms comunes son:
47
Agrupar por vecinos cercanos (enlace simple): La distancia entre dos grupos se determina por la distancia entre los dos vectores (o unidades de anlisis) ms cercanos pertenecientes a grupos distintos. Esto produce grupos que pueden quedar encadenados por elementos vecinos. Agrupar por los vecinos ms lejanos (enlace completo): En este caso, la distancia entre dos grupos se define como la mayor distancia entre dos vectores pertenecientes a grupos distintos. Este mtodo es bueno cuando las unidades de anlisis forman grupos claramente definidos. Promediar todas las distancias (enlace promedio): La distancia entre grupos se define como el promedio de las distancias entre todos los pares de elementos de uno y otro grupo. Este mtodo funciona bien cuando los grupos estn suficientemente separados como para distinguirse. Una variante de este mtodo consiste en calcular el centroide o baricentro de cada grupo, i.e. es la interseccin de todos los hiperplanos que dividen al grupo en dos partes de igual volumen con respecto al hiperplano. Informalmente es el promedio de todos los puntos de grupo. Calculado el centroide, la distancia entre grupos, es simplemente la distancia entre sus respectivos centroides. Promediar pesadamente todas las distancias (enlace promedio ponderado): Es una metodologa idntica a la anterior, con la salvedad de que el tamao de los grupos, es decir, el nmero de elementos que estos contienen, es usado como peso en el clculo de las distancias. Puede ser til cuando el tamao de los grupos difiere mucho. Mtodo de Ward (1963): La pertenencia a un grupo se determina calculando la varianza de los elementos, es decir, la suma de los cuadrados respecto de la media del grupo. El elemento pertenecer al grupo si da lugar a un incremento mnimo de esta varianza. Uno de los principales inconvenientes de la metodologa es identificar el nmero ptimo de grupos a considerar. Si son demasiado pocos tal vez se est sub-especificando la situacin y viceversa. En definitiva, la alternativa ptima es parte de la decisin del analista que deber hacer a partir, por ejemplo, de estudiar la distancia promedio de elementos en los grupos formados. En el caso del agrupamiento jerrquico, los saltos significativos de este valor conforme se avanza en los niveles jerrquicos, daran a entender que se han fusionado dos grupos que previamente podan ser significativamente dismiles. En el caso de los mtodos no jerrquicos se parte de una agrupacin de k conglomerados no solapados elegidos al azar, con k especificado a priori, definidos como resultado de la optimizacin de una funcin objetivo. Luego se calcula el centroide de cada uno (o tambin puede ser la varianza, segn el caso) y se relocalizan los elementos ms cercanos a estos y as iterativamente hasta que no se produzcan cambios en los grupos (Hartigan, 1975). La funcin objetivo suele consistir en (i) minimizar la distancia al centroide (o la varianza del grupo, segn el caso) y, a su vez, (ii) maximizar la distancia al centroide (o varianza) de los elementos fuera del grupo. Para finalizar esta seccin vale comentar que la principal desventaja de los mtodos de agrupamiento es que, sin importar la naturaleza de la informacin con que se alimentan, siempre terminarn realizando algn tipo de clasificacin, independientemente de su relevancia interpretativa. Otro inconveniente importante es que existen numerosas opciones metodolgicas lo cual puede llevar al analista a la confusin acerca de cul aproximacin utilizar. As mismo, cuando el nmero de variables es muy grande y se supone que algunas de ellas pueden no contribuir a identificar la estructura de los conglomerados, es posible recurrir a metodologas hbridas que combinen en anlisis de agrupamientos y el anlisis factorial o el ACP y cuyo objetivo es, por un lado, reducir la dimensionalidad del sistema y por el otro lograr llegar a un agrupamiento lo ms fiel posible a los objetivos que se persiguen.
48
(1) Donde p representa un factor de escala (unidad de medida). Obsrvese que su valor depende de la escala o unidad de medida de las variables.
Distancia de Chebishev:
(6) Esta medida es til cuando se desea definir elementos como diferentes si hay una diferencia apreciable en cualquiera de las dimensiones de los mismos.
Distancia potenciada:
(7) Esta medida es til cuando se desea incrementar o atenuar el peso de una dimensin (o, mejor dicho, variable). El valor de s, calibra las diferencias de cada variables, mientras que r, permite controlar el peso de la distancia entre unidades de anlisis diferentes.
Proporcin de discrepancias:
(8) Esta medida es ventajosa cuando se trabaja con informacin discreta o categorizada.
Por lo general los principales paquetes de software estadstico entre los que se destacan el STATISTICA, el SAS, el SPSS y los programas de aplicaciones matemticas como el MatLab, por ejemplo, tienen disponibles mdulos que facilitan la implementacin de estas tcnicas de anlisis multivariado. En el caso de no disponerse de estos paquetes de informacin existen tambin herramientas de libre acceso que permiten realizar estos clculos. 49
La ausencia de datos en algunas unidades de anlisis en algunos o todos los periodos bajo estudio ser una situacin habitual cuando se realice el ejercicio de construccin de un indicador compuesto, especialmente cuando se considere el conjunto de todos los pases del mundo. Es muy frecuente que la informacin que alimenta el indicador no est disponible para todos ellos. Esto es particularmente evidente en el caso de las estadsticas de medio ambiente que al da de hoy an no se han armonizado a escala global. La prdida de informacin puede ser ocasional, cuando el valor del dato perdido no depende de la variable en cuestin o sistemtica (no aleatoria), cuando s depende; por ejemplo, los perceptores de altos ingresos tienden a no declararlo en las encuestas de ingresos y gastos que se les hagan. Cuando se trate de una prdida sistemtica de datos debera modelarse la situacin en forma particular. En el reciente artculo de Medina y Galvn (2007), publicado por la CEPAL, se analizan los fundamentos tericos de un conjunto amplio de mtodos de imputacin. A continuacin y a modo introductorio, slo se expondrn los lineamientos generales del tema. Se suelen considerar 3 posibles aproximaciones para lidiar con datos perdidos (Little & Rubin, 2002): Eliminar la informacin: en este caso se omite el registro de todo el anlisis, con el consiguiente perjuicio de que podra haber diferencias sistemticas entre usar o no la muestra completa, producir sesgos e incrementos en la dispersin. Cabe destacar que si la unidad de anlisis es el pas, eliminar el registro significara eliminar el pas, lo que podra llegar a ser inaceptable. Alternativamente se puede eliminar la variable del anlisis. En este caso como regla emprica, se puede considerar que si una variable posee menos del 5% de datos perdidos respecto a todo el conjunto, no conviene eliminarla. Hacer una imputacin simple de los datos, por ejemplo, a travs del uso de promedios, medianas, modas, o mediante regresiones con la informacin disponible. Imputacin mltiple: en este caso se recurre a tcnicas ms sofisticadas como los algoritmos de Monte Carlo via el uso de cadenas de Markov. La principal ventaja de asignar datos perdidos es que con ello se reducen los sesgos y se realiza el anlisis sobre la base de una cierta completitud en el conjunto de informacin. No obstante, la incerteza que deviene de imputar datos debe quedar reflejada en la varianza de las estimaciones. La asignacin simple de datos perdidos puede dar lugar la subestimacin de la varianza.
51
Modelizacin implcita
En la modelizacin implcita, el foco est puesto en mecanismos de asignacin basados en supuestos implcitos. Su desventaja radica en que una vez asignados los datos se tender a considerar al conjunto de datos como completo, olvidndose que se realiz una asignacin. Esta variante supone: Llenar los vacos de informacin a partir de unidades que se comporten de manera similar. Por ejemplo, en una encuesta agregar la informacin que respondieron ciertos encuestados a aquellos, de similares caractersticas, que no las respondieron. Sustituir la informacin ausente con registros existentes. Reemplazar los datos perdidos con valores tomados de otras fuentes externas.
Modelizacin explcita
La modelizacin explcita se realiza considerando un modelo estadstico que parte de supuestos concretos y explcitos. La imputacin se puede realizar por el uso de:
RECUADRO 4 REGRESIONES LINEALES Sea la variable , observada en r unidades de anlisis, pero con datos perdidos en M r de ellas, se puede realizar una regresin para todos ellos, conocidos los datos para las de todas las unidades de anlisis, de manera tal que la imputacin se hace a partir de la prediccin: (1) Una variacin de esta aproximacin es agregar un elemento estocstico a la estimacin: (2) con la varianza residual de la regresin de a partir de de los r casos completos.
Fuente: Nardo et al (2005b).
52
RECUADRO 5 ALGORITMO DE EXPECTACIN-MAXIMIZACIN (EM) Sea X el conjunto de datos. Se supone que los datos se generan por un modelo descrito por la funcin de distribucin , donde el vector de parmetros (que desconocemos) del espacio de parmetros. Esta funcin captura la relacin entre el conjunto de datos y los parmetros del modelo de datos. Como se desconocen los parmetros pero se conocen los datos tiene sentido estimar la probabilidad de observar cierto conjunto de parmetros dados los datos, es decir la funcin de verosimilitud. El algoritmo EM alterna pasos de expectacin, donde se computa la expectacin de la verosimilitud mediante la inclusin de variables latentes como si fueran observables, y un paso de maximizacin, donde se computan estimadores de mxima verosimilitud de los parmetros mediante la maximizacin de la verosimilitud esperada del paso anterior. Los parmetros que se encuentran en el paso de maximizacin se usan para comenzar el paso de expectacin, y as el proceso se repite recursivamente. Dado X, sea la funcin de verosimilitud Para M observaciones distribucin normal proporcional a : (1) consideradas independientes e idnticamente distribuidas conforme una se tiene que la funcin de densidad conjunta es: (2) Entonces, el logaritmo de la funcin de verosimilitud ser: (3) La condicin de primer orden para la maximizacin de esta funcin es: (4) es decir: (5) con esto se buscan aquellos valores de que ms se acomodan a la muestra de datos X. Dado que los datos perdidos forman parte de X, el algoritmo debe estimar tanto como los valores perdidos. Para llegar a esta solucin, se suele proceder iterativamente, como se coment previamente. En el paso de maximizacin, se estiman los parmetros como si no hubiera datos perdidos (estos son reemplazados por estimaciones), en el paso de expectacin, se estiman los datos perdidos a partir de los conocidos y los parmetros previamente estimados. Luego se establece un ciclo replicando estos pasos hasta alcanzar un cierto criterio de convergencia pre-establecido, como por ejemplo, la ausencia de cambios significativos de los valores. El resultado final sera la obtencin de un mximo local de la funcin de verosimilitud.
Fuente: Nardo et al (2005b).
53
de las principales tcnicas utilizadas es la de Monte Carlo via Cadenas de Markov4. Brevemente, esta metodologa consiste en partir de valores sin haber rellenado los datos perdidos, computar el respectivo vector con los promedios y la matriz de covarianza asociada. A partir de aqu se estima una distribucin a priori, con la que se tomarn valores al azar para imputarlos a los perdidos, se recomputan las medias y la matriz de covarianza en un ciclo que finaliza cuando se alcanza cierta estacionaridad y ambos dejan de cambiar. Para ms detalles se recomienda consultar Nardo et al (2005 a y b). As, esta metodologa, asigna numerosos valores a cada dato perdido a partir de una distribucin de datos estimada con el fin de representar la incertidumbre inherente a la informacin que no est disponible. Conformados los numerosos conjuntos de datos, se los analiza estadsticamente con el fin de obtener estimadores de los valores que sern utilizados en la imputacin. Usualmente se recurre al promedio, la desviacin estndar y el p-value. A manera de cierre de esta seccin se plantea el comentario de que, en cualquier caso, se debe tener presente que el uso de estas herramientas de imputacin no puede sustituir totalmente la informacin perdida, por lo que el primer criterio para el tratamiento de datos perdidos debe ser el tratar de recuperar desde las fuentes originales la informacin. Adems debe tenerse presente que el abuso de los mtodos de imputacin de valores perdidos (en la medida en que sustituyan un porcentaje importante de la informacin) puede conducir a anlisis que no reflejen con precisin lo que ocurre en realidad.
Una cadena de Markov es una serie de eventos en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. En tal sentido, la distribucin de probabilidades de un elemento depende del valor del elemento anterior a l.
54
Seguramente, en el caso de la construccin de un indicador compuesto de desarrollo sostenible, muchas de las variables que se seleccionen, estarn expresadas nominalmente en unidades econmicas o fsicas (Dlares PPP, $, m, km, km2, ha, yardas, pulgadas, cm, Tn, kg, por ejemplo), en fracciones de una determinada unidad (cantidades per cpita, por hectrea, por km2, en kg/m3, etc.), en forma de tasas de variacin o como porcentajes de variacin, unidades con relacin a un ao base, etc. Por eso, antes de proceder a agregar las variables seleccionadas en un solo indicador compuesto para cada unidad de anlisis, ser necesario normalizarlas para evitar la congregacin de variables de unidades de medida distintas y la aparicin de fenmenos dependientes de la escala. Se pueden identificar dos formas de enfrentar el proceso de normalizacin de la informacin. Una de ellas concierne a las unidades de medida, las escalas y las magnitudes de las variables per se. La otra se refiere a la representacin de estas en trminos comparativos, segn los valores que adquieran las unidades de anlisis.
55
Fuente: Elaboracin propia. Nota: En esta lista de valores se definen los cuartiles. El rango intercuartlico es 14, por lo cual valores mayores a 51 o menores a 5 son considerados como datos atpicos.
56
Por eso, con el fin de corregir la asimetra de las distribuciones muestrales originales, se puede trabajar con transformaciones potenciales simples, esto es, reemplazar por las races -simas: Por el carcter montono de la funcin, estas transformaciones preservan el orden de los valores, sin embargo, modifican la distancia entre ellos. Con potencias , o con el logaritmo, se comprime la escala en la parte superior de la distribucin con relacin a los valores menores, lo que (por ejemplo el cuadrado) se tiende a reducir la asimetra cuando el ndice es negativo. Cuando tiene el efecto contrario, es decir que si la distribucin muestral original tiene un valor del ndice de asimetra positivo considerable, la aplicacin de esta ltima transformacin lo reducir. Finalmente, existe una familia de transformaciones de variables muy utilizada para resolver los problemas de falta de normalidad y de heterocedasticidad denominadas como las transformaciones de Box-Cox (1964), muy similares a las que se han comentado (ver el recuadro 6).
RECUADRO 6 TRANSFORMACIONES DE BOX-COX Considerando que , la transformacin en forma genrica es: (1) Para estimar el valor de con el objetivo de obtener un conjunto de valores distribuidos de la manera ms parecida a la normalidad, se calcula la mxima verosimilitud. En primer lugar se calcula: (2) Luego se estima el valor de que maximiza la funcin de verosimilitud: (3) Si bien esto no garantiza que efectivamente la variable transformada provenga de una distribucin normal, se aproxima a ella. En ocasiones puede haber variables para las que ninguna transformacin es satisfactoria. Numerosas son las transformaciones propuestas por otros investigadores, como una versin exponencial similar a la familia de Box-Cox, propuesta por Manly (1976): (4) que admite valores negativos y, segn se comenta, es til para distribuciones asimtricas. Otro caso es el de la transformacin mdulo propuesta por John y Draper (1980) para distribuciones simtricas: (5) entre otras posibles transformaciones.
Fuente: Box & Cox (1964), Manly (1976), John y Draper (1980).
Mtodos de normalizacin
A continuacin se detallan las principales tcnicas para normalizar los datos de manera tal de facilitar la mejor comparacin posible entre unidades de anlisis. La eleccin de una u otra
57
metodologa, depender de las caractersticas de cada indicador y formar parte del juicio experto del analista. Nota: en esta seccin el suprandice i, rotula la unidad de anlisis i.
De esta manera, los datos se independizan de la magnitud de los posibles datos atpicos que pudieran estar presentes. Cuando se dispone de informacin en varios instantes del tiempo el ordenamiento se hace en cada perodo por separado. Ello permitira seguir el desempeo comparado o relativo de cada unidad de anlisis en el tiempo, pero no de su situacin per se.
Estandarizacin (z-score)
Dado que para cada variable se puede calcular la media y desviacin estndar medidas sobre la poblacin de unidades de anlisis, es posible estandarizar la variable calculando el valor estadarizado tambin llamado valor z ( z-score) como:
Para cada unidad de anlisis i, el valor obtenido representa la distancia entre el valor de la variable y la media poblacional, expresada en unidades de desviacin estndar. Es importante destacar, que el clculo de este indicador requiere estimar la media y desviacin estndar poblacional y no, la muestral, lo que supondra la realizacin de algunas pruebas para analizar la compatibilidad entre los valores muestrales y el modelo poblacional asumido. Lo interesante de esta representacin es que los valores de cada unidad de anlisis quedan estandarizados respecto de una misma distribucin. As mismo, dado que la media que deviene de la transformacin es cero se evita, cuando se agregan todas las variables, la presencia de distorsiones debidas a las diferencias entre las medias de los indicadores. Cuando se trabaja con variables registradas a lo largo del tiempo, se suele estimar la media y desviacin estndar en referencia a un ao base que usualmente ser el primer ao en que se dispone de la informacin.
Re-escalamiento
En este caso se considera el rango de los valores que la variable adquiere. Consiste en transformar los niveles de las variables para llevarlos al intervalo [0,1], empleando la distancia entre los valores mximos y mnimos que la variable adquiere considerando todos los datos de la variable conjuntamente, esto es, calcular:
58
La unidad de anlisis de mayor desempeo tendr un valor 1 y el de menor, 0. Como el reescalamiento opera sobre los valores extremos de la variable, es importante verificar que no se est en presencia de registros atpicos ya que la comparabilidad realizada sobre la base de este tipo de valores, distorsionara considerablemente el anlisis y concentrara los valores tpicos en un estrecho rango de valores dentro del intervalo [0,1]. Asimismo, si los valores registrados de una variable yacen dentro de un sub-intervalo estrecho, la aplicacin de la transformacin abrira el rango de los registros transformados, lo que no ocurrira con la transformacin anterior.
RECUADRO 7 ALTERNATIVAS DE REESCALAMIENTO Cuando se trabaja con registros realizados en varios instantes del tiempo, se suele considerar un ao base: (1) Sin embargo, bien podra suceder que: (2) Por lo que, como mejor opcin, podra calcularse: (3) El problema de esta transformacin es que no es estable ya que la llegada de nueva informacin que modifique los mnimos o mximos, obliga a alterar todos los valores de la serie.
Fuente: Elaboracin propia.
donde R es una unidad de anlisis considerada como de referencia ya que es en relacin a ella que los resultados quedan referidos y to el perodo inicial. En algunos casos no se fija el valor del tiempo y la referencia respecto de la cual se calculan los valores puede ir variando con la llegada de nueva informacin. Por otro lado, es posible reemplazar la unidad de anlisis de referencia por un valor objetivo a ser alcanzado, una unidad promedio o, a veces, se considera la propia unidad de anlisis como referencia a partir del valor en el instante inicial to. Otro tipo de medicin de distancia que puede emplearse es:
cuya nica diferencia es centrar los valores resultantes alrededor del cero.
Categorizacin de escalas
En este caso, a cada indicador se le asigna un rango de categoras, por ejemplo: una, dos, tres, cuatro o cinco estrellas, o se establece un semforo con categoras: verde, amarillo, rojo. Tambin se puede establecer una escala de logros cualitativa, por ejemplo: objetivo alcanzado: totalmente, parcialmente o no alcanzado. A cada categora se le asigna un rango de valores dentro del cual esta es vlida. Por lo general, estos rangos se basan medidas de localizacin como los percentiles, los deciles o los cuartiles.
59
Est tcnica puede ser til para representar informacin cualitativa en rangos relativamente cuantificables. No obstante, el principal inconveniente de este mtodo es que tiende a producir la prdida sustancial de informacin cuantitativa que podra ser relevante, por ejemplo, acerca de la dispersin de las magnitudes.
Entre las principales desventajas de esta metodologa se puede comentar que la eleccin del umbral pareciera arbitraria, ya que est sujeta a la experiencia que el analista tiene acerca de la informacin con que trabaja. As mismo, al establecerse rangos categorizados, se pierde la informacin nominal de la variable procesada.
60
Finalmente se llega a la etapa crucial del proceso, la cual consiste en componer los mltiples indicadores y variables seleccionados en el indicador compuesto propiamente dicho. Ello supone la necesidad de agregar la informacin de manera uniforme o, segn se considere, estableciendo diferentes factores de peso que den cuenta de la importancia relativa de cada indicador en el agregado. La manera en que se pese la informacin disponible definir en forma determinante el valor final de indicador; por ello la metodologa de agregacin debe ser claramente explicitada y de fcil y transparente reproduccin. Existen distintas pautas de agregacin que consideran diversas tcnicas, cada una de las cuales supone asumir ciertos supuestos de partida especficos. Sin pretender ser exhaustivos, a continuacin se revisan los principales procedimientos que se pueden seguir para agregar la informacin ya depurada y normalizada. Sin embargo, no se debe perder de vista que independientemente de la metodologa adoptada, ponderar un conjunto de variables para agregarlas en un nico indicador, termina siendo en esencia un juicio de valores que debera explicitar el objetivo que subyace al diseo del indicador. Ello se debe a que no existe metodologa objetiva para establecer los pesos de las variables. Por esta razn, adems de trabajar a partir de un marco conceptual consistente suele recurrirse tambin, a la opinin experta y a la bsqueda de consensos con grupos de inters que sinteticen las prioridades polticas y los puntos de vista. Otro argumento para considerar la agregacin con ponderaciones diferenciadas se refiere a la calidad de la informacin estadstica. Es razonable asignarle una mayor visibilidad a aquellas variables cuya calidad sea ms confiable. Por ejemplo, cuando la cantidad de datos perdidos sea mnima o la medicin de los datos se realice a partir de criterios internacionalmente estandarizados y armonizados con de lneas de base similares. En muchos casos, se suelen aplicar ponderadores equi-proporcionales, especialmente cuando no hay fundamentos slidos que indiquen la necesidad de ponderar discrecionalmente las distintas variables consideradas. Sin embargo, debe tenerse en cuenta que esto no significa no pesar las variables ya que el uso de factores de peso idnticos es de por s un juicio de valor que asigna la misma prioridad a todas ellas. Por eso, a veces es razonable promediar de manera simple un conjunto de sub-indicadores reflejando el mismo nivel de prioridad a cada uno, pero construir cada sub-indicador con variables agregadas con factores de peso diferentes. Finalmente, es importante destacar que al momento de determinar los ponderadores de las variables se debe tener claro conocimiento acerca de las posibles correlaciones entre estas con el fin de evitar la doble contabilidad que pudiera darse cuando dos o ms indicadores, aunque parcialmente, midan el mismo fenmeno. Por ese motivo, en la seccin de anlisis exploratorio se han introducido 61
algunas de las metodologas ms utilizadas al respecto. Si dos variables colineales son incluidas en el indicador compuesto se estara duplicando el peso en la dimensin que ambas representan. Es por ello que deben realizarse pruebas estadsticas que evalen la correlacin entre variables, como por ejemplo, el clculo de coeficiente de Pearson y seleccionar un conjunto de variables que tengan la menor correlacin entre s posible o atenuar el peso de aquellas variables que pudieran estar correlacionadas. Ya nos hemos referido a esto en la seccin VI en que exploramos las opciones de anlisis estadstico multivariado. A continuacin se detallan las principales tcnicas de ponderacin.
la variable y el objetivo que se le plantea alcanzar para ella. En tal sentido, las metas de las polticas que se aplican, los niveles de sostenibilidad considerados como plausibles, el desempeo comparado de las unidades de anlisis con caractersticas similares, etc., pueden ser la base para definir los objetivos planteados. No obstante, en algunos casos puede no ser viable la definicin del objetivo en relacin con las variables consideradas. As mismo, hay que tener en cuenta que muchas veces la comparabilidad entre unidades de anlisis puede dificultarse. Por ejemplo, si consideramos variables como las carencias en la calidad de la vivienda, no es lo mismo un pas que este ubicado cerca de los trpicos, que poseen una sola estacin clida durante todo el ao, que pases que tengan estaciones fras.
Luego se pueden expresar las componentes como las combinaciones lineales de las variables. Entre las principales desventajas del ACP como mtodo para ponderar variables se puede comentar que por un lado es muy sensible a la incorporacin de informacin y la presencia de datos atpicos (que introducen variabilidades espurias en el conjunto de datos). Adems, el mtodo tiende a minimizar la contribucin de variables que poseen una evolucin distinta de los dems indicadores. La asignacin de factores de ponderacin sobre la base del anlisis de factores o de componentes principales se basa en la presencia de correlaciones que pueden no corresponder a las verdaderas relaciones que pudieran existir entre los fenmenos bajo anlisis y las variables con que se trabajan, o simplemente que corresponden a relaciones distintas a las que se quiere estudiar. Debe considerarse que correlacin no necesariamente implica redundancia. As mismo, estos tipos de tcnicas buscan encausar la homogeneidad ms que representar la pluralidad de comportamientos y slo pueden aplicarse cuando se est en presencia de correlaciones significativas.
64
Sea una unidad de anlisis c, ubicada fuera de esa frontera. Conocida la frontera es posible considerar una unidad virtual de referencia c con la que c puede compararse. Entonces, el mtodo de anlisis envolvente de datos no es ms que una tcnica, basada en el uso de la programacin matemtica que, dada una unidad de anlisis (c), nos permite identificar aquellas otras que nos sirven para construir la unidad virtual de referencia, con la que compararemos la que est bajo anlisis y que yace en la interseccin con la lnea que pasa por el origen y la ubicacin del punto que definen los datos de la unidad de anlisis c. A lo largo de esta lnea radial y hacia el nordeste, tienen lugar los cambios equiproporcionales de ambas variables y1 e y2 que tendran que darse para que la unidad c mejore su desempeo. Nuevamente, debe considerarse que la unidad de anlisis de referencia no es real sino que es un ideal con el cual comparar el desempeo de c y que se construye a partir de una combinacin lineal convexa de los vectores de las variables y1 e y2 de las unidades a y b, como se observa en la figura. De acuerdo a Farrell (1957), el cociente entre las distancia oc y la distancia oc, que por cierto ser siempre menor o igual que la unidad, da cuenta la eficiencia tcnica de la unidad de anlisis en trminos de las variables con que se trabaja (vase Schuschny, 2007). Tngase en cuenta que estas distancias pueden medirse con independencia del nmero de variables considerado, aunque en este ejemplo se han esbozado slo dos. Es fcil comprender que las unidades de anlisis cuyas variables los ubican en la frontera tendrn un indicador de eficiencia tcnica igual a uno. Dado que c y c yacen en la misma recta radial, el conciente se puede expresar como:
Si se generaliza este resultado, es posible definir al indicador compuesto como el cociente entre el nivel de desempeo de la unidad de anlisis en relacin con su referencia virtual, es decir:
indizadas por , correspondientes las unidades de anlisis donde las variables calculada para los momentos t, estn normalizadas. Dado que esta es una metodologa no tradicional y poco utilizada se ha optado por no dar demasiados detalles del clculo de estos pesos y los dems pasos a seguir. Una explicacin pormenorizada de estos as como una descripcin de los principales paquetes computacionales gratuitos para su clculo pueden encontrarse en Schuschny, 2007. El anlisis envolvente de datos puede ser muy til para endogenizar en un solo indicador el comportamiento de numerosas variables. Adems, tiene la ventaja de establecer para cada unidad de anlisis una comparacin del desempeo en relacin con otra que si bien tiene un comportamiento hipottico, es el que empricamente mejor se desempea, a la vez que resulta ser el mejor caso a ser empleado como medida de comparacin ya que surge de una combinacin lineal de los casos de mejor desempeo. Sin embargo, posee ciertas desventajas. Dado que es un mtodo matemticamente sofisticado, hasta cierto punto puede ser visto como una caja negra que sustituye la opinin de los expertos mediante la aplicacin realizada por el analista y por eso, en parte se pierde transparencia, algo por cierto, importante al momento de comunicar los resultados obtenidos. Por otro lado, las unidades que conforman la frontera poseern un valor del indicador igual a 1, lo que puede dificultar el anlisis de sus progresos en el desempeo per se. En Cherchye et al (2006) se ejemplifica el uso del mtodo DEA para la construccin de un indicador compuesto.
de peso obtenidos a partir de este procedimiento sern aquellos que minimizan el trmino de error resultante. Esta metodologa se asemeja al anlisis de regresin, sin embargo en este caso, se supone que el fenmeno que se desconoce pero la variable dependiente no es conocida. Sea se desea medir para cada unidad de anlisis. Sean los indicadores que se disponen, cada uno de los cuales mide algn aspecto de . Consideremos que el resultado observable para la unidad de anlisis j, del indicador i queda definido por y puede escribirse como una combinacin lineal del fenmeno no observado y un trmino de error: donde son parmetros no conocidos que mapean . El trmino de error resume dos fuentes de incertidumbre: (i) la que deriva del mapeo y (ii) la posibilidad de una medicin imperfecta. Se supone que posee media nula y la misma varianza para todas las unidades de anlisis, i.e.: es una variable aleatoria, As mismo, con el fin de facilitar los clculos, se supone que tambin con media nula y varianza unitaria y que las variables han sido normalizadas para tomar valores para cada unidad de anlisis se realiza mediante el clculo de la media entre (0,1). La estimacin de de la distribucin condicional del componente no observado, es decir: (*) siendo los factores de ponderacin una funcin decreciente de la varianza de la variable asociada y creciente de la de los dems e iguales a:
Ntese que el valor de los pesos ser menor ante la presencia de datos atpicos (outliers). La varianza de la condicional de la distribucin es una medida de la precisin del indicador compuesto y sirve para definir sus intervalos de confianza. Est dada por:
Resulta razonable que, como se observa, la varianza crece con el nmero de indicadores considerados y el valor de sus respectivas varianzas. La estimacin del modelo se facilita bajo la suposicin de que se distribuyan normalmente. Se trata de estimar el valor de los parmetros: que maximizan la funcin de verosimilitud que se basa en los datos observados. Los valores estimados se sustituyen en la distribucin condicional del componente no observado, usando la ecuacin (*), para obtener el valor del indicador compuesto y sus factores de ponderacin. Esta metodologa, si bien resulta interesante pues no depende de formular ninguna representacin ad hoc, tiene la desventaja de dar lugar a problemas de identificacin cuando las variables intervinientes estn altamente correlacionadas.
66
Como cada fila de la matriz es mltiplo de la primera fila, el rango de la misma es igual a uno y, por lo tanto, habr un slo autovalor no nulo, digamos: p. Dado que , y que la suma de todos los autovalores es igual a la traza, tenemos que:
As mismo, se puede comprobar que: , donde decir que los pesos son el autovector de W con autovalor p.
Sobre la base de estas interesantes conclusiones Saaty (1980) propone calcular los factores de ponderacin, realizando comparaciones entre las variables tomadas de a pares. Para ello se pregunta, en cada caso, cul variable es ms importante y cunto ms lo es. La intensidad de la preferencia puede medirse en una escala de Likert (de 1 a 9). Un valor asignado a una variable de 1 indica que es igualmente importante que aquella con la que se compara, mientras que si se le asigna el valor 9, esa variable se considerar muchsimo ms importante que la otra. Hechas las comparaciones se construye una matriz de comparaciones, que llamamos A, cuadrada en el nmero de variables, cuyos indican cunto la variable de la fila i es ms importante de la variable de la columna j. elementos Para completar la matriz basta considerar que:
Ntese que la matriz A es muy similar a la matriz de razones (ratios) W. Dada la forma en que se construye, se puede demostrar que: (i) el mximo autovalor de A, es mayor o igual a p y (ii) que su autovector asociado posee todas sus componentes estrictamente positivas. Entonces, dada la similitud entre A y W, para estimar los factores de ponderacin a partir de la matriz de comparaciones A, basta con y normalizarlo de manera tal que la suma de sus calcular el autovector asociado al autovalor componentes sea la unidad. Dicho vector corresponder a los factores de ponderacin que surgen de las comparaciones realizadas por los expertos. La principal ventaja de esta metodologa es que transparenta el proceso de definicin de los pesos sobre la base de un procedimiento ampliamente utilizado. Sin embargo y dado que se deben hacer numerosas comparaciones entre pares de variables puede tornarse tediosa su sistematizacin. As mismo y como sucede con los mtodos participativos, los resultados dependern del grupo de expertos seleccionados para priorizar las variables.
67
Anlisis Conjunto
El anlisis conjunto, llamado tambin modelo composicional multiatributo, es una tcnica estadstica utilizada en las ciencias sociales aplicadas, practicularmente en el marketing, la administracin del producto y la investigacin operativa (Malhotra, 1996). Como la anterior, esta metodologa tiene un carcter eminentemente participativo. El objetivo del anlisis conjunto es determinar qu combinacin de un nmero limitado de atributos es el ms preferido por un grupo de encuestados. Mientras que la tcnica anterior, el Analytic Hiererchy Process valoriza las alternativas agregando el valor individual de las variables, el anlisis conjunto lo hace desagregndolo. El anlisis conjunto busca establecer una medida de los juicios o percepciones de los consultados sobre un conjunto de escenarios o alternativas, en nuestro caso, se les pide a los consultados (en este caso, expertos) que elijan y/o prioricen un conjunto de variables de su eleccin. Los encuestados eligen el conjunto de variables preferidas por ellos. En primer lugar, el analista debe ser capaz de formular el problema a ser resuelto identificando los atributos a considerar, en nuestro caso se trata de las variables y sus posibles niveles. Un anlisis tpico involucra la identificacin de no ms de 10 variables. Por ejemplo, para cada variable se pueden definir los niveles segn sea una variable econmica, social, institucional o ambiental. Luego se debe disear la forma de presentarle la informacin al encuestado. Ello se puede hacer a travs de comparaciones entre pares de variables o realizando una evaluacin directa de cada una de ellas. En el primer caso se contrasta cada nivel de cada variable con los de las dems, por lo cual se torna un procedimiento bastante engorroso puesto que supone, por parte del consultado, realizar numerosas comparaciones. A pesar de ello, para este puede resultar ms fcil tantear entre pares que hacer una evaluacin global de cada variable. La evaluacin directa implica que, para cada variable se realiza una evaluacin global independiente del resto de las variables. Es decir que se busca establecer un puntaje de preferencia y no un ordenamiento o ranking de variables. Suele considerarse una escala de puntaje de Likert de 9 puntos (1 no es preferido, 9 es muy preferido). La principal desventaja de esta metodologa es que supone el diseo de una encuesta que puede complicarse cuando el nmero de variables y niveles asociados es grande. Ello puede dificultar la evaluacin por parte del encuestado.
RECUADRO 8 ANLISIS CONJUNTO Siguiendo lo expuesto por Malhotra (1996) que se basa en Jain, Acito, Malhotra y Majan (1979), el nivel de utilidad (o preferencia) general, dado por la contribucin asociada a cada nivel j del atributo (variable) i, est dado por: (1) donde, es nmero de niveles de la variable i ( ). La importancia de la variable i, que definimos como, puede estimarse como la diferencia entre el mximo y mnimo de los coeficientes : (2) Para luego, calcular los factores de ponderacin a partir de la normalizacin de estos valores, de manera tal que: (3)
(Contina)
68
Sobre la base de esta representacin esquemtica, se detalla, a continuacin, cmo proceder para calcular los coeficientes . La manera ms usual de estimarlos es a travs del empleo de regresiones con variables indicadoras (o dummies) que asumen valores 0 1. Como se indica en Malhotra (1996), pueden utilizarse tambin modelos LINMAP, MONANOVA y LOGIT. Si una variable (o atributo) tiene niveles, ser necesario emplear variables indicadoras. Para realizar la regresin, se toma como variable dependiente al nivel general de utilidad (o preferencia) y como independientes las variables indicadoras que codifican en conjunto los niveles de las variables (atributos). Por ejemplo, si una variable tiene 3 niveles, cada uno de ellos se puede codificar con dos variables indicadoras como: (4) siendo , las variables indicadoras (dummies) asociadas a los niveles de la variable considerada i. El R2 de la regresin indicara cun bien el modelo se ajusta a la informacin. Hecho esto para todas las variables se debe estimar el modelo: (5) Obtenida la estimacin de los parmetros: , se calculan los valores de los coeficientes tomando el nivel que corresponde a la codificacin con todos los nulos como nivel de base y considerando el sistema lineal:
(6) a estas cumpla: ecuaciones se le agrega una restriccin ms, cerrando el sistema, en que se impone que se (7) As, se obtienen todos los valores de . Esta operacin se repite para todas las variables. Luego, para cada variable se calcula su nivel de importancia la cual se haba definido como: para, finalmente, obtener los factores de ponderacin que resultaban de la normalizacin conforme a la ecuacin (3).
Fuente: Malhotra (1996).
69
X. Mtodos de agregacin
Una vez determinados los factores de ponderacin (pesos) hay que proceder a agregar todas las variables o sub-indicadores en un indicador sinttico, en aqullos casos en que el mtodo de ponderacin utilizado no establece de manera natural un mtodo de agregacin subsecuente. Considerando que el suprandice representa a las variables que intervienen y el a las unidades de anlisis (por ejemplo pases) de la muestra, detallamos a continuacin, las principales tcnicas de agregacin de la informacin.
La principal ventaja de este mecanismo es la simplicidad y la supuesta independencia que se logra respecto de los datos atpicos. Sin embargo, se debe tener en cuenta que tiende a perderse informacin acerca del valor absoluto de las variables que componen el indicador.
El valor del umbral se selecciona luego de realizar un anlisis exploratorio que permita determinar aproximadamente el rango de valores que adquieren las variables. Como en el caso anterior, este modelo de agregacin no se ve afectado por la presencia de datos atpicos, sin embargo, tambin se pierde informacin de la magnitud que pueden poseer las variables. 71
Como se explic en la seccin anterior, la forma en que se obtuvieron los factores de peso debe quedar explcitamente determinada. As mismo, es deseable que los indicadores sean preferentemente independientes entre s en el sentido de que para todo par de variables , la posible vinculacin entre ellas, i.e.: cumpla que:
respecto de cualquier otra variable . Esta suposicin impedira la presencia de sesgos indeseables y facilitara el clculo de las contribuciones marginales de cada variable en el valor del indicador compuesto separadamente. Bajo esta consideracin, es fcil verificar que el cociente de los pesos de dos variables cualesquiera, digamos, i y k representa la magnitud de mejora en i necesaria para compensar una declinacin en k de una unidad sin que se vea afectado el valor de indicador compuesto. En efecto diferenciando:
se obtiene: El uso de factores de ponderacin idnticos, i.e. , puede ser apropiado cuando de trabaja con sub-indicadores que agregan distintas dimensiones del contexto de aplicacin. Por ejemplo, cuando se trate indicadores de sostenibilidad puede no ser polticamente correcto priorizar alguna de las dimensiones econmicas, sociales, ambientales o institucionales, en desmedro de ellas. Ello tambin exigira considerar una igual cantidad de variables estadsticas para analizar cada uno de estos sub-sistemas. Asimismo, puede ser conveniente usar ponderadores idnticos cuando las variables estn altamente correlacionadas entre s, sin que ello implique la presencia de redundancia explicativa puesto que esos elementos correlacionados explican aspectos diferentes de fenmeno en cuestin.
Ntese que si las variables estn expresadas como logaritmos, la media aritmtica ponderada es el logaritmo de la geomtrica, i.e.:
72
Adems, cuando se promedia geomtricamente, el cociente de los pesos de dos variables cualesquiera, digamos, i y k representa el porcentaje de mejora en i necesario para compensar una declinacin en k de un 1% sin que se vea afectado el valor de indicador compuesto. En efecto, sin prdida de generalidad sean i= 1 y k=2, diferenciando:
, tenemos que:
Tanto en este caso, como en el de las medias aritmticas subyace un razonamiento compensatorio entre variables, lo que supone la existencia de vnculos o compromisos entre estas. Cuando se piensa que los factores de ponderacin de las variables determinan la importancia relativa de estos en la composicin del indicador sinttico y no se desea que no reflejen la posibilidad de compensaciones entre stas, es posible - y algunos como Podinovskii (1994) recomiendan - recurrir a criterios de agregacin no compensatorios, como el que se ver a continuacin.
9 9
3.93 9
De la simple observacin de ambos resultados es fcil darse cuenta que la agregacin geomtrica establece una clara diferencia entre ambos pases mientras que, con la agregacin lineal, se obtiene el mismo valor del indicador, a pesar de tratarse de dos pases con contextos totalmente distintos. Por eso, desde el punto de vista poltico un pas con bajos valores en sus indicadores, pero algunos muy altos preferir realizar las comparaciones entre pases sobre la base de los mecanismos de ponderacin lineal. As mismo, cualquier cambio marginal de la segunda, tercera o cuarta variable tendr un mayor efecto, sobre el valor del indicador, si se agrega geomtricamente, por lo que, en caso de aplicarse este tipo de agregacin, habr un mayor incentivo a aplicar polticas que mejoren la situacin que reflejan las variables que poseen los valores ms bajos.
Aproximaciones multi-criterio
Cuando se utilizan numerosas variables para evaluar un conjunto de unidades de anlisis y se desea establecer un ordenamiento o ranking para analizar sus desempeos relativos, es ms que probable que algunas de las variables favorezcan el desempeo de algunas unidades de anlisis, mientras que otras el 73
de otros, creando un cierto conflicto acerca de la forma de realizar el ordenamiento. Para subsanar este inconveniente, se puede apelar a aproximaciones multi-criterio (Munda, 2004). Sea el conjunto (finito) de indicadores: y el de unidades de anlisis (por ejemplo pases) : . Consideremos que el ordenamiento de cada pas j se basa en una escala de medida. Supongamos que los indicadores se adaptaron de manera tal que cuanto mayor es su valor mejor ser la evaluacin del pas en esa dimensin de anlisis particular. Sea el conjunto de pesos: (calculados segn lo visto en la seccin anterior) y que satisfacen:
Si se toman los pases de a pares ser posible construir una matriz E (de Npas x Npas) que cuantifica el desempeo comparado entre ellos. Sin embargo, cabe preguntarse cmo establecer la comparacin mutua habida cuenta de que estamos operando en un espacio de muchas dimensiones de anlisis dadas por el nmero de indicadores considerados. Por ejemplo, bien se podra medir la intensidad de los ordenamientos, esto es, preguntarse cunto un dado pas se desempea mejor que otro para cada indicador y establecer una medida que resume esto; tambin se podra contabilizar el nmero de indicadores a favor de uno u otro pas; o comparar la relacin de cada uno de los dos pases con el resto y fijar una medida total, entre otras posibilidades. Dadas las mltiples posibilidades de ordenamiento, lamentablemente, no ser posible establecer una agregacin o un ordenamiento perfecto y nico. Por ello, lo ms importante ser procurar que ninguna de las dimensiones de anlisis sea despreciada. Establecido un criterio de comparacin de a pares de pases se puede calcular la matriz E, cuyos elementos pueden definirse como:
donde
son los factores de ponderacin en los que j tiene un mejor desempeo que k y
aquellos en lo que se ambos se desempean en forma aproximadamente similar5. Ntese que: . Conocida la matriz, sera posible ordenar el desempeo de los pases de muy diversas maneras. Una posibilidad sera considerar la metodologa de Condercet-Kemeny-Young-Levenglick que consiste en hacer comparaciones entre pares de pases, agregar y ordenar de acuerdo a los mejores desempeos. Lo complicado de este procedimiento es que formalmente se deben realizar comparaciones. Formalmente, si definimos al conjunto , como todos los posibles ordenamientos de pases (de los cuales hay que seleccionar el mejor), se puede calcular el puntaje sobre todos los: como la suma de los pares de alternativas posibles con Es decir que: que maximiza esta suma, o sea: . Entonces, el ordenamiento elegido ser el que surja de la solucin
Este mtodo de agregacin tiene la ventaja de que supera algunos de los inconvenientes que presentan las agregaciones aritmticas o geomtricas, como la posible compensacin frente a cambios
Considerando una terminologa microeconmica, Pr viene de considerar a j como preferido a k, mientras que In significa que ambos nos son indiferentes entre s.
74
mutuos de las variables, la necesidad de uso de escalas homogneas y los compromisos mutuos que se generan entre los factores de ponderacin de las variables. Gracias a esta tcnica, sera posible trabajar simultneamente con informacin cuantitativa y cualitativa que no necesita ser normalizada. El principal inconveniente es la posible aparicin de situaciones cclicas en las que no se llegue a una conciliacin. Por ejemplo, si un pas a est mejor posicionado que uno b y este lo est respecto de uno c, pero este ltimo lo est respecto al primero, a qu pas elegir? Adems, la metodologa no considera la magnitud de las variables, haciendo que proporciones como mayor que o mucho mayor que tengan similar sentido. (Ver Munda 2004; Young 1988). A manera de conclusin de esta seccin se resalta que, toda vez que se busque realizar la descripcin de algn aspecto del mundo real mediante el uso de indicadores compuestos, es necesario disear un modelo conceptual que posea cierto grado de coherencia interna. Sin embargo, ello slo no es suficiente. El modelo debe satisfacer los objetivos e intenciones que se plantea el analista ya que el universo de posibilidades combinatorias es enorme. La potencial imposibilidad de construir un indicador compuesto plenamente objetivo no significa que la metodologa deba ser rechazada. Siempre que un indicador permita establecer un vnculo entre el contexto de anlisis y el espacio de decisiones desde donde surgen las opciones de poltica, el uso de indicadores compuestos queda enteramente justificado.
75
Si el indicador se ha diseado en forma deficiente pueden tener lugar errores de interpretacin y producir mensajes poco robustos. Todas las etapas de desarrollo de un indicador compuesto deben ser sometidas al escrutinio de expertos y se debe procurar evitar la presencia de fuentes de subjetividad. Es por ello que una combinacin entre el anlisis de incertidumbre y de sensibilidad debe llevarse a cabo para incrementar la transparencia del proceso de diseo del indicador. Es necesario juzgar lo realizado crticamente y evaluar la sensibilidad frente a cambios en la eleccin de las variables pues podra ocurrir que pequeos cambios de la arquitectura del indicador compuesto den lugar a grandes alteraciones de los valores o rankings obtenidos. En general, las incertidumbres asociadas al diseo de indicadores compuestos pueden vincularse con un nmero de factores entre los que se incluyen: 1. 2. 3. 4. 5. La eleccin del modelo para estimar los errores de medicin de los datos. El mecanismo y marco metodolgico utilizado para incluir o excluir sub-indicadores en el indicador sinttico. La forma en que los sub-indicadores son transformados. El tipo de esquema de normalizacin o estandarizacin empleado con el fin de eliminar los efectos de escala que pudiera haber. La cantidad de datos perdidos y la eleccin del mtodo de imputacin usado para llenar dichos vacos.
El mtodo de determinacin de los factores de peso. Los niveles de agregacin de la informacin si es que se superponen o complementan varios de ellos. La eleccin de sistema de agregacin de los sub-indicadores y variables.
Anlisis de incerteza
de incerteza se puede partir de considerar que es el ndice compuesto de la unidad de anlisis j, calculado , donde los nmeros rotulan distintos modelos y conforme al modelo de agregacin representa un mtodo de estimacin de los factores de peso dado de un conjunto representan las variables o sub-indicadores que componen el indicador finito de posibilidades. Los 77 Para realizar un anlisis
sus factores de peso calculados conforme al modelo s. Para cada unidad de anlisis compuesto y los j se puede calcular el valor del ranking que ocupa en relacin al resto, i.e.: . Este se constituir en la medida de inters en el estudio de incertidumbre-sensibilidad. Entonces, para cada mtodo de clculo de los factores de peso s se puede estimar la discrepancia agregada respecto a una metodologa de referencia, es decir:
Una de las formas de realizar el anlisis de incertidumbre-sensibilidad es mediante la aplicacin de la tcnica de Monte Carlo6 que consiste en perturbar todas las fuentes de incertidumbre de manera aleatoria de a una por vez, para analizar cules son los efectos derivados de tales cambios luego de hacer un anlisis estadstico. Por ejemplo, es posible excluir o incluir variables y analizar cmo cambia la situacin en relacin a los valores de y . As, sera posible estimar una funcin de distribucin para y . Los pasos seguir para aplicar la metodologa de Monte Carlo son los siguientes: Para cada factor de variabilidad se debe considerar una variable aleatoria discreta sobre la cual se realizar el tanteo de alternativas consistente con el algoritmo de Monte Carlo. Sin prdida de generalidad, supongamos que se plantean 3 fuentes de variabilidad: (1) la inclusin o exclusin de variables ( ), (2) la frmula de agregacin ( ) y (3) el mtodo de clculo de los factores de peso ( ), por ejemplo. Cada uno de estos factores de variabilidad posee un nmero finito de alternativas a ser consideradas. Sea el caso (genrico) del factor: , el cual se supone posee m opciones a ser elegidas. Sea el nmero aleatorio del que partir el algoritmo. Entonces, dado el valor que adquiera en el sorteo, se seleccionar una de las m opciones si tal valor de queda incluido dentro de los intervalos, segn se indica en la siguiente tabla:
...
...
Para realizar el experimento de Monte Carlo se debern considerar 3 nmeros al azar, uno para cada factor de incertidumbre. Se genera aleatoriamente un nmero N de muestras compuestas por las combinaciones de , con . Para cada muestra de evala el indicador y luego se factores que puede ser . , segn se elija. computa el escalar Se calcula el valor para todas las combinaciones. Estos valores sern analizados en conjunto para constatar el grado de sensibilidad del indicador compuesto frente a los cambios considerados.
El mtodo de Monte Carlo proporciona soluciones aproximadas a una gran variedad de problemas matemticos posibilitando la realizacin de experimentos con muestreos de nmeros pseudo aleatorios en una computadora.
78
La generacin de las muestras puede realizarse empleando procedimientos como muestreo aleatorio simple, estratificado, muestreo cuasi-aleatorio u otro que se considere conveniente emplear (Saltelli, Chan y Scott, 2000).
(5) 79
Cada trmino de la ecuacin combina las interacciones entre los diversos factores que consideramos independientes y que combinados en la agregacin afectan la varianza de la variables de salida . Conocida esta varianza total es posible calcular el ndice de sensibilidad para cada factor segn: (6) y anlogamente: (7) (8) La varianza condicional puede escribirse en trminos genricos como: y expresa la contribucin total a la varianza de debida los factores distintos de , por lo que involucra la variabilidad (a primer orden) debida al factor . Dada la ecuacin (2), el ndice de sensibilidad puede escribirse como: (9) Toda diferencia sustantiva entre la interaccin entre factores es relevante. y el ndice de sensibilidad a primer orden: indicara que
La estimacin de ambos ndices se puede realizar mediante diversos mtodos de muestreo estadstico. De acuerdo a Saltelli (2002) bastan 2 n (# factores +1) evaluaciones del indicador donde n representa el tamao de la muestra requerida para computar las medias y varianzas y que vara en el rango de cientos o miles de casos. Debe tenerse en cuenta que cuando los factores de variabilidad no son independientes la varianza total no puede ser descompuesta de acuerdo a la ecuacin (5). Es importante concluir que si los expertos consultados durante el proceso de construccin del indicador compuesto no acuerdan acerca de la arquitectura de su diseo, es difcil que los anlisis de incerteza y de sensibilidad puedan proveer la robustez que emana de los consensos que pudieran lograrse. Ello es particularmente cierto pues, por lo general, del estudio comparado del indicador utilizado, se establecen los ordenamientos (rankings) del desempeo de las unidades de anlisis con que se trabaja.
80
XII. Algunas propuestas existentes de indicadores compuestos para evaluar la sostenibilidad del desarrollo
Una vez presentada la ltima etapa metodolgica de construccin de indicadores compuestos, se exponen en este apartado algunos ejemplos de indicadores compuestos enfocados a la evaluacin de la sostenibilidad del desarrollo para cada uno de los tipos descritos en el captulo II.
manejo de las escalas es directo a partir del uso de porcentajes de cambio, y el manejo de los datos faltantes tiene una estructura claramente definida, establecida a partir del nmero disponible de datos en las series temporales que conforman la informacin sobre la poblacin de las especies analizadas. Para el caso en que se utiliza una serie de dos a cinco puntos, los datos faltantes son interpolados, suponiendo tasas de cambio constantes entre ellos. En el caso de series de seis o ms puntos de datos, se utiliza un modelo aditivo general para adecuar la tendencia de los datos. La cuestin de la ponderacin se realiza mediante el sencillo esquema de pesos iguales, al generar promedios geomtricos simples de los cambios para cada especie en cada grupo, y tambin promedios geomtricos simples de los cambios entre los tres grupos (bosques, aguas dulces y mares) para generar el ndice agregado. El ndice de Planeta Vivo tiene una interpretacin muy simple y clara, que generalmente se aprecia en su presentacin grfica. Asimismo tiene como caracterstica particular la posibilidad de desagregacin por subgrupos de especies, lo cual ha sido utilizado para construir LPI especficos para diferentes segmentos de poblaciones, como el caso de las especies migratorias (Latham, et. al. 2008).
Una vez obtenidos los valores transformados de concentracin para cada contaminante, el ndice se construye por medio de una de las formas ms simples de agregacin, consistente en tomar el mximo valor de entre los seis disponibles. Este valor una vez calculado se utiliza, comparado con umbrales previamente definidos, para determinar acciones concretas de poltica en materia de contaminantes 82
atmosfricos. La escala de calidad del aire es la siguiente: por debajo de los 50 puntos se considera buena; entre 51 y 100 puntos es satisfactoria; entre 101 y 200 puntos es no satisfactoria; entre 201 y 300 puntos se considera mala; ms de 300 puntos se considera muy mala. Dependiendo del valor del ndice de calidad del aire en un da, se implementan medidas de contingencia para el da siguiente, que pueden incluir restricciones a la circulacin vehicular de cierto grupo de automviles, as como a otras actividades altamente contaminantes. Tambin se incluyen, dentro del mbito de medidas de poltica, restricciones sobre actividades fsicas al aire libre para los escolares, y recomendaciones relacionadas al mismo tema para el resto de la poblacin.
83
Huella Ecolgica
El indicador denominado huella ecolgica (Wackernagel, Mathis y Loh (2001) consiste en la medicin de la superficie de tierra y agua biolgicamente productiva que se requiere para satisfacer las necesidades de una poblacin de manera indefinida utilizando las tecnologas disponibles. Partiendo del supuesto de que cada categora de energa y materia consumida, y de descarga de desechos requiere de cierta capacidad productiva o absorbente de un rea finita de agua o tierra, el ndice cuantifica para cada rubro, esa rea que sumada refleja el rea total necesaria para soportar el consumo y las descargas totales de cierta poblacin, y que comparada con el rea total productiva de esa poblacin, permite evaluar si ese nivel de consumo y generacin de desechos puede ser sostenible en el tiempo. Este indicador es muy simple en su interpretacin, por lo cual tiene una gran ventaja comunicacional.
84
Conocimientos
Conocimientos
Previo a la generacin del ndice global, se construyen ndices para cada dimensin. Estos ndices se generan con bases muy simples, que no involucran metodologas estadsticas, y que se basan en promedios ponderados. El procedimiento de estandarizacin consiste en establecer para cada indicador, cotas inferiores y superiores, a las cuales se reasigna el valor 0 y 1 respectivamente. El clculo del indicador estandarizado se obtiene al hacer el cociente entre la diferencia del valor del indicador y la cota inferior, dividida por la diferencia entre la cota superior y la inferior. Cada indicador estandarizado toma valores entre 0 y 1, as pues para las dimensiones de vida larga y saludable, y de Nivel de vida decente, el ndice corresponde al valor del indicador correspondiente estandarizado. El ndice correspondiente a la dimensin de conocimientos se construye con un promedio ponderado de los indicadores estandarizados de tasa de analfabetismo y de asistencia escolar con pesos de 2/3 y 1/3 respectivamente. Finalmente el ndice de desarrollo humano se obtiene con el promedio simple de los tres ndices correspondientes a las tres dimensiones establecidas. Esto se puede ver esquemticamente de la siguiente forma:
CUADRO 7 INDICADORES Y PESOS PARA EL NDICE DE DESARROLLO HUMANO (IDH)
Dimensin Vida larga y saludable Peso en IDH 1/3 Indicador Esperanza de vida al nacer Tasa de analfabetismo de los Adultos Conocimientos 1/3 Asistencia escolar combinada (primaria, secundaria y superior) PIB per cpita, PPA Peso en la dimensin 1 2/3 Cota superior 85 100 Cota inferior 25 0
1/3 1
100 40,000
0 100
1/3
Cabe sealar que en la construccin del ndice para la dimensin Nivel de vida decente, se utiliza una transformacin logartmica para el indicador PIB per cpita, PPA. La justificacin planteada para ello es que para alcanzar un nivel de vida respetable no se requiere un ingreso ilimitado. 85
El grado de sencillez del ndice de Desarrollo Humano conlleva el anlisis de un reducido nmero de indicadores, lo que puede dejar de considerar otros aspectos relevantes del desarrollo entendido de manera integral. Asimismo la subjetividad se hace presente en dos puntos fundamentales de su construccin, primero con la asignacin de los pesos, y segundo con la asignacin de las cotas de cada indicador. Para evaluar cmo los cambios en ambas asignaciones podran conducir a modificaciones en los valores finales del ndice, es conveniente realizar anlisis de sensibilidad en este punto. Para ms detalle de pueden consultar los Informes de Desarrollo Humano que el PNUD publica anualmente.
Seis categoras esenciales de indicadores son definidas: (i) Salud Ambiental, (ii) Calidad del Aire, (iii) Recursos Hdricos, (iv) Biodiversidad y Hbitat, (v) Recursos Naturales Productivos y (vi) Cambio Climtico. Dentro de cada una de dichas categoras se definen subcategoras para las cuales se plantea el uso de dos a cuatro indicadores centrales con pesos distintos. Esta estructura se propone con el objetivo de permitir a los pases evaluar el desempeo de polticas bien establecidas por reas o en el mbito agregado.
A partir de los objetivos que se plantea el EPI se hacen dos grandes agrupaciones, la primera referida al objetivo de reducir los impactos ambientales sobre la salud incluye a la categora Salud Ambiental. Por su parte, la segunda agrupacin correspondiente al objetivo de promover la vitalidad de los ecosistemas incluye las categoras Calidad del Aire, Recursos Hdricos, Biodiversidad y Hbitat, Recursos Naturales Productivos y Cambio Climtico. Se utilizan, en la seleccin de los indicadores, los siguientes criterios: (1) Relevancia; (2) Orientacin al desempeo, (3) Transparencia, (4) Calidad de la Informacin. En las siguientes tablas se presentan los indicadores agrupados por las categoras y subcategoras previamente descritas, la descripcin de los indicadores planteados y sus fuentes.
86
Recursos Hdricos
87
Regulacin sobre Pesticidas Area quemada Emisiones per cpita Emisiones provenientes de la Produccin de Electricidad Intensidad de Carbono Industrial
88
89
La metodologa de construccin es del tipo proximidad a la meta, por lo cual para cada uno de los indicadores se definen metas por alcanzar. Dichas metas son establecidas a partir de consensos internacionales basados en acuerdos, o a partir de consenso con expertos en el tema. La distancia a la meta de cada indicador ser la base de medicin del desempeo de cada nacin.
CUADRO 11 METAS DE LOS INDICADORES PARA EL NDICE DE DESEMPEO AMBIENTAL (EPI)
Indicador Carga Ambiental de las Enfermedades Servicios Sanitarios adecuados Agua potable Partculas Urbanas Contaminacin del aire en lugares cerrados Ozono Local Ozono Regional Emisiones de Dixido de Azufre (SO2) ndice de calidad del agua Estrs hdrico ndice de Riesgo de Conservacin Conservacin Efectiva Proteccin Crtica de Hbitat reas Marinas Protegidas Inventario de bosques ndice Trfico Marino Intensidad de Pesca de Arrastre Estrs por riego Subsidios Agrcolas Cultivo agrcola intensivo Regulacin sobre Pesticidas Area quemada Emisiones per cpita Emisiones provenientes de la Produccin de Electricidad Intensidad de Carbono Industrial 0 100% 100% 20 ug/m3 0% 0 excedente sobre 85 pbb 0 excedente acumulado sobre 40 ppb durante horas del da en verano 0 tons SO2 / tierra poblada puntaje de 100 0% territorios bajo estrs de agua razn de 0,5 10% 100% 10% razn de al menos 1 no disminuir 0% 0% 0% 0% 22 puntos 0% 2,24 Mt CO2 eq. 0 g CO2 per kWh 0,85 tons de CO2 por $1000 (USD, 2005, PPP) de PIB industrial Meta
Las distancias a la meta de cada indicador son estandarizadas para poder realizar la posterior agregacin, teniendo en cuenta que no se consideran las distancias negativas, es decir, se asigna distancia cero a cualquier valor del indicador superior a la meta. Adicionalmente, en caso de ser necesario, se realiza una transformacin para corregir por sesgo distribucional. Previo a la construccin del ndice se realizan dos tareas, la primera consistente en imputar valores perdidos, y la segunda relacionada con la generacin de una segmentacin de pases. 90
La imputacin de valores perdidos se realiza por diversos mtodos, seleccionados ad hoc para cada uno de los indicadores. Se exploran metodologas de imputacin por medias, por regresin, y por simulacin de Monte Carlo va Cadenas de Markov. La segmentacin de pases se realiza en dos etapas, primero a partir del uso del mtodo de conglomerados jerrquicos se define el nmero aproximado de segmentos, y posteriormente utilizando el mtodo de conglomerados de k medias, se definen los segmentos. Una vez definidos los segmentos y realizada la imputacin de valores perdidos, se construyen los pesos de cada indicador. Para ello se intent utilizar el Anlisis de Componentes Principales para dar una gua de los pesos asociados y, en ausencia de interpretacin de los mismos, se utilizaron pesos iguales reajustados de acuerdo a consenso con los expertos. El mtodo ha sido evaluado desde la perspectiva del anlisis de sensibilidad para evaluar su robustez en trminos de la eleccin de los indicadores, la eleccin de los pesos, la correccin por sesgo y la metodologa de agregacin, resultando en conclusiones a favor de las elecciones hechas para la construccin del ndice. El cuadro 12 muestra, para cada indicador, los pesos y las metas que han sido determinados para la construccin del ndice de Desempeo Ambiental (EPI).
Debido a falta de informacin, cobertura limitada, inconsistencias metodolgicas y baja calidad de las mediciones, varios aspectos relevantes que se consideran de importancia no son reflejados por el EPI. Estos aspectos incluyen:
exposicin a txicos; varias dimensiones de la calidad ambiental del aire; manejo de los desechos seguridad nuclear; seguridad en el uso de pesticidas y exposicin qumica; prdida de pantanos y humedales; salud de los ecosistemas de agua dulce; calidad y erosin en suelos agrcolas; exposicin a metales pesados; y varios aspectos concernientes a las emisiones de gases de efecto invernadero.
CUADRO 12 FACTORES DE PESO DE LOS INDICADORES PARA EL NDICE DE DESEMPEO AMBIENTAL (EPI)
Categora 50% Sub categora Carga Ambiental de las Enfermedades Agua (Efecto en los seres humanos) 25.0% 6.25% 6.25% 5.0% 25% Contaminacin del Aire (Efecto en los seres humanos) 5.0% 2.5% Indicador Carga Ambiental de las Enfermedades Servicios Sanitarios adecuados Agua potable Partculas Urbanas Contaminacin del aire en lugares cerrados Ozono Local (Contina)
91
Sub categora Contaminacin del Aire (Efecto en el medio ambiente) 1.25% 1.25% 3.75% 3.75% Ozono Regional
Indicador
100%
Emisiones de Dixido de Azufre (SO2) ndice de calidad del agua Estrs hdrico ndice de Riesgo de Conservacin Conservacin Efectiva Proteccin Crtica de Hbitat reas Marinas Protegidas
Recursos Hdricos
100%
Biodiversidad y Hbitat
100%
Biodiversidad y Hbitat
33%
Bosques
2.5% 1.25%
Inventario de bosques ndice Trfico Marino Intensidad de Pesca de Arrastre Estrs por riego Subsidios Agrcolas Cultivo agrcola intensivo Regulacin sobre Pesticidas Area quemada Emisiones per cpita Emisiones provenientes de la Produccin de Electricidad Intensidad de Carbono Industrial
33%
33%
Agricultura
Cambio Climtico
100%
Cambio Climtico
8.33% 8.33%
92
El ESI mide el impacto, las respuestas y vulnerabilidad humana ante cambios en el medio ambiente, as como la capacidad social de lidiar con el estrs ambiental y la contribucin de cada nacin a la gestin global. Los indicadores y variables propuestos por el ESI se basan en el modelo de poltica ambiental denominado Presin Estado Respuesta (PER). Los aspectos y variables incorporados fueron seleccionados por medio de una revisin extensa de la literatura ambiental, tomando en consideracin la accesibilidad de los datos as como los comentarios de expertos, cientficos y tomadores de decisiones. El ESI utiliza 21 indicadores de sostenibilidad ambiental que se agrupan en cinco grandes categoras con los siguientes argumentos: Sistemas ambientales: una nacin est ms cercana a la sustentabilidad ambiental en tanto que sus sistemas vitales ambientales se mantengan cercanos a niveles saludables, de preferencia mejorando y no deteriorndose. Reduccin de la vulnerabilidad humana ante el estrs ambiental: una nacin est ms cercana a la sustentabilidad ambiental en tanto que las personas y los sistemas sociales no sean vulnerables a fenmenos ambientales que afecten el bienestar bsico humano, Reduccin del estrs ambiental: una nacin est ms cercana a la sustentabilidad ambiental en tanto que los niveles de estrs antropognico sean suficientemente bajos como para no generar daos a los sistemas ambientales. Gestin global: una nacin est ms cercana a la sustentabilidad ambiental en tanto que coopere con otras naciones en el manejo de problemas ambientales comunes, reduciendo a su vez el efecto negativo de los impactos ambientales fuera de sus fronteras a niveles que no causen daos serios. Capacidad social e institucional de respuesta a retos ambientales: una nacin est ms cercana a la sustentabilidad ambiental en tanto que tenga instituciones, patrones sociales y redes que generen respuestas efectivas a los retos ambientales. El ndice de Sostenibilidad Ambiental es el promedio ponderado de los 21 indicadores antes descritos. En este sentido es un ndice construido a partir de pesos iguales, ello justificado por la dificultad de tener unos pesos globalmente aplicables. Por su parte, para la construccin de cada indicador a partir de las variables que lo conforman tambin se utilizan factores de peso idnticos. Debido a que existe una gran cantidad de datos faltantes, se utilizan tcnicas de imputacin ad hoc para cada variable, en particular: el mtodo de simulacin de Monte Carlo va cadenas de Markov, enfoque basado en modelos de regresin y el algoritmo de maximizacin expectacin. Para poder hacer comparables los indicadores entre pases, y hacer ms sencilla la agrupacin de las variables en los indicadores correspondientes, dichas variables son transformadas de distintas formas, utilizando estandarizaciones por medio del Score z, y en donde se requiere, suavizando las colas de las distribuciones para obtener menores datos atpicos por medio de mtodos como el de winsorizacin7. Tambin se utilizan transformaciones cuando el sesgo de las distribuciones de las variables es muy notorio.
Mtodo consistente en contraer los datos extremos al acercarlos a la observacin no extrema ms cercana. Requiere la definicin de dato extremo mediante lmites ya sea cuantlicos, o de rango asociado a la media mas menos cierto nmero de desviaciones estndar.
93
Sistemas Ambientales
94
CEPAL Coleccin Documentos de proyectos Cuadro 13 (conclusin) Grupo Gestin Global Indicador Participacin en esfuerzos de colaboracin internacionales Emisiones de gases de efecto invernadero Reduccin de las presiones ambientales transfronterizas
Variable Nmero de miembros en organizaciones ambientales intergubernamentales Contribucin a financiamiento internacional y bilateral de proyectos ambientales Participacin en acuerdos ambientales internacionales Emisiones de Carbono por milln de dlares de PIB Emisiones de Carbono per cpita Exportaciones de SO2 Importacin de bienes contaminantes como porcentaje del total de bienes y servicios importados Razn del precio de la gasolina con respecto al precio promedio mundial Medida de corrupcin Efectividad gubernamental Porcentaje de rea total protegida Encuesta del Foro econmico mundial sobre gobernabilidad ambiental Regulaciones de ley Iniciativas de la Agenda 21 local por milln de habitantes Libertades Civiles y Polticas Porcentaje de variables faltantes de la CGSDI Organizaciones miembro del IUCN por milln de habitantes Creacin de conocimientos en ciencias ambientales, tecnologa y polticas Medida de democracia Eficiencia energtica Produccin de energa hdrica y renovable como porcentaje del total de energa producida Indice grupal de sustentabilidad Dow Jones Promedio de empresas de nivel "EcoValue" establecidas en el pas Nmero de compaas certificadas ISO 14001 por PIB Encuesta del foro econmico mundial sobre innovacin ambiental en el sector privado Participacin en programas responsables de la la asociacin de productores de qumicos ndice de Innovacin ndice de acceso digital Tasa de conclusin de la educacin primaria en mujeres Tasa de matriculacin en educacin superior Nmero de investigadores por milln de habitantes
Eco eficiencia
Ciencia y Tecnologa
La construccin de los indicadores se realiza entonces a travs de la suma ponderada de las variables que lo conforman, por medio del uso de pesos iguales, siendo posible la agregacin debido a que al estar estandarizadas las variables por medio del score z tienen la misma escala de valores. Para evaluar la calidad del ndice de Sostenibilidad Ambiental, se realiza un anlisis de sensibilidad en los siguientes mbitos: (i) seleccin de variables, (ii) tratamiento de valores faltantes, (iii) seleccin del modelo de agregacin y (iv) generacin de pesos. Esto se realiza buscando la robustez del ndice. Los resultados del ndice de Sostenibilidad Ambiental estn sujetos a numerosas fuentes de incertidumbre, haciendo incompleto el conocimiento global de la sostenibilidad ambiental y la precisin de las conclusiones debido a los errores de medicin y a la gran cantidad de datos faltantes. En el ltimo caso se puede sin embargo hacer anlisis para medir el margen de error que generan los datos faltantes.
95
Ya se ha comentado que el proceso de diseo y construccin de un indicador compuesto est motivado por la relevancia poltica del tema tratado y debe poder necesariamente contribuir a la toma de decisiones informadas. Asimismo, su diseminacin debera potenciar la resonancia comunicacional que se pretenda producir con relacin al tema estudiado. No se debe desconocer que, tal como lo expresa el principio 10, de la Declaracin de Ro sobre el Medio Ambiente y el Desarrollo (Naciones Unidas, 1992) trascrito en la introduccin de ste trabajo, toda iniciativa en pro del desarrollo de un indicador compuesto deber estar orientada por una demanda potencial puesta de manifiesto por los actores sociales que pudieran estar vinculados al rea de incumbencia considerado por el indicador. Estos grupos de inters suelen ser diversos y dispersos por lo que es necesario considerar una estrategia comunicacional para favorecer su amplia diseminacin. El diseo de una estrategia comunicacional de difusin supone una simplificacin adicional al propio proceso de desarrollo del indicador ya que, por lo general, los tomadores de decisiones suelen destinar poco tiempo al estudio y anlisis de los temas, delegando en los cuadros tcnicos esta labor y por lo tanto, demandando que los resultados les sean presentados de la manera ms concisa y sinttica posible. Es all donde el indicador compuesto juega un rol protagnico debido a la simplificacin que ste debera motivar, entendida esta con una connotacin manifiestamente positiva. La manera en que se debe presentar el indicador no es trivial. Vivimos una poca en la que abunda la informacin pero escasea la atencin del usuario. Por ello, su presentacin debe comunicar una imagen que facilite su visualizacin rpida y precisa. El diseo visual de su presentacin debe proveer seales claras que alerten y expongan situaciones extraordinarias y permitan identificar las posibles reas de intervencin.
Formatos de presentacin
Presentacin en Tablas
La forma ms simple de presentar la informacin, aunque tal vez la menos amigable, es tabulando los resultados. Independientemente del formato que se escoja para presentar los resultados, siempre ser conveniente proveer de documentacin adicional en la que se conste con detalle la metodologa adoptada, as como las tablas con la informacin que alimenta al indicador y los respectivos metadatos. 97
Cuando se muestran datos tabulados en necesario adoptar algn criterio para presentar la informacin de manera ordenada. Usualmente se suelen exhibir los resultados ubicando, por ejemplo, los pases por orden alfabtico y/o agrupndolos en subregiones. Otras veces la presentacin de los resultados se categoriza de acuerdo a otros criterios clasificatorios como por ejemplo si se los separa segn los niveles de ingreso per cpita. Sin embargo, si la tabla tiene el objetivo de mostrar el indicador compuesto podra ser conveniente listarlo conforme a un ordenamiento decreciente.
Grficos de barras
En este caso las unidades de anlisis suelen ubicarse en el eje vertical y los valores de indicador compuesto en el horizontal. En este caso y gracias al uso de colores o grisados, es posible expresar conjuntamente los valores del indicador en varios perodos del tiempo. Cuando se opta por este formato, es importante ordenar las unidades de anlisis segn el valor de indicador, de menor (arriba) a mayor (abajo) de manera tal de configurar una suerte de pirmide. As mismo, puede ser conveniente fijar lineas de corte en las que se exprese el valor promedio sobre toda la poblacin, en el caso de tratarse con unidades de anlisis que son pases, el valor promedio mundial, por ejemplo. El uso de colores o tramas pueden, a su vez, ser usados para representar criterios de clasificacin adicionales sin embargo, pueden tambin dar lugar a confusin y distraer la atencin del observador. No obstante ello, este formato es, por lo general, claro y de fcil comprensin.
Grficos de lneas
Cuando se dispone de informacin obtenida en varios momentos del tiempo y la cantidad de unidades de anlisis no es demasiado extensa puede ser conveniente representar los resultados en forma de grficos de lneas. En estos grficos se puede expresar una gama de posibilidades: (i) la evolucin de los niveles absolutos del indicador, (ii) los crecimientos en trminos absolutos, es decir, los porcentajes o tasas de variacin en relacin al ao anterior, (iii) la evolucin del ndice con asiento en un ao base (base 100, por ejemplo); en este caso todos las unidades de anlisis parten del mismo valor en un dado ao, o (iv) la indizacin de los crecimientos. Una recomendacin que puede realizarse cuando se vuelque la informacin en reportes y medios para su difusin, es aprovechar el potencial de los programas graficadores al mximo posible, por ejemplo, combinando la seleccin adecuada de smbolos, la tipografa, el diseo general del grfico y el suavizado de las lneas para que no aparezcan quebradas. As mismo, en los casos en que se tengan numerosos registros en el tiempo, es decir, que el indicador compuesto constituya una serie temporal propiamente dicha, puede ser interesante, adems de representar punto por punto, analizar la tendencia. Para ello pueden graficarse tambin las medias mviles del indicador calculadas sobre una cantidad conveniente de perodos.
Seales de trfico
En este caso, para cada valor del indicador compuesto e incluso tambin para los sub-indicadores que lo componen, es posible expresar los resultados mediante seales de trfico o emoticones8. Esto puede realizarse cuando la informacin que se muestra est ligada al desempeo de metas concretas o cuando
8
Emoticones o caras de Chernoff. Ests ltimas permiten representar datos en mltiples dimensiones. Cada punto (pas) se representa por una cara, que se describe mediante sus caractersticas faciales (excentricidad de la cara, del ojo, tamao de la pupila, ngulo de las cejas, tamao de la nariz, forma de la boca, etc.)
98
interesa expresar los cambios acontecidos. En tal sentido, la escala a considerar es ms o menos evidente: Rojo/Triste=bajo desempeo, Amarillo/Indiferente=sin cambios apreciables, y Verde/Sonriente= Mejora sustantiva. Dos comentarios caben. En primer lugar, es necesario establecer un criterio de corte coherente al categorizar cada una de las tres posibilidades. En segundo lugar, cuando se utilizan colores debe tenerse en cuenta que, muchas veces la informacin es reproducida en fotocopias o impresiones en blanco y negro. Por lo cual, el color se puede perder. Esto vale tambin para cualquier otro tipo de representacin en la que los colores representen algn significado.
Pictogramas
Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de una variable o su nivel de magnitud. Estos grficos se hacen representado a diferentes escalas un mismo dibujo. El escalamiento de los dibujos debe ser tal que el rea de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa o a su valor. Este tipo de grficos suele usarse en los medios de comunicacin, para que sean comprendidos por el pblico no especializado, sin que sea necesaria una explicacin demasiado compleja.
99
Diseo de informacin
Bases conceptuales para su definicin
Intentando ir un poco ms all de la representacin grfica simplificada de los indicadores compuestos resultantes y sus componentes, tal como lo hemos expuesto aqu, vale la pena comentar, aunque sea, con brevedad una nueva tendencia que intenta vincular el uso de estadsticas y datos cuantitativos con el diseo y cuyo fin es facilitarle al usuario la labor de bsqueda, exploracin y anlisis de la informacin al vincularlo con una verdadera experiencia. Se ha denominado a este espacio de actividad transdisciplinaria como el diseo de informacin (information design). Bajo el ttulo de diseo de informacin se quiere caracterizar al uso de grficos, figuras, smbolos y narrativas cuya finalidad ltima ser: comunicar ideas, ilustrar informacin de manera amigable sin que ello implique la prdida de contenido y expresar relaciones causales por medio de un soporte visual.
El objetivo que se persigue en todo diseo de informacin es clarificar, concitar la atencin y convencer sobre el contenido de un mensaje que se desea transmitir. Por esta razn, el diseo de informacin busca mediar y acotar las brechas que existen entre las distintas jerarquas de los saberes. Con esto nos queremos referir a la evolucin que se produce cuando se pasa de los meros datos (que son simples hechos carentes de contexto), a la informacin (que puede definirse como datos destilados y puestos en un contexto de significado), hacia el conocimiento (que es aquel patrn cuya medida de inters para el usuario supera un cierto umbral de comprensin) y, finalmente, hacia el ltimo nivel de entendimiento que sera el de la sabidura o meta-conocimiento (que se suscita cuando se pueden combinan los patrones comprendidos a situaciones nuevas) (vase el grfico 6).
GRFICO 6 JERARQUAS DE LOS SABERES
100
La principal premisa desde la cual se asume la necesidad de realizar un adecuado diseo de informacin es que el entorno y diseo grfico, esto es: la forma (tamao, posicin, orientacin, estilo y textura), el color (tonalidad, densidad y contraste), la funcionalidad y la interactividad que rodea a cualquier contenido impactan en la manera que este es interpretado. Ello hace suponer que cualquier contenido de informacin se torna relevante si, por un lado est en un contexto particular, y por el otro se determina una estrategia para su difusin. En tal sentido, el diseo de informacin como tctica comunicacional, busca representarla visualmente para lograr la interiorizacin del conocimiento mediante su percepcin gracias a que, por medio del diseo, se facilita la identificacin patrones, causalidades, tendencias y objetivos; se posibilita el contraste con hechos estilizados y se representa un mensaje a travs de la conformacin de narrativas visuales. La informacin al disearse debe estimular una experiencia y es de la experiencia donde surge el conocimiento. Ello es posible gracias al diseo de informacin. As como la economa tiene el objetivo de promover la gestin de los recursos materiales, que son escasos, el diseo de informacin (la infonoma) procurara gestionar los recursos de informacin en un contexto de escasez atencional como en el que hoy vivimos a plena luz de la sociedad de conocimiento. Por eso, combinando la gama de posibilidades como la que se muestra en el grfico 7 junto con textos y frases, tablas, grafos, diagramas de causa-efecto, metforas visuales (fotos), sparklines, etc., es posible disear el contenido de un mensaje complejo en un espacio reducido.
GRFICO 7 ALGUNAS HERRAMIENTAS PARA EL DISEO DE INFORMACIN
101
Una vez calculado el indicador compuesto as como los sub-indicadores asociados, y con la finalidad de organizar el ejercicio de diseo de informacin vale la pena pasar revista a las siguientes preguntas: Qu mensaje clave se desea transmitir? Cul ser la audiencia objetivo? Qu resultados se esperan de la difusin? Cul informacin se expondr y cul ser excluida? Cmo se la presentar? Qu medio se usar para la difusin? De la misma forma, a medida que se van respondiendo estas preguntas se va definiendo la pauta sobre la cual se realizar el diseo. Debe tenerse en cuenta que la realizacin de esta labor se encuentra a mitad de camino entre ciencia y arte. Es por ello que no hay reglas generales de aplicacin. Sin embargo, valgan las siguientes recomendaciones, que pueden resultar ambiguas, pero que de seguro contribuirn a orientar el proceso de diseo: 1 - Priorizar lo importante 2 - Tomarse tiempo en el diseo 3 - Proveer un contexto 4 - Procurar la simplicidad visual y evitar a exuberancia 5 - Contrastar las diferencias 6 - Usar lenguaje accesible 7 - Clarificar con documentacin anexa y enlaces 8 - Procurar que los grficos definan una narrativa en s misma 9 Emplear metforas, por ejemplo a travs del uso de pictogramas 10 - Evaluar la labor realizada e iterar
Algunos ejemplos
A continuacin y con el fin de aterrizar lo expresado en la seccin anterior valga el siguiente inventario (no exhaustivo) de excelentes ejemplos de diseo de informacin. Para comenzar vale la pena citar el Trendalyzer (http://graphs.gapminder.org/world/) diseado por la Organizacin sin fines de lucro Gapminder y luego adquirido por la empresa Google. El grfico 8 muestra este interesante dispositivo.
102
Fuente: Gapminder.org.
Lo interesante de este diseo es su capacidad de interactividad y el potencial que posee de mostrarnos simultneamente la evolucin en el tiempo de hasta 4 variables (ordenadas y absisas, tamao y color de los puntos). Se podra argir que este tipo de simulacin con informacin involucra altos costos de diseo. Sin embargo, al da de hoy el uso de esta aplicacin esta disponible para todo usuario accediendo al sistema de planillas de clculo en lnea que provee la empresa Google (http://docs.google.com/), desde donde ser posible incrustar la aplicacin implementada en cualquier otro sitio web. Sobre la base del Gapminder, la sede de las Naciones Unidas en Nueva York implemento este sistema para mostrar los avances en direccin al cumplimiento de las metas del milenio. Los indicadores asociados a cada una de las metas puede consultarse en: http://mdgs.un.org/unsd/mdg/Trendalyzer/index.html. Muy parecida a esta iniciativa el Programa de las Naciones Unidas para el Desarrollo (PNUD) realiz una presentacin interactiva del Informe de Desarrollo Humano (2005), bajo el ttulo: Tendencias del Desarrollo Humano (2005) (http://www.gapminder.org/GapminderMedia/GapTools/HDT05L/application.swf), y que se relaciona con el ndice de Desarrollo Humano que se presenta en el siguiente captulo. Sin embargo, muchas veces la informacin debe presentarse en formatos grficos que no poseen la versatilidad e interactividad que facilita el uso de la Internet. En tales casos, es necesario adecuar los contenidos a este formato eminentemente esttico. Ello no significa que, diseo mediante, puedan realizarse infografas notables, como el caso que se muestra en el grfico 9, en que se exponen simultneamente diez variables.
103
Asimismo, es posible combinar los medios de difusin. Un caso interesante es el realizado por Richard Saul Wurman, uno de los creadores del diseo de informacin, que combin la presentacin de un libro con un sitio web donde se muestran numerosos aspectos de la sociedad norteamericana (http://www.understandingusa.com/). Cierto es que siempre ser mucho ms difcil partir de la nada. Si se tuviera alguna intuicin acerca de lo que se busca se facilitara enormemente la labor. Por eso, antes de iniciar la tarea de bosquejar un diseo puede ser muy til identificar algn ejemplo interesante que nos d una pauta acerca de los que se desea realizar. Valga citar el blog http://disenodeinformacion.blogspot.com/ en que se podrn encontrar numerosos ejemplos que bien podran adecuarse a lo buscado.
104
Los indicadores compuestos pueden ser tiles herramientas del proceso de toma de decisiones en el mbito de diseo, implementacin y evaluacin de polticas pblicas, siempre y cuando se cumpla toda una serie de elementos que a lo largo de este manuscrito se ha procurado destacar y explicitar, de la manera ms sencilla posible pero sin perder rigor tcnico. Partiendo del elemento bsico que establece que la construccin de un indicador compuesto requiere una necesidad explcita previa que justifique su construccin, el presente documento ha descrito las ms recientes metodologas aplicadas al procesamiento, clculo y anlisis de indicadores compuestos. Se han considerado los principales aspectos metodolgicos involucrados en el proceso de establecimiento de un marco conceptual, de seleccin de indicadores, anlisis, normalizacin y agregacin de las variables que componen un indicador sinttico.
CUADRO 14 RESUMEN DE LAS PRINCIPALES CARACTERSTICAS DE LOS INDICADORES COMPUESTOS RELACIONADOS CON EL MEDIO AMBIENTE Y LA SOSTENIBILIDAD
105
Asimismo, se presentaron las principales iniciativas realizadas, con particular nfasis en las experiencias relacionadas con la definicin de indicadores compuestos que buscan evaluar la sostenibilidad del desarrollo de los pases y aquellos casos que se aplicaron al anlisis y tratamiento integrado del medio ambiente. En la tabla 14, quedan resumidas las principales caractersticas de los indicadores comentados. Cmo se ha explicitado en el documento, el empleo de indicadores compuestos no queda exento de limitaciones y crticas, muchas de las cuales fueron expuestas en este documento. La controversia a favor o en contra de su uso probablemente siga abierta. No obstante, sea que se considere a esta metodologa como vlida o no para describir de manera sinttica el comportamiento integrado de numerosas variables acerca de un tema, es insoslayable que en algn momento los analistas y tcnicos estarn en presencia de ellos. Es de esperarse que este documento sirva para dar luz acerca de cmo stos son diseados y cules son las etapas de su construccin y as poder comprender los alcances de la metodologa subyacente. Con todo, los indicadores compuestos no deben ser vistos como un objetivo en s mismo, sino como un punto de partida para el debate acerca de una cuestin relevante y, de esta forma, permita atraer el inters y la inquietud de aquellos grupos vinculados al tema analizado. A lo largo del documento se detallan etapas secuenciales, destacndose la importancia del cuidado metodolgico que se imprima en cada una de ellas como elementos para para poder llegar a tener indicadores compuestos confiables y tiles. La necesidad de disponer de bancos de informacin adecuados es tan importante como la calidad en la definicin de los ponderadores que generen el ndice compuesto. No se recomienda en ninguna forma el tratar de construir indicadores compuestos cuando la base de los mismos, la etapa de construccin de estadsticas e indicadores bsicos, no han sido suficientemente desarrolladas de forma que se disponga de indicadores y estadsticas de calidad, confiables y tiles, que permitan que los indicadores compuestos que se construyan a partir de ellas reflejen adecuadamente la realidad que se pretende comprender. Se ha destacado a lo largo del documento que en el contexto del Desarrollo Sostenible existen diversas aproximaciones con respecto al marco conceptual que se puede seleccionar, algunas de las cuales han sido adoptadas por varios pases de Amrica Latina y el Caribe para dar inicio a la posibilidad de generar listados de indicadores de desarrollo sostenible, que posteriormente permitan construir indicadores compuestos. Sin embargo existen ciertos retos y desafos que deben alcanzarse para poder dar ese paso en la regin. La disponibilidad de informacin es limitada y es fundamental reforzar esa rea en los pases. Por otro lado se encuentra el desafo de capacitar a los funcionarios pblicos para que sean capaces de generar e interpretar indicadores compuestos construidos con rigor conceptual y metodolgico (principal motivacin para el diseo de la presente gua). Nos ha tocado vivir en un momento de profundos cambios paradigmticos: estamos en la sociedad del conocimiento. Nunca como hoy, la velocidad de los cambios ha tenido tanto impulso y nunca como hoy ha resultado tan complicado alcanzar una imagen de contexto que nos permita obtener conocimiento de los distintos aspectos de la realidad econmica, social y ambiental desde una perspectiva sistmica. No es posible conocer cmo se desempean, integradamente, los sistemas socioeconmicos y los ambientales si no se poseen herramientas de informacin que nos provean las seales necesarias para comprender cmo stos evolucionan y cmo esa evolucin puede compararse entre pases o regiones. Es aqu donde el uso de indicadores compuestos puede constituirse en una valiosa herramienta de trabajo.
106
Bibliografa
Berumen, S. A., (2004) Construccin y Anlisis del ndice de Calidad de Vida en Guatemala (PQIL), en Estudios Econmicos de Desarrollo Internacional, vol. 4 no. 002. Box, G. E. P. y Cox, D. R. (1964). An analysis of transformations. Journal of the Royal Statistical Society, Series B 26, 211 - 246. Castro Bonao. J. M. (2002), Indicadores de Desarrollo Sostenible Urbano: Una Aplicacin para Andaluca, Tesis Doctoral, Universidad de Mlaga http://www.eumed.net/tesis/jmc/ Cattell, R. B. (1965). Factor Analysis: An Introduction to essentials, Biometrics, 21, 190-215. Cherchye, L. y T. Duosmanen, (2002), Benchmarking Sustainable Development: A Synthetic Meta- Index Approach, Documento preparado en el contexto del programa de investigacin en Mtodos No paramtricos en Enomoma de la Produccin, los recursos Naturales y el Medio Ambiente. Cherchye, L., Moeson, W., Rogge, N., Van Puyenbroeck, T., Paisana, M., Saltelli, A., Liska, R. y Tarantola, S. (2006), Creating composite indicators with DEA and robustness analysis: the case of the technology achievement index, CES Discussion Paper 06.03. Comrey, A. L. (1985). Manual de Anlisis Factorial. Editorial Ctedra, Madrid, Espaa. Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests, Psychometrika, 16(3), 297-334. DESA, UN, (2007) Indicators of Sustainable Development: Guidelines and Methodologies, 3ra. Edicin. DESA, UN, (2001) Indicators of Sustainable Development: Guidelines and Methodologies, 2ra. Edicin. DESA, UN, (1996) Indicators of Sustainable Development: Guidelines and Methodologies, 1ra. Edicin. DESA, UN, (2008) Official list of MDG Indicators, Effective 15 january 2008. Drsteler, Juan C. (2007), Diagramas para la Visualizacin, Info@Vis! http://www.infovis.net/printMag.php?num=186&lang=1 Esty, Daniel C., M.A. Levy, C.H. Kim, A. de Sherbinin, T. Srebotnjak, y V. Mara (2008), 2008 Environmental Performance Index, New Haven: Yale Center for Environmental Law and Policy. Esty, Daniel C., Marc Levy, Tanja Srebotnjak, y Alexander de Sherbinin (2005), 2005 Environmental Sustainability Index: Benchmarking National Environmental Stewardship, New Haven: Yale Center for Environmental Law & Policy. Farrell, M. J. (1957), The measurement of productive efficiency, Journal of the Royal Statistical Society, Series A (General), Vol. 120, No. 3, 253-290. Funtowicz, S. y Ravetz, J. (2000), La ciencia posnormal: ciencia con la gente, Editorial Icaria, Barcelona. Gallopn, G. C., (2006), Los Indicadores de desarrollo Sostenible: Aspectos Conceptuales y Metodolgicos, Ponencia realizada para el Seminario de Expertos sobre Indicadores de Sostenibilidad en la Formulacin y Seguimiento de Polticas FEDEPAL Gallopn, G. C., (2006b), Sostenibilidad del Desarrollo en Amrica Latina y el Caribe: cifras y tendencias Honduras. CEPAL Divisin de Desarrollo Sostenible y Asentamientos Humanos
107
Gonzlez, F., Martn, F. Y M. Fernndez (2004) Medicin del Desarrollo sostenible y Anlisis Regional: Diseo y Aplicacin de un ndice Sinttico Global a las Comunidades Autnomas Espaolas. En Investigaciones Regionales vol. 5 pp 91 112. Hk, T, B.M. Moldan y A. Lyon Dahl, eds. (2007) Sustainability Indicators. A scientific Assessment, Scope 67. Island Press Hall, R. y Jones, C. (1999), Why do some countries produce so much more output per worker than others?, Quarterly Journal of Economics, 114 (1), 83 116. Hamilton, C. y Saddler, H. (1997), The Genuine Progress Indicator A New index of changes in well-being in Australia, the Australia Institute, Discussion Paper No. 14, October. Hamilton, C. y Denniss, R. (2000), Tracking well-being in Australia, The Genuine Progress Indicator 2000, The Australia Institute, Discussion Paper No. 35, December. Hamilton, K. (2001), Indicators of Sustainable development: Genuine Savings. Note for technical discussion on sustainable development indicators, OECD. Hartigan, J. A. (1975). Clustering Algorithms, John Wiley & Sons, NY. International Atomic Energy Agency (2004) Guidance for Calculating the Indicator of Sustainable Development for radioactive Waste Management. Documento de trabajo. INE, SEMARNAP, CENICA, JICA, (1997) Segundo Informe sobre la Calidad del aire en ciudades mexicanas, INE, CENICA, JICA, Mxico. Jain, A. K., Acito, F., Malhotra, N. K. y Majan, V. (1979), A comparison of the internal validity of alternative parameter estimation methods in decompositional multiattribute preference models, Journal of Marketing Research, Agosto de 1979, 313 322. John, N. R. y Draper, J. A. (1980). An alternative family of transformations. Applied Statistics, 29(2), 190 197. Johnson, R. A. and Wichern, D. W. (2007). Applied Multivariate Statistical Analysis. 6a edicin Prentice Hall. London Jolliffe, I. T. (2002) Principal Component Analysis, 2a edicin. Springer Kairser, H. F. (1958). The varimax criterion for analytic rotation in factor analysis, Psychometrika, 23, 187 200. Keynes, John Maynard (1921), A Treatise on Probability; New York: MacMillan. Kim, J. y Mueller, C.W. (1978). An Introduction to Factor Analysis: What it is and how to do it. Beverly Hills, CA: Sage. Koopmans, T. C (1947). Measurement without theory, Review of Economics and Statistics, 29 (3), 161-172. Latham, J., Collen, B., McRae, L,., and Loh, J. (2008) El ndice de Planeta Vivo para las especies migratorias: un ndice del camibio en la ambundancia de las poblaciones. Informe final para la Convencin sobre la Conservacin de Especies Migratorias. World Wide Fund. Little, R. J. A. y Rubin, D. B. (2002). Statistical Analysis with Missing Data, Wiley Interscience, John Wiley & Sons, New Jersey. Lpez Mart, L. J. y Hernndez Lpez, M. (1997). Nuevos algoritmos no jerrquicos en clasificacin de datos, Estadstica Espaola, 39, 142, 129 140. http://www.ine.es/revistas/estaespa/142_6.pdf Malhotra, Naresh K. (1996), Marketing Research: An applied orientation, Prentice Hall, New Jersey, USA. Manly, B. F. J. (1976), Exponential data transformations, The Statistician, 25, 37-42. Medina, F. y Galvn, M. (2007) Imputacin de datos: teora y prctica, Serie estudios estadsticos y prospectivo No. 54, CEPAL, Naciones Unidas. http://www.eclac.org/publicaciones/xml/9/29949/LCL2772e.pdf Moldan, B. M, Billharz, S. y Matraverrs, S. eds. (1997) Sustainability Indicators. A report on the Project on Inticators of Sustainable Development, Scope 58. Munda, G. (2004), Mtodos y procesos multi-criterio para la evaluacin social de polticas pblicas, Revista Iberoamericana de Economa Ecolgica, 1, 31-45. http://dialnet.unirioja.es/servlet/articulo?codigo=2162659&orden=92626&info=link Nardo, M., Saisana, M., Saltelli, A. y Tarantola, S., Hoffman, a. y Giovannini, E. (2005a). Handbook on constructing composite indicators: Methodology and user guide, OECD Statistics Working Paper, STD/DOC(2005)3. Nardo, M., Saisana, M., Saltelli, A. y Tarantola, S. (2005b). Tools for Composite Indicators Building, European Commission, directorate-General, Joint Research Centre, EUR 21682 EN. Naciones Unidas (1992), Programa 21: Programa de Accin de las Naciones Unidas de Rio, Declaracin de Rio sobre el medio ambiente y el desarrollo. http://www.un.org/esa/sustdev/documents/agenda21/spanish/riodeclaration.htm
108
Nicoletti G, Scarpetta, S. y Boylaud, O (2000). Summary indicators for product market regulation with an extension to employment protection legislation, Economic Department working papers No. 226, ECO/WKP(99)18, OECD. http://www.oecd.org/dataoecd/21/13/1880867.pdf OECD (2002), Aggregated environmental indices: Review of aggregation methodologies in use, Environment Directorate, ENV/EPOC/SE(2001)2/FINAL Pearson, K. (1901). On lines and planes of closest fit to a system of points in space, Philosophical Magazine, 6, 559-572. Peters, W. S. y Butler, J. Q. (1970). The construction of regional economic indicators by principal components, Annals of Regional Science, 4, 1 - 14. Pintr, L. , Hard, P., y P. Bartelmus (2005), Sustainable Development Indicators. Proposals For a Way Forward, International Institute for Sustainable Developement (IISD). Documento preparado para la CDS. Podinovskii, V. V. (1994), Criteria importance theory, Mathematical Social Sciences, 27, 237- 252. PNUD(2007/2008) Informe sobre el Desarrollo Humano 2007/200. La lucha contra el cambio climtico, solidaridad ante un mundo dividido. Quiroga, R. M. (2007), Indicadores de Sostenibilidad ambiental y de desarrollo sostenible: estado del arte y perspectivas, Serie manuales, CEPAL, Naciones Unidas. Rodrguez-Labajos, B y S. E. Shmelev (2006) Multi-dimensional Assessment of Sustainability at the Macro Level: The case of Austria, Documento producto de la escuela de verano sobre teoras emergentes y mtodos en investigacin de la sostenibilidad (THEMES), Universidad de Barcelona, Espaa Saaty, T. L. (1980), The analytic Hierarchy Process: Planning, Priority Setting, Resource Allocationn, McGraw-Hill, New York. Saltelli, A. (2002), Making best use of model valuations to compute sensitivity indices, Computer Physics Communications, 145, 280-297. Saltelli, A., Chan, K. y Scott, M. (2000), Sensitivity analysis, Probability and Statistics series, John Wiley and Sons, New York. Spath, H. (1980). Cluster Analysis Algorithms, Chichester, Inglaterra, Ellis Horwood. Schuschny, A. (2007), El mtodo DEA y su aplicacin al estudio del sector energtico y las emisiones de CO2 en Amrica Latina y el Caribe, Serie estudios estadsticos y prospectivos, CEPAL, Naciones Unidas. http://www.eclac.org/id.asp?id=28668 Stockolm Environmental Institute.(1996). Sustainable Economic Welfare in Sweeden. A pilot Index 19501992. Turner, K., Graham, J., McGregor, P. y K. Swales (2002), Additional Measures of Progres for Scotland: An Anlisis of the Issuers and Problems Associated with Aggregate/Composite Measures of Sustainability. Documento preparado para el Grupo de evaluacin del progreso de medidas adicionales. Universidad de Strathclyde, Escocia. Uriel Jimnez, E. (1995), Anlisis de Datos. Series temporales y anlisis multivariante, Editorial AC, Madrid, Espaa. Wackernagel, M. y Loh, J. (2001), Indicators of Sustainable Development: the Ecological Footprint, Note for technical discussion on sustainable development indicators, OECD, Pars, June. Wautiez, F. (2002) Indicadores para otra Economa, texto preparado para el libro: A Outra Economa, Antonio David Catan, Veraz Editores, Brasil. Ward, J. H. (1963). Hierarchical grouping to optimize an objective function. Journal American Statistical Association, 58, 236 - 244. Woldwide Fund for Nature (2008), Living Planet Report 2008, The Living Planet Index, http://www.panda.org/news_facts/publications/living_planet_report/living_planet_index/index.cfm Yale University and Columbia University (2005), Environmental Performance Index: Benchmarking National Environmental Stewardship, http://www.yale.edu/esi/ Yale University and Columbia University (2008), Environmental Performance Index, http://epi.yale.edu Young, H. P. (1988), Condorcet's theory of voting, American Political Science Review, 82:1231-1244.
109