Está en la página 1de 11

Implementando la Publicacin de Datos

Eduardo Poggi
Comencemos el anlisis de la Implementacin de la Publicacin de Datos con dos ejercicios
simples de procesos institucionales de gestin de informacin.
1 Anlisis de casos
Hay mucha bibliografa sobre como debe ser la publicacin de datos y muchas exigencias que
sobre esto se discuten, tratemos ahora de hacer un ejercicio que nos permita pensar ms en la
implementacin y percibir los detalles y la complejidad que esto genera.
Hay datos sobre los cuales es relativamente fciles de resolver si son publicables o no, por
ejemplo: el resultado de censos o encuestas, estadsticas, presupuestos y estados contables de
los organismos, resultados de investigaciones ya publicados, etc.; son todos datos que salvo por
algn tema muy especfico son fcilmente publicables y difcilmente haya oposiciones. Otros
pueden ser un poco ms difciles de resolver por que requieren de un anlisis especfico sobre la
posibilidad de publicacin.
Ejercicio 1 gestin de documentos
Por ejemplo en cualquier organismo pblico existen una serie de documentos que luego de algn
tratamiento pasan por una etapa de formalizacin claramente establecida, tanto para normas
generales como para normativas internas. Estos procesos de formalizacin convierten a los
documentos en resoluciones, decretos, dictmenes, ordenanzas, etc., que reciben una variedad
de nombres dependiendo del nivel que tiene y de cada sistema administrativo. Salvo casos
especficos donde el contenido del documento este protegido por algn tipo de secreto, todos los
dems documentos formalizados deberan ser publicados y abiertos a la sociedad.
Desde el punto de vista operativo, cualquier organismo razonablemente informatizado debera
tener digitalizado el proceso de elaboracin de estos documentos y su versin formalizada
debera estar publicado en una Intranet. Es probable tambin, que aquellos que el organismo
considere con algn nivel de secreto, ya est protegida su publicacin en la red Interna. Por lo
tanto, es estos casos los documentos publicados internamente deberan ser publicados tambin
en forma externa.
La situacin parece simple pero se deberan aplicar algunas consideraciones:
Los documentos deben estar digitales y ser parte de un sistema de workflow o tracking que
permita su fcil identificacin y tratamiento. De no ser as, el tratamiento para lograr su
publicacin sera artesanal y poco sustentable.
Es necesario poder distinguir automticamente entre los documentos pblicos y los que no
lo son. Por lo tanto, el sistema de gestin debera gestionar algn tipo de reglas o
permisos que permitan tal clasificacin.
Salvo que el organismo cuente con algn proceso de formalizacin digital, basado en firma
electrnica por ejemplo, la publicacin tradicional exigira que la versin final del
documento se imprimiera en papel, se firmara y sellara manualmente y luego se
digitalizara para poder publicarlo. Para cumplir con los principios, esta versin digitalizada
debera estar acompaada por su correspondiente versin digital editable, por lo menos
para el contenido. Lo cual implica administrar el flujo de los documentos para poder
asegurar que ambos contenidos coinciden. En un entorno ms sofisticado se podra
implementar el documento firmado digitalmente. Habra que resolver en este caso, quin
en nombre del organismo, es el responsable de firmarlo.
Cuando los documentos se gestionan en una Intranet se tienen en cuenta una serie de
condiciones propias del entorno (acceso por empleados autenticados, con compromisos
contractuales, con normas de seguridad, etc.) que no se cumplen en un sitio pblico.
Habra que verificar como afecta el cambio de estas condiciones a la gestin de Intranet.
Ejercicio 2 la gestin de recursos humanos
Concentrmonos ahora, para acotar el anlisis, en los datos producidos por los sistemas de
informacin para la gestin de los organismos pblicos normalmente persistidos en una base de
datos. La primera consideracin en conocer con certeza cuales datos son pblicos y cuales no. En
principio, los datos pueden ser clasificados de tres formas segn su nivel de publicacin:
1. Pblicos: los que pueden ser accedidos por cualquiera sin ningn tipo de restriccin.
2. Irrestrictos: lo que podra requerir justificar pertinencia de acceso, se podran entregar a
cualquier que los requiriera siempre que se identificara y pudiera en el caso de que se le
requirese- justificar el por qu de la solicitud.
3. Restringidos: son aquellos para los cuales existe una regla o trmite administrativo
(basados en alguna normativa) que limita su acceso y permite discernir a quienes se les
puede entregar y quienes no.
Para ejemplificar, consideremos para el anlisis el Sistema de Gestin de Recursos Humanos
(HRIS) de un organismo cualquiera. En principio, este sistema representa parte del
funcionamiento del estado y es mantenido por recursos pblicos, por lo tanto estara bajo el
mandato de ser publicados para asegurar la transparencia.
En trminos generales, estos sistemas administran 3 grandes entidades de datos:
La estructura organizativa con posiciones (puestos de trabajo), perfiles, competencias
necesarias, carrera, etc.
Los empleados con datos bsicos de las personas y detallados de experiencia laboral y
competencias.
La relacin laboral entre las personas y la estructura organizativa.
Los salarios.
Estas entidades suelen contener los datos histricos, presentes y probablemente proyecciones de
futuros cambios. La ubicacin de los datos salariales depende del sistema de remuneraciones
pero en general estn en el tercer grupo.
Entonces: cmo se publican estos datos? Veamos algunos pasos simples para empezar
asumiendo que todos los datos que administra el sistema son pblicos. Entonces, un primer
proceso de pre-publicacin debera realizar lo siguiente:
1. Cumpliendo con los principios de complecin, fuente primaria y procesabilidad, una forma
bsica de publicacin sera exportar todas las tablas 1 a un formato estndar (un XML por
ejemplo) y publicar el conjunto de las mismas.
2. Para cumplir con el principio de documentacin se deber agregar toda la meta-
informacin pertinente: diagramas de entidad relacin, diccionario de datos, etc.
3. Generar un ZIP con todos los documentos y asignarle una URL con la fecha.
4. Firmar digitalmente todo el paquete.
5. Para cumplir con el principio de permanencia, la publicacin se podra hacer
peridicamente, en forma mensual por ejemplo.
Adems de mantener un mnimo de documentacin de la base de datos, habra que agregar un
proceso automtico de ejecucin peridica para que realice el proceso anterior. Hasta aqu no hay
mayores problemas. El proceso es relativamente simple y slo requiere algn tiempo de
procesamiento y lugar de almacenamiento que dependern fuertemente de la cantidad de datos,
que sern dependientes de la cantidad de empleados y de los aos de historia. Se podra
complicar un poco procesamiento para no usar tanto almacenamiento generando una copia base
la primera de cada ao calendario por ejemplo- y las restantes slo como una actualizacin de la
anterior, filtrando solo los datos (filas de las tablas en realidad) que han sido modificadas o
1
Se debe tener en cuenta que un sistema complejo de gestin de recursos humanos puede utilizar ms de
1000 tablas normalizadas para su funcionamiento.
agregadas. Los cual tambin complica el proceso de reconstruccin. El proceso tambin debe
considerar otros aspectos, por ejemplo: filtrar datos resultantes de transacciones no completadas
o no confirmadas.
Hasta aqu slo tenemos costos de procesamiento y almacenamiento para cumplir con las
demandas de publicacin, siempre que partamos del supuesto que todos los datos son pblicos.
Sin embargo, varios datos de un HRIS pueden estar protegidos por diferentes leyes en cada pas.
Por ejemplo, los sueldos de cada empleado no poltico, su grupo familiar, su domicilio, su historia
de ausencias por salud, su historia de ausencias por causas religiosas, todo lo relacionado a los
postulantes a una posicin, las evaluaciones de desempeo, etc. Algunos de stos podran ser
irrestrictos o restringidos dependiendo de la normativa vigente. Para publicar estos datos sin violar
la ley se requiere administrar reglas que permitan identificar, filtrar y restringir la publicacin o el
acceso a los datos protegidos. Esto implica administrar un conjunto de reglas variables para gran
cantidad de entidades de datos, atributos y tablas y requiere de la existencia de un sistema de
gestin de reglas de proteccin de datos que puedan ser interpretadas y aplicadas por el proceso
de publicacin. Tarea no menor por cierto.
El proceso de pre-publicacin ya no sera una simple exportacin en formato XML, sino que
debera interpretar las reglas y aplicarlas para filtrar columnas y filas de las tablas manteniendo la
integridad referencial. Por lo que el proceso de complicara ms, adems del esfuerzo de
gestionar las reglas. Hay que considerar adems que la existencia de datos irrestrictos y
restringidos requiere de la administracin y operacin de un sistema de gestin de identidades
que permita identificar, registra, autenticar y autorizar usuarios; lo que requerir un esfuerzo
importante de gestin de usuarios externos. Adems para asegurar el no repudio de la consulta se
deber disponer de mecanismos de persistencia de los accesos, que habr que decidir por cuanto
tiempo deben mantenerse.
Adicionalmente, para cumplir con el principio de interoperabilidad, es probable que sea necesario
traducir cdigos internos del sistema en cdigos estandarizados para su publicacin. Por ejemplo,
si el sistema de gestin de recursos humanos utiliza un nmero interno de legajo para identificar a
las personas, deber traducirlo a la identificacin de personas de uso nacional (un Documento
Nacional de Identidad, por ejemplo); si utiliza tablas propias para identificar direcciones postales o
localidades, deber traducirlas a los estndares; y as siguiendo con todos los datos que estn
bajo los esquemas de interoperabilidad. Por lo tanto, el proceso de pre-publicacin deber
complicarse mucho ms para hacer esta traduccin, adems de mantener las tablas de
traduccin correspondientes.
Finalmente, el proceso de pre-publicacin debera estar bajo la responsabilidad del rea de
sistemas, pero la gestin de las reglas sobre el rea de negocio- administradora de los datos, en
este caso, el departamento de personal, por ejemplo. Alguien debera verificar la calidad del
proceso y el cumplimiento de las reglas de seguridad y privacidad, para asegurar que no se
filtraron datos no publicables. Por lo tanto si, cumpliramos con las buenas prcticas de gestin de
procesos, el archivo a publicar debera ser firmado digitalmente por el CIO y por el CHRO 2 por lo
menos; quienes deberan confiar en la buena calidad de los datos gestionados por todas las
partes involucradas en el uso del sistema.
Por lo tanto, el proceso de publicacin no es tan simple cuando hay datos irrestrictos o
restringidos. Dista mucho de ser un problema informtico, requiere de cambios en los procesos de
negocio. Tampoco es gratuito, ya que requiere desarrollar procesos, ejecutarlos y persistir una
gran cantidad de datos redundantes. Tambin requiere de muy buenas prcticas de gestin
informtica que permitan publicar datos de gestin con riesgo muy bajo. Por lo tanto, agregar la
etapa de publicacin de datos en un proceso bsico de gestin organizacional, requiere de cierta
capacidad institucional para realizarlo.
2 Variables analticas para la Publicacin de Datos
Muchas de las demandas conceptuales o legales sobre la transparencia del accionar del sector
pblico se pueden transformar en variables que los organismos deben atender como un
conjunto- para asegurar su cumplimiento. Como veremos ms adelante, estas variables no son
2
Responsable de Sistemas y de Recursos Humanos respectivamente.
todo o nada sino que se puede determinar para cada una de ellas un gradiente de costo-valor
que puede remontarse paulatinamente.
Nivel de apertura
El espritu es maximizar la disponibilidad de informacin del sector pblico para su uso y
reutilizacin, basado en la presuncin de la transparencia como la regla por defecto al facilitar el
acceso y la reutilizacin. El desarrollo de un rgimen de los principios de acceso, asumiendo la
apertura de la informacin del sector pblico es una regla predeterminada, sin importar el modelo
de financiacin del desarrollo y del mantenimiento de la informacin. Se debe minimizar el uso de
motivos de denegacin total o parcial, por proteccin de los intereses de seguridad nacional,
privacidad personal, preservacin de intereses privados y la utilizacin de derechos de autor,
patentes o la aplicacin de legislaciones restrictivas de acceso. Y, en el caso de utilizarlos, los
mismos deben ser explcitamente transparentados.
Nivel de sistematizacin del proceso
El objetivo de la publicacin es que sea sistemtica y continua y no artesanal y discrecional, por lo
tanto la etapa de publicacin debe ser considerada en todos los procesos organizacionales e
implementada en aquellos que la amerite. Esto requiere gestionar eficientemente los procesos
organizacionales ms la capacidad de ampliar incluyendo la publicacin y todos sus
requerimientos especficos.
Utilizacin de estndares
Los datos no deberan publicase de cualquier forma, se debe hacer de forma que tenga las
menores restricciones posibles para su explotacin. Por lo tanto, se deberan evitar formatos
privativos o que requieran de recursos privativos o pagos para su tratamiento. La utilizacin de
estndares abiertos tambin suele facilitar el trabajo de publicacin ya que suelen publicarse
adems gran variedad de herramientas para su tratamiento que mejoradas continuamente gracias
al aporte de los usuarios.
Oportunidad de la publicacin
Para cada entidad de datos habr que establecer el ritmo o la periodicidad de publicacin
razonable en funcin de lgica de actualizacin propia del negocio y a un equilibrio en los costos
de publicacin.
Acceso y condiciones de transparencia para su reutilizacin
Se debe fomentar el acceso amplio y no discriminatorio, eliminando acuerdos de exclusividad y
barreras o restricciones sobre las formas en que se puede acceder, utilizar, volver a utilizarse, etc.,
de tal forma que toda informacin accesible quede abierta para ser reutilizable por todos.
Registro de entidades publicadas
No solo se deben publicar las entidades correspondientes sino que se debe informar de forma
fehaciente su existencia, su publicacin y dems informacin relevante. Esto puede hacerse por
cada organizacin o sector, pero idealmente se debera manejar un reservorio nico donde
pudiera accederse a toda la informacin publicada por una administracin.
Calidad
Para cada entidad se deben explicitar los parmetros de calidad aplicados en la recoleccin,
procesamiento y resguardo. Los datos se deben entregar con la misma calidad con que son
utilizados en el organismo que los gestiona. La cooperacin entre los diversos organismos
involucrados en la creacin, coleccin, procesamiento, almacenamiento y la distribucin de la
informacin del sector pblico, es un factor fundamental para mejorar la calidad, que debe ser
utilizado lo ms posible para evitar inconsistencias entre las publicaciones individuales de dos o
ms organismos.
Integridad
Se debe establecer las salvaguardias adecuadas para proteger la informacin de modificaciones
no autorizadas o de la negacin deliberada o involuntaria de acceso autorizado a la informacin.
Preservacin
Atendiendo la obsolescencia tecnolgica y los desafos de largo plazo de preservacin de los
datos, se deben encontrar formas para mantener las entidades publicadas utilizables en el tiempo,
esquivando prcticas de mercado que fomentan la obsolescencia.
Derechos de Autor
Los derechos de propiedad intelectual deben ser respetados, pero se debe asegurar que existan
los acuerdos correspondientes para que la informacin gestionada por el sector pblico est libre
de copyright. Se debe fomentar el ejercicio de los derechos de autor de manera que facilite
reutilizacin (incluida la supresin de los derechos de autor y la creacin de mecanismos que
faciliten exencin de derechos de autor cuando los dueos del copyright estn dispuestos y sean
capaces de hacerlo) y, donde los titulares de derechos de autor estn de acuerdo, el desarrollo de
mecanismos sencillos para promover un mayor acceso y uso.
Precios
Dependiendo de la normativa vigente, los datos administrados por el sector pblico pueden tener
algn costo. Normalmente, los costos con cargo al usuario que no deben exceder los costos
marginales de mantenimiento y distribucin y, en casos especiales costos adicionales, por
ejemplo de digitalizacin. Las estrategias de precios de los datos deberan terne en cuenta
consideraciones de competencia entre las empresas que ofrecen servicios de valor aadido.
Deben perseguir la neutralidad, la igualdad y la oportunidad de acceso y tener en cuenta la
posibilidad de subvenciones cruzadas de otras actividades del gobierno.
Mecanismos de atencin
Como todo servicio, la publicacin debe tener asociados mecanismos de atencin de usuarios que
asistan a su explotacin al igual que disponer de accesos simples para cuando existan quejas o
procesos de apelacin ante los datos publicados.
Las asociaciones pblico-privadas.
Facilitar la colaboracin pblico-privada cuando sea apropiado y viable en la toma de informacin
del sector pblico disponibles, por ejemplo, encontrar formas creativas de financiar los costos de
digitalizacin, mientras que el aumento del acceso y la reutilizacin de los derechos de terceros.
El acceso internacional
El acceso diferenciado o no a usuarios no nacionales es un tema delicado. Se debera buscar la
mayor coherencia en el acceso internacional en apoyo a la cooperacin para la reutilizacin
comercial o no comercial. En estos casos es necesario considerar el ejercicio de la
interoperabilidad para facilitar el intercambio y la comparacin con bases de datos internacionales.
3 Hacia un modelo de madurez
Como todo proceso complejo, la implementacin de la publicacin sistemtica de datos no puede
hacerse de un da para otro. La generacin de las capacidades institucionales para realizarla
correctamente, asegurando una buena ecuacin entre servicio y costo, debe hacerse en forma
gradual e incremental. Para este tipo de situaciones es til utilizar Modelos de Madurez como es
habitual en tantas disciplinas relacionadas a la gestin tecnologa3. No es pretensin de este
documento armar un Modelo de Madurez para la Publicacin de Datos, solamente se expondrn
las principales dimensiones y variables analticas necesarias para la descripcin de fenmeno
utilizando dicha matriz de pensamiento.
Inicialmente podemos definir las siguientes variables:
1. Sistematizacin del proceso
2. Nivel de apertura
3. Utilizacin de estndares
4. Oportunidad
3
Vase por ejemplo Poggi (2008) una aplicacin de Modelos de Madurez para la interopearbilidad.
5. Accesibilidad
6. Calidad

Niveles 1 2 3 4 5
Variables Inicial Administrado Definido Medido Optimizado
Proceso de Proceso de
recopilacin captura,
Datos Proceso de Proceso de
automtico con verificacin y
recopilados captura captura y
procesos publicacin
Sistematizacin artesanalmente y sistematizado verificacin
manuales para sistematizado
del proceso publicados con
su formateo,
con verificacin sistematizado
segn un
uso intensivo de y publicacin con publicacin
seleccin, proceso
mano de obra. manual. manual.
verificacin y formalmente
publicacin. establecido.
Entidad
protegida por Entidad para uso
Copyright que privado.
restringe su Entidad que solo
utilizacin. Se permite su Entidad de uso
Nivel de reuso sin Entidad libre de requiere
pblico no
apertura Requiere de aprobacin solo uso comercial. reconocimiento
comercial.
proceso manual para fines de fuente.
de solicitud / privados no
autorizacin para comerciales.
su acceso o uso.
Estndares
abiertos y Estndares
documentados Estndares abiertos con
abiertos con metadata y
Las entidades metadata. material
Estndares se publican con descriptivo.
Estndares estndares Las entidades
abiertos.
cerrados o abiertos y con se publican con Las entidades se
ausentes. Entidades informacin estndares publican con
publicadas con descriptiva abiertos y con estndares
Entidad
Estndares estndares sobre el informacin abiertos y con
publicada con
utilizados estndares o
abiertos como contenido. descriptiva informacin
archivos sobre el descriptiva sobre
especificaciones (csv, odb, odt,
individuales. contenido el contenido
propietarios. ods + procesable. procesable y con
(csv, txt, odb, odt, informacin informacin
(doc, xls)
ods, etc.) adicional como (open API, URI, adicional.
tamao, tipo de rdf sin
dato, rango de informacin (rdf con
valores, adicional) informacin
cantidad de adicional)
registros, etc.)
Acorde a la
natural
actualizacin de
Publicacin solo
Publicacin a Publicacin Publicacin la entidad y/o
Oportunidad por demanda
pedido. discrecional. peridica. con perodos de
formal.
actualizacin
claramente
establecidos.
Niveles 1 2 3 4 5
Variables Inicial Administrado Definido Medido Optimizado
Disponible en
Web pero
Disponible en requiere de
Disponible por
Web pero cierta
Solo disponible API
requiere de elaboracin o
por Disponible en documentada o
cierta procesamiento
Accesibilidad requerimiento Web con acceso
elaboracin o para completar
algn otro
especfico y restringido. lenguaje de
procesamiento la entidad. Se
manual. consulta
para completar deben
apropiado.
la entidad. diferenciar por
la fecha de
actualizacin.

4 Desafos organizacionales
De las variables anteriormente mencionadas se puede deducir que la puesta en prctica de la
publicacin de datos en los organismos pblicos presenta una serie de desafos a nivel de cada
institucin como de la propia administracin que los contiene. Solo a modo demostrativo podemos
presentar algunas de las ms importantes:
El tradicional aislamiento y opacidad de los organismos pblicos debe ser roto, tanto
para relacionarse con los dems como para transparentar su accionar. La particular
Cambiar la cultural
resistencia a abrir los datos utilizados en la gestin, ya sea por sensacin de poder,
organizacional
vergenza o desidia, debe ser cambiada y esto afecta a los aspectos ms bsicos de las
culturas organizacionales.
Los organismos gestionan la calidad de sus datos en funcin de sus propias necesidades
y capacidades. Al publicar y compartir estos datos, las necesidades de calidad y
Asegurar la calidad de
actualizacin pueden cambiar significativamente. Por lo tanto, es preciso articular los
los datos
medios para una gestin creciente de calidad, la que impacta en todos los planos de la
gestin organizacional.
La publicacin no puede quedar atada a la disponibilidad presupuestaria coyuntural, sino
que debe ser asumida como actividad organizacional bsica. Por lo tanto se deben hacer
Gestin presupuestaria
las previsiones presupuestarias necesarias para que las actividades relacionados no
queden expuestas al vaivn de los ciclos econmicos.
La responsabilidad de los organismos no termina con la publicacin, sino que deben
Aumento del inters
hacerse cargo del servicio posterior de consumo y explotacin de los mismos, siendo
pblico
ellos mismos publicitadores de su existencia.
Como todo proceso sujeto a controles de calidad y seguridad, la publicacin de datos
Equilibrio entre control y tendr su punto de equilibrio donde la suma de los costos se minimiza. Buscar este
efectividad punto es fundamental para evitar la sobre exigencia de capacidad institucional para
temas que no lo ameritan.
La Publicacin, como todo servicio debe tener su correspondiente nivel de servicio y
Asegurar la rendicin de asistencia al usuario externo. Los procesos no se terminan cuando los datos salen de la
cuentas frontera sino que las instituciones deben hacerse caso de lo producido y atender las
inquietudes, necesidades y reclamos que esto genere.
Gestionar la La Publicacin exige de procesos institucionales y de sistemas de informacin para su
infraestructura gestin, estos a su vez se apoyan en infraestructura tecnolgica que debe estar
tecnolgica adecuada en tiempo y forma a las necesidades.
La seguridad de los datos es un proceso trasversal a todos los dems e impacta sobre
toda la organizacin y no solo sobre el rea de TI. La seguridad en su visin ms amplia
Garantizar la seguridad
debe ser entendida como parte esencial de proceso de Publicacin de datos tanto en sus
caractersticas especficas como generales.
Al igual que todo el quehacer institucional pblico, la Publicacin debe ir acompaada
Mantenimiento de por un ajuste normativo que le de seguridad y legitimidad. Por lo tanto, las instituciones
normativas debern acomodar sus normativas internas y las administraciones debern a su vez
realizar los ajustes pertinentes para las normativas generales.
5 Recomendaciones
Para la implementacin de todo proceso que afecte significativamente la operatoria de las
organizaciones en todos sus planos, se pueden realizar algunas recomendaciones generales,
como las que se presentan a continuacin:
No es sensato pensar que todos los cambios se pueden hacer de un momento para otro,
Utilizar un enfoque de
ni esperar obtener todas las capacidades institucionales para hacerlo. Por lo tanto,
implementacin por
usando instrumentos tipo Modelo de Madurez, se deben ir planificando las actividades
fases
relacionadas a la publicacin en forma incremental y permanente.
Hacer aproximaciones preliminares en procesos y entidades de complejidad razonable
Considerar la realizacin
suele ser una buena estrategia para ir haciendo experiencia e ir adquiriendo de a poco la
de proyectos piloto.
capacidad institucional.
Asegurar los recursos Las previsiones presupuestarias y de los dems recursos se deben ir asegurando con el
necesarios tiempo para evitar faltantes que amenacen retroceder en los avances logrados.
Dar prioridad a la
Seleccionar las entidades centrales que hacen al quehacer de la organizacin y no
utilizacin de la regla
perderse en detalles de poco inters.
80/20
Alinear las iniciativas de
Incluir las iniciativas estratgicas relacionadas al OD en los planes estratgicos de la
gobierno abierto con los
organizacin evitando que sean medidas aisladas o parciales.
objetivos del organismo
Establecer mecanismos La gestin de datos, espacialmente cuando se exterioriza, debe quedar bajo control del
de gobernanza para el organismo. No pueden permitirse fugas o debilidades que atenten contra los recursos
intercambio de datos organizacionales o la seguridad y la privacidad.
Las personas, como parte central del quehacer organizacional, deben ser capacitadas e
Trabajar en el cambio
inducidas a apropiar la publicacin, en paralelo o anticipadamente a los cambios
cultural
organizacionales.
Explicitar y transparentar las acciones, los logros y los planes relacionados a la
Hacer pblico el
Publicacin. Como mecanismo de transparencia, como estmulo y para evitar demandas
compromiso
excesivas.
Evitar la discrecionalidad apuntando a incardinar los cambios en la organizacin,
Institucionalizar rearmando los procesos, formando a las personas, ajustando las normativas y los
mecanismos de control.
Sin la tecnologa adecuada no se pueden hacer estos cambios significativos salvo en
Apropiar la tecnologa
escalas muy reducidas o a costos muy altos. Por lo tanto la informatizacin institucional y
adecuada
la apropiacin de tecnologa especfica debe ser parte del proceso de cambio.
La integracin de la organizacin al resto de la administracin y a la sociedad, a travs
Coordinar las del flujo de informacin es un objetivo central de la Publicacin de datos. Se deben evitar
organizaciones la simple publicacin para cumplir con los requisitos a favor de que esta sea un vnculo
de la organizacin con el exterior.
A nivel de la Administracin se debe aprovechar la creacin de comunidades de prctica
Desarrollar comunidades
con los involucrados en las tareas propias de la Publicacin en los distintos organismos,
de prctica
aprovechando el conocimiento colectivo.
Desarrollar y comunicar
Tambin a nivel Administracin se debe desarrollar y comunicar el plan comn a todos
una estrategia de todo el
los organismos, asumiendo los compromisos y explicitando los logros y los problemas.
gobierno

6 Experiencias de publicacin
Se presentan a continuacin distintas experiencias sobre Open Data para tomar como ejemplo y
referencia de lo expuesto.
Proyecto Aporta del Ministerio de Ciencia y Tecnologa de Espaa. Son interesantes as
Aporta
definiciones que contiene. www.aporta.es/web/guest/guia_reutilizacion.
El Principado de Asturias, uno de los tres casos testigo de Espaa.
Asturias
url.ctic.es/datosasturias
Uno de los referentes de Espaa. En el portal de la Generalitat se puede consultar y
tambin descargar el catlogo con todas las iniciativas de datos abiertos dentro de la
Catalua institucin. Incluso un conjunto significativo de datos se encuentran en los formatos que
se consideran de alta calidad para su reutilizacin como el RDF.
dadesobertes.gencat.cat/es/
Un ejemplo concreto del Reino Unido donde recientemente se ha publicado la base de
Coins
datos que contiene todo el gasto del gobierno nacional. data.gov.uk/dataset/coins
El CTIC (fundacin especializada en el desarrollo de polticas, estrategias y proyectos de
sociedad de la informacin, si.ctic.es) mantiene un mapa de las iniciativas de Open Data
a nivel mundial. Partiendo de esta base y de los amplios conocimientos en el desarrollo y
la aplicacin de la Arquitectura Web, CTIC ha desarrollado una metodologa propia en
CTIC varias fases que van desde el anlisis y la asesora estratgica a los gobiernos sobre qu
datos publicar y cmo, hasta todas las piezas tcnicas necesarias para realizar dicha
publicacin utilizando tecnologa Web 3.0, pasando por el despliegue de un catlogo de
datos y la construccin de aplicativos de ejemplo que podran utilizar dichos datos.
datos.fundacionctic.org/sandbox/catalog/map
Uno de los casos ejemplo de Open Data. www.data.gov. Vase tambin
Estados Unidos
www.whitehouse.gov/open
Euskadi El Pas Vasco, uno de los tres casos testigo de Espaa. opendata.euskadi.net
La tendencia hacia la liberacin del acceso a datos se extiende tambin a los organismos
internacionales. Por ejemplo, a partir del 1/07/2010 puede accederse libremente en lnea
a la mayor base de datos mundiales sobre alimentos, agricultura y hambre de la FAO
FAO (Food and Agriculture Organization of the United Nations). FAOSTAT permite el acceso a
ms de 3 millones de series cronolgicas y estructuras de datos. Su nueva versin a
nivel nacional CountrySTAT ofrece un puente de ida y vuelta entre estadsticas
subnacionales, nacionales e internacionales.faostat.fao.org/default.aspx
Uno de los precursores del Open Data. data.gov.uk y
Reino Unido
www.nationalarchives.gov.uk/doc/open-government-licence/open-government-licence.htm
Open data es actualmente una materia de inters para W3C eGovernment donde se
desarrollan las mejores prcticas sobre cmo publicar open data. Puede tratarse de
cosas sencillas como: "es mejor publicar en XML que en Excel" como de cosas ms
complicadas: "cmo publicar un catlogo de Linked Government Data" (es decir, como
W3C
llevar el "open data" a formar parte de la Web 3.0, o Web de los Datos"). Una de las
tareas ms recientes es la creacin de un formato uniforme para describir los catlogos
de "open data", algo que an no existe y que permitir agregar, filtrar y comparar los
diferentes catlogos de "open data" que los gobiernos estn poniendo en la Web.
Zaragoza datos.zaragoza.es.
Proyecto Aporta del Ministerio de Ciencia y Tecnologa de Espaa. Son interesantes as
Aporta
definiciones que contiene. www.aporta.es/web/guest/guia_reutilizacion.
El Principado de Asturias, uno de los tres casos testigo de Espaa.
Asturias
url.ctic.es/datosasturias
Uno de los referentes de Espaa. En el portal de la Generalitat se puede consultar y
tambin descargar el catlogo con todas las iniciativas de datos abiertos dentro de la
Catalua institucin. Incluso un conjunto significativo de datos se encuentran en los formatos que
se consideran de alta calidad para su reutilizacin como el RDF.
dadesobertes.gencat.cat/es/

7 Conclusiones y reflexiones
Existen varias tensiones en ciertos aspectos de la implementacin de la Publicacin de Datos, por
ejemplo: los datos deben publicarse como un repositorio plano o interpretados? A muchas
autoridades les gusta ms la segunda opcin ya que existe "temor de las interpretaciones de
terceros", argumento que se ha escuchado en varias oportunidades; qu pasa si de una
determinada base de datos se sacan conclusiones sin el contexto? Por lo tanto se plantea que
debe existir la "interpretacin oficial", si bien es relevante dicha interpretacin es relevante que
exista la posibilidad de procesamiento independiente de la data, desde su fuente primaria.
Otro tema difcil es la gestin de la metadata: qu tipo de marcas y qu documentacin se van a
elaborar y publicar junto con los datos? Ambas tareas que requieren de un esfuerzo importante y
que adems se ir depurando en el tiempo. Es importante destacar que este es un proceso
continuo y no coyuntural.
La experiencia del data.gov ha dejado algunas enseanzas:
Focalizarse en el acceso: la plataforma de publicacin debe permitir un acceso lo ms
cerca a la fuente original posible, incluso plantea que los datos residan en las instituciones
generadoras.
Plataforma abierta: debe permitir no slo la descarga sino adems la interaccin va API
(del ingls: Application Programming Interface) u otros instrumentos semejantes.
Datos desagregados al mximo nivel posible: sin que se entre en atentar contra la
privacidad y los datos personales de los individuos.
Retroalimentacin: crecimiento y mejoramiento por la va del aporte de los usuarios.
Hacerse cargo: las agencias que publican deben hacerse responsables de la caducidad y
la privacidad de los datos, sin recargar a los consumidores en temas que son de
incumbencia estatal.
Estandarizar: apropiar buenas prcticas en temas de publicacin de datos y gestin de
informacin
Van a continuacin algunas reflexiones no como conclusiones sino todo lo contrario, como
iniciadores de nuevas reflexiones y generadores de intercambios:
La Publicacin de Datos exige a las administraciones y organismos pblicos poner en
marcha cambios profundos que afectan a todos los planos de su quehacer: cultural, poltico,
legal, organizacional, informacional y tecnolgico.
No se puede exigir a las administraciones y organismos pblicos que publiquen todo y en un
corto plazo. Asumir la publicacin como una actividad institucional ms es un proceso que
requiere esfuerzo y tiempo para apropiacin institucional de nuevas capacidades.
La Publicacin no es gratuita, los organismos deben hacer esfuerzo para realizarla como
corresponde. Por lo tanto, el objetivo es lograr que se haga de forma sistemtica y
correctamente soportada por la tecnologa que la haga viable.
La Publicacin debe hacerse siguiendo los estndares y las buenas prcticas establecidos
de gestin de datos, al igual que cualquier proceso institucional.
8 Bibliografa
AR/SGP/FRRII (2008) Mapa de restricciones a la Interoperabilidad en el sector pblico.
Presentacin del trabajo realizado por el Grupo de Interoperabilidad del Foro de
Responsables Informticos de la ONTI/SGP en USUARIA 2006. rrii.sgp.gob.ar/index.php?
option=com_docman&task=cat_view&gid=154&Itemid=200002
Barros, Alejandro (04-12-11): Data.xx ya no existen excusas. www.alejandrobarros.com
Eaves David (200) Open Data: USA vs. Canada, October 2009. eaves.ca/2009/10/08/open-data-
us-vs-canada/
Gwanhoo Lee y Young Hoon Kwak (2011): An Open Government Implementation Model: Moving
to Increased Public Engagement. En Using Technology Series.
http://www.businessofgovernment.org/report/open-government-implementation-model-
moving-increased-public-engagement
Lakhani, Karim, Austin, Robert & Yumi Yi (2010): Data.gov, a Harvard Bussines School Case
Studies. www.data.gov/documents/hbs_datagov_case_study.pdf Lista de catlogo de Open
Data, eadminblog.net/post/2010/04/11/lista-de-catalogos-de-open-data-en-el-mundo
MELODA: Methodology for Releasing Open Data Version 0.4. www.meloda.org
OCDE (2008) Recomendacin para el mejor acceso y el efectivo uso de la informacin pblica.
www.oecd.org/dataoecd/0/27/40826024.pdf
OEA (2010) Boletn Electrnico del Foro de e-Goierno de la Organizacin de Estados Americanos,
N 56, agosto de 2010. www.suboletin.com/contentsoea/docs/Boletin_56/Principal56.htm
Open Data USA, www.data.gov
Poggi, Eduardo (2008): Modelos de Madurez para la Interoperabilidad. Monografa presentada
en el 2 SIE / 37 JAIIO 2008, Santa Fe, Argentina, Septiembre de 2008. (2 Premio
Nacional de Gobierno Electrnico Edicin 2008)
Tauberer, Joshua (2009) Open Data is Civic Capital: Best Practices for Open Government Data",
versin 1.3 del 14/04/2010. http://razor.occams.info/pubdocs/opendataciviccapital.html
W3C (2009) Publishing Open Government Data, W3C Working Draft 8 September 2009.
www.w3.org/TR/2009/WD-gov-data-20090908/
Wikipedia, es.wikipedia.org