Está en la página 1de 12

Taxonomías y Metadata en la Gestión de

Contenido Empresarial

Documento de Conceptos y Mejores Prácticas

Enero 2007

Versión 2.0

Taxonomías y Metadata – Conceptos y Mejores Prácticas


Taxonomías y Metadata en la Gestión de Contenido
Empresarial

Introducción

El contenido electrónico que manejan las empresas ha crecido en los últimos años de forma
abrupta. El hecho de manejar demasiada información representa un gran problema en las
empresas “conectadas” de hoy en día. Las dificultades para catalogar y recuperar
información no estructurada efectivamente es un problema eterno.

Se estima que un empleado promedio destina 15% de su tiempo, o seis horas a la semana,
en busca de información y que el 50% de las búsquedas que realiza fallan en encontrar la
información deseada. Eso significa que sus trabajadores desperdician el 7,5% de su jornada
laboral porque no encuentran la información que necesitan. Ahora calcule el 7,5% de su
nómina salarial y eso es cuanto usted está perdiendo cada año por búsquedas ineficaces.

Por más alto que este costo parezca, no representa su costo real. El costo real de no tener
un acceso efectivo a la información proviene de:

¾ Duplicar trabajos pre-existentes porque alguien no lo pudo encontrar en una


búsqueda de texto
¾ Re-comprar productos de información que ya había adquirido pero que no pudo
encontrar en la red
¾ Decisiones inconsistentes basadas en documentos distintos
¾ Oportunidades perdidas por no haberlas detectado a tiempo debido a la inhabilidad
para encontrar información

Todos estos costos son evitables. Y la respuesta está en la clasificación de sus documentos.
Si usted organiza su propia información, ¿porqué esperar menos del contenido corporativo?

Taxonomías

¿Qué es exactamente una taxonomía? En términos generales, una taxonomía es una


estructura jerárquica de categorías siguiendo un protocolo de género-especie o general-
específico. Permite clasificar los documentos de acuerdo a su contenido. Por lo tanto, es
parte inherente de cualquier sistema complejo de gestión de contenidos. Gracias a la

Taxonomías y Metadata – Conceptos y Mejores Prácticas


taxonomía se organiza la estructura y se guía el indexado, etiquetado y asociaciones del
contenido.

¿Qué preferiría usted, tener que realizar una búsqueda dentro de un conjunto de 20.000
documentos, o que los mismos se presenten en categorías que lo ayuden a estrechar su
búsqueda y descubrir documentos nuevos y relacionados?

Ya sea para encontrar información, entrar en acción o producir resultados, las taxonomías y
la clasificación son la solución. Los beneficios son simples: proveen la estructura y
organización que hacen que la información empresarial sea manejable, usable y por ende
más valiosa.

Una buena taxonomía también puede mejorar el proceso de decisión. Puede encuadrar la
manera en que las personas toman decisiones, y ayudarlos a encontrar la información que
necesitan para tener en cuenta todas las alternativas posibles. Con una buena taxonomía,
los tomadores de decisiones disfrutan una nueva perspectiva.

Metadata

Para manejar, manipular e integrar la información se necesita nombrarla y describirla. Estos


nombres y descripciones son “metadata” literalmente, información de la información.

En una organización, la metadata es utilizada por cualquiera que trabaje con información, ya
sea estructurada o no estructurada. Esto es siempre así, aunque no utilicen específicamente
el término metadata, aunque la metadata este guardada separada de la información, o
aunque las personas no puedan distinguir entre la información que usan y como la nombran
o la describen.

La metadata es un factor crítico de éxito en la estrategia de gestión de contenidos. Es más


que información de la información, es cómo está codificado el conocimiento de la
organización, y puede ser utilizado para determinar no solo lo que el contenido es sino quién
lo usa, cómo lo usa, cómo será entregado y cuándo, etc..

Taxonomías y Metadata – Conceptos y Mejores Prácticas


El desafío de diseñar y construir una taxonomía. ¿Por donde
empezar?

Embarcar un proyecto de creación de una taxonomía puede ser intimidante, ya sea


empezando desde cero o utilizando taxonomías ya existentes. Existen tres conceptos básicos
a tener en cuenta para un proyecto exitoso de taxonomías.

1.- Definir un equipo de proyecto

En el ambiente corporativo, el desarrollo de una taxonomía es una actividad multi-


disciplinaria que cruza las fronteras y líneas de la organización. Un equipo típico de
taxonomía consiste en representantes de las siguientes especialidades:

¾ IT: Arquitectura y gestión de la información; gestión de contenidos, gestión de


metadata
¾ Biblioteca o centros de información
¾ Web Site
¾ Comunicaciones corporativas
¾ Editores, Escritores, Publicadores

En definitiva, se puede asignar la tarea a cualquiera en la organización que tenga un


conocimiento profundo del contenido empresarial. La construcción de una taxonomía incluye
tecnología y es un proceso iterativo, por lo tanto la participación del staff de IT es de gran
ayuda.

2.- Analizar dependencias, planificar el proyecto

Lo más importante es darse cuenta que lo proyectos de taxonomías casi nunca empiezan
desde cero. Existe un número de recursos internos y externos que asisten en el diseño de la
taxonomía. Si no se toma el tiempo para analizar y planificar el proyecto, seguramente
perderá más tiempo re-creando lo que ya tiene. Una buena práctica en el planeamiento de
una taxonomía es pensar globalmente, pero actuar localmente.

Tareas a realizar durante el planeamiento:

Taxonomías y Metadata – Conceptos y Mejores Prácticas


¾ Defina el propósito de la taxonomía que esta construyendo y sus objetivos:
o Un enunciado claro de porqué y para qué se construye la taxonomía ayudará a
no perder el rumbo en los momentos de debate acerca de cómo debe
estructurarse la taxonomía, con qué nivel de apertura, etc.
¾ Desarrolle un plan para analizar contenido y necesidades del usuario:
o Es de vital importancia establecer un inventario lo más exhaustivo posible de
los tipos de contenidos que serán organizados en la taxonomía, así como
quiénes serán los usuarios y los criterios más comunes por los que estos
usuarios intentarán buscar estos contenidos.
¾ Establezca roles y responsabilidades:
o Defina claramente y en forma temprana “quién hará qué”.
¾ Capacite al equipo de trabajo: propósitos de la taxonomía, características,
aplicaciones y funciones.
¾ Analizar relación entre metadata y taxonomías:
o No es aconsejable separar ambos análisis. Ambos conceptos están íntimamente
relacionados y deben estar diseñados en forma coherente, en base a un
análisis conjunto.

3.- Desarrollar la taxonomía

Una vez conformado el equipo, analizadas las dependencias y realizado el planeamiento, se


debe comenzar a construir la taxonomía. Esta etapa se puede dividir en cuatro pasos:

a. Creación de la taxonomía

Las dos tareas más importantes para crear una taxonomía son:

i. Crear categorías y asignar jerarquía: la necesidad de categorizar y posicionar los


contenidos en las resultantes taxonomías requiere una clasificación cuidadosa y
deliberada de cada fuente de información. La asignación de etiquetas (metadatos)
que unen el contenido con una categoría específica representan un esfuerzo
necesario para la creación de una taxonomía.

ii. Crear las reglas que caracterizan las categorías y los documentos que serán
asignados a ellas: la idea es definir las reglas que deberán seguir los usuarios a la
hora de definir en qué categoría de la taxonomía ingresarán un contenido. Las
reglas pueden consistir en términos sinónimos y acrónimos, que conducen los
documentos a la categoría apropiada. Por ejemplo, para una categoría
denominada “FAQ”, la reglas a crear incluirán “frequently asked questions”, “faq”,
“preguntas frecuentes” y otros términos usados comúnmente para referirse a las
FAQ. Adicionalmente puede tratarse de reglas de negocio, tales como definir

Taxonomías y Metadata – Conceptos y Mejores Prácticas


relaciones entre categorías de la taxonomía y tipos ya pre-establecidos de
documentos (“todos los materiales de capacitación a usuarios deben ser bajo la
categoría “Capacitación”). Regular cuidadosamente el uso de cada categoría
permite encaminarse hacia una terminología corporativa, a un estándar de
clasificación, que asegura poder encontrar los documentos en la categoría dónde
deben estar.

b. QA de la taxonomía

Este es uno de los pasos más importantes antes de publicar una taxonomía para su uso:
testearla para asegurarse la calidad. Durante esta fase, expertos en la materia deben:

¾ Revisar la taxonomía poblada de datos


¾ Clickear en cada categoría
¾ Reveer los documentos
¾ Verificar que los documentos se encuentren en sus respectivas categorías
¾ Verificar si existe la necesidad de crear nuevas categorías
¾ Verificar si hay demasiados documentos en una categoría
¾ Documentar todo lo que encuentra, los cambios que realiza y por qué los realiza

En cada caso, se deben refinar las reglas que se definieron, crear sub-categorías adicionales
o eliminar categorías.

c. Publicación de la Taxonomía

Una vez finaliza la etapa de QA, se procede a publicar la taxonomía a los usuarios finales. Si
bien la mayoría esta familiarizado con el uso de taxonomías, no esta de más tener en cuenta
lo siguiente:

¾ Distribuya tutoriales para el uso, navegación y búsqueda de información en las


taxonomías
¾ Implementar un mecanismo de feedback y sugerencias de parte de los usuarios
finales
¾ Trabaje en conjunto con el equipo de proyecto y el de calidad para realizar chequeos
¾ Implemente un programa de satisfacción del usuario

d. Mantenimiento de la Taxonomía

Taxonomías y Metadata – Conceptos y Mejores Prácticas


El trabajo no finaliza con la publicación de la taxonomía. A través del tiempo los usuarios
crearán documentos sobre productos, tecnologías, clientes, mercados, etc. La forma en que
los usuarios usan el contenido cambiará continuamente, por lo tanto es necesario invertir en
mantenimiento de modo de que la taxonomía continúe siendo relevante y utilizable. El
tiempo dedicado al mantenimiento de la taxonomía dependerá de su tamaño, la volatilidad
del contenido, la dedicación de recursos y la frecuencia con la que se agrega contenido.

¾ Establezca auditorías regulares de la taxonomía


¾ Establezca procesos de mantenimiento y colaboración
¾ Revise las sugerencias de los usuarios y realice cambios si es necesario
¾ Distribuir las tareas de mantenimiento entre los expertos de cada categoría simplifica
el proceso

Regla de Diseño de las Taxonomías – “10 x 4”:


Existe una regla general que surge de la experiencia de los usuarios, que dice que desde el
punto de vista de un usuario promedio una taxonomía bien diseñada nunca presentará más
de 10 tópicos o nodos en cualquier nivel de la taxonomía, y que cualquier “ruta” no debiera
contener más de 4 niveles (un usuario no irá nunca más allá de 3 o 4 niveles para buscar
información).
Claro está esto coloca un desafío para colecciones de contenido altamente diversas y
detalladas, y debe ser tomada tan solo como una referencia.

Taxonomías en COLDview:
En particular la aplicación en COLDview de las Taxonomías presenta otro impacto, más allá
de los conceptos hasta aquí planteados. Se trata de la relación entre las categorías o nodos
de la taxonomía COLDview con la Seguridad de Acceso.

El objetivo de esta relación es poder establecer un control sobre qué documentos son
accedidos (o publicados) por cada usuario. Esto se resuelve en COLDview indicando en las
herramientas de Administración de Seguridad para cada Perfil de Usuario, en qué nodos de
la taxonomía dicho usuario podrá:
o Publicar documentos; y/o,
o Consultar documentos; y/o,
o Descargar documentos (“download”); y/o
o Eliminar documentos.

Es importante destacar que a efectos de mantener la flexibilidad esta definición no es


“jerárquica”, es decir que la habilitación a un nodo “padre” no implica la habilitación
automática a todos sus “hijos”. Podría entonces darse acceso al nodo padre, y a alguno de
los nodos hijos (o a ninguno de ellos). Por el contrario podría no darse acceso a un nodo
superior y sí a alguno de nivel inferior en la jerarquía de la taxonomía.

Taxonomías y Metadata – Conceptos y Mejores Prácticas


También es importante mencionar que cada usuario visualizará solamente los nodos o
categorías a los que está habilitado.

Nota – Perfiles de Usuarios:


Se entiende por Perfil de Usuario a una agrupación de usuarios. De este modo se definen
Perfiles a los que luego se le asignarán múltiples usuarios, los que heredarán las
características de seguridad definidas en el Perfil.

Categoría de Acceso:
Existe un tipo de metadata especial en COLDview que permite calificar o categorizar un
documento al momento de su publicación de acuerdo a su nivel de confidencialidad. De este
modo un documento puede ser categorizado como Confidencial, o como Secreto, etc.
En las herramientas de Administración de Seguridad se podrá limitar para cada categoría
o nodo de la Taxonomía, y en cada Perfil de Usuario, a qué Categoría de Acceso de los
documentos podrá consultar. De este modo podría por ejemplo restringirse que cierto grupo
de usuarios no visualice documentos categorizados como “confidenciales”.
Metadata: mejores prácticas y estrategias de diseño

A partir de aquí lo guiaremos en como definir una estrategia de implementación de metadata


que se ajuste a las necesidades de su organización
Se ampliará el concepto de metadata, se detallarán los desafíos e inconvenientes que la
rodean y se definirán las mejores prácticas asociadas a la implementación de metadata.

Concepto

Existe un pensamiento común alrededor del concepto de metadata: en la mayoría de las


organizaciones la metadata es frecuentemente malentendida, no utilizada y desaprovechada
por aquellos que podrían beneficiarse de ella. Esto ocurre principalmente por que no se logró
una buena estrategia de implementación. Existe la tendencia a complicar demasiado el
concepto de metadata, haciéndolo poco entendible para la mayoría de los usuarios finales.

El concepto principal de metadata es comúnmente referido a “información de la


información”. En resumen, es cualquier atributo que describe a un documento. Este
documento que usted está leyendo en este momento tiene un título, un autor, un nombre de
archivo, una descripción, una fecha en el que fue creado, un campo de búsqueda, palabras
relacionadas, y cualquier otro atributo. Eso es metadata.
Debido al impacto que tiene la información, necesitamos metadata más que nunca. Los
valores que provee son:

Taxonomías y Metadata – Conceptos y Mejores Prácticas


• Integración e interoperabilidad: Las organizaciones que generan cantidades masivas
de datos pueden utilizar metadata como lenguaje común para combinar los
documentos en diferentes repositorios, logrando una integración. A través de la
descripción consistente de la información los documentos se pueden combinar más
allá de su diversidad geográfica, funcional u organizacional.

• Gestión: La metadata cobra más importancia especialmente en aquellas


organizaciones que tengan que cumplir con regulaciones como Sarbanes-Oxley,
teniendo la posibilidad de mantener un registro y control de los documentos.
Mediante la metadata se puede inculcar a la organización a tener una contabilidad de
los documentos, controlar el versionado y cumplir con los procedimientos de
seguridad. Esto se traduce en beneficios directos, ya que el tiempo utilizado en
rehacer documentos o usar documentos incorrectos se reduce.

• Filtrado y categorización: Nos acerca la idea de recuperar documentos con mayor


facilidad. Una buena metadata se complementa con la taxonomía, permitiendo a los
usuarios navegar de forma intuitiva a través de la misma estrechando los campos de
búsqueda para obtener información exacta.

En general hay tres tipos de metadata:

¾ Metadata descriptiva: Se utiliza para describir objetos/documentos con el propósito


de identificarlos y recuperarlos. Puede incluir elementos como título, descripción,
autor, palabras clave, etc. Generalmente, es el tipo de metadata que un usuario final
utilizará para buscar un objeto.

¾ Metadata estructural: Se usa para indicar la relación lógica entre objetos, por
ejemplo la secuencia de páginas para un grupo de imágenes de un libro. Permite
describir el contenido por agrupamientos, ya sea capítulos, secciones, expedientes,
carpetas, etc. La metadata estructural especifica una presentación coherente del
contenido digital.

¾ Metadata administrativa: es la información utilizada para la gestión de los


documentos y el control de acceso a los mismos. Puede incluir información sobre
cómo y cuando fue generado el archivo, el tipo de formato y otra clase de
información técnica. También información sobre derechos de autor y de preservación
a largo plazo de los objetos digitales. Campos de metadata administrativa muy útiles
son el “Estado” y la “Versión” del documento, permitiendo describir en que fase o
etapa se encuentra un documento o a que versión corresponde, siendo esta última de
reconocimiento automático a igualdad de características de un documento.

Taxonomías y Metadata – Conceptos y Mejores Prácticas


Mejores Prácticas

Existen muchas razones por la cual las organizaciones no obtienen valor de su metadata.
¿Como se revierte la situación? ¿Cuál es la clave? La respuesta está en simplificar la
estrategia y considerar las necesidades de los usuarios finales. Las siguientes son mejores
prácticas que pueden ayudar a la organización a recorrer el camino correcto en la estrategia
de implementación de metadata.

¾ Tómese el tiempo para definir los casos de uso de metadata: muchas


organizaciones cometen el error de crear demasiados campos de metadata que nunca
serán completados. Exigen demasiados detalles o definen procesos rigurosos que
nunca serán realizados. Para que esto no ocurra trabaje con los verdaderos dueños
del contenido: los usuarios finales. Trate de entender como lo clasifican, como lo
buscan y como lo usan.

¾ Empiece con una estrategia simple de metadata que soporte una evolución
a través del tiempo: como se menciona arriba, muchas organizaciones tienden a
complicar demasiado las estrategias, incluyendo muchos campos de metadata, y
muchos pasos para el proceso de publicación. La idea es hacerlo simple, y dejar que
crezca lógicamente a través del tiempo, en la medida que lo necesite.

¾ Busque feedback de los usuarios finales y los publicadores: construya


mecanismos de feedback para asegurarse que el sistema será intuitivo. Pregunte qué
campos de metadata desearían adicionar, entre qué opciones de una lista desearían
elegir. Instale el mensaje de que el feedback es crítico para hacer el sistema más
funcional, y esté preparado para reaccionar. No sirve de nada recolectar feedback y
luego no actuar sobre él.

¾ Focalícese en la comunicación, educación, y capacitación durante el ciclo


del proyecto: asegúrese que todos los usuarios responsables de publicar contenido
entiendan por qué se les está pidiendo que completen metadata para sus
documentos. Eduque a la organización acerca del valor de la metadata. Si los usuarios
estuvieron involucrados en el proceso de definición de metadata responderán de
manera rápida y favorable en este tipo de entrenamiento.

¾ Defina un plan de seguridad para sus sistemas: mas allá de la cantidad de


educación que se le brinde a aquellos que publican contenido, siempre habrá alguno
que no realice un buen trabajo completando metadata. Para evitar esto defina un
sistema de seguridad, autorizando a publicar sólo aquellos que realicen un buen
trabajo. También se pueden realizar chequeos al azar de documentos para tener una

10

Taxonomías y Metadata – Conceptos y Mejores Prácticas


idea de cómo se están publicando e identificar a quienes no lo están haciendo bien.
Se le debe dar importancia al rol de publicador.

¾ Defina estándares que tengan sentido para todos los usuarios: asegúrese que
los nombres se escriban siempre consistentemente, tanto el nombre de los archivos
como el de los documentos. Asimismo defina estándares en el uso de acrónimos y
abreviaciones. En resumen, trate de lograr una consistencia en la manera en que se
debe completar cada campo. Esto conducirá a presentar la información de la misma
forma a todos los usuarios y será familiar para ellos.

¾ Limite al mínimo el uso de campos manuales de texto: aún los mejores


encargados del contenido o publicadores tienden a ser menos exactos cuando deben
completar más de 3 campos manualmente. Los campos que típicamente se deberían
dejar para ser completados manualmente son Nombre o Titulo del Documento y
Descripción. Las listas desplegables o valores por default ayudan a limitar el número
de de campos manuales. Simplifique también esas listas al máximo posible. El
objetivo no es tener una infinidad de opciones, sino que el usuario identifique
rápidamente la opción que desea.

¾ Piense en metadata como una pieza del sistema Taxonomía/Navegación: el


uso más efectivo de la metadata se encuentra en la integración con la taxonomía y el
motor de búsqueda. Los componentes deben ser considerados como complementos y
en consecuencia tienen que ser diseñados en conjunto.

¿Como empezar?

1) Forme un equipo de metadata: Reúna un equipo con representantes de la


organización que entiendan como funcionan los documentos. El equipo debería estar
conformado por individuos que den a conocer las perspectivas del área que
representan.

2) Eduque el equipo de metadata: Dedique tiempo a educar a todos los miembros


acerca de los beneficios de la metadata, la problemática asociada y las mejores
prácticas.

3) Defina el propósito del proyecto: planifique el proyecto y los esquemas que se


construirán. Identifique los tipos de documentos que se van a publicar. Tenga en
cuenta la audiencia (los usuarios) y el futuro.

11

Taxonomías y Metadata – Conceptos y Mejores Prácticas


4) Defina los casos de uso: Planifique de que manera los usuarios obtendrán mayor valor
de la metadata. Es decir, tener en cuenta cómo los usuarios clasifican la información,
que campos utilizan o desearían utilizar para buscar un documento, etc.

5) Investigue campos potenciales de metadata: Que cada miembro del equipo


confeccione una lista con los 10 campos que cree que se deberían incluir. Una vez
que todos lo han hecho, que el grupo resuelva la diferencias entre ellos. De esta
manera se pueden identificar los campos más relevantes.

6) Defina criterios de metadata: Para cada campo defina sus reglas y limitaciones

- Nombre del Campo


- Manual o Automático
- Tipo de campo (texto, fecha, lista desplegable, numérico, etc.)
- Formato
- Límite de caracteres
- Valores

12

Taxonomías y Metadata – Conceptos y Mejores Prácticas

También podría gustarte