Está en la página 1de 24

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/271823139

Estructura de los documentos jurídicos y XML

Chapter · December 2014

CITATIONS READS

0 1,444

2 authors:

M. Mercedes Martínez-González Dámaso-Javier Vicente


Universidad de Valladolid Universidad de Valladolid
52 PUBLICATIONS   138 CITATIONS    23 PUBLICATIONS   28 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Semantic Web and Law. KOS sharing in the Semantic Web. View project

Semantic Web for managing relationships in the legal domain View project

All content following this page was uploaded by M. Mercedes Martínez-González on 03 June 2016.

The user has requested enhancement of the downloaded file.


CAPÍTULO III

ESTRUCTURA DE LOS DOCUMENTOS


JURÍDICOS Y XML
Mercedes Martínez González (*)
mercedes@infor.uva.es

Dámaso-Javier Vicente Blanco (**)


damaso@der.uva.es

(*) Departamento de Informática, Universidad


de Valladolid, Edificio TIT s/n, 47011
Valladolid (España)
(**) Departamento de Derecho Mercantil,
Derecho del Trabajo y Derecho Internacional
Privado de la Universidad de Valladolid

I. INTRODUCCIÓN

La digitalización de documentos ha permitido su manejo y gestión de un modo


impensable sin la existencia de las tecnologías informáticas. Las técnicas utilizadas
consisten en el uso de formatos que emplean marcas o etiquetas para señalar los
apartados de los documentos y caracterizar los atributos, bien de formato o semánticos,
del texto (Martínez González, 2000).

Hoy se navega con libertad entre aplicaciones informáticas y ordenadores que


hasta no hace tanto eran incompatibles, gracias a que se han normalizado, de modo que
como se ha dicho, se establecen “espacios virtuales de trabajo y de comunicación
abiertos, cada vez más independientes de su soporte” (Lévy, 2007). En paralelo, se ha
generalizado el uso de normas de descripción de estructura de los documentos de texto,
que posibilitan que la integridad de la información se conserve intacta, pese a que varíen
los soportes de los programas y de los ordenadores.

Estas normas constituyen los lenguajes de etiquetado, que son convenciones de


marcado usadas para la codificación de los textos que permiten registrar la estructura
lógica de los documentos y especificar las marcas permitidas y las marcas necesarias
que luego son identificadas y reconocidas reproduciendo la información, y también
cómo se van a distinguir del texto que modifican y cuál es su significado (W3C, 2008;
Martín Galán, 2002). La digitalización de los documentos posibilita la creación de
hipertextos, textos que permiten trasladarse a otros textos a través de hipervínculos
(“navegar”) y que crean o reproducen cadenas de relaciones entre ellos1. El hipertexto

1
Según lo define G.P. Landow: “Hipertexto, expresión acuñada por Theodor H. Nelson en los años
sesenta, se refiere al tipo de texto electrónico, una tecnología informática radicalmente nueva y, al mismo
tiempo, un modo de edición. Como él mismo lo explica: «Con ‘hipertexto’, me refiero a una escritura no

1
digital marca una diferencia sustancial con los textos tradicionales en soporte papel.
Supone un paso sustancial que aleja el texto de la imprenta.

La tecnología XML (Extensive Markup Language) es un lenguaje de marcado o


etiquetado de documentos cuyo éxito reside en que mejora la calidad y las prestaciones
de otros lenguajes de marcado más populares, como el HTML, cuya flexibilidad
sintáctica da lugar a documentos que pueden resultar imposibles de procesar por las
aplicaciones informáticas. La mejora de la calidad y la garantía y seguridad del
procesado, además de su capacidad para intercambiar información procedente de
distintas fuentes, han colocado al lenguaje XML en un lugar privilegiado (Martínez
González, 2000). Sus posibilidades de operatividad le otorgan una excelente
funcionalidad al servicio de la interconexión electrónica en la red a través del
hipertexto2. Además, desde que Tim Berners-Lee lo incluyó como un elemento de la
Web Semántica (Berners-Lee, Hendler y Lassila, 2001), contribuye a la realización de
esta idea donde es posible establecer relaciones máquina a máquina de forma
automatizada hasta el punto de que hipotéticamente pueden darse relaciones
automatizadas capaces de acordar contratos sin la intervención humana directa
(Cunningham, 2006: Ossowski, 2013). Sin embargo, tales posibilidades hay que verlas
con prudencia, sin conceder a la tecnología atributos humanos que no le corresponden3.

II. LA ESTRUCTURA DE LOS DOCUMENTOS JURÍDICOS

En lo que hace al Derecho, la tradición jurídica de los sistemas romano-


germánicos, los sistemas de base legal, es directamente deudora de la imprenta como
tecnología de reproducción de los documentos escritos. Del mismo modo que los
sistemas normativos consuetudinarios se deben a las formas de comunicación jurídica
oral, la Ley, como fuente del Derecho, y la codificación, en tanto que método de
sistematización del ordenamiento, responden a la universalización de la imprenta como
tecnología común y, consecuentemente, al acceso a los textos escritos de forma más
fácil y generalizada por la población (Pérez Luño, 1996).

Los documentos y textos jurídicos, particularmente los legislativos (pero


también los jurisprudenciales), poseen unas características que les hacen aptos para su
tratamiento informático estandarizado: la estructura, la articulación, las posibilidades de
comparabilidad e interrelación, la referenciación entre ellos, la jerarquía, la
complementariedad, etc.

Desde la tradición de la imprenta, la estructura de los documentos legislativos se


despliega a través de títulos, capítulos, artículos, párrafos, números, etc. que organizan
la información contenida en el texto legal de forma sistemática, junto con toda una
pléyade de reglas que forman parte de la técnica legislativa (Carbonell et al., 2000;

secuencial, a un texto que bifurca, que permite que el lector elija y que se lea mejor en una pantalla
interactiva. De acuerdo con la noción popular, se trata de una serie de bloques conectados entre sí por
nexos, que forman diferentes itinerarios para el usuario»” (Landow, 1995).
2
Su aparición fue anunciada como una verdadera revolución tecnológica que iba a cambiar el sentido de
las cosas, al combinarse con el hipertexto y la web (Bosak y Bray, 1992).
3
Como se ha dicho “XML favorece de modo particular el establecimiento de modelos de comercio de
empresa a empresa (business to business o B2B)”. Sin embargo, sobre el uso de sus posibilidades de
relación directa máquina a máquina y en consecuencia, de empresa a empresa, se han hecho afirmaciones
en un tono excesivamente grandilocuente (Marketing y Comercio Electrónico, 1999).

2
Colmo, 1961; Corona Ferrero et al, 1994; Gretel, 1986 y 1989; Martino, 2001; Muro
Ruíz, 2006; Pérez Bourbon, 2000 y 2007; Sáenz Arroyo, 1988; Sáinz Moreno y Silva,
1989; Balsega, 2009). Ésta constituye una materia que se incluye dentro de la
denominada Ciencia, Teoría o Doctrina de la Legislación y que trata del estudio de la
composición y redacción de las leyes y disposiciones jurídicas (Gretel, 1989, p. 11;
Martino, 2005, pp. 3-7).

En lo relativo a la forma y estructura de las leyes y textos normativos


articulados, la técnica legislativa establece criterios de organización que los
estandarizan. Usualmente, un criterio utilizado en España es el de organizar un
documento legislativo utilizando un esquema que recoge el Título, la cláusula de
promulgación, la Exposición de Motivos o Preámbulo y la Parte Dispositiva, que en la
práctica española se divide entre el texto articulado propiamente dicho y las
Disposiciones de la Parte Final (Gretel, 1989, p. 30). Vamos a efectuar una somera
mención a la estandarización de cada una de estas partes de la estructura, siguiendo a
Pablo Salvador Coderch y a su equipo de GRETEL, en su Curso de Técnica Legislativa
de 1989.

En cuanto al Título, posee una estructura patrón, de forma que incluye: el tipo de
norma (Ley Orgánica, Ley, Real Decreto Ley, etc.), el número correspondiente del tipo
de norma consecutivo del año en curso, tras una barra, el año en cuestión y la fecha, día
y mes, de promulgación y finalmente una denominación sintética de su contenido u
objeto (Gretel, 1989, pp. 30-31 y 49-71). Por ejemplo, la Ley Orgánica 4/2000, de 11 de
enero, sobre derechos y libertades de los extranjeros en España y su integración social,
la Ley 54/2007, de 28 de diciembre, de Adopción internacional o el Real Decreto-ley
20/2012, de 13 de julio, de medidas para garantizar la estabilidad presupuestaria y de
fomento de la competitividad. Lo que, en el primer caso significa que es la Ley
Orgánica número 4 del año 2000, promulgada el 11 de enero y que se refiere o tiene por
objeto la materia de derechos y libertades de los extranjeros y su integración social.
Además, si una ley es temporal, debe determinar en el título el período de su vigencia.
Así sucede, por ejemplo, con las leyes de presupuestos generales del Estado, por
ejemplo, la Ley 2/2012, de 29 de junio, de Presupuestos Generales del Estado para el
año 2012.

La Exposición de Motivos o Preámbulo tiene la finalidad de fijar unas


“disposiciones directivas”, colocadas al inicio del texto, tras el título, donde el
legislador debe hacer una explicación de la norma, su encuadramiento en el
ordenamiento jurídico, los antecedentes y los objetivos y finalidad de las disposiciones
recogidas en el texto legal (Gretel, 1989, pp. 74-102; Santaolalla, 1991, pp. 47-64). Su
contenido tiene valor jurídico, pues sirve como instrumento de interpretación de las
disposiciones normativas del texto.

La estructura estándar de la parte dispositiva divide el articulado de la ley en


Libros, Títulos, Capítulos (a veces con Secciones) y Artículos (Gretel, 1989, pp. 114-
134; Pau, 2009). No se permite pasar de una unidad de división a otra omitiendo una
intermedia, a excepción de las Secciones, que pueden omitirse.

Los artículos se numeran con cifras y en caso de que haya uno sólo se le
denominará “artículo único”. En cuanto a su división, los artículos están constituidos
por párrafos, numerados también a su vez con cifras, salvo que haya uno sólo, en cuyo

3
caso no lleva numeración. Por su parte, los párrafos pueden subdividirse, mediante el
uso de letras minúsculas dispuestas por orden alfabético. También se prevé la creación
de enumeraciones tabuladas, que recogen un listado encabezado por una fórmula
introductoria y, en su caso, con un inciso final.

Por último, las Disposiciones de la Parte Final se dividen en un máximo de


cuatro categorías, manteniendo el orden siguiente: Disposiciones Adicionales,
Disposiciones Transitorias, Disposiciones Derogatorias y Disposiciones Finales (Gretel,
1989, pp. 135-172). Estas categorías son típicas y cerradas, es decir, cada una de ellas
tiene sus particularidades y no cabe establecer otras categorías. Así, las Disposiciones
Adicionales incorporarán los regímenes jurídicos especiales que no se puedan colocar
en el articulado, los mandatos y autorizaciones que no se dirijan a la producción de
normas jurídicas y los preceptos secundarios que no puedan incorporarse en otro lugar
en el texto normativo. Las Disposiciones Transitorias incorporarán, como su
denominación indica, el Derecho transitorio especial aplicable a la norma, si no se le
aplican las reglas generales transitorias. Las Disposiciones Derogatorias determinarán
las normas vigentes que el nuevo texto deroga y hace inaplicables. Por último, la
Disposiciones Finales incluyen diversos tipos de normas, cláusulas sobre modificación
del Derecho vigente, cláusulas de salvaguardia, reglas de supletoriedad, mandatos y
autorizaciones normativos y las reglas sobre entrada en vigor de la ley y, en su caso,
plazo de vigencia.

Finalmente, hay que resaltar que, de igual modo, la modificación de las leyes se
lleva a cabo a través de “leyes modificativas”, con el sometimiento a principios de
modificación elaborados también en el marco de la técnica legislativa (Gretel, 1989, pp.
174-199).

Así mismo, es posible reconocer unas reglas de estructura en la jurisprudencia,


donde se pueden identificar una cabecera, un preámbulo, los antecedentes, los
fundamentos jurídicos, el fallo y los votos (Arellano y Nogales, 2009; Peri, 2009).

Todo ello ofrece ya una estandarización susceptible de ser utilizada para el


tratamiento informático. Además, podría llegar a entenderse que la estructura lógica de
los preceptos legales (Atienza, 1991; Hernández Marín, 2002), sus mismas
características (claridad, coherencia, consistencia, etc.) podrían facilitar también su
tratamiento digital. La lógica normativa persigue evitar que las leyes incurran en
incoherencias, que posean contradicciones, lagunas, redundancias, ignorancia de la
reglamentación a través de otros instrumentos normativos, de forma que la exigencia de
coherencia se predica tanto en el interior del texto legislativo aislado, como en el
conjunto del ordenamiento jurídico en el que se inserta, en tato que sistema jurídico.

El beneficio funcional que la tecnología aporta al Derecho en este campo podría


concretarse en el hecho de que puede ser útil, puede servir para el reconocimiento, la
interpretación, la determinación, la elaboración y la aplicación normativas. La
tecnología incluso sería capaz de permitir crear incluso un documento complejo (un
“hiperdocumento”) con toda la pluralidad de contenidos y de documentos jurídicos (los
conceptos, las categorías, los preceptos, las interpretaciones jurisprudenciales y
doctrinales, etc. e incluso con la posibilidad de generar variantes donde se oculte la
información sensible). Lo que permitiría reproducir, con la unión de todos los

4
elementos, la unidad y sistematicidad del sistema jurídico, las relaciones entre sus
proposiciones normativas (Arellano, 2005, p. 169).

Al respecto, el lenguaje XML ha demostrado ser el instrumento más adecuado


para suministrar estándares para los documentos jurídicos en formato digital. El XML
como lenguaje de marcado se ha convertido paulatinamente en el formato preferido para
modelar la información jurídica, de modo que su utilización en este entorno es tan
general que se puede hablar del XML como el metalenguaje estándar para los
documentos jurídicos.

¿Y hasta dónde llega la relevancia de estos cambios? La nueva metodología


digital tiene hoy en día para el Derecho, como se ha dicho, tanta importancia como la
imprenta tuvo en el pasado para la codificación (Ramos Núñez, 1992, p. 22). Si la
codificación limitó el horizonte jurídico del jurista, subordinando su actividad a los
Códigos, la nueva realidad digital abre otros horizontes. El Código representaba el
Proyecto de la Modernidad, ordenaba el mundo y organizaba la vida social a través de
un criterio de razón. Pero el Código entró en crisis por su incapacidad paulatina para
abarcarlo todo, a medida que la sociedad se hacía más compleja. Y la descodificación
ha supuesto la aparición de un sinfín de leyes especiales que han fragmentado la
realidad en “microsistemas legislativos” y han impuesto en cada parcela su lógica
singular, al margen de la lógica del Código (Irti, 1992).

En paralelo, por un lado, el Estado Nación, que era el sostenedor del Código, se
ha debilitado y, por otro lado, el universo tipográfico está siendo cuestionado por la
realidad electrónica; el periódico por los portales de Internet (los blogs y bitácoras) y el
libro por el hipertexto. Para comenzar, el hipertexto quiebra la linealidad del Código,
que en definitiva es un libro, al desaparecer la paginación y sustancialmente los títulos y
capítulos, ya que puede viajarse de un lado a otro a voluntad de un golpe de ratón y no
página a página.

Para continuar, el propio hipertexto tiene una virtualidad nueva, pues puede ser
capaz de reconstruir la unidad hasta ahora fragmentaria de la legislación y fomentar una
suerte de recodificación, de recomposición del orden perdido, a través de la articulación
informática. Pero además, es que la Web semántica abre nuevos caminos de
interrelaciones e interconexiones con transformaciones que en el campo del Derecho
están aún por explorar (Casanovas et al, 2010; Valvé et al, 2012). Y en la base de estas
transformaciones, como instrumento tecnológico básico que aporta sus posibilidades, se
halla el lenguaje XML.

III. DOCUMENTOS JURÍDICOS Y DOCUMENTOS XML

Puesto que el término documento es un concepto amplio, que puede referirse


tanto a los objetos o entidades intelectuales de un dominio (v.gr., los documentos
jurídicos que constituyen las fuentes del Derecho4) como a los objetos electrónicos que
se almacenan en los sistemas de información en calidad de representantes digitales de

4
Por fuente del Derecho nos referimos aquí exclusivamente a los ‘tipos o categorías de normas, que
configuran el ordenamiento jurídico y que se pueden distinguir por su origen o por el alcance de su
eficacia’’ (De Diego, 1915, pp. 33 y ss.; De Castro y Bravo, 1955, pp. 363 y ss.).

5
los primeros, merece la pena recuperar aquí, a los efectos que nos interesan, la
distinción que la recomendación FRBR, de IFLA (FRBR, 1998) hace entre obra (work),
expresión (expression) y manifestación (manifestation), puesto que permitirán entender
mejor la distinción entre ambas categorías y a qué tipo de objeto nos referimos en cada
caso:
Una obra es una entidad abstracta; no existe un único objeto que se
corresponda con una obra. Se accede a una obra a través de sus
realizaciones individuales o expresiones de la obra, pero la obra
realmente es el contenido común entre sus distintas expresiones. Cuando
se habla de la Iliada de Homero como una obra, aquello que se referencia
no es una recitación (lectura) o impresión concreta de la obra, sino la
creación intelectual a la que se accede a través de todas esas expresiones
de la obra5.

En nuestro interés, una obra es un documento jurídico, fuente del Derecho,


resolución, comentario, u otro, tal como a él se refieren sus usuarios, abstrayéndose del
formato o modo en que puedan acceder a ella, y las correspondientes representaciones
en formato digital, sea XML, ePub, pdf, etc. serían manifestaciones (manifestations).
Asimismo, aunque no entraremos en este capítulo a tratar este tema con detalle, las
diferentes versiones , bien históricas o en distintas lenguas (como ocurre en Cellar), de
cada fuente del Derecho se corresponderían con expresiones (expressions). Por ejemplo,
una obra (work) es la Constitución Española de 1978 (CE). La CE ha sido reformada
parcialmente en dos ocasiones: en 1992, con ocasión de la incorporación de España a
las Comunidades Europeas, que requirió una pequeña modificación del artículo 13.2,
referida al ejercicio del derecho de sufragio de los extranjeros en elecciones
municipales; la segunda reforma se produjo en 2011 y modificó el artículo 135
introduciendo el concepto de ‘estabilidad presupuestaria’. Cada una de estas reformas
dió lugar a diferentes versiones, esto es, expresiones. De cada una de estas versiones
existen múltiples representaciones, tanto en formato papel, .doc, .xml, ePub, etc.,
correspondiendo cada una de ellas a una manifestación diferente. A su vez, cada copia
de ellas, por ejemplo, cada ejemplar ePub distribuido constituye un ítem.

IV. TIPOS DE ESTRUCTURAS EN LOS DOCUMENTOS JURÍDICOS

Es posible distinguir dos tipos de estructura en los documentos: la estructura


lógica y la estructura física. La estructura lógica representa la división del documento
en objetos abstractos y la jerarquía de inclusión entre ellos. Es aplicable a la obra. En
España los textos legales poseen una estructura característica estandarizada, que es
manifestación de la importancia que ésta posee para el manejo y uso práctico de los
documentos jurídicos por los profesionales del Derecho. Tal como se indicó en el
apartado II, estos textos se articulan en libros, títulos, capítulos, secciones, artículos,
disposiciones, etc., elementos que se refieren a distintos bloques de contenido, cada uno
de los cuales puede tener su propio título y contener otros elementos. Por ejemplo, la

5
En su version original en inglés (la traducción es nuestra): “A work is an abstract entity; there is no
single material object one can point to as the work. We recognise the work through individual
realizations or expressions of the work, but the work itsel exists only in the commonality of content
between the various expressions of the work. When we speak of Homer’s Iliad as a work, our point of
reference is not a particular recitation or text of the work, but the intellectual creation that lies behind all
the various expressions of the work”.

6
Constitución Española, nuestra norma fundamental, consta de 10 títulos, dentro de los
que se organizan los 169 artículos que la componen, más once disposiciones, entre las
que podemos distinguir 9 transitorias, una derogatoria, y una disposición final.

La estructura genérica, que regula los elementos permitidos y las reglas de


inclusión entre ellos, común a todos los documentos similares (vgr., a todos los textos
legislativos), podría representarse con una gramática formal bien definida (Martínez,
2001). Los beneficios de disponer de la gramática asociada a una clase son múltiples,
pero uno de los más importantes es la posibilidad de disociar la semántica y contenido
de los documentos de los aspectos de formato aplicables a sus correspondientes
manifestaciones, a la vez que asociar al conjunto de la clase las instrucciones que
permiten dar formato a cualquier documento incluido en ella. Las herramientas de
edición pueden beneficiarse del conocimiento de la estructura lógica general en el
momento de la presentación de los documentos, para gestionar las inclusiones o
eliminaciones de elementos, para componer nuevos documentos a partir de los
existentes, o para definir las reglas de transformación entre documentos.

La estructura física, sin embargo, divide la representación visible en áreas


físicas, como por ejemplo páginas. La estructura física está fuertemente ligada al
dispositivo en el que se vaya a visualizar el documento, así por ejemplo, la estructura
física en páginas de un libro difiere entre su manifestación en formato papel y el ePub
correspondiente. En este capítulo no nos interesa tanto esta estructura, sino que nos
centraremos en la estructura lógica, asociada al documento jurídico, y las posibilidades
que ofrecen los lenguajes de marcas como XML para representarla y manipularla6. Nos
ocuparemos también del modo en que estas posibilidades han sido explotadas hasta el
momento, clasificando las aproximaciones realizadas, y abarcando tanto iniciativas
internacionales como iniciativas estrictamente españolas. No obstante, el énfasis se
pondrá en las iniciativas españolas, utilizando las iniciativas internacionales sobre todo
como referencias para nuestra comparación y análisis.

V. XML Y SU CAPACIDAD PARA APORTAR ESTRUCTURA

La capacidad de XML para aportar estructura es bien conocida desde que este
metalenguaje de marcado empezó a utilizarse. Una de sus bondades, con un amplio
impacto en su aceptación, es su extensibilidad, que permite definir marcas (elementos) a
medida de las necesidades de los usuarios. Los XML Schema (previamente las DTD),
sirven para definir la estructura general de una clase de documentos, a la cual deben
adaptarse todos los miembros de la clase. Así, podemos expresar a través de un
esquema las reglas de estructura para los textos normativos que nos proporciona la
técnica legislativa (comentadas en el apartado II de este mismo capítulo). En este
esquema se definen los tipos de elementos que pueden aparecer en los documentos
6
No obstante, no debemos olvidar que la fuerte tradición de la publicación en papel de algunos tipos de
documentos jurídicos, como la publicación en los Boletines Oficiales, supuso la costumbre de referirse a
elementos físicos, como las páginas de los boletines en los que algo se publica, que hoy se mantiene
plenamente vigente. No sabemos si los progresivos cambios que la introducción de la tecnología conlleva
(por ejemplo, desde el 1 de enero de 2009 los BOE han dejado de publicarse en papel) acabarán
provocando cambios también en estas costumbres. Así, podríamos imaginar fácilmente el uso de una
PURL (Permanent URL, que se distingue por su cualidad de permanencia: seguir siendo válida a pesar de
cambios en la ubicación física real del objeto) como referencia para la publicación en un Boletín en lugar
del número de página.

7
XML y las reglas de inclusión entre ellos. De este modo, XML se ha utilizado para dar
estructura a todo tipo de colecciones y documentos.

Ciñéndonos al campo que nos ocupa, el de los documentos jurídicos, podemos


encontrar numerosos ejemplos: Formex en la Oficina de Publicaciones de la Unión
Europea es el estándar que esta oficina utiliza para sus documentos XML; CEN Metalex
(www.metalex.eu) es un estándar para el intercambio de textos jurídicos, utilizado para
representar legislación del Reino Unido y de Holanda, AKOMA/NTOSO
(www.akomantoso.org), surgido a su vez como una evolución de NormaInRete en Italia,
define estándares XML para documentos legislativos, etc. En España, podemos
encontrar varios usos de XML para representar documentos jurídicos, tanto por parte de
editoriales jurídicas, instituciones oficiales, o en iniciativas de grupos de investigación.
En el volumen 15 de la revista Scire (Martínez y Vicente, 2009) se recoge un
compendio de iniciativas: SIDRA del gobierno de Asturias (Peri, 2009), el uso por parte
de la editorial LexNova (Escudero, 2009), y las propuestas de grupos de investigación
de la Universidad Carlos III (Arellano y Nogales, 2009), Universidad de Valladolid
(Martínez et al, 20097) y la Universidad de Murcia (de Andrés Rivero y Hernández,
2009). Además también encontramos otras iniciativas, algunas de las cuales aparecen
recogidas en otros capítulos de este libro, tales como el Estatuto de Aragón, cuyo portal
es objeto de atención en el capítulo 4, o la utilización de XML en el Tribunal
Constitucional, que incluiremos entre los ejemplos de este capítulo. Estas son sólo
algunas de las iniciativas que podríamos recoger, pero suficientes para ofrecer una
panorámica del estado actual de la cuestión en España.

Gracias a su capacidad para modelar estructura, XML permite organizar la


información. Por ejemplo, es posible representar en un documento XML la estructura,
esto es, composición, de una colección de textos. Un buen ejemplo de esta utilización lo
tenemos en el capítulo 7 de este mismo volumen, en cuya sección cuarta nos presentan
la utilización de XML para representar y almacenar la información de un Diario Oficial
(DO) de la Unión Europea y los Reglamentos y Decisiones que en él aparecen. En este
caso no sólo se almacena el contenido de los textos normativos, que son de hecho el
tercer fichero XML mostrado en el ejemplo, sino que los dos primeros sirven para
estructurar el contenido del DO y guardar una serie de metainformación, de carácter
bibliográfico principalmente, que describe el propio diario, y también cada uno de los
textos normativos, tales como fechas, fuente productora, etc. (para más detalle ver la
descripción incluida en el capítulo 7). Este uso para almacenar metainformación
bibliográfica, o específica, viene siendo relativamente habitual. También podemos
encontrarlo en las distintas iniciativas internacionales referenciadas anteriormente, o en
las propuestas realizadas por los correspondientes grupos de la Universidad de Murcia,
de la Universidad Carlos III, o de la Universidad de Valladolid, para representar los
textos jurídicos.

7
En el caso de la propuesta de la Universidad de Valladolid, su origen está en la tesis doctoral codirigida
por el Dr. Pablo de la Fuente Redondo, de la Universidad de Valladolid, y el Dr. Jean-Claude Derniame,
del INRIA, que fue defendida en los correspondientes centros de España y Francia en abril y septiembre
de 2001, respectivamente, bajo los títulos «Principios para la explotación dinámica de relaciones entre
documentos en las bibliotecas digitales: aplicación al entorno jurídico» y «Principes d’explotation
dynamique des relations inter-documents dans les bibliothèques électroniques: application au domaine
juridique».

8
1. Criterios diferenciadores
Las diferencias entre las propuestas debemos buscarlas en dos aspectos,
relacionados con el modo en que se organizan el contenido y la metainformación. Por
un lado, un grupo de propuestas optan por almacenar conjuntamente la metainformación
y el contenido en un documento XML. Un ejemplo de esta solución lo tenemos en
CRONOLEX, en la universidad de Murcia, cuyo documento XML contiene dos
elementos principales: un elemento ‘metainformacion’ para almacenar la
metainformación y un elemento ‘articulado’ para almacenar el contenido. También en
FORMEX, de la UE, y en la propuesta del Tribunal Constitucional se opta por esta
solución consistente en almacenar conjuntamente metainformación y contenido en el
mismo documento XML. En una segunda aproximación se elige separar el contenido de
la metainformación. Un ejemplo de esta solución lo tenemos en la propuesta que
realizamos desde la Universidad de Valladolid a comienzos de la década de 2000,
donde se almacena la información sobre las referencias y otras relaciones entre textos
legislativos como documentos XML separados, aunque relacionados. En ambas
categorías podemos encontrar varios ejemplos, aunque es difícil encontrar una
propuesta ‘pura’; la mayoría no incluye toda la metainformación junto al contenido,
pero tampoco almacena estrictamente contenido en un documento XML.

El segundo aspecto que aporta diferencias entre unas y otras propuestas es el


vocabulario elegido, esto es, los elementos utilizados en los documentos XML. Estos
elementos son los que aparecen en las definiciones de esquemas correspondientes, así
como los valores que los atributos pueden tomar en algunos casos, para lo cual se
remiten a ontologías y sistemas de organización del conocimiento, como SKOS, que
aportan el conjunto de posibles valores y su semántica. Sobre las ontologías no vamos a
incidir aquí, puesto que están ampliamente desarrolladas en otros capítulos, como los
capítulos 4 y 5, además de tener ejemplos de su utilización combinada con SKOS en el
sistema Cellar de la UE (capítulo 7).

En lo que se refiere a los elementos elegidos (marcas XML), debemos recordar


que esta elección de diseño se realiza en función de la perspectiva de cada sistema de
información. No son las mismas las propuestas realizadas bajo el amparo de CEN
MetaLex (Boer et al, 2002), o del proyecto AKOMA/NTOSO (Palmirani y Brighi, 2002),
que la realizada por la propia Oficina de Publicaciones de la UE, incluso cuando se trata
de representar textos normativos comunitarios. Por otro lado, las propuestas en España
deben adaptarse a nuestro propio sistema de fuentes, así como, tal como se ha indicado,
a la perspectiva de cada uno de los sistemas de información. Esto nos lleva a tomar en
cuenta la propia estructura y características de los textos jurídicos y su impacto en el
diseño de esquemas XML realizados en nuestro país.

2. Esquemas (XML) para textos jurídicos en España


Ya indicamos que los textos jurídicos suelen tener una estructura bien definida,
la cual se explota de diversos modos, tanto por los usuarios finales como por aquellos
que los manipulan durante su creación y edición. Así, por ejemplo, la estructura de una
sentencia nos diferencia claramente entre una parte de fundamentos de hecho y una
parte de fundamentos de derecho, de modo que las mismas tienen una relación directa
con el tipo de información que cada una contiene, y cómo debe ser en consecuencia
analizada y entendida por aquellos que utilizan la sentencia. Esta estructura será
posteriormente utilizada al referirse a ella; por ejemplo, un profesor de Derecho puede

9
indicar a sus alumnos que utilicen un determinado fundamento jurídico de una sentencia
para realizar un ejercicio práctico, o a su vez puede ser invocados en sentencias
posteriores o recursos. Es evidente el interés que tiene disponer de esta misma estructura
en el formato electrónico y poder explotarla de forma grácil, para ser enviados por
nuestras aplicaciones de modo inmediato a la parte o partes que nos interesan
(imaginemos al alumno que realiza la práctica y pretende dirigirse directamente a
aquellos fundamentos que su profesor le ha indicado debe utilizar), navegar por ellas en
los índices de contenidos, o a través de las referencias, o poder obtener la
metainformación asociada tanto al documento que la contiene como aquella otra
específica de la parte que nos interesa. Esto será posible si la representación electrónica
del texto es capaz de aportar esa misma estructura a las aplicaciones que nos ofrecen las
interfaces de usuario.

En la figura 1 mostramos un par de extractos de documentos XML que se han


utilizado para representar textos normativos españoles. El fragmento del recuadro
situado a la izquierda procede de la propuesta hecha desde la Universidad de Valladolid
(Martínez et al, 2009), mientras que el texto del recuadro situado a la derecha procede
de los textos utilizados por el sistema CRONOLEX, desarrollado desde la Universidad
de Murcia8 (Rivero y Hernández, 2009) . Como se puede comprobar las propuestas
muestran diferencias en sus elementos, tales como la utilización del elemento
‘CuerpoArticulo’ usado en Cronolex, que no es utilizado en Valladolid. Pero ambas
propuestas coinciden en la elección de trasladar al documento XML la estructura lógica
del texto legal, siendo así que en ambas, si bien se habían desarrollado de modo paralelo
e independiente, se utilizan elementos de tipo ‘articulo’ para delimitar cada artículo del
texto jurídico.

Otro ejemplo de uso de XML en nuestro país, en este caso para resoluciones
judiciales, lo encontramos en el Tribunal Constitucional (TC). En este caso nos
encontramos con el uso combinado de dos esquemas, uno más sencillo referido
principalmente al contenido de las sentencias, y otro en el que se incluyen los análisis
hechos por el servicio de Doctrina Constitucional del Tribunal Constitucional. Los
documentos XML se almacenan en un gestor de contenidos, que es el que soporta la
página web a través de la cual es posible acceder a las resoluciones de este tribunal. El
esquema ampliado es un interesante ejemplo, donde se combinan el uso de XML para
almacenar información estructurada, como son los metadatos (vgr., tipo, número y año
de la resolución, fecha de registro, referencia en el BOE, un resumen, etc.), y también se
refleja la estructura lógica de las resoluciones en los elementos XML: antecedentes,
fundamentos, dictamen, pie, y votos particulares. El ejemplo de la figura 2 es un
pequeño extracto de un documento XML utilizado por el Tribunal Constitucional para
la publicación de las resoluciones que nos ha sido facilitado para esta publicación.

8
Texto original disponible en la presentación hecha por los autores en el I Simposio sobre XML
Legislativo en España. Disponible en http://www.infor.uva.es/xmleg/files/SimposioXML-Cronolex.pdf

10
... ...
<doc> <Articulo id="1">
<title>Real Decreto 685/1982, de 17 de <Tit>Artículo único.</Tit>
marzo, por el que se desarrollan determinados <CuerpoArticulo>
aspectos de la Ley 2/1981, de 25 de marzo, de <Apartado id="1.1">
Regulación del Mercado Hipotecario.</title> <Tit></Tit>
<capitulo id="c1"><head>CAPÍTULO I. <CuerpoApartado>
LOS EMISORES.</head> <Enunciado id="1.1.1">
<seccion id="c1s1"><head>SECCIÓN I. <Cuerpo>
EN GENERAL.</head> Se da nueva redacción al apartado 1 del
<articulo id="a1"><head>Artículo 1. El artículo 7 del Real Decreto 1451/1983, de 11
mercado hipotecario.</head> de mayo, con el siguiente contenido:
<p>El mercado hipotecario, regulado por la <Modifica
Ley 2/1981, de 25 de marzo, tiene por objeto xlink:href="urn:um:RD1451/1983@7.1
la negociación de los títulos emitidos por las “fecha="19990127">
Entidades a que se refiere el artículo siguiente, Las empresas que contraten por tiempo
con la cobertura de los créditos hipotecarios indefinido y a jornada completa a trabajadores
concedidos por las mismas, siempre que unos minusválidos, tendrán derecho a una
y otras reúnan las condiciones establecidas en subvención ... se reducirá proporcionalmente a
este Real Decreto.</p> la jornada pactada.
</articulo> </Modifica>
...

Figura 1. Dos fragmentos de textos normativos con XML procedentes de dos propuestas distintas:
Universidad de Valladolid y CRONOLEX, de la Universidad de Murcia.

...
<resolucion>
<tipo_resolucion>SENTENCIA</tipo_resolucion>
<numero_resolucion>235</numero_resolucion>
<anno_resolucion>2007</anno_resolucion>
<bis>0</bis>
<fecha_registro>07/11/2007</fecha_registro>
<numero_registro>5152-2000</numero_registro>
<idioma>ES</idioma>
<sintesis_descriptiva>Planteada por la Sección Tercera de la Audiencia Provincial de
Barcelona respecto al artículo 607.2 del Código penal.</sintesis_descriptiva>
<sintesis_analitica>Vulneración del derecho a la libre expresión: sanción penal de la
difusión de ideas o doctrinas que nieguen o justifiquen delitos de genocidio. Nulidad parcial e
interpretación de precepto legal. Votos particulares.</sintesis_analitica>
...
<publicada_integra>1</publicada_integra>
<referencia_boe>BOE-T-2007-21161</referencia_boe>
<numero_boe>295</numero_boe>
<fecha_boe>10/12/2007</fecha_boe>
...
<antecedente>
<numero>2</numero>
<texto>Los antecedentes de la cuestión, según resulta del Auto de
planteamiento y de la documentación adjunta, son los siguientes:
a) Con fecha de 16 de noviembre de 1998, el Juzgado de lo Penal núm. 3 de Barcelona dictó una
Sentencia ...

Figura 2. Extracto de una resolución del Tribunal Constitucional.

11
3. El criterio de la especificidad y la multiplicidad de esquemas

Nuevamente, existe un criterio que nos permite realizar una división de las
propuestas existentes en dos categorías: aquellas que optan por unificar bajo un único
esquema una estructura que ‘cobije’ al mayor número posible de textos, y aquellas que
optan por crear múltiples esquemas, adaptados cada uno de ellos específicamente a un
subtipo de documentos. Lógicamente, en el primer caso nos encontramos ante esquemas
más complejos y flexibles, puesto que han de dar cobertura a un mayor abanico de
diversas estructuras en los textos, mientras que en la segunda orientación cada uno de
los esquemas propuestos limitará más las variedades en la estructura permitidas y será
más específico para un concreto conjunto de documentos. ¿Cuál es mejor? No existe un
criterio que de modo rotundo nos permita decidir entre una y otra aproximación. Pero sí
podemos indicar qué opciones se han tomado en cada caso y dejar que el lector decida
cuál aplicar en cada caso.

Un esquema para dar cobijo a una amplitud de documentos

Esta es la opción más ampliamente seguida. Como ejemplo encontramos CEN


Metalex (www.cenmetalex.org), una propuesta para unificar bajo un esquema global
una representación unificada de la legislación internacional. También es interesante fijar
la atención en Formex, la propuesta de la Oficina de Publicaciones de la Unión Europea,
utilizada para representar los distintos ‘content types’ que se manejan en los sistemas de
información asociados9.

También tenemos en esta línea la propuesta adjunta a CRONOLEX y la de la


Universidad de Valladolid para los textos normativos españoles. Asimismo la realizada
por el grupo de investigación de la U. Carlos III y la del sistema SIDRA en Asturias. Y
en último término podemos referirnos a la propuesta realizada por el Tribunal
Constitucional para las sentencias. En este último caso, aunque pueda parecer que el
hecho de usar dos esquemas se correspondería con dos tipos de sentencias diferentes, en
realidad la diferencia no estriba en el tipo de documento para el que se utiliza, sino en la
cantidad de información aportada junto al contenido. Así, el primero, más sencillo, se
utiliza para los documentos XML que recogen únicamente el contenido de las
sentencias, autos y declaraciones publicados en la web del Tribunal Constitucional.
Mientras que el segundo, ampliado, incorpora además del texto los análisis,
categorizaciones y dependencias de otra información que realiza el Servicio de Doctrina
Constitucional de este Tribunal.

Múltiples esquemas, adaptados a las especificidades de un conjunto de documentos

Este es el caso de la propuesta NormaInRete en Italia (Palmirani y Brighi, 2002)


y lo era también de la propuesta hecha en su día para el Parlamento de Tasmania
(Arnold-Moore y Clemes, 2000). En la primera, que en su momento fue adoptada como
un estándar por el Parlamento Italiano para la producción de sus textos normativos, se
proponía el uso de varias DTD diferentes para representar otros tantos tipos de
9
Official Journal of the European Union (OJ), Treaty, International Agreement, Legislation –incluye
Regulations, Directives, Decisions, Other Acts, Agreements with no-member states or international
organizations, Agreements between Member States, Acts of bodies created by international agreements--,
Preparatory Acts –varios subtipos--, Case Law –judgement, order, court’s opinion, Advocate General’s
opinion--, Parliamentary questions, y consolidation of legislation).

12
información. Esta visión fue trasladada al proyecto AKOMA/NTOSO, que recogió el
testigo del proyecto NormaInRete, donde se propone un esquema general junto a un
conjunto de esquemas particulares (custom schemas) para los tipos de legislación de
cada país participante en el proyecto. En nuestro país no encontramos esta orientación
en niguna propuesta pública a la que hayamos podido acceder.

VI. EXPLOTACIÓN DE LA ESTRUCTURA EN LOS DOCUMENTOS XML

Las posibilidades de explotar la estructura son diversas, y en muchos casos


consisten en trasladar al tratamiento informático aquellas tareas que han venido
realizandose con anterioridad de modo manual en el entorno jurídico. Entre ellas, la más
conocida por la amplia aceptación que este modo de difundir información tiene, se
encuentra la construcción de páginas web, con índices de contenidos, que permiten
navegar del índice al contenido y viceversa de modo sencillo a través de los enlaces. Ya
hemos hablado anteriormente de las ventajas y propiedades del hipertexto. Esta
posibilidad podemos encontrarla en múltiples servidores.

A partir de los documentos XML es posible construir de modo automático las


páginas web que nos interesa servir al usuario, aplicando unas reglas de transformación
que permiten pasar de uno a otro ‘formato’10. Así encontramos procesos de generación
automática de grandes volúmenes de documentos en la Oficina de Publicaciones de la
Unión Europea. O podemos visitar la página web del Tribunal Constitucional y acceder
a la representación HTML de las sentencias de este Tribunal obtenida a partir de los
documentos XML (manifestaciones) correspondientes. También podemos encontrarnos
con esta posibilidad en distintos servidores de información jurídica disponibles (el
capítulo 1 ofrece una amplia panorámica del uso de XML en los servidores de
información jurídica). Y últimamente podemos observar cómo a partir de un contenido
original es posible generar diversas representaciones en formatos adaptados a los
dispositivos con los cuales estemos accediendo a los servidores que albergan los
documentos (por ejemplo, las necesidades de presentación difieren con un ordenador
portátil de una tablet o un smartphone). En estas tareas ayudan los gestores de
contenidos, que permiten almacenar documentos XML y asociar formatos de
presentación diversos en función del usuario o dispositivo de destino. Ésta es, por
ejemplo, la opción seguida en el sitio web del Tribunal Constitucional.

Otras posibilidades, menos conocidas, pero no por ello menos útiles, son las que
están relacionadas con procesos que permiten generar nuevo contenido. Entre ellas,
destaca la que permite automatizar la consolidación de textos legislativos, tratada con
detalle en el capítulo 3. Esta tarea, para la cual es necesario en muchos casos conocer y
manejar la estructura de los documentos afectados por las modificaciones, ha sido
abordada por algunos grupos de investigación, en cuyos esquemas ha pesado
notablemente la finalidad de esta tarea. En concreto, y limitándonos al contexto español
nos podemos referir al esfuerzo realizado desde la Universidad de Murcia con el sistema
CRONOLEX y a la propuesta hecha desde la Universidad de Valladolid. Pero también
hay interesantes propuestas y trabajos internacionales --véase por ejemplo, el interesante
artículo publicado por Grandi, Mandeoli y Tiberio (2005) al respecto--.

10
En rigor, deberíamos referirnos a esquema, puesto que el formato no varía necesariamente, ya que en
muchos casos tanto los documentos originales como los finales son XML.

13
Debe decirse que una automatización total del proceso de consolidación no se ha
conseguido aún, puesto que las modificaciones son a su vez de diversos tipos, y no
todas ellas se refieren a la estructura (encontramos un ejemplo extremo en la
Disposición Derogatoria de nuestra Ley Fundamental, que en su número tercero dispone
que ‘quedan derogadas cuantas disposiciones se opongan a lo establecido en esta
Constitución’, lo cual, obviamente, supone un criterio estrictamente semántico, sin
ninguna vinculación con la estructura). No obstante, el valor de la consolidación
automática es innegable, como demuestra el continuo esfuerzo que en este campo se
sigue realizando, también a nivel internacional, donde destacan actualmente los trabajos
realizados en el Reino Unido para el servidor legislation.gov.uk (Sheridan y Tennison,
2010) y en Holanda a través del servidor Metalex (Hoekstra, 2011).

Además la consolidación suele venir acompañada de la provisión de


metainformación relacionada con las modificaciones, tal como los datos del
modificador o el tipo de modificación. En las propuestas más recientes, esta
información, que venía siendo codificada en documentos XML, bien junto al
documento modificado (CRONOLEX), bien de modo independiente (Valladolid), está
migrando a RDF, que permite toda la explotación semántica referida en los capítulos 4 y
5. No obstante, es conveniente recordar aquí que RDF no es un estándar que compita
con XML, puesto que ambos forman parte de la ‘pila de la Web Semántica’ propuesta
por Tim Berners-Lee y el W3C, de modo que XML aporta la sintaxis y RDF la
semántica (éste es un modo simplificado de expresarlo, pero nos permitirá entender o
intuir la diferencia sin adentrarnos en una explicación detallada de ambos estándares).
De hecho, los grafos RDF suelen representarse en formato RDF/XML, esto es, de todas
las formas posibles de representar un grafo RDF (XML, JSON, N3, ...) el elegido para
intercambiar documentos RDF entre aplicaciones suele ser XML. Esta metainformación
da soporte a consultas históricas acerca de la evolución de un documento y las
modificaciones que ha sufrido. Unos interesantes ejemplos de uso de RDF los podemos
encontrar en el capítulo sobre el sistema Cellar de la UE (capítulo 7).

Otra de las posibilidades a las que ya nos hemos referido anteriormente es la de


explotar las relaciones entre textos que hacen alusión a la estructura. El tipo de relación
donde esta posibilidad cobra mayor relevancia en nuestra opinión son las referencias
cruzadas, tan frecuentes en los textos jurídicos, en las cuales es frecuente aludir a un
fragmento o fragmentos concretos de un texto (recuérdese el ejemplo que poníamos
anteriormente donde un profesor indica a sus alumnos con qué fundamentos jurídicos
debe trabajar para realizar una práctica; en el informe que el alumno presente, hará a su
vez alusión al fundamento o fundamentos concretos a los que en cada caso se refiera su
argumentación).

Aunque los ejemplos hasta aquí señalados son suficientes para hacernos una idea
del interés que manipular la estructura tiene y de las amplísimas posibilidades que XML
abrió al respecto, no son las únicas. Puede usarse para facilitar la comparación de textos,
para hacer notas u observaciones sobre elementos concretos, para aportar información
sobre cada uno de ellos (un ejemplo, aplicado a la CE, está accesible para los
navegadores de Linked Data en la PURL http://purl.org/xmlegUVa/CE_1978), para
generar distintas vistas donde se evite mostrar información sensible en función del tipo
de usuario (Arellano y Nogales, 2009), etc.

14
VII. LA OBTENCIÓN DE LA ESTRUCTURA Y SU TRASLACIÓN A LAS MANIFESTACIONES
XML

Como ya hemos indicado, es posible reflejar la estructura lógica de los


documentos jurídicos en sus correspondientes manifestaciones XML. La cuestión que
ahora abordamos es cómo obtener o crear estos documentos XML. Existen dos
aproximaciones que condensan las distintas propuestas hechas al efecto.

La primera consiste en hacerlo de modo simultáneo al proceso de creación del


documento jurídico. Esto es, utilizar editores que permitan redactar el contenido y darle
simultáneamente estructura. El usuario configura la estructura usando la funcionalidad
del editor, construido o adaptado expresamente para este tipo de edición, el cual va
creando simultáneamente una representación XML del texto editado, cuyas etiquetas
reflejan las selecciones del usuario creador de contenido. Esta es la propuesta hecha en
el marco del proyecto NormaInRete y su sucesor, Akoma Ntoso. En nuestro país
también fue utilizada en el marco del proyecto CRONOLEX de la Universidad de
Murcia.

La segunda alternativa consiste en partir del contenido, y realizar un análisis


encaminado a reconocer su estructura, que será reflejada en un documento XML que se
genera como salida del proceso. Este proceso, relacionado con la extracción de
información en textos, muy utilizada para extraer metainformación o resúmenes a partir
del contenido, es posterior a la edición, y toma como entrada un documento ya
disponible en algún otro formato. Esta es la aproximación que tomamos en la
Universidad de Valladolid.

VIII. XML, RDF Y JSON

Como indicamos, XML y RDF forman parte de la ‘pila de la Web Semántica’


propuesta por Tim Berners-Lee y el W3C11. RDF es un estándar concebido para
describir recursos y, en este sentido, es fácil concebir la posibilidad de modelar los
metadatos de los documentos jurídicos con RDF. Por ejemplo, para el caso de
sentencias, podríamos considerar cada sentencia o auto como un recurso que queremos
describir. Sus metadatos serían las propiedades que adornan el recurso. También cada
voto particular, o fundamento, podría ser a su vez un recurso. Otro ejemplo lo podemos
ver en la figura 4. En este caso el recurso descrito es la Constitución Española de 1978.
Se trata de la descripción disponible en la PURL http://purl.org/xmlegUVa/CE_1978
mencionada en la sección VII. A su vez, cada uno de sus elementos, o partes, es
considerado un recurso, y esta relación de inclusión entre ellos se representa como una
propiedad, en ambos sentidos (hasPart / isPartOf). Al igual que sugeríamos con las
sentencias, los metadatos (título, fecha, etc.), se han descrito con propiedades (escogidas
en este caso entre vocabularios que se reutilizan). En la figura se muestra un mínimo
extracto del grafo RDF, el cual contiene algo más de 2600 tripletas. El código XML
correspondiente se puede ver en la figura 5.

11
Para un conocimiento mejor de la Web Semántica y sus posibilidades pueden consultarse las siguientes
publicaciones: (García, 2009) y (Antoniou y Harmelen, 2010).

15
Como se sabe, una de las formas de implementar o representar un grafo RDF es
mediante RDF/XML, lo que nos llevaría a una utilización de XML diferente a la vista
en este capítulo, donde la estructura vendría determinada por la relación entre los
componentes del grafo que hemos representado (nodos y arcos). La utilización de RDF
no es óbice para combinarlo con un XML para el contenido donde se refleje la
estructura del documento jurídico tal como hemos indicado en este capítulo. De hecho,
prueba de ello es el uso combinado de Formex y RDF en Cellar, o en otros sistemas
como legislation.gov.uk o Metalex, de los cuales hemos hablado con anterioridad.

Por su parte, JSON es un formato alternativo a XML, aparecido con


posterioridad a éste, para aligerar el tamaño de los mensajes XML que se intercambian
entre sistemas informáticos. Su utilidad es proporcionar la misma información en un
espacio más reducido (archivos o mensajes más cortos, con menos bytes, esto es, menos
‘pesados’ durante una transmisión). Esto lo hace a su vez más críptico que XML, y más
parecido a los lenguajes de programación. Lógicamente, su ventaja es que permite una
transmisión de datos más rápida que XML, precisamente debido al menor tamaño de los
mensajes. No obstante, como se ha indicado, esta ‘ligereza’ se consigue a cambio de
renunciar a capacidad expresiva.

Figura 4. Grafo RDF para describir la Constitución Española de 1978.

16
...
<?xml version="1.0"?>
<rdf:RDF xmlns:frbr="http://purl.org/vocab/frbr/core#"
xmlns:CExmleg="http://purl.org/xmlegUVa/CE_1978/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:bibo="http://purl.org/ontology/bibo/"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:derecho="http://purl.org/derecho/vocabulario#"
...>

<derecho:NormaJuridicaEspanola rdf:about="http://purl.org/xmlegUVa/CE_1978/">
<rdf:type rdf:resource="http://purl.org/ontology/bibo/LegalDocument" />
<rdf:type rdf:resource="http://purl.org/ontology/bibo/Legislation" />
<rdfs:comment xml:lang="es">Aprobada por las Cortes en sesiones plenarias del
Congreso de los Diputados y del Senado celebradas el 31 de octubre de 1978. Ratificada
por el pueblo español en referéndum de 6 de diciembre de 1978. Sancionada por S. M. el
Rey ante las Cortes el 27 de diciembre de 1978.</rdfs:comment>
<rdfs:label xml:lang="es">Constitución española de 1978</rdfs:label>
<dcterms:date>1978-12-06</dcterms:date>
<dcterms:title xml:lang="es">Constitución española de 1978</dcterms:title>
<dcterms:coverage rdf:resource="http://dbpedia.org/resource/Spain" />
<dcterms:valid>1978/12/06-</dcterms:valid>
<owl:sameAs rdf:resource="http://dbpedia.org/resource/Spanish_Constitution_of_1978" />
<rdfs:seeAlso rdf:resource="http://www.infor.uva.es/~mercedes/CE_1978.xml" />
<frbr:realization rdf:resource="http://www.infor.uva.es/~mercedes/CE_1978.xml" />
<metalex:fragment>
<rdf:Description rdf:about="http://purl.org/xmlegUVa/CE_1978/Preambulo">
<dcterms:title xml:lang="es">Preámbulo</dcterms:title>
<rdfs:label xml:lang="es">Preámbulo</rdfs:label>
...
<dcterms:isPartOf rdf:resource="http://purl.org/xmlegUVa/CE_1978/" />
</rdf:Description>
</metalex:fragment>
...

Figura 5. Texto RDF/XML correspondiente al grafo de la figura 4.

Por ejemplo, si observamos los ejemplos que ofrecen en


www.json.org/example.html podemos comprobar rápidamente al comparar la
representación XML y JSON del mismo mensaje que en la última se ha perdido la
distinción entre atributos y elementos, que sí está en la primera. Esto, en el caso de
documentos jurídicos es relevante, puesto que la distinción entre atributos y elementos
ha sido utilizada para representar con los primeros propiedades o metadatos del
contenido (del documento jurídico), mientras que los elementos se reservaban para el
contenido en sentido estricto. Esta pauta era en sí misma una buena guía para las
aplicaciones que manipulan los documentos, aún siendo éstas genéricas, como editores
y parsers XML, puesto que el tratamiento que estas aplicaciones dan a elementos XML
y sus atributos suele diferir en todo caso. Habremos, por tanto, de evaluar
cuidadosamente ambos extremos de la balanza –expresividad, ligereza—antes de optar
por una alternativa.

17
IX. CONCLUSIONES

La capacidad de XML para representar estructura lo convirtió desde sus inicios


en un candidato ideal para los documentos jurídicos. Estos últimos son documentos que
ofrencen un interés singular, ya que aparecen como especialmente adecuados para
usarlos con XML, puesto que además de ser muy estructurados, tienen la cualidad
particular de la relevancia que esta estructura tiene en todo el proceso de su
manipulación por parte de los usuarios, siendo esto cierto en grado tal que nos es difícil
encontrar otro entorno cuyos usuarios manejen con tanta asiduidad y soltura la
estructura de los documentos que utilizan como en éste.

Esto motivó numerosas propuestas, tanto nacionales como internacionales, para


representar documentos jurídicos con XML, y sigue siendo actualmente la
aproximación generalmente utilizada, también por su versatilidad a la hora de generar
nuevos documentos a partir de los existentes, transformarlos a otros formatos, y en
definitiva, de crear procesos que producen múltiples y diversas salidas tomando como
entrada las manifestaciones XML de los documentos jurídicos.

En estas diversas propuestas observamos una tendencia acusada con el paso del
tiempo a reflejar en las etiquetas o marcas XML la estructura lógica de los documentos
que utilizan los usuarios. Así, en el caso de nuestra legislación, podemos encontrar
elementos XML que se corresponden con los tipos de elementos del articulado en las
distintas propuestas. Otro tanto podemos decir de las sentencias y resoluciones jurídicas.
Las principales diferencias entre unas y otras propuestas las encontramos en el nivel de
detalle elegido en la representación (cuántos tipos de elementos distintos considera el
esquema propuesto), o en los metadatos asociados y su representación con XML.

La llegada de estándares como RDF, o JSON, nos ofrecen alternativas para


representar los metadatos, o el propio documento XML en el segundo caso. En lo que al
primero se refiere, como hemos indicado previamente en este mismo capítulo, su
utilización es en realidad complementaria de la de XML, como así vemos en los
diversos proyectos que hemos mostrado y que utilizan esta posibilidad. Respecto a
JSON, como también indicamos en la sección VIII, su idoneidad como alternativa a
XML para textos jurídicos nos suscita algunas dudas, por las razones allí expuestas.
Asimismo, hasta donde conocemos, no somos conscientes de ningún desarrollo a gran
escala, ni nacional ni internacional, donde se haya optado por JSON como sustituto de
XML para la representación de textos jurídicos.

Finalmente, cabe preguntarse sobre la disponibilidad de las representaciones


XML de los documentos jurídicos desde las fuentes de producción, como son
principalmente en algunos de estos tipos de documentos, las instituciones públicas. En
este punto pensamos en instituciones tan relevantes en nuestro país como son el
Congreso y el Senado, cuya web ha sido renovada recientemente, con particular eco en
los medios de prensa nacionales12. Significativamente, se esperaría encontrar en estas

12
La nueva web del Senado fue renovada por más de 437.000 euros y puesta en funcionamiento el 12 de
noviembre de 2012. Al respecto pueden consultarse diversas noticias de prensa en variados medios:
http://tecnologia.elpais.com/tecnologia/2012/11/28/actualidad/1354095742_842570.html,
http://www.abc.es/20121112/espana/abci-senado-nueva-
201211121026.html,http://www.elmundo.es/elmundo/2012/10/14/espana/1350210350.html,http://es.wiki
pedia.org/wiki/Senado_de_Espa%C3%B1a#Pol.C3.A9mica_por_la_nueva_p.C3.A1gina_web, etc.

18
nuevas web referencias sobre el uso de XML, los vocabularios elegidos, y los esquemas
que sirven para representar los textos y sus metadatos, algo que sí hemos encontrado sin
dificultad en la web de la Oficina de Publicaciones de la UE (la documentación sobre
FORMEX está accesible online, a través de la propia web), o en el caso italiano, donde
la propuesta surgida a partir de NormaInRete fue adoptada como estándar en este último
país. Sin embargo, no ha sido así, los metadatos utilizados no están disponibles en
ningún formato abierto que cumpla la propuesta de la iniciativa de Datos Abiertos, ni
existe documentación sobre ellos o los esquemas utilizados. Consideramos deseable
que en un futuro próximo la pauta marcada por la Oficina de Publicaciones de la UE sea
un modelo a seguir en estas instituciones.

En último término, como dijimos, el uso de las tecnologías XML supone para el
Derecho una transformación tan relevante como la que tuvo la imprenta en su época.
Una mutación capaz de reproducir, con la unión de todos los elementos, la unidad y
sistematicidad del sistema jurídico, las relaciones entre sus proposiciones normativas.
Capaz, de algún modo, de recomponer, a través de la articulación informática y de la
interrelación de los elementos fragmentados por la descodificación, una parte del orden
perdido.

REFERENCIAS

Alvite Díez, M. L. (2009). Las bases de datos jurídicas y el uso del lenguaje XML en España.
// Scire: Representación y Organización del Conocimiento. 15:1 (2009) 33-58.

Andrés Rivero, J.; Hernández Marín, R. (2009). Cronolex: Sistema para la representación
dinámica de cuerpos legales. // Scire: Representación y Organización del Conocimiento.
15:1 (2009) 133-147.

Antoniou, G.; Van Harmelen, F. (2010) Manual de Web Semántica (A Semantic Web Primer,
MIT Press, 2008, 2ª ed.). // Traducción y edición de Nuria Casellas y Manuel Atencia,
Colección La Razón Áurea, Granada: Comares.

Arellano Pardo, M.C., Aportaciones de la Técnica Legislativa y XML a la Informática


Jurídica Documental, Universidad Carlos III de Madrid/Boletín Oficial del
Estado, Madrid, 2005.

Arellano Pardo, M. C.; Nogales Flores, J. T. (2009). Lenguajes de marcado y


documentación jurídica: experiencias del grupo TecnoDoc de la UC3M// Scire:
Representación y Organización del Conocimiento. 15:1 (2009) 149-172.

Arnold-Moore, T.; Clemes, J. (2000). Connected to the Law: Tasmanian Legislation Using
EnAct. // Journal of Information, Law and Technology (JILT). 1 (2000).
http://www2.warwick.ac.uk/fac/soc/law/elj/jilt/2000_1/arnold/ (2013-01-10).

Atienza, M. (1991), «Robert Alexy: la argumentación jurídica como discurso racional»,


en Las razones del Derecho. Teorías de la argumentación jurídica, Centro de
Estudios Constitucionales, Madrid.

19
Balsega García-Escudero, P. (2009). Materiales para el estudio de la técnica
legislativa. Madrid. 2009. http://www.ucm.es/info/idp/docs/docs/008-
biliografia_tecnica_legislativa.pdf (2012-12-11).

Berners-Lee, T.; Hendler, J. ; Lassila, O., “The Semantic Web: a new form of Web
content that is meaningful to computers will unleash a revolution of new
possibilities”. Scientific American, May 2001 (se puede consultar a través de la
página web de la revista: http://www.sciam.com).

Boer, A.; Hoekstra, R.; Winkels, R.; van Engers, T. M.; Willaert, F. (2002). Proposal
for a Dutch Legal XML Standard. // EGOV 2002. Lecture Notes in Computer
Science. 2456 (2002) 142-149.

Bolioli, A.; Dini, L.; Mercatali, P.; Romano, F. (2002). // Legal Knowledge and
Information Systems (JURIX 2002).

Bosak, J.; y Bray, T., «XML and the Second-Generation Web», Scientific American
Magazine, mayo de 1999, en
http://www.scientificamerican.com/article.cfm?id=xml-and-the-second-genera.

De Castro y Bravo, Federico (1955). Derecho civil de España. Madrid, IEP, 1955..

Carbonell, M.; Pedroza de la Llave, S. T. (2000). Elementos de técnica legislativa.


México: UNAM, 2000.

Casanovas, P.; Pagallo, U.; Sartor, G.; Ajan; G. (eds.). (2010). AI Appoaches to te
Complexity of Legal Systems, Berlín, Springer, 2010.

Colmo, A. (1961). Técnica Legislativa del Código Civil argentino, 2ª ed. Buenos Aires:
Abeledo-Perrot, 1961.

Corona Ferrero, M. J.; Paul Vall, F.; Tudela Aranda, J. (coords.) (1994). La técnica
legislativa a debate. Madrid:Tecnos, 1994.

Cunningham, L. A., «Language, Deals and Standards: The Future of XML Contracts»,
Washington University Law Review, vol. 84, 2006, pp. 313-373.

De Diego, C. (1915). Las Fuentes del Derecho civil común en general, según el Código
Civil español. // Revista de Derecho Privado. 2 (1915).

García Marco, F. J. (2009). Perspectivas sobre el uso de la Web Semántica en el tratamiento


de información y documentación legislativa. // Scire: Representación y Organización del
Conocimiento. 15:1 (2009) 59-86.

Grandi, F.; Mandreoli, F.; Tiberio, P. (2005). Temporal modelling and management of
normative documents in XML format. // Data & Knowledge Engineering. 54:3
(2005) 327-354.

20
Gretel, Grupo de Estudios de Técnica Legislativa (1986). La forma de las leyes. 10
estudios de técnica legislativa. Barcelona: Bosch, 1986.

Gretel, Grupo de Estudios de Técnica Legislativa (1989). Curso de técnica Legislativa.


Madrid: Centro de Estudios Constitucionales, 1989.

Hernández Marín, R. (2002), Introducción a la teoría de la norma jurídica, Marcial


Pons, Madrid.

Hoekstra, R. (2011). The MetaLex Document Server – Legal Documents as Versioned Linked
Data. // International Semantic Web Conference (2). Springer, 2011. 128-143.

IFLA Study Group on the Functional Requirements for Bibliographic Records (FRBR).
(1998). Functional requirements for bibliographic records : final report. IFLA
Series on Bibliographic Control:19. Munich: K.G. Saur Verlag, 1998. — ISBN
978-3-598-11382-6. Versión actualizada y corregida accesible en
http://www.ifla.org/publications/functional-requirements-for-bibliographic-
records (2012-10-18).

Irti, Natalino (1992). La edad de la descodificación, Bosch, Barcelona, 1992.

Landow, G. P. (1995). Hipertexto. La convergencia de la teoría crítica contemporánea


y la tecnología. Barcelona: Paidós, 1995.

Lévy, P. (2007). La cultura de la sociedad digital. Barcelona: Anthropos, 2007. p 29.

Marketing y Comercio Electrónico, Redacción, «XML, comienza una nueva era en


Internet. Un progreso evolutivo que cambiará la forma en que personas y
empresas usan la información», Marketing y Comercio Electrónico, nº 5, junio de
1999, en http://www.marketingycomercio.com/numero5/5xml.htm.

Martín Galán, B. (2002) Tratamiento y difusión en Internet de información


jurisprudencial mediante tecnologías XML: aplicación al caso del Tribunal
Constitucional. Universidad Carlos III de Madrid, 2002. Tesis doctoral. http://e-
archivo.uc3m.es/handle/10016/480 (2012-10-18).

Martínez González, M. M. (2000). Extensible Markup Language (XML): Una solución


para modelar documentos. // Scire: Representación y Organización del
Conocimiento. 6:2 (2000) 121-151.
http://ibersid.eu/ojs/index.php/scire/article/view/1137/1119 (2012-10-18).

Martínez González, M. M. (2001). Principios para la explotación dinámica de relaciones entre


documentos en las bibliotecas digitales: aplicación al entorno jurídico / Principes
d'exploitation dynamique des relations inter-documents dans les bibliothèques
électroniques: application au domaine juridique. Universidad de Valladolid (España);
Institut National Polytechnique de Lorraine/ Institut National de Recherche en
Informatique et Automatique (Francia), 2001. Tesis doctoral.

Martínez González, M. M.; Vicente Blanco, D. J. (eds.). (2009). Scire: Representación y


organización del conocimiento. 15:1 (2009). Dedicado a: XML legislativo:
representación y organización de la información jurídica a través de la tecnología XML.

21
Martínez González, M. M.; Vicente Blanco, D. J.; de la Fuente Redondo, P.; Adiego Rodríguez,
J.; Pisabarro Marrón, A. M.; Sánchez Felipe, J. M. (2009). Estructura, semántica,
extracción de información y XML legislativo: experiencias en la Universidad de
Valladolid. // Scire: Representación y Organización del Conocimiento. 15:1 (2009) 173-
186.

Martino, A. A. (dir.) (2001). Manual de Técnica Legislativa. Colegio de Abogados de la


Capital Federal, Universidad de Buenos Aires, Facultad de Derecho, Ministerio de
Justicia y Derechos Humanos, Buenos Aires, 2001.
http://www.salvador.edu.ar/vrid/iiefgs/tr_manual_tecnica_legis.pdf (2012-12-12).

Martino, A. A. (2005), «Ciencia de la Legislación», Revista Electrónica de Teoría y


Práctica de la Elaboración de Normas Jurídicas, nº 2, junio de 2005, pp. 3-7

Muro Ruíz, E. (2006). Algunos Elementos de Técnica Legislativa. México: UNAM,


2006.

Ossowski, S. (ed.) (2013). Agreement Technologies. Dordrecht, Springer, 2013.

Palmirani, M.; Brighi, R. (2002). An XML Approach for Italian Legislation Acts. // JURIX
2002 Workshop on e-Government. Londres: Institute of Advanced Legal Studies, 2002.

Pau i Vall, F. (2009), «La estructura de las leyes en España», Revista Debate, Asamblea
Nacional de Panamá, núm. 16, abril de 2009, pp. 12-20.

Pérez Bourbon, H. (2000). Reglas prácticas de técnica legislativa. Buenos Aires:


Belgrano, 2000.

Pérez Bourbon, H. (2007). Manual de Técnica Legislativa. Buenos Aires: Honrad


Adenauer Stiftung, 2007.

Pérez Luño, A. E. (1996). Manual de Informática y Derecho. Barcelona: Ariel, 1996.

Peri, A. (2009). SIDRA: XML en la gestión y explotación de la documentación jurídica. //


Scire: Representación y Organización del Conocimiento. 15:1 (2009) 111-124.

Ramos Núñez, Carlos (1996). Codificación, Tecnología y Postmodernidad. La muerte


de un paradigma. Lima: Ara Editores, , 1.ª Ed.

Revista Electrónica de Teoría y Práctica de la Elaboración de Normas Jurídicas,


editada por el Centro de Estudios sobre la Elaboración de Normas Jurídicas de la
Facultad de Derecho de la Universidad de Buenos Aires (dirigida por el profesor
Miguel Ángel Ciuro Caldani), en
http://www.derecho.uba.ar/academica/posgrados/centro_normas_juridicas.php.

Sáenz Arroyo, J. et al. (1988). Técnica legislativa. México: Porrúa, 1988.

Sáiz Moreno, F.; Sival Ochoa, J. C. (coords.). (1989). La calidad de las leyes. Vitoria:
Parlamento Vasco, 1989.

22
Sheridan, J.; Tennison, J. (2010). Linking UK Government Data. // Linked Data on the Web
Workshop (LDOW 2010). Raleigh, North Carolina, USA, 2010. http://ceur-ws.org/Vol-
628/ldow2010_paper14.pdf (2013-01-10).

Valvé, J.-J.; Fernández Barrera, M.; Casellas, N.; Casanovas, P. (eds.). (2012). Lecturas
sobre Derecho y Web Semántica, Comares, Granada

World Wide Web Consortium (W3C). (2008). Extensible Markup Language (XML) 1.0
(Fith Edition). Recomendación W3C 10 de febrero de 1998 (REC-xml-
19980210). 2008. http://www.w3.org/TR/xml/ (2012-10-18).

AGRADECIMIENTOS

Agradecemos su colaboración al Servicio de Informática del Tribunal Constitucional.

23

View publication stats

También podría gustarte