Está en la página 1de 80

Versionado de documentos legislativos usando XML

Maria Hallo Escuela Politcnica Nacional QuitoEcuador mhallo1700@hotmail.com Dr Pablo de la Fuente Dra Mercedes Martnez Universidad de Valladolid-Espaa

Problemtica
Documentos legislativos en diferentes fuentes, formatos , lenguajes, estructuras internas Modificaciones en el tiempo Necesidad de consolidacin automtica En cada jurisdiccin diferentes formas de asignar identidades para versionado

Modelos de datos basados en XML


Permite ms sofisticadas bsquedas, Manejo de versiones de documentos y sus partes Formato no propietario Preservacin a largo plazo Apropiado para difusin en la Web semntica

Experiencias
En redaccin de texto legislativo: Tasmania, Canad, USA, Sud Australia, Italia, Espaa En administrar documentos legislativos digitales : UK, Singapur, Tasmania, Canad USA y un nmero de estados de USA

Formatos XML para documentos legales


Experiencias en Europa NormeInRete (Italia) Cen Metalex SDU BWB (Holanda) LexDania (Dinamarca) eLaw (Austria) CHLexML (Suiza)

Formatos XML para documentos legales


Otras experiencias Akoma Ntoso (Africa) En Act (Tasmania) Legal RDF en USA Dynamic Relationship Modelling (Spain) Cronelex System (Spain)

Estndares XML legales Primera generacin, describen texto y estructura considerando entidades Segunda generacin ponen atencin a la estructura del texto,descripcin y metadatos sin un anlisis previo de clases originando un gran nmero de DTDs y esquemas (Norme in Rete..) Tercera generacin basada en patrones describiendo clases, propiedades , modelos de contenidos y ontologias. Akoma Notoso, Cen Metalex

Estndares XML legales


Cuarta generacin de estndares: Usan patrones y validaciones basadas en reglas. Ej uso de: Schematron : Lenguaje de esquema estructural expresado en XML, RELAX NG: Regular languaje for XML next generation

Capas para representar el modelado de doc legales


Texto Estructura Metadatos Ontologas Reglas legales

Norme in Rete
(Legislation on the Net)
Proyecto iniciado en 1999, financiado por el Ministerio de Justicia Italiano. Productos: Mquina de bsqueda para recuperar leyes publicadas en diferentes sitios Web de la administracin pblica implementado en Sistema Norma. (migrado a normattiva.it) Estndares NIR (basados en XML, RDF): DTD para describir la estructura formal y funcional URN para documentos legales independiente de URL

Norme in Rete DTDS


DTD estricto: usado para marcar doc legales (180 elementos) Loose DTD: tiene pocas reglas obligatorias DTD base: subconjunto del DTD estricto, mnimo para garantizar la interoperabilidad (100 elementos)

Norme in Rete
1.global.dtd:contiene definiciones globales 2. norme.dtd: contiene definiciones de la estructura de divisin 3. text.dtd: para definiciones de estructuras de texto, tablas and formas; 4. meta.dtd: contiene definiciones de esquemas de metadatos.

Ej NIR
Urn:nir:<authority> :<measure> :<details> :<annex>* @<version>? #<partition>? urn:nir:stato:decreto.legislativo:1992-0724;358#art5 @fecha de la ltima modificin 0 o ms veces ? 0 o una vez

Elementos del DTD


Estructurales: ttulo, prembulo, seccin, artculo, prrafo. Especiales: referencias a otras leyes Metadatos. Fecha de publicacin, relaciones, clasificacin Elementos semnticos: Provisiones: Obligaciones, Prohibiciones, Modificaciones Roles

Norme.DTD
Estructura formal del texto normativo
Ttulo(tipoDoc|dataDoc|numDoc|ttuloDoc|da taDoc..) Frmula inicial, Prembulo Articulado(Libro|parte|ttulo|captulo|secc| prrafo|artculo) Frmula final Conclusiones Anexos

Metadatos
Dublincore (dc:title | dc:creator | dc:subject |dc:description | dc:publisher|dc:contributor |dc:date | dc:type | dc:format |dc:identifier | dc:source | dc:language |dc:relation | dc:coverage | dc:rights) Disposiciones: Modificaciones. Trabajos preparatorios Editoriales Comentarios

Disposiciones
Describen el significado de cada fragmento de texto, su tiempo de validez, derogacin, etc.

Sistema Norma
Cubre todas las fases del ciclo de vida de un documento legal Los documentos siguen el DTD de Norme In Rete

Modelo de datos Sistema Norma

Modelo E-R Sistema Norma (metadata)

Almacenamiento de metadatos
Los metadatos que describen la cadena de versionamiento de cada documento y para cada versin su intervalo de tiempo, referencias normativas y anexos se almacenan en un sistema relacional

Consolidacin
Se realiza con tres paquetes Documentos y anexos modificantes Documentos y anexos a modificarse Lista de provisiones modificatorias Cada paso del proceso de modificacin es anotado en el texto modificado: Tipo de modificacin, nombre del documento modificante, particin de texto modificado

Consolidacin
Se convierten los paquetes XML a formato Word

Problemas
Estructura estricta del texto Documentos almacenados en sistema de archivos Sistema ligado a la estructura Consultables versiones de documentos Consolidaciones semiautomticas

Akoma Ntoso (Africa)


Architectrure for Knowledge-Oriented Management of Any normative Texts using Open Standards and Ontologies

Conjunto de estndares y metodologas para e-servicios parlamentarios en el contexto Pan-Africano: Akoma-Ntoso XML schema, Convenciones de nombres para identificacin de recursos legales(URI2) Guias para preparacin de documentos legislativos bien estructurados

Usos de Akoma Notoso


Formatos usados en Legislacin primaria Debates parlamentarios Listas de modificaciones Documentos judiciales

Patrones
Container: estructuras secuenciales no jerrquicas. Ej prefacio, prembulo, conclusiones, cuerpo Hcontainer: Contenedores jerrquicos de estructuras. Ej captulo, seccin, artculo, clusula Blocks: Contenedores de texto. Ej Prrafos

Patrones
Inline : Contenedores de texto. Ref, ttulo, fecha Marker: Ej imgenes, notas Popup: Ej notas de autora, firmas pies de documentos www.akomanotoso.org

CEN METALEX
Formato de Intercambio abierto para recursos legales y legislativos
CWA 15710:2010

CEN METALEX
Rediseado considerando lecciones de Norme in Rete y Akoma Notoso

Metalex Caractersticas
Independiente de lenguaje y jurisdiccin No interfiere con formatos propietarios Estructura basada en contenedores que a su vez contienen otros bloques o contenedores Basado en XML, RDF, RDF(S), OWL, Xlink, XHTML. XSL Soporta URIs a un nivel muy detallado Combinable con GML para encadenar regulaciones a reas espaciales

Entidades Bibliogrficas en Metalex

Conceptos
Fuente de ley bibliogrfica: objeto, bibliogrfico que fue es o puede ser referenciado

Metalex
Principios de diseo

Cada elemento Metalex es definido por un nombre, modelo de contenido y uno o ms atributos La Estructura de un doc legislativo es definida por artculos agrupados en particiones y a su vez compuestos de partes y subpartes Se puede tener varias versiones en varios lenguajes el mismo documento (atrib lang)

Metalex
Principios de diseo

Cada elemento puede tener zero o ms anotaciones Se exige identificacin con URIs pero no se restringe a un formato Los metadatos se pueden almacenar dentro de los documentos y adems separados como triples RDF

Metalex
Principios de diseo

Containers: book, chapter, section Blocks: sentences, titles, indices, etc. MetaLex: (containers +) articles (+ subcontainers) + text

Metalex
Manejo del tiempo

Permite almacenar:
Fechas de publicacin, promulgacin, derogacin Perodos de validez, de eficacia.(El perodo de tiempo en el cual deben haber ocurrido los hechos para que la legislacin sea aplicable) Es posible tener varias versiones de un texto en el mismo documento

Metalex
Metadatos Ontologas de metadatos contienen:
Entidades Bibliogrficas: Trabajo, expresin, manifestacin, item y modelo de contenidos Referencias entre entidades bibliogrficas Actividades: Acciones y roles de entidades bibliogrficas (creacin, derogacin, promulgacin) Agentes y competencias usados en actividades legislativas

Metalex
Transformaciones a RDF

Los Metadatos pueden ser envueltos en manifestaciones XML y representados como atributos pueden ser transformados a RDF con hojas de estilo XSL.

Metalex Administracin de versiones


El esquema de metadatos Metalex OWL incluye definiciones de tipos de evento a nivel de expresin Creacin de una entidad bibliogrfica, entrada en vigor de una expresin (versin), derogacin de una expresin

Expresiones modificantes
A nivel de container insercin/borrado de una parte A nivel de bloque insercin/borrado /modificacin de texto

Metalex Document Server

Metalex Document Server doc.metalex.eu


Almacena las versiones de estatutos y regulaciones del sitio holands http://wetten.overheid.nl publicado desde mayo del 2011 como CEN Metalex y como Linked Data

Wetten.overheid.nl
Es la fuente de datos para informacin legislativa en Holanda. Permite bsquedas por un artculo especfico asi como por la versin de un texto a una fecha especfica. Proporciona una API para recuperar manifestaciones XML de estatutos y regulaciones

Wetten.overheid.nl
Problemas : identificadores no consistentes (varios apuntan al mismo elemento) Se recupera solamente la ltima versin Fecha reportada como fecha de modificacin es la fecha del registro en e l CMS Metadatos en tablas HTML

Conversin
Modela cada documento segun FRBR Crea URIs para todas las partes del texto legislativo (modelo UK) Genera metadatos RDF de cada documento y sus elementos asi como de los eventos y procesos que los modifican

Estructura de un doc en Metalex

Metadatos
El MDS usa para metadatos: La Ontologa Metalex para representar eventos de modificaciones El Modelo de Eventos (Simple Event Model) OPMV (Open Provenance Model Vocabulary) para una descripcin de procesos e informacin de orgenes de datos.

Modificaciones
Cada elemento es identificado con una URI opaca con un valor Hash SHA1 del contenido textual de un elemento XML y simultneamente mantienen un link entre el URI opaco y el identificador permitiendo distinguir diferentes expresiones en el tiempo. (Metalex Doc Server)

Legislation.gov.uk
El sitio contiene legislacin como fu originalmente promulgada y versiones presentando cambios a la legislacin en el tiempo

Modificaciones

Modelo de datos
Estructura en rbol implementada con XML para los documentos y metadatos y un grafo representado en RDF para los metadatos Se usa una base de datos XML para los documentos y metadatos y un repositorio RDF para los metadatos

Estructura de un acto legislativo (ltima versin)


Adapted from: http:www.legislation.gov.uk/ukpga/1985/65/data.xml

XML doc

Metadata

Legislation

Dublin Core Links metadata

Unapplied effects

Others

Preliminary

Body

Appendix

Schedule

Changes Explanatory Notes

Part

Pblock (Section)

Pgroup (Paragraphs)

PBlock amendement

La estructura de un item legislative est definida en legislative.xsd

Entidades (FRBR) (Requisitos Funcionales de Registros Bibliogrficos)


Item legislativo (Work) ( Acto, Parte, Seccin, Schedule (Prrafo)) Versin ( Expression) (previa, actual, prospectiva, a una fecha dada) Publicacin ( Manifestation) (pdf, rdf, xml, htm)

copias (items)

Recursivo

Modificaciones
Los elementos usados para marcar cambios en textos se describen en Changes.xsd Tipos de cambios: Adicin, sustitucin, referencias a comentarios, acrnimos, abreviaciones, citaciones

Modificaciones

Modificaciones http://www.legislation.gov.uk/changes/applied/affected/ukpga?affectedtitle= transport act 1985

Proceso editorial
http://www.legislation.gov.uk/pdfs/GuideToRevisedLegislation_Jan_2012.pdf

Una nueva pieza de legislacin se graba como una versin promulgada (enacted) Se prepara una versin revisada tabulando efectos en otras legislacin es y aadiendo anotaciones a la versin revisada (Ej. Fechas de entrada en vigor, alcance geogrfico, etc) (toma de 4 a 8 semanas) Los efectos tabulados se presentan en el website en la seccin cambios a la legislacin

Legislacin revisada vs promulgada


http://www.legislation.gov.uk/pdfs/GuideToRevisedLegislation_Jan_20 12.pdf

Tipos de anotaciones
Hay varios tipos de anotaciones: Modificaciones textuales (F-notes) Informacin adicional (E-Notes) Modificaciones que no alteran el texto (Cnotes) Informacin de inicio de los cambios (Inotes) Citas marginales (M-notes) Informacin editorial (X notes)

Annotations
Ej de anotacin en el Acto analizado1985 que no alteran el texto (tipo C). C1 Act amended by S.I. 1986/1628, reg. 5(2)(3) Los cambios realizados aparecen en el contenido y son referenciados con anotaciones

Annotaciones
Ej: S.14A(7) applied (with modifications) (30.12.2005) Adoption and Children Act 2002 by Ca.29(6) (with Sch 4 paras 6-8); S.I.2005/2213, art. 2(c). Provisin afectada- subseccin (7) de la seccin 14A El tipo de efecto: applied (with modifications) La fecha en la que la provisin afectante entra en vigor (30.12.2005) La legislacin afectante Adoption and Children Act 2002 La provisin afectante : subsec 6, seccin 29 La provisin que origina la entrada en vigor S.I.2005/2213, art. 2(c).

URIs
URIs de documentos : Se usan para referirse a documentos particulares en la web: versiones de items. Siguen el siguiente template: http://www.legislation.gov.uk/{type}/{year}/{n umber}[/{section}][/{authority}][/{extent}][/{v ersion}] http://www.legislation.gov.uk/ukpga/1985/67/ 2003-04-01

URIs
http://www.legislation.gov.uk/developer/uris

URIs de identificacin http://www.legislation.gov.uk/id/{type}/{year}/ {number}[/{section}]

URIs
URIs de representaciones Cada documento es disponible en mltiples formatos. La Uri para un formato en particular sigue el template: http://www.legislation.gov.uk/{type}/{year}/{number}[/{sectio n}][/{authority}][/{extent}][/{version}]/data.ext

Documento Legislativo (version original promulgada)


Transport Act 1985 1985 Chapter 67 Content table: Introductory Text Part I General Provisions Relating to Road Passenger Transport Abolition of road service licensing 1. Abolition of road service licensing. Meaning of local service 2. Local services. Traffic commissioners 3. Traffic commissioners. 4. Inquiries held by traffic commissioners. 5. Assistance for traffic commissioners in considering financial questions.

Ej cambio
Modificacin prospectiva de texto: section-26-6 http://www.legislation.gov.uk/id/ukpga/1985/67/section/26/6 s. 26(6) text amended by 2008 c. 26 s. 62(9) s. 26(6)(a) text amended by 2008 c. 26 s. 62(9)(b)

6.A condition attached to a licence under subsection (5) above shall (a)apply only to vehicles which have their operating centre in the traffic area for which the commissioner acts; and (b)be in addition to (and not be taken as prejudicing in any way) any conditions attached to the licence under section 16 of the 1981 Act as to the maximum number of vehicles which the operator may at any one time use under the licence. Segn seccin-62-9 de http://www.legislation.gov.uk/id/ukpga/2008/26/section/62/9 (9)In subsection (6) (a)for subsection (5) substitute subsection (5A) ; (b)in paragraph (a) after the commissioner insert who attached that condition .

http://legislation.data.gov.uk/ukpga/1985/67/data.xml ltima versin Metadata (dc elements)

<Legislation xmlns=http://www.legislation.gov.uk/namespaces/legislation DocumentURI="http://www.legislation.gov.uk/ukpga/1985/67" IdURI="http://www.legislation.gov.uk/id/ukpga/1985/67" NumberOfProvisions="305 xml:base="http://www.legislation.gov.uk/id/ukpga/1985/67"> - <ukm:Metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dct="http://purl.org/dc/terms/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:ukm="http://www.legislation.gov.uk/namespaces/metadata> <dc:ident>http://www.legislation.gov.uk/ukpga/1985/67</dc:iden> <dc:title>Transport Act 1985</dc:title> <dc:description>An Act to amend the law relating to road passenger transport; to make provision for the transfer of the operations of t he National Bus Company.</dc:description> <dc:date>1985-10-30</dc:date> <dc:modified>2011-05-27</dc:modified> <dct:valid>2009-09-01</dct:valid>

http://legislation.data.gov.uk/ukpga/1985/67/data.xml Metadata (atom link elements)


atom:link rel="self" type="application/xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.xml" /> <atom:link rel="http://www.legislation.gov.uk/def/navigation/resources" href="http://www.legislation.gov.uk/ukpga/1985/67/resources" title="More Resources" /> <atom:link rel="http://www.legislation.gov.uk/def/navigation/act" href="http://www.legislation.gov.uk/ukpga/1985/67" title="whole act" /> <atom:link rel="http://www.legislation.gov.uk/def/navigation/introduction" href="http://www.legislation.gov.uk/ukpga/1985/67/introduction" title="introduction" /> <atom:link rel="http://www.legislation.gov.uk/def/navigation/body" href="http://www.legislation.gov.uk/ukpga/1985/67/body" title="body" /> <atom:link rel="http://www.legislation.gov.uk/def/navigation/schedules" href="http://www.legislation.gov.uk/ukpga/1985/67/schedules" title="schedules" /> <atom:link rel="alternate" type="application/rdf+xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.rdf" title="RDF/XML" /> <atom:link rel="alternate" type="application/xhtml+xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.htm" title="HTML snippet" /> ..

http://legislation.data.gov.uk/ukpga/1985/67/data.xml PrimaryMetadata

<ukm:PrimaryMetadata> - <ukm:DocumentClassification> <ukm:DocumentCategory Value="primary" /> <ukm:DocumentMainType Value="UnitedKingdomPublicGeneralAct" /> <ukm:DocumentStatus Value="revised" /> </ukm:DocumentClassification> <ukm:Year Value="1985" /> <ukm:Number Value="67" /> <ukm:EnactmentDate Date="1985-10-30" />

http://legislation.data.gov.uk/ukpga/1985/67/data.xml Unapplied effects: Text amended


<ukm:UnappliedEffect Row="4160" Type="text amended"

Index="57" Modified="2012-05- 25T15:44:39.594+01:00" AffectedClass="UnitedKingdomPublicGeneralAct AffectedYear="1985" AffectedNumber="67" AffectedProvisions="s. 26(6)" AffectingClass="UnitedKingdomPublicGeneralAct" AffectingYear="2008" AffectingNumber="26" AffectingProvisions="s. 62(9)" AffectedURI=http://www.legislation.gov.uk/id/ukpga/1 985/67 AffectingURI=http://www.legislation.gov.uk/id/ukpga/2 008/26 AffectingCommencementSections="http://www.legislati on.gov.uk/id/ukpga/2008/26/section/134http://www.le gislation.gov.uk/id/ukpga/2008/26/section/134"

http://legislation.data.gov.uk/ukpga/1985/67/data.xml

Unapplied effects: Text amended


<ukm:AffectedProvisions> <ukm:Section Ref="section-26-6 URI=http://www.legislation.gov.uk/id/ukpga/1985/67/section/26/ 6 StartDate="1991-01 </ukm:AffectedProvisions> - <ukm:AffectingProvisions> <ukm:Section Ref="section-62-9" URI=http://www.legislation.gov.uk/id/ukpga/2008/26/section/62/ 9 StartDate="Prospective ukm:Section> </ukm:AffectingProvisions> <ukm:AffectedTitle>Transport Act1985</ukm:AffectedTitle> <ukm:AffectingTitle>Local Transport Act 2008</ukm:AffectingTitle> </ukm:UnappliedEffect>

Efectos no aplicados
La ontologia Metalex se usa para describir los efectos que se usan listando esa lgica Un Trabajo (Work) es realizado por alguna versin (Expression) Esa version es el estado inicial de alguna Modificacin legislativa La modificacin legislativa tiene legislaciones afectantes de otra legislacin

(RDF/XML)

Problemas
Cada versin de un item legislativo es grabada en un archivo lo cual implica redundancia de datos y posibilidades de inconsistencia en el caso de correccin de errores Los tiempos requeridos para anotaciones son muy largos de 4 a 8 semanas por texto legislativo Existe dificultad en obtener los datos necesarios para construir las versiones revisadas de textos histrico

Conclusiones
Es necesario estudiar alternativas de manejo de versiones de textos legislativos Usando RDF y ontologas estndar Buscando optimizar el almacenamiento, tiempos de bsqueda y recuperacin de versiones de textos y fragmentos legislativos consolidados. Usando sistemas de administracin de bases de datos XML

Conclusiones
Es necesario estudiar alternativas de manejo de versiones de textos legislativos Usando modelos de grafos y ontologas estndar Buscando optimizar el almacenamiento, tiempos de bsqueda y recuperacin de versiones de textos y fragmentos legislativos. Usando sistemas de administracin de bases de datos XML y repositorios RDF

Bibliografia
Palmirani M and Brighi R. Norma-System: A Legal Document System for Managing Consolidated Acts. DEXA 2002. Database and Expert Systems Applications, Springer, 2002; 310-320 Sheridan J. Legislation.gov.uk, in VoxPopuLII. 2010, Cornell University Law School. http://blog.law.cornell.edu/voxpop/tag/legallinked-data/(2011, accessed march 2012). Hoekstra R. The MetaLex Document Server, in VoxPopulLII. http://blog.law.cornell.edu/voxpop/2011/10/25/the-metalexdocument-server/ (2011, accessed Nov 2011) Martnez-Gonzlez M, Derniame J and De la Fuente P. A method for the dynamic generation of virtual versions of evolving documents. In: 17th ACM Simposium on Applied Computing (SAC 2002), Special Track on Database and Digital Library Technologies. Madrid , Spain, March 2002.

Bibliografia
Palmirani, M. et al. Deliverable 3.1. General XML format(s) for legal Sources, University of Amsterdam, University of Bologna, http://www.estrellaproject.org/doc/D3.1-General-XML-formats-ForLegal-Sources.pdf (2006, accessed Nov 2011) Francesconi E. The Norme in Rete- project: Standards and Tools for Italian Legislation. International Journal of Legal Information, 2006; 34: 358-376.

Agradecimientos
Al grupo GRINBD del Departamento de Informtica de la Universidad de Valladolid