Paper XML

XML (Extensible Markup Language)
Nelson Enrique Pérez Prieto. Cod:20142015221

Andrés Felipe Guaneme Passos. Cod:20142015152
Universidad Distrital Francisco José de Caldas
Ingeniería Industrial
Comercio electrónico
neperezp@correo.udistrital.edu.co
afguanemep@correo.udistrital.edu.co
II. XML SOLUCIÓN PARA MODELADO DE

Abstract: The characteristics, advantages, the evolution of DATOS
the workflow schemes will be discussed with reference to
their properties and modeling in comparison with the
XML (Extensible Markup Language) es un lenguaje de
HTML language. The extended markup language (XML)
stands out for its simplicity and readability in documents, etiquetado de documentos (se introducen etiquetas entre
the separation between synthetic formats and graphic el texto). XML fue publicado por el W3C como una
preparation, also highlighting the power of its hyperlinks. recomendación estable (3) en 1998. Se trata de una
Key words: Society - Synthetic formats- hyperlinks -
simplificación de SGML (Standard Generalised Markup
modeling-language Language) (SGML,1986), cuya aplicación más
conocida es HTML. XML modela los documentos
como conjuntos de elementos que contienen cadenas de
Resumen: Se discutirán las características, ventajas, la
evolución de los esquemas de flujo de trabajo haciendo
caracteres. El principio y el final de cada elemento se
referencia a sus propiedades y modelado en comparación delimita con etiquetas.
con el lenguaje HTML. El Extended Markup Languaje
(XML) se destaca por su sencillez y legibilidad en los La idea fundamental detrás de XML consiste en marcar
documentos, la separación entre formatos sintéticos y o etiquetar la información, de modo que cada porción
preparación gráfica, también resaltando la potencia de sus
hiperenlaces (elemento) del documento se delimita por una etiqueta
de comienzo seguida de la correspondiente etiqueta de
Palabras Clave- Formatos sintéticos- hiperenlaces - modelado - cierre que indica el final de ese elemento (similar, pero
lenguaje
con una barra inclinada -'/'- que la diferencia de la
marca de comienzo de elemento).
I. INTRODUCCIÓN Las etiquetas son los textos delimitados entre ángulos

(<...>); el resto es el contenido del documento. Cada
XML surge como un nuevo formato para representar los
elemento tiene un tipo (nombre de la etiqueta) y un
procesos de negocio de las empresas, ya que es un
lenguaje flexible e intercambiable. En el área del flujo valor (lo que hay entre las etiquetas). Cada elemento
de trabajo, una de las cuestiones más discutidas es la puede contener una combinación de texto y otros
evolución de las representaciones del flujo de trabajo, elementos.
para cumplir con los nuevos requisitos del mercado es
así como surgió XML como un lenguaje de marcado de Propiedades relevantes de XML
documentos que sustituirá a HTML en la Web. Ambos
lenguajes son herederos de SGML, el lenguaje de
marcado estándar para la descripción formal y de
contenido de los documentos, XML llegó para ampliar
capacidad reducida de estructurar documentos, esto
radica en su uso, tanto en Web como en sistemas
corporativos, como herramienta de definición de
estructuras y de descripción de contenidos. En ambos
casos, la estructura y/o descripción se incluyen dentro
del documento y permiten la reutilización de partes del
mismo.
Delimitar claramente los elementos es fundamental para
que sea posible construir herramientas capaces de
analizar los documentos (parsers), seleccionar XML Y HTML
elementos del documento, indexar los documentos, etc.,
Al comparar XML con HTML (Tabla 1). HTML
que de otro modo serían incapaces de detectar los
también se basa en la idea de etiquetar los elementos.
límites de cada elemento. Por eso, una de las bases de
Sin embargo, existen dos diferencias importantes entre
XML es la definición de unas reglas sintácticas simples
ambos. La primera es que en HTML las reglas
pero estrictas, que garantizan que cualquier documento
sintácticas son menos estrictas. Por ejemplo, en un
XML puede ser procesado por herramientas sencillas,
documento HTML puede haber etiquetas de apertura
construidas para trabajar con documentos XML
para elementos que nunca estén cerrados (un caso muy
genéricos. A los documentos que cumplen estas reglas
habitual son las páginas que contienen una etiqueta
sintácticas se les dice documentos “bien formados”
<html>, pero no incluyen en ningún punto la etiqueta
(well-formed). Estas características son especialmente
(</html>). Esta primera diferencia provoca que el
relevantes y se espera que lo sean aún más en un
tratamiento automático de los documentos HTML sea
entorno tan popular y en auge como Internet.
mucho más difícil que el de los documentos XML, y es
Pero lo realmente relevante de XML es que permite la culpable de que existan pocas herramientas que lo
etiquetar los documentos teniendo en cuenta la permitan, o de que los motores de búsqueda en Internet
semántica de la información. Dicho de otro modo, cada ofrezcan muy limitadas posibilidades de búsqueda por
diseñador de información puede crear las etiquetas o campos en las páginas. Este problema se evita con
conjuntos de etiquetas que considere que mejor XML, ya que cualquier documento que se diga XML
describen los elementos que componen sus documentos. debe cumplir unas reglas sintácticas mínimas; es decir,
debe estar “bien formado”.
A esta propiedad consistente en permitir la creación de
nuevas etiquetas se la denomina La segunda diferencia reside precisamente en la
propiedad de extensibilidad de XML: en HTML el
extensibilidad. De esta propiedad se deriva otra conjunto de etiquetas que pueden aparecer en el
propiedad adicional de los documentos XML: su documento está restringido al que define el propio
legibilidad, dado un documento XML etiquetado con estándar y se trata de un conjunto de etiquetas que
marcas suficientemente representativas, cualquier modelan características relativas al formato del
usuario con o sin conocimientos de XML es capaz de documento (por ejemplo, la etiqueta <h1> indica que el
reconocer los distintos elementos del documento, las estilo que se debe utilizar para visualizar el fragmento
reglas de inclusión entre esos elementos, y qué de texto marcado es Heading 1). Sin embargo, los
representa cada uno de los elementos. En el ejemplo del documentos XML —si bien pueden estar etiquetados en
libro que hemos visto, es sencillo deducir que la base a criterios de formato o presentación suelen
información que se está modelando para cada libro son disociar la semántica de los documentos de su
datos tales como su autor o autores, precio, y otros. presentación, de modo que el etiquetado dice que
contienen los elementos en vez de como se presentan
dichos elementos o qué hacer con ellos. Esto es lo que
ocurre en el ejemplo del libro de la figura 1: sabemos
qué información guardamos, pero nos despreocupamos
de cómo se visualizará, imprimirá, etc. En realidad, la
calidad del etiquetado depende del creador o autor del
documento.
FIGURA 1 Datos para libros modelados con XML recuperado a

partir de:https://ibersid.eu/ojs/index.php/scire/article/view/1
III. CONCLUSIONES
● Se determinó que los parsers XML son

esenciales para el análisis de documentos e
información ya que son herramientas software
capaces de procesar un documento XML, verificar su
corrección sintáctica, extraer la información de sus
elementos y atributos con la posibilidad de pasar esta
comparación entre HTML y XML elaboración propia. información a otras aplicaciones.
● XML es utilizado principalmente por los
DISTRIBUCIÓN XML profesionales, debido a la complejidad de las
especificaciones, pero según vayan saliendo al
A la vista de todas estas ventajas, XML sustituye cada mercado nuevos editores que permitan manipular
vez más al lenguaje SGML (Standard Generalized documentos XML, se podrán utilizar por cualquier
Markup Language) como estándar ISO para la persona, de forma similar a como se trabaja con los
representación de documentos. XML se encuentra en editores de textos actuales.
muchos ámbitos de la vida, entre otros. ● Para evitar que no existan innumerables
formas de describir documentos de un determinado
● en los feed de RSS sector, ya se está trabajando en la definición de DTDs
● al entrar en una cuenta de correo electrónico sectoriales de carácter público que estén respaldados
(vía SAML) por el máximo de empresas y organismos posibles.
● en las páginas web basadas en XHTML Según se vayan publicando, se crearán nuevas
● en las presentaciones de PowerPoint
●
herramientas para su tratamiento.
en la facturación de los servicios
● ● XML hará las veces de "base de datos", los
en los archivos de configuración
scripts servirán para realizar búsquedas selectivas y el
Sectores en los que XML está más extendido HTML permitirá que se muestre la información
resultante en la pantalla.
• servicios sanitarios y sociales
• administraciones públicas
• proveedores de servicios financieros IV. BIBLIOGRAFÍA
• ICT
• suministro de energía [1] Conklin, J. (2007). Hypertext: An introduction and survey.
// IEEE Computer. 20 : 9(2007)17-41.
Tecnología [2] Eulegis. URL: <http://www.eulegis.net>.
Con la gama de productos DocBridge, incluido el [3] Finke, N. (2005). TEI Extensions for Legal Text.
Mixed Format Filter (MFF), Compart ofrece la Proceedings of the Text Encoding Initiative.
posibilidad de convertir XSL-FO, XHTML, OOXML y
SVG a todos los formatos convencionales como AFP, [4] Martínez González, M.ª Mercedes; Vicente Blanco,
PostScript, PDF, IPDS etc.. Los documentos XSL-FO Dámaso-Javier; Fuente Redondo, Pablo de la; Adiego
Rodríguez, Joaquín; Pisabarro Marrón, Alma María; Sánchez
se procesan con SAX (API simple para XML). El
Felipe, José Manuel (2009). Estructura, semántica, extracción
archivo se lee línea por línea. En cuanto está lista, la de información y XML.173-186.
página se transfiere al filtro de salida correspondiente.
[5] Vañó Vañó, María José (2009). Integración de la
XML conversiones posibles documentación legal electrónica a través de LEXML. // Scire:
Representación y Organización del Conocimiento. 15:1, 87-
1. XML en AFP 11.
2. XML en IPDS
3. XML en PCL [6] Martin. G. Información y Documentación XML (VII,
4. XML en PDF Bilbao 2010). Bilbao: Universidad del País Vasco, 2010, p.
5. XML en PostScript 113-124.

Paper XML

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Paper XML

Cargado por

Copyright:

Formatos disponibles

XML (Extensible Markup Language)

Nelson Enrique Pérez Prieto. Cod:20142015221

II. XML SOLUCIÓN PARA MODELADO DE

I. INTRODUCCIÓN Las etiquetas son los textos delimitados entre ángulos

FIGURA 1 Datos para libros modelados con XML recuperado a

● Se determinó que los parsers XML son

También podría gustarte