Introducción XML
Qué es XML
Es un lenguaje de marcas. Los contenidos están delimitados por etiquetas.
Es un metalenguaje. Se pueden definir las etiquetas necesarias.
Define una sintaxis general para maquetar datos.
Es un formato estándar y flexible para documentos informáticos que puede ser
adaptado al campo de aplicación que se desee.
Es un formato de texto plano, muy adecuado para almacenar información y
transmitirla.
Un archivo XML contiene etiquetas y datos.
Qué NO es XML
No es un protocolo de comunicación. No enviará datos por nosotros.
No es un sistema gestor de bases de datos. Aunque una base de datos
relacional pueda contener campos del tipo XML, incluso pueden existir bases de
datos nativas XML
No es un lenguaje de programación. No se pueden generar ejecuciones a partir
de un documento XML.
Para qué se utiliza
Es muy utilizado para intercambio de información. Ya que xml es texto plano es
adecuado para almacenar información y transmitirla.
Es muy utilizado para estructurar documentos. Podríamos decir que, al igual
que las bases de datos relacionales son adecuadas para almacenar y tratar
datos, XML es adecuado para almacenar y tratar documentos.
XML no hace nada por sí mismo. Estructura la información y permite que otros
programas la utilicen.
Tecnologías XML
● XML. Lenguaje de marcas de uso general.
● Validación XML:
○ DTD. Sistema de validación de ficheros XML.
○ XSD, XML Schema. Sistema de validación de ficheros XML.
● Conexión de documentos XML:
○ Xlink. Permite crear vínculos en documentos XML:
○ XPointer. Permite identificar partes de XML para vínculos.
● XSL. Permite describir como se muestra XML. se compone de;
○ XSLT. Permite la transformación de documentos XML:
○ XSL-Fo. Indica como se van a mostrar los datos en pantalla. es un lenguaje de maquetado
○ XPath. Permite buscar y seleccionar en XML para XSLT
● XQuery. Parecido a SQL con capacidades de programación:
Estructura de documento XML
La estructura general de un documento XML está formada por dos partes:
Prólogo (opcional): contiene una secuencia de instrucciones de procesamiento
y/o declaración del tipo de documento. Se puede dividir en dos partes:
● Declaración XML. Establece la versión de xml, el tipo de codificación y si es
un documento autónomo.
● Declaración de tipo de documento. Establece el tipo de documento que es.
Cuerpo: es el contenido de información del documento, organizado como un
árbol único de elementos marcados.
●
Estructura de documento XML
La estructura general de un documento XML está formada por dos partes:
Prólogo (opcional): contiene una secuencia de instrucciones de procesamiento
y/o declaración del tipo de documento. Se puede dividir en dos partes:
1. Declaración XML. Establece la versión de xml, el tipo de codificación y si es
un documento autónomo.
2. Declaración de tipo de documento. Establece el tipo de documento que es.
Cuerpo: es el contenido de información del documento, organizado como un
árbol único de elementos marcados.
●
Estructura de documento - Declaración XML
La declaración XML es una instrucción de procesamiento especial y cumple
varias funciones:
○ Marca el documento como texto XML
○ Incluye la declaración de la versión de XML utilizada en el documento
○ Aporta información sobre la codificación empleada para representar los caracteres
○ Indica si el documento es autónomo o no
Si está presente, la declaración XML debe ser la primera línea del documento. Un
ejemplo de declaración XML completa podría ser:
<?xml versión= “1.0” encoding= “ISO-8859-1” standalone= “yes”?>
1. Declaración XML
La declaración XML es una instrucción de procesamiento especial y cumple
varias funciones:
○ Marca el documento como texto XML
○ Incluye la declaración de la versión de XML utilizada en el documento
○ Aporta información sobre la codificación empleada para representar los caracteres
○ Indica si el documento es autónomo o no
Si está presente, la declaración XML debe ser la primera línea del documento. Un
ejemplo de declaración XML completa podría ser:
<?xml versión= “1.0” encoding= “ISO-8859-1” standalone= “yes”?>
1. Declaración XML
<?xml versión= “1.0” encoding= “ISO-8859-1” standalone= “yes”?>
Los campos dentro de la declaración XML deben seguir el orden estricto
Aunque es opcional, muchos documentos XML comienzan con una línea como
la primera. Es la encargada de indicar que lo que la sigue es un documento XML.
Puede tener varios atributos (los campos que van dentro de la declaración),
algunos obligatorios y otros no:
Si se especifica la codificación (“encoding”), o la declaración de documento
autónomo (“standalone”), es necesario incluir también la información sobre la
versión (“versión”).
1.2. Declaración XML
• version: indica la versión de XML usada en el documento; la actual es la 1.0. Es
obligatorio ponerlo, a no ser que sea un documento externo a otro que ya lo
incluya.
• encoding: señala la forma en que se ha codificado el documento. Cualquier
valor está permitido, y depende del parser entender o no la codificación. Por
defecto es UTF-8, aunque existen otras, como UTF-16, US-ASCII, ISO-8859-1, etc.
No es obligatorio salvo que se trate de un documento externo a otro principal.
• standalone: indica si el documento va acompañado de un DTD (no), o no lo
necesita (yes). Su presencia no es necesaria, ya que más tarde se indicará el
DTD en caso de ser necesario.
2. Declaración tipo de documento
Hay que resaltar algunos detalles de gran importancia:
• Los documentos XML son sensibles a las mayúsculas. Es decir, en ellos se
diferencian las mayúsculas de las minúsculas. Por ello <FICHA> sería una
etiqueta diferente a <ficha>.
• Además todos los espacios y retornos de carro se tienen en cuenta (dentro de
las etiquetas, en los elementos).
• Hay algunos caracteres especiales reservados, que forman parte de la sintaxis
de XML: <, >, &, " y '. En su lugar, cuando se desee representarlos habrá que usar
las entidades <, >, &, " y ' respectivamente.
2. Declaración tipo de documento
Los valores de los atributos de todas las etiquetas deben ir siempre
entrecomillados. Son válidas las dobles comillas (") y la comilla simple (').
Analizando el contenido, se observan una serie de etiquetas que contienen
datos.
Diferencia existente entre los conceptos de elemento y etiqueta: los elementos
son las entidades en sí, lo que tiene contenido, mientras que las etiquetas sólo
describen a los elementos. Un documento XML está compuesto por elementos,
y en su sintaxis éstos se nombran mediante etiquetas.
2. Declaración tipo de documento
Existen dos tipos de elementos: los vacíos y los no vacíos. Hay varias
consideraciones importantes a tener en cuenta:
• Toda etiqueta no vacía debe tener una etiqueta de cerrado: <etiqueta> debe
estar seguida de </etiqueta>. Esto se hace para evitar posibles errores de
interpretación.
• Todos los elementos deben estar perfectamente anidados. No está permitido
lo que se expone en el siguiente ejemplo:
<ficha><nombre>Jesus</ficha></nombre> Documento XML mal formado