Está en la página 1de 14

Introducción XML

Qué es XML

Es un lenguaje de marcas. Los contenidos están delimitados por etiquetas.

Es un metalenguaje. Se pueden definir las etiquetas necesarias.

Define una sintaxis general para maquetar datos.

Es un formato estándar y flexible para documentos informáticos que puede ser


adaptado al campo de aplicación que se desee.

Es un formato de texto plano, muy adecuado para almacenar información y


transmitirla.

Un archivo XML contiene etiquetas y datos.


Qué NO es XML

No es un protocolo de comunicación. No enviará datos por nosotros.

No es un sistema gestor de bases de datos. Aunque una base de datos


relacional pueda contener campos del tipo XML, incluso pueden existir bases de
datos nativas XML

No es un lenguaje de programación. No se pueden generar ejecuciones a partir


de un documento XML.
Para qué se utiliza

Es muy utilizado para intercambio de información. Ya que xml es texto plano es


adecuado para almacenar información y transmitirla.

Es muy utilizado para estructurar documentos. Podríamos decir que, al igual


que las bases de datos relacionales son adecuadas para almacenar y tratar
datos, XML es adecuado para almacenar y tratar documentos.

XML no hace nada por sí mismo. Estructura la información y permite que otros
programas la utilicen.
Tecnologías XML

● XML. Lenguaje de marcas de uso general.


● Validación XML:
○ DTD. Sistema de validación de ficheros XML.
○ XSD, XML Schema. Sistema de validación de ficheros XML.
● Conexión de documentos XML:
○ Xlink. Permite crear vínculos en documentos XML:
○ XPointer. Permite identificar partes de XML para vínculos.
● XSL. Permite describir como se muestra XML. se compone de;
○ XSLT. Permite la transformación de documentos XML:
○ XSL-Fo. Indica como se van a mostrar los datos en pantalla. es un lenguaje de maquetado
○ XPath. Permite buscar y seleccionar en XML para XSLT
● XQuery. Parecido a SQL con capacidades de programación:
Estructura de documento XML

La estructura general de un documento XML está formada por dos partes:

Prólogo (opcional): contiene una secuencia de instrucciones de procesamiento


y/o declaración del tipo de documento. Se puede dividir en dos partes:

● Declaración XML. Establece la versión de xml, el tipo de codificación y si es


un documento autónomo.
● Declaración de tipo de documento. Establece el tipo de documento que es.

Cuerpo: es el contenido de información del documento, organizado como un


árbol único de elementos marcados.


Estructura de documento XML

La estructura general de un documento XML está formada por dos partes:

Prólogo (opcional): contiene una secuencia de instrucciones de procesamiento


y/o declaración del tipo de documento. Se puede dividir en dos partes:

1. Declaración XML. Establece la versión de xml, el tipo de codificación y si es


un documento autónomo.
2. Declaración de tipo de documento. Establece el tipo de documento que es.

Cuerpo: es el contenido de información del documento, organizado como un


árbol único de elementos marcados.


Estructura de documento - Declaración XML

La declaración XML es una instrucción de procesamiento especial y cumple


varias funciones:

○ Marca el documento como texto XML


○ Incluye la declaración de la versión de XML utilizada en el documento
○ Aporta información sobre la codificación empleada para representar los caracteres
○ Indica si el documento es autónomo o no

Si está presente, la declaración XML debe ser la primera línea del documento. Un
ejemplo de declaración XML completa podría ser:

<?xml versión= “1.0” encoding= “ISO-8859-1” standalone= “yes”?>


1. Declaración XML

La declaración XML es una instrucción de procesamiento especial y cumple


varias funciones:

○ Marca el documento como texto XML


○ Incluye la declaración de la versión de XML utilizada en el documento
○ Aporta información sobre la codificación empleada para representar los caracteres
○ Indica si el documento es autónomo o no

Si está presente, la declaración XML debe ser la primera línea del documento. Un
ejemplo de declaración XML completa podría ser:

<?xml versión= “1.0” encoding= “ISO-8859-1” standalone= “yes”?>


1. Declaración XML
<?xml versión= “1.0” encoding= “ISO-8859-1” standalone= “yes”?>

Los campos dentro de la declaración XML deben seguir el orden estricto

Aunque es opcional, muchos documentos XML comienzan con una línea como
la primera. Es la encargada de indicar que lo que la sigue es un documento XML.
Puede tener varios atributos (los campos que van dentro de la declaración),
algunos obligatorios y otros no:

Si se especifica la codificación (“encoding”), o la declaración de documento


autónomo (“standalone”), es necesario incluir también la información sobre la
versión (“versión”).
1.2. Declaración XML
• version: indica la versión de XML usada en el documento; la actual es la 1.0. Es
obligatorio ponerlo, a no ser que sea un documento externo a otro que ya lo
incluya.

• encoding: señala la forma en que se ha codificado el documento. Cualquier


valor está permitido, y depende del parser entender o no la codificación. Por
defecto es UTF-8, aunque existen otras, como UTF-16, US-ASCII, ISO-8859-1, etc.
No es obligatorio salvo que se trate de un documento externo a otro principal.

• standalone: indica si el documento va acompañado de un DTD (no), o no lo


necesita (yes). Su presencia no es necesaria, ya que más tarde se indicará el
DTD en caso de ser necesario.
2. Declaración tipo de documento

Hay que resaltar algunos detalles de gran importancia:

• Los documentos XML son sensibles a las mayúsculas. Es decir, en ellos se


diferencian las mayúsculas de las minúsculas. Por ello <FICHA> sería una
etiqueta diferente a <ficha>.

• Además todos los espacios y retornos de carro se tienen en cuenta (dentro de


las etiquetas, en los elementos).

• Hay algunos caracteres especiales reservados, que forman parte de la sintaxis


de XML: <, >, &, " y '. En su lugar, cuando se desee representarlos habrá que usar
las entidades &lt;, &gt;, &amp;, &quot; y &apos; respectivamente.
2. Declaración tipo de documento

Los valores de los atributos de todas las etiquetas deben ir siempre


entrecomillados. Son válidas las dobles comillas (") y la comilla simple (').

Analizando el contenido, se observan una serie de etiquetas que contienen


datos.

Diferencia existente entre los conceptos de elemento y etiqueta: los elementos


son las entidades en sí, lo que tiene contenido, mientras que las etiquetas sólo
describen a los elementos. Un documento XML está compuesto por elementos,
y en su sintaxis éstos se nombran mediante etiquetas.
2. Declaración tipo de documento

Existen dos tipos de elementos: los vacíos y los no vacíos. Hay varias
consideraciones importantes a tener en cuenta:

• Toda etiqueta no vacía debe tener una etiqueta de cerrado: <etiqueta> debe
estar seguida de </etiqueta>. Esto se hace para evitar posibles errores de
interpretación.

• Todos los elementos deben estar perfectamente anidados. No está permitido


lo que se expone en el siguiente ejemplo:

<ficha><nombre>Jesus</ficha></nombre> Documento XML mal formado

También podría gustarte