Está en la página 1de 17

INTRODUCCION A XML

Que es XML?

(eXtensible Markup Language Lenguaje extensible de marcas) es un conjunto de reglas que sirven para definir etiquetas semnticas para organizar un documento. Adems el XML es un metalenguaje que te permite disear tu propio lenguaje de etiquetas. A diferencia del un lenguaje de etiquetas normal (HTML), XML te permite definir tu propio lenguaje.. Vindolo desde un punto de vista simple y sin meternos en definiciones muy tcnicas. XML nos ayuda a tener nuestra informacin estructurada jerrquicamente por medio de etiquetas Tags que nosotros mismos crearemos.

Historia XML

Objetivos y usos de XML

Objetivos y usos del XML El XML se cre para que cumpliera varios objetivos.

Que fuera idntico a la hora de servir, recibir y procesar la informacin que el HTML, para aprovechar toda la tecnologa implantada para este ltimo.
Que fuera formal y conciso desde el punto de vista de los datos y la manera de guardarlos. Que fuera extensible, para que lo puedan utilizar en tod os los campos del conocimiento. Que fuese fcil de leer y editar.

Que fuese fcil de implantar, programar y aplicar a los distintos sistemas.

Estructura de un documento

Aunque a primera vista, un documento XML puede parecer similar a HTML, hay una diferencia principal Un documento XML contiene datos que se autodefinen, exclusivamente. En XML se separa el contenido de la presentacin de forma total.

Ejemplo:
<?xml version="1.0"?>
<mensaje> <remite> <nombre>Alfredo Reino</nombre> <email>alf@ibium.com</email> </remite> <destinatario> <nombre>Bill Clinton</nombre> <email>president@whitehouse.gov</email>

</destinatario>
<asunto>Hola Bill</asunto> <texto> <parrafo>Hola qu tal? Hace <enfasis>mucho</enfasis> que no escribes. A ver si llamas y quedamos para tomar algo.

</parrafo>
</texto> </mensaje>

Este mismo documento puede ser visto de forma grfica, para comprender mejor la estructura de un documento XML.

Componentes de un Documento XML


Comentarios
<!-- Esto es comentario <-d#dd -->

Elementos
<nombre id="surname">Perez</nombre>
<vacia color="verde"/>'

Declaraciones de tipo elemento

El elemento cliente debe contener a nombre y


<!ELEMENT cliente (nombre,apellidos,nif?,tlf*,direccion+)> <!ELEMENT nombre (#PCDATA)> <!ELEMENT apellidos(ape1,ape2?)>

apellidos, puede contener a nif y tlf - a este incluso ms de una vez- y debe contener al menos una vez la direccin del cliente (para poder enviarle el pedido a casa).

Declaraciones de listas de atributos


Significado
El atributo ser una cadena de caracteres. No todos los caracteres son vlidos. Usaremos secciones PCDATA cuando queramos incluir los carcteres no vlidos. El atributo sirve para identificar al elemento dentro del documento. Slo puede haber un atributo de tipo ID por elemento.
Este atributo se emplear para referenciar a otros elementos del documento a partir de su ID.

Valor

CDATA

ID

IDREF/S

ENTITY/S NMTOKE/S
(<< enumerados>>)

Contiene nombres de entidades. Ver siguiente apdo. Contiene una nica cadena de texto (ed, una sola palabra).
Aqu especificamos EL conjunto de valores q puede tomar el atributo; esto lo hacemos separandolos con |.

Valores por defecto


Significado Con esto indicamos que es obligatorio darle un valor al atributo. Con esto indicamos que es opcional darle un valor al atributo. Podemos poner un valor (NO lista de valores) opcional directamente; entonces, si no se le otorga un nuevo valor posteriormente, asumir el dado (ed, es el valor x por defecto). No es obligatorio darle un valor en el doc.

Valor #REQUIRED #IMPLIED

<<valor>>

#FIXED <<valor>>

Con esto obligamos a q el atributo tome necesariamente el valor especificado en <<valor>>

Documentos XML bien formados

Estructura jerrquica de elementos <LI>HTML <B>permite <I>esto</B></I>. <LI>En XML la <B>estructura <I>es</I> jerrquica</B>.</LI>

Etiquetas Vacias <LI>Esto es HTML<BR>en el que casi todo est permitido</LI> <LI>En XML, somos<BR/> ms restrictivos.</LI>

Un solo elemento raiz


Los documentos XML slo permiten un elemento raiz, del que todos los dems sean parte. Es decir, la jerarqua de elementos de un documento XML bien-formado slo puede tener un elemento inicial.

Tipo de letra, espacios en blanco

El XML es sensible al tipo de letra utilizado, es decir, trata las maysculas y minsculas como caracteres diferentes. Si un elemento de XML est definido como "ELEMENTO", no podemos usar "elemento", ni "Elemento", ni "eleMENto" para referirnos a l.
Nombrando cosas Al utilizar XML, es necesario asignar nombres a las estructuras, tipos de elementos, entidades, elementos particulares, etc. no se pueden crear nombres que empiecen con la cadena "xml", "xMl", "XML" o cualquier otra variante. Las letras y rayas se pueden usar en cualquier parte del nombre. Tambin se pueden incluir dgitos, guiones y caracteres de punto, pero no se puede empezar por ninguno de ellos. El resto de caracteres, como algunos smbolos, y espacios en blanco, no se pueden usar.

Marcado y datos

Es sencillo reconocer las marcas en un documento XML. Son aquellas porciones que empiezan con "<" y acaban con ">", o bien, en el caso de las referencias de entidad, empiezan por "&" y acaban con ";".

Tecnologias relacionadas con XML

Contenidos: DTD o XML Schema

Un documento XML puede contener muchos tipos de informacin. Es decir, pueden haber muchos lenguajes escritos en XML para cualquier colectivo de usuarios. Por ejemplo, Si lo utiliza el colectivo de mdicos podra crear un lenguaje en XML especfico para almacenar diagnsticos de los pacientes. Este lenguaje se podra llama PacientesML. Si los distribuidores de pelculas utilizan XML podrn crear sus propios lenguajes para guardar la informacin de las pelculas. Este lenguaje se podra llamar PeliculasML. Si estamos escribiendo aplicaciones para mviles podremos utilizar un lenguaje para aplicaciones inalmbricas (Wireless), que se llama WML.

Diseo: CSS o XSL

Para cada documento XML que se desee presentar en pantalla formateado de la manera que deseemos se tiene que escribir una hoja de estilos o similar estas son las CSS. XSL, que son las siglas de XML Style Language, es el segundo lenguaje con el que trabajar en XML. Este lenguaje no se limita a definir qu estilo aplicar a cada elemento del documento XML. Adems se pueden realizar pequeas instrucciones tpicas de los lenguajes de programacin y la salida no tiene porque ser un documento HTML, sino que adems podra ser de otros tipos, cualquiera que podamos necesitar como un documento escrito en WML (para WAP), un documento de texto plano u otro documento XML.

Programacin: SAX o DOM

Si queremos realizar acciones con nuestros datos escritos en XML tenemos tambin mucho camino ya implementado. El W3C ha especificado dos mecanismos para acceder a documentos XML y trabajar con ellos. Se tratan simplemente de unas normas que indican a los desarrolladores la manera de acceder a los documentos. Estas normas incluyen una jerarqua de objetos que tienen unos mtodos y atributos con los que tendremos que trabajar y que nos simplificarn las tareas relativas al recorrido y acceso a las partes del documento. Estos dos mecanismos se denominan SAX y DOM. SAX se utiliza para hacer un recorrido secuencial de los elementos del documento XLM y DOM implica la creacin de un rbol en memoria que contiene el documento XML, y con l en memoria podemos hacer cualquier tipo de recorrido y acciones con los elementos que queramos.

Diferencias entre HTML y XML

El HTML se preocupa por formatear datos y para ello son las etiquetas que tiene el lenguaje, para formatear la informacin que se desea mostrar. El XML se preocupa por estructurar la informacin que pretende almacenar. La estructura la marca la lgica propia de la informacin. Procesar la informacin en HTML es inviable, por estar mezclada con los estilos y las etiquetas que formatean la informacin. En XML se puede procesar la informacin con mucha facilidad, porque todo est ordenado de una manera lgica, as mismo el formateo de la informacin para que se pueda entender bien por el usuario es viable a travs de un pequeo procesamiento, a travs de hojas de estilos o similares.