Está en la página 1de 34

Universidad Tcnica Federico Santa Mara Departamento de Electrnica ELO-330 Programacin de Sistemas

Introduccin a XML

XML
XML (Extensible Markup Language) es un subconjunto del SGML (Standard Generalized Markup Language). XML es un metalenguaje con el que se pueden definir otros lenguajes de etiquetas. Los documentos XML tienen formato de texto. Desde febrero de 1998 es una recomendacin del W3C (World Wide Web Consortium).

Aplicaciones basadas en XML


En general, XML puede servir en tres casos:
Para contener informacin Para definir el contenido de los mensajes Para describir el contenido de los mensajes

Aplicaciones basadas en XML


Ejemplo Real de Mtodo Antiguo Transmisin de informacin
0148I49A052209020622052002090206VANADU ADUANA EX JORGE CABE 02649000868610148I49N1506062002GEORGINA OLAVARRIA Y CIA.LTDA.AV.NUEVA COSTANERA 3730, VITACURA1313203788508204JORGE OLAVARRIA ROMUSSI 024845591BRU TEXTILES NV ZANDVOORSTRAAT 12 D B-2800 MECHELEN 51400000000000000000000000000000000000000000000000000000000514BELGICA 514BELGICA 04AMSTERDAM T621AEROP.A.M.BENIT992RAEROSAN S.A. (SA101805200200000000012205200200000000 22052002 2205200200000000000000000003649000868610148I49MARTINAIR HOLLAND 51596674490148110090000432 180520021922376 17052002ABX LOGISTICS 7996876070000000000000000000000000000000GENERAL 01004010060000000026921013000000004327300100000000312480010000000001084 400000120000000000625000000000570000000004271700000000000000 04649000868610148I49001TEJIDO DE FILAMENTO CONTINUO DAE WON UNITECH-F 100 PCT. POLIESTER TENIDOS, SIN TEXTURIZAR TEJIDO DE TRAMA Y URDIMBRE 00000000000000000004385006E000000712611170000000000000 540761130000000427170007002230000000029900018000000178+0000000082270000 000000000 0000000000000000000000000 0000000000000000000000000 000000000000

Aplicaciones basadas en XML


Ejemplo real en Aduana de Chile
<DSC> <codproducto>YNUA00385</codproducto> <FechaCreacionUsuario>2002-07-15 00:00:00.0</FechaCreacionUsuario> <VersionProducto>2</VersionProducto> <despachador>A54</despachador> <RutCliente>86223700</RutCliente> <DigitoVerificador>5</DigitoVerificador> <DescripcionDeclarada> ; SIERRA ALTERNATIVA; ALBER; KERF GANGSAW; DE 420MM X 13MM X 40MM X 0,80MM., PARA MAQUINA PARA TRABAJAR LA MADERA </DescripcionDeclarada> <FechaCargaAduana>2002-08-14 16:27:58.0</FechaCargaAduana> <RESPUESTAS> <respuesta> ACEPTADO </respuesta> </RESPUESTAS> </DSC>

Aplicaciones basadas en XML


Personalizacin de la WEB (lenguaje propio) Cada usuario (o grupo de usuarios) puede crear su propio lenguaje para el formato de datos y documentos, su propio vocabulario, segn sus necesidades, siguiendo las reglas de XML. Aplicaciones XML para el comercio electrnico (intercambio) Aunque inicialmente XML se defini para separar contenido de presentacin, ha resultado esencial para el intercambio de informacin estructurada a travs de Internet

Aplicaciones basadas en XML


Gestin de la informacin / conocimiento (visual) Si etiquetamos la informacin y a cada usuario se le proporciona una serie de etiquetas de inters, se podra resaltar la informacin que le es interesante, frente a la que no es relevante.
Descargar trabajo en el Servidor (desaturacin) Por medio del Modelo de Objetos de Documentos (DOM), podemos evitarle trabajo al servidor, espera al cliente y no saturar tanto la red.

Aplicaciones basadas en XML


Buscador WEB (velocidad en bsquedas) Si disponemos de un sitio donde toda la informacin se encuentre etiquetada en documentos XML, las bsquedas seran mucho ms efectivas, ya que se conjuga la potencia de la bsqueda indexada junto la bsqueda semntica.
Intercambio de informacin (seguridad, velocidad gestiones) Si contratamos a una empresa y nos facilitan la estructura de los datos que vamos a recibir (DTD/Schema), sabremos en todo momento qu tipos de documentos XML estamos recibiendo, y podremos tratarlos de la forma que deseemos.

Cmo trabajar con XML


Navegadores (Browsers) Editores XML Parsers XML Editores XSL

Cmo trabajar con XML


Un documento XML tiene dos estructuras, una lgica y otra fsica.
Fsicamente, un documento XML puede consistir en una o ms unidades de almacenamiento, llamadas entidades. Las entidades tienen contenido y estn identificadas por un nombre. Cada documento XML contiene una entidad, llamada entidad documento, que sirve como punto de partida para el procesador XML y que puede contener el documento completo.

Cmo trabajar con XML


Entidades Predefinidas
En XML 1.0, se definen cinco entidades para representar caracteres especiales y que no se interpreten como marcado en el procesador XML. Es decir, por ejemplo, as podemos usar el carcter "<" sin que se interprete como el comienzo de una etiqueta XML.

Entidad &amp; &lt; &gt; &apos; &quot;

Carcter & < > ' "

Cmo trabajar con XML


Lgicamente, esta estructurado en forma de rbol, con una raz a partir de la cual se organiza la informacin.
El documento est compuesto de declaraciones, elementos, comentarios, referencias a caracteres e instrucciones de procesamiento, todos los cuales estn estn indicados por una marca explcita.
Ej. <aviso tipo="emergencia" gravedad="mortal">Que no cunda el pnico</aviso>

Cmo trabajar con XML


Los elementos pueden tener atributos, que son una manera de incorporar caractersticas o propiedades a los elementos de un documento.
Ej. un elemento "chiste" puede tener un atributo "tipo" y un atributo "calidad", con valores "vascos" y "bueno" respectivamente. <chiste tipo="vascos" calidad="bueno"> Esto es un da que Patxi y Josu van paseando... </chiste>

Cmo trabajar con XML


Cada documento XML contiene uno o ms elementos, cuyos limites estn delimitados por etiquetas de comienzo y de final o, en el caso de elementos vacos, por una etiqueta de elemento vaco. Cada elemento tiene un tipo, identificado por un nombre, denominado identificador genrico, y puede tener un conjunto de especificaciones de atributos.

Cmo trabajar con XML


La "declaracin de tipo de documento" define qu tipo de documento estamos creando para ser procesado. Es decir, definimos que declaracin de tipo de documento (DTD) valida y define los datos que contiene nuestro documento XML. Un identificador pblico (PUBLIC): que hace referencia a dicha DTD. El tipo de documento Identificador universal de recursos (URI): precedido de la palabra SYSTEM. Dnde encontrar la informacin sobre su Definicin Ej. <!DOCTYPE MESAJE SYSTEM "mesaje.dtd">
<!DOCTYPE HTML PUBLIC "-/ /W3C/ /DTD HTML 3.2 Final/ /EN"> <!DOCTYPE LABEL SYSTEM http://azuaje.ulpgc.es/dtds/label.dtd">

Estructura de XML
Un documento bien formado es aquel documento que cumple con la especificacin de XML 1.0, es decir que sea sintctica mente correcto. Un documento XML bien formado debe seguir algunas reglas bsicas: Debe contener uno o ms elementos. Debera comenzar con una declaracin XML. Ej. <?xml version="1.0"standalone="yes"?> (explicacin) Slo puede haber un elemento raz.

Estructura de XML
Cumple todas las restricciones que proporciona su especificacin a travs del DTD. Toda etiqueta abierta hay que cerrarla. Para cada etiqueta de inicio debe existir una etiqueta de termino. Las nicas etiquetas que van solas son las etiquetas vacas. Ej. < Nombre> Rodrigo </Nombre> <xsd:attribute name="xxx" type="yyy"/>

Estructura de XML
Es sensible a maysculas y minsculas, las etiquetas de inicio y de termino se tienen que escribir igual. No se pueden intercalar etiquetas.
Ej. <li>HTML <b> permite <i> esto </b> <li>En XML la <b> estructura <i> es </i> jerrquica </b>.</li> </i>.

Una etiqueta puede tener atributos cerrados entre comillas. Ej. <xsd:attribute name=idioma"/> El nombre de las etiquetas empiezan con una letra, o con uno o ms signos de puntuacin. Los comentarios van encerrados.

Estructura de XML
Un ejemplo de un documento XML bien formado:
<?xml version="1.0" standalone="yes"?> <biblioteca> <libro call_no="PZ3.S8195Gr6"> <cover href="grapes.gif" alt="Grapes of Wrath"/> <titulo>The Grapes of Wrath</titulo> <autor> <apellido>Steinbeck</apellido> <nombre>John</nombre> </autor> <publicacin>Viking Press</publicacin> <ao_pub>1939</ao_pub> </libro> </biblioteca>

XERCER?
Xercer es un parser XML, es decir, un analizador del archivo XML, que establece si ste es vlido.
Xercer es desarrollado y mantenido por la organizacin apache. Es multiplataforma.

Xerces-J
Caracterstica: 100% en conformidad con XML Schema processor

Xerces-J
Xerces2 Java Parser 2.6.2, apoya los siguientes estndares y APIs: eXtensible Markup Language (XML) 1.0 Third Edition Recommendation Namespaces in XML Recommendation eXtensible Markup Language (XML) 1.1 First Edition Recommendation Namespaces in XML 1.1 Recommendation Document Object Model (DOM) Level 2 Core, Events, and Traversal and Range Recommendations Simple API for XML (SAX) 2.0.1 Core, and Extensions Java APIs for XML Processing (JAXP) 1.2 XML Schema 1.0 Structures and Datatypes Recommendations

Xerces-J
La mayor parte de los Parser pueden trabajar de dos formas:
de forma independiente. usndolos como libreras desde lenguajes de programacin.

Xercer-J no es la excepcin:
se puede usar stand-alone. o como una librera xerces.jar, cuyos objetos se pueden instanciar desde los programas.

Parser en Lnea
XParse de Jeremie

Conclusiones
Perspectivas futuras de XML .

Existen herranmientas que apoyan el desarrollo y la implementacin de XML, entre ellas se encuentra Xercer, el cual esta implementado para ser usado con Java.
XML tiene un muy amplio campo de aplicaciones, que le permite seguir creciendo como ayuda a los usuarios de internet . Agentes

XML, a pesar de su rpido desarrollo, tiene un largo camino hacia su total madurez. Esta parte explora desde el punto de vista tcnico y poltico el futuro de XML y estndares asociados tanto dentro de W3C como fuera de ella.

al

FIN

DTD
Un "Document type definition, DTD, es una declaracin en un documento de SGML o de XML que especifiqua apremios en la estructura del documento. Puede ser incluido dentro del archivo de documento, pero se almacena normalmente en un archivo separado de ASCII-text. La sintaxis del DTD de SGML y de DTD de XML son muy similares, pero no idnticos

Example
Un ejemplo de un muy simple DTD de XML para describir un lista de personas es dado a continuacin: <!ELEMENT people_list (person*)> <!ELEMENT person (name, birthdate?, gender?, socialsecuritynumber?)> <!ELEMENT name (#PCDATA) > <!ELEMENT birthdate (#PCDATA) > <!ELEMENT gender (#PCDATA) > <!ELEMENT socialsecuritynumber (#PCDATA) > Tomando esto lnea por lnea, dice: Una "people_list" es un elemento que contiene muchos elemetos "person". El "*" denota que pueden haber 0, 1 o muchos elementos "person". Un elemento "person" contiene los elementos "name", "birthdate", "gender" y "socialsecuritynumber". El "?" indica que un elemento es opcional. El elemento "name" no tiene "?", entonces "person" debe contener un elemento"name". Un elemento "name" contiene informacin. Un elemento "birthdate" contiene informacin. Un elemento "gender" contiene informacin. Un elemento "socialsecuritynumber" contiene informacin.

Un ejemplo de un archivo XML, el cual usa el DTD


<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE people_list SYSTEM example.dtd"> <people_list> <person> <name>Fred Bloggs</name> <birthdate>27/11/2008</birthdate> <gender>Male</gender> </person> </people list>
Aplicaciones Estructura

XML DOM
Cmo funciona XML DOM?
Los archivos _XML, son enviados a la mquina cliente, en la cual, gracias a DOM, se pueden realizar las operaciones pedidas por los clientes. Una vez, que el cliente termina sus requerimientos, la informacin es reenviada, al servidor. Gracias a DOM, no hay prdida, ni desorden en los datos enviados.

Aplicaciones

Metadato
Metadatos: informacin sobre los datos. Proporcionan descriptores, propiedades, informacin acerca de otros objetos (textos, contenidos multimedia, manuales, programas, personas, etc.) para simplificar su uso y su gestin o facilitar su localizacin. En las bibliotecas existen desde tiempos inmemoriales en forma de fichas de catlogo, que facilitan la localizacin de los documentos. En Internet esto no es tan fcil: los metadatos deben ser adecuados para la interpretacin tanto por parte de las personas como por los robots de bsqueda. Adems deben ser tan fciles de crear que cualquier autor pueda describir el contenido de sus pginas: accesibilidad y utilidad.

Metadato
La etiqueta META del HTML. Ej: se usa keyworks para indexar y devuelve description en lugar de las dos primeras lneas del documento.
<META NAME="description" CONTENT="XML, formatos para Internet"> <META NAME="keyworks" CONTENT="XML, Internet, ebusiness">

Declaracin
version: Indica la versin de XML usada en el documento. Es obligatorio ponerlo, a no ser que sea un documento externo a otro que ya lo inclua. encoding: La forma en que se ha codificado el documento. Se puede poner cualquiera, y depende del parser el entender o no la codificacin. Por defecto es UTF-8, aunque podran ponerse otras, como UTF-16, US-ASCII, ISO-8859-1, etc. No es obligatorio salvo que sea un documento externo a otro principal. standalone: Indica si el documento va acompaado de un DTD ("no"), o no lo necesita ("yes"); en principio no hay porqu ponerlo, porque luego se indica el DTD si se necesita Volver

También podría gustarte