Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción A: Universidad Técnica Federico Santa María Departamento de Electrónica ELO-330 Programación de Sistemas
Introducción A: Universidad Técnica Federico Santa María Departamento de Electrónica ELO-330 Programación de Sistemas
Introduccin a XML
XML
XML (Extensible Markup Language) es un subconjunto del SGML (Standard Generalized Markup Language). XML es un metalenguaje con el que se pueden definir otros lenguajes de etiquetas. Los documentos XML tienen formato de texto. Desde febrero de 1998 es una recomendacin del W3C (World Wide Web Consortium).
Estructura de XML
Un documento bien formado es aquel documento que cumple con la especificacin de XML 1.0, es decir que sea sintctica mente correcto. Un documento XML bien formado debe seguir algunas reglas bsicas: Debe contener uno o ms elementos. Debera comenzar con una declaracin XML. Ej. <?xml version="1.0"standalone="yes"?> (explicacin) Slo puede haber un elemento raz.
Estructura de XML
Cumple todas las restricciones que proporciona su especificacin a travs del DTD. Toda etiqueta abierta hay que cerrarla. Para cada etiqueta de inicio debe existir una etiqueta de termino. Las nicas etiquetas que van solas son las etiquetas vacas. Ej. < Nombre> Rodrigo </Nombre> <xsd:attribute name="xxx" type="yyy"/>
Estructura de XML
Es sensible a maysculas y minsculas, las etiquetas de inicio y de termino se tienen que escribir igual. No se pueden intercalar etiquetas.
Ej. <li>HTML <b> permite <i> esto </b> <li>En XML la <b> estructura <i> es </i> jerrquica </b>.</li> </i>.
Una etiqueta puede tener atributos cerrados entre comillas. Ej. <xsd:attribute name=idioma"/> El nombre de las etiquetas empiezan con una letra, o con uno o ms signos de puntuacin. Los comentarios van encerrados.
Estructura de XML
Un ejemplo de un documento XML bien formado:
<?xml version="1.0" standalone="yes"?> <biblioteca> <libro call_no="PZ3.S8195Gr6"> <cover href="grapes.gif" alt="Grapes of Wrath"/> <titulo>The Grapes of Wrath</titulo> <autor> <apellido>Steinbeck</apellido> <nombre>John</nombre> </autor> <publicacin>Viking Press</publicacin> <ao_pub>1939</ao_pub> </libro> </biblioteca>
XERCER?
Xercer es un parser XML, es decir, un analizador del archivo XML, que establece si ste es vlido.
Xercer es desarrollado y mantenido por la organizacin apache. Es multiplataforma.
Xerces-J
Caracterstica: 100% en conformidad con XML Schema processor
Xerces-J
Xerces2 Java Parser 2.6.2, apoya los siguientes estndares y APIs: eXtensible Markup Language (XML) 1.0 Third Edition Recommendation Namespaces in XML Recommendation eXtensible Markup Language (XML) 1.1 First Edition Recommendation Namespaces in XML 1.1 Recommendation Document Object Model (DOM) Level 2 Core, Events, and Traversal and Range Recommendations Simple API for XML (SAX) 2.0.1 Core, and Extensions Java APIs for XML Processing (JAXP) 1.2 XML Schema 1.0 Structures and Datatypes Recommendations
Xerces-J
La mayor parte de los Parser pueden trabajar de dos formas:
de forma independiente. usndolos como libreras desde lenguajes de programacin.
Xercer-J no es la excepcin:
se puede usar stand-alone. o como una librera xerces.jar, cuyos objetos se pueden instanciar desde los programas.
Parser en Lnea
XParse de Jeremie
Conclusiones
Perspectivas futuras de XML .
Existen herranmientas que apoyan el desarrollo y la implementacin de XML, entre ellas se encuentra Xercer, el cual esta implementado para ser usado con Java.
XML tiene un muy amplio campo de aplicaciones, que le permite seguir creciendo como ayuda a los usuarios de internet . Agentes
XML, a pesar de su rpido desarrollo, tiene un largo camino hacia su total madurez. Esta parte explora desde el punto de vista tcnico y poltico el futuro de XML y estndares asociados tanto dentro de W3C como fuera de ella.
al
FIN
DTD
Un "Document type definition, DTD, es una declaracin en un documento de SGML o de XML que especifiqua apremios en la estructura del documento. Puede ser incluido dentro del archivo de documento, pero se almacena normalmente en un archivo separado de ASCII-text. La sintaxis del DTD de SGML y de DTD de XML son muy similares, pero no idnticos
Example
Un ejemplo de un muy simple DTD de XML para describir un lista de personas es dado a continuacin: <!ELEMENT people_list (person*)> <!ELEMENT person (name, birthdate?, gender?, socialsecuritynumber?)> <!ELEMENT name (#PCDATA) > <!ELEMENT birthdate (#PCDATA) > <!ELEMENT gender (#PCDATA) > <!ELEMENT socialsecuritynumber (#PCDATA) > Tomando esto lnea por lnea, dice: Una "people_list" es un elemento que contiene muchos elemetos "person". El "*" denota que pueden haber 0, 1 o muchos elementos "person". Un elemento "person" contiene los elementos "name", "birthdate", "gender" y "socialsecuritynumber". El "?" indica que un elemento es opcional. El elemento "name" no tiene "?", entonces "person" debe contener un elemento"name". Un elemento "name" contiene informacin. Un elemento "birthdate" contiene informacin. Un elemento "gender" contiene informacin. Un elemento "socialsecuritynumber" contiene informacin.
XML DOM
Cmo funciona XML DOM?
Los archivos _XML, son enviados a la mquina cliente, en la cual, gracias a DOM, se pueden realizar las operaciones pedidas por los clientes. Una vez, que el cliente termina sus requerimientos, la informacin es reenviada, al servidor. Gracias a DOM, no hay prdida, ni desorden en los datos enviados.
Aplicaciones
Metadato
Metadatos: informacin sobre los datos. Proporcionan descriptores, propiedades, informacin acerca de otros objetos (textos, contenidos multimedia, manuales, programas, personas, etc.) para simplificar su uso y su gestin o facilitar su localizacin. En las bibliotecas existen desde tiempos inmemoriales en forma de fichas de catlogo, que facilitan la localizacin de los documentos. En Internet esto no es tan fcil: los metadatos deben ser adecuados para la interpretacin tanto por parte de las personas como por los robots de bsqueda. Adems deben ser tan fciles de crear que cualquier autor pueda describir el contenido de sus pginas: accesibilidad y utilidad.
Metadato
La etiqueta META del HTML. Ej: se usa keyworks para indexar y devuelve description en lugar de las dos primeras lneas del documento.
<META NAME="description" CONTENT="XML, formatos para Internet"> <META NAME="keyworks" CONTENT="XML, Internet, ebusiness">
Declaracin
version: Indica la versin de XML usada en el documento. Es obligatorio ponerlo, a no ser que sea un documento externo a otro que ya lo inclua. encoding: La forma en que se ha codificado el documento. Se puede poner cualquiera, y depende del parser el entender o no la codificacin. Por defecto es UTF-8, aunque podran ponerse otras, como UTF-16, US-ASCII, ISO-8859-1, etc. No es obligatorio salvo que sea un documento externo a otro principal. standalone: Indica si el documento va acompaado de un DTD ("no"), o no lo necesita ("yes"); en principio no hay porqu ponerlo, porque luego se indica el DTD si se necesita Volver