Está en la página 1de 4

Investigación taller Introducción a XML.

1. Definición.
XML es el acrónimo de Extensible Markup Language, es decir, es un lenguaje de marcado
que define un conjunto de reglas para la codificación de documentos.
El lenguaje de marcado es un conjunto de códigos que se pueden aplicar en el análisis de
datos o la lectura de textos creados por computadoras o personas. El lenguaje XML
proporciona una plataforma para definir elementos para crear un formato y generar un
lenguaje personalizado.
Un archivo XML se divide en dos partes: prolog y body. La parte prolog consiste en
metadatos administrativos, como declaración XML, instrucción de procesamiento
opcional, declaración de tipo de documento y comentarios. La parte del body se compone
de dos partes: estructural y de contenido (presente en los textos simples).
El diseño XML se centra en la simplicidad, la generalidad y la facilidad de uso y, por lo
tanto, se utiliza para varios servicios web. Tanto es así que hay sistemas destinados a
ayudar en la definición de lenguajes basados en XML, así como APIs que ayudan en el
procesamiento de datos XML – que no deben confundirse con HTML.

2. Traer un XML
Las diferentes funciones de PHP simple XML que vamos a ver son:

 simplexml_load_file(): Carga un XML físico en un ojeto.


 simplexml_load_string(): Carga la estructura de un XML alamacenada en una
variable en un objeto.
 Con PHP foreach() recorreremos los xml.
 Con PHP count() obtendremos el número de nodos.
 La funicón attributes() de PHP simpleXML nos permite acceder a los valores de los
atributos de un XML.
 Para sacar la información de los nodos con namespaces usaremos la función
getNamespaces().

3. Sintaxis
El XML es un lenguaje de marcas esto quiere decir que al igual que el HTML es un
lenguaje de etiquetas. Su sintaxis es muy similar al HTML. Para cada elemento de texto
tenemos una etiqueta de apertura y otra de cierre, y también podemos poner etiquetas
vacías.
Sin embargo aquí el contenido o nombre de cada etiqueta lo elegimos nosotros, es
decir, podemos llamar a cada etiqueta con el nombre que queramos. Veamos un ejemplo
de documento XML y después lo analizaremos:
<?xml version="1.0"?>
<agenda>
<contacto>
<nombre>Miguel Marcos</nombre>
<telefono>645552388</telefono>
<email>miguelmar@gmail.com</email>
</contacto>
</agenda>

4. Elemento, Atributos, namespace


-Elemento:
Las distintas piezas de información en las que podemos dividir un documento reciben, en
XML, el nombre de elementos. Los elementos son los ladrillos, las piezas básicas de la
estructura del documento. Generalizando, podemos decir que los elementos cumplen las
siguientes funcionalidades:

 Especificación de contextos
 Delimitación de contenidos
 Estructuración de contenidos
 Jerarquización de elementos

Como mínimo, siempre encontraremos en un documento XML un elemento: el elemento


raíz. Como ya sabemos, todo documento XML tiene obligatoriamente un elemento raíz
(uno y sólo uno).
Los elementos están formados por tres componentes: una etiqueta de inicio o apertura
(también llamada marca inicial), por ejemplo <Titulo>, una etiqueta de finalización o cierre
(marca final), por ejemplo </Titulo>, y un contenido, situado entre ambas etiquetas.
Hay que notar que, al contrario de lo que sucede en HTML, todos los elementos de XML,
están formados por estas tres partes, las etiquetas no son el elemento en sí, son una
parte de él que lo delimita y que lo marca. El hecho de olvidar una etiqueta de finalización
o de inicio implica un error de buena formación. Una buena costumbre para no olvidar una
etiqueta de fin es escribir la de
inicio y la de fin al mismo tiempo.
En XML pueden existir elementos sin contenido, que reciben el nombre de elementos
vacíos, estos elementos pueden aparecer expresados de dos maneras, mediante dos
etiquetas, una de inicio y otra de fin, seguidas, o mediante una única etiqueta especial, la
etiqueta de elemento vacío.
El contenido de un elemento consta de datos carácter y/o otros subelementos. Pueden
incluirse referencias a caracteres, referencias a entidades y secciones CDATA (más
adelante veremos qué es esto).

-Atributos:
Los elementos pueden tener atributos, que son una manera de incorporar características
o propiedades a los elementos de un documento.
-Namespace:
Los espacios de nombres (namespaces) son uno de los pilares que conforman los
cimientos de XML.
En general, en informática, un namespace o espacio de nombres es un medio para
organizar clases dentro de un entorno, agrupándolas de un modo más lógico y jerárquico.
Por ejemplo, si estamos desarrollando un conjunto de clases para las operaciones de
gestión de una biblioteca, podemos ir escribiendo todas las clases y situarlas dentro de
una misma aplicación o DLL (biblioteca). Supongamos que tenemos dos clases para
operaciones de gestión de préstamos, denominadas Titulo y Fecha, y otras dos clases
para operaciones de compra, denominadas Factura y Precio.
Si necesitáramos añadir una clase más para las compras que registre el título del libro, el
nombre más idóneo sería Titulo, pero este nombre ya está siendo utilizado, así que para
evitar problemas de duplicidad, deberíamos elegir otro que puede que no se ajuste a
definir la funcionalidad de la clase.

5. DTD y Schema:
Al igual que las DTDs, los Schemas describen la estructura de la información. El motivo
de la creación de este nuevo estándar para realizar la labor de las DTDs es, básicamente,
la utilidad. Durante un tiempo, y a falta de otra solución más ajustada, se emplearon los
mecanismos que proporcionaba SGML para modelizar la información en XML. Pero el
descubrimiento de nuevas aplicaciones de XML al margen de la estructuración de
documentos forzó la creación de otras soluciones que ayudasen a solventar los nuevos
problemas a los que se enfrentaba el mercado. En el apartado siguiente veremos la
principales diferencias que existen entre las DTDs y los XML Schemas.
Como hemos indicado antes, una DTD es una especificación y estructuración necesaria
que permite validar el contenido estructural y formal de un documento de SGML (y XML).
Las DTDs se pueden usar para la definición de modelos de contenido, es decir, en que
orden y que elementos pertenecen a un elemento de orden superior en la jerarquía del
documento; además permiten, aun que de modo muy limitado, imponer ciertas
restricciones sobre el tipo de los elementos.

6. Display:
Las hojas de estilo CSS se desarrollaron para utilizarse junto con el lenguaje de marcas
HTML, pero un documento XML también puede hacer referencia a una hoja de estilo CSS
y visualizarse en el navegador.

7.Dom:
El DOM define un estándar para acceder y manipular documentos:

El HTML DOM define una forma estándar para acceder y manipular documentos
HTML. Presenta un documento HTML como una estructura de árbol.

El XML DOM define una forma estándar para acceder y manipular documentos
XML. Presenta un documento XML como una estructura de árbol.
8. Parser

Un Parser es un módulo, biblioteca o programa que se ocupa de transformar un archivo


de texto en una representación interna. En el caso de XML, como el formato siempre es el
mismo, no necesitamos crear un parser cada vez que hacemos un programa, hay muchos
parsers disponibles.

Los parser de XML se clasifican en SAX y DOM.

También se hace distinción entre los que son Validantes y los No Validantes. Los
primeros verifican que el documento, además de estar bien formado de acuerdo a las
reglas de XML, responda a una estructura definida en una DTD.

También podría gustarte