Está en la página 1de 10

UT1.

Reconocimiento de las caractersticas de Lenguajes de marcas


1.1. DEFINICIN Y CLASIFICACIN DE LENGUAJES DE MARCAS:

Los lenguajes de marcas son aquellos que se utilizan para codificar un documento donde, junto con el texto, se incorporan marcas, etiquetas o anotaciones con informacin adicional, relativa a la estructura del texto, a su presentacin o informacin del propio documento.
Estos lenguajes no son equivalentes a los lenguajes de programacin, pues no tienen variables ni funciones aritmticas, sino que se usan para especificar cules son las etiquetas posibles, dnde deben colocarse y el significado que tendr cada una de ellas.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.2. TIPOS DE LENGUAJES DE MARCAS: Se suelen dividir en tres grupos, aunque existen lenguajes que combinan caractersticas de ms de un grupo:

Lenguajes orientados a presentacin. Usados tradicionalmente por los procesadores de texto (EJ: Microsoft Word), codifican cmo ha de presentarse el documento (EJ: tipo de letra, tamao, espacio entre prrafo lnea). tiles para maquetar la presentacin de un documento para su lectura, pero resulta insuficiente para el procesamiento automtico de la informacin. Ej: RTF (Rich Text Format) de Microsoft, HTML, Lenguajes procedurales. Aqu, las etiquetas son tambin orientadas a presentacin, pero se integran dentro de un marco procedural que permite definir macros (secuencias de acciones) y subrutinas. (EJ: PostScript y LaTeX, con el que se realizan la mayora de documentos cientficos). En este caso, el programa que representa el documento debe interpretar el cdigo en el mismo orden en que aparece. Lenguajes descriptivos. Aqu las marcas sirven para indicar qu es esa informacin (fragmento de texto), es decir, describen qu es lo que se est representando, tal como es, pero sin especificar cmo debe ser representada (aparecer), o en qu orden. (EJ: SGML, XML, etc.). Ventaja: flexibidad Por ejemplo, los hiperenlaces fueron diseados, en un principio, para que un usuario que leyese el texto los pulsase. Sin embargo, los buscadores los emplean para localizar nuevas pginas con informacin relacionada, o para evaluar la popularidad de determinado sitio web.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.3. EVOLUCIN DE LOS LENGUAJES DE MARCAS Y ORGANIZACIONES DESARROLLADORAS:

En la dcada de los 60 IBM comenz a desarrollar la idea de separar presentacin y estructura de los documentos, para resolver sus problemas asociados al tratamiento de documentos en diferentes plataformas. Para ello, cre el GML (Generalized Markup Language). Ms tarde, GML pas a manos de ISO (International Organization for Standardizacin) y se convirti en la dcada de los 80 en SGML (ISO 8879, Standart Generalized Markup Language). Esta norma, voluntaria, es la que se aplica desde entonces a todos los lenguajes de marcas, cuyos ejemplos ms conocidos son: HTML(Hyper-text Markup Language), creado a finales de los 80 por el CERN, (Conseil Europen por la Recherche Nuclaire), para compartir informacin a travs de internet. XML (eXtended Markup Languaje) creado en 1998 por W3C (World Wide Web Consortium), ms sencillo que SGML y ms potente que HTLM.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.4. ETIQUETAS, ELEMENTOS Y ATRIBUTOS:

Una Etiqueta (tag) es un texto que va entre los smbolos (<) (>). Existen etiquetas de inicio y etiquetas de fin. Ej: etiqueta de inicio <html> etiqueta de fin </html>. Los elementos representan estructuras mediante las que se organizar el contenido del documento o acciones que se desencadenan cuando el programa navegador interpreta el documento. Consta de la etiqueta de inicio, la etiqueta de fin y de todo aquello que se encuentra entre ambas. Ej: <nombre> Mara </nombre> Un atributo es un par nombre valor que se encuentra dentro de la etiqueta de inicio de un elemento e indican las propiedades que pueden llevar asociadas los elementos. Ej: <p align=center> Este prrafo est centrado </p>

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.5. UTILIZACIN DE LENGUAJES DE MARCAS EN ENTORNOS WEB

Una pgina web es un documento electrnico adaptado para la Red Informtica Mundial (World Wide Web) que, normalmente, forma parte de un sitio web. Est compuesta, principalmente, por informacin (solo texto o mdulos multimedia) as como por hiperenlaces; adems, puede contener datos de estilo para especificar cmo debe visualizarse y tambin aplicaciones embebidas (incrustadas) para hacerla interactiva. Las pginas web estn escritas en HTLM, lenguaje de marcas que permite manejar e insertar hiperenlaces. El contenido de la pgina puede ser: Predeterminado (pgina web esttica). No se actualizan en bastante tiempo (meses). Generado en el momento de su visualizacin o al solicitarla a un servidor web, gracias al uso de SGBD y lenguajes como PHP, java, (pgina web dinmica). Ej: la de Amazon (http://www.amazon.com) donde al buscar un libro nos dan, no slo informacin del libro, sino que, incluso, nos hacen ofertas por comprar ms de un libro de temtica similar. O Yahoo! (http://www.yahoo.com ) donde podemos personalizarla a nuestro gusto adaptando, no slo el diseo, sino incluso definiendo que contenidos desearemos ver.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.6. GRAMTICAS
1.6.1. DTD

Todo documento de un lenguaje de marcas tiene en comn una gramtica que define el marcado permitido en esa clase, el marcado requerido y cmo debe ser utilizado. El estndar define esta gramtica mediante la DTD (Definicin de Tipo de Documento) que establece las reglas de formacin del lenguaje formal, es decir, qu combinaciones de smbolos elementales son sintcticamente correctas. En la DTD se identifica la estructura del documento, es decir, aquellos elementos que son necesarios en la elaboracin de un documento o un grupo de documentos estructurados de manera similar. Contiene las reglas de dichos elementos: el nombre, su significado, donde pueden utilizarse y qu pueden contener. La especificacin del W3C para HTLM 4.0, recomienda ceirse a los recursos de la DTD estricta (HTLM 4.0 Strict DTD), que incluye los elementos y atributos que no han sido declarados desaprobados o en desuso.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.6. GRAMTICAS
1.6.1. DTD

La DTD es el formato de esquema nativo (y el ms antiguo) para validar documentos XML. Utiliza una sintaxis no-XML para definir la estructura o modelo de contenido de un documento XML vlido: Define todos los elementos. (Lxico) Define las relaciones entre los distintos elementos. (Reglas Sintcticas) Proporciona informacin adicional que puede ser incluida en el documento (atributos, entidades, notaciones). Aporta comentarios e instrucciones para su procesamiento y representacin de los formatos de datos.

Es el mtodo ms sencillo usado para validar. Las DTD pueden ser internas o externas a un documento o ambas cosas a la vez.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.6. GRAMTICAS
1.6.2. ESQUEMA XML

XML Schema es la evolucin de la DTD, tambin denominado XSD (definicin de esquema XML). Es un lenguaje de esquema ms complejo y ms potente. Utiliza sintaxis XML. Su utilizacin en la validacin del documento, supone un gran consumo en recursos y tiempo debido a su gran especificacin y complejidad en la sintaxis. El modelo de datos de XML Schema incluye:

El vocabulario (qu elementos y atributos pueden aparecer). El contenido modelo (relaciones y estructura): elemento raz, elementos simples, complejos, o vacos Los tipos de datos que pueden utilizarse en cada elemento o atributo.

UT1. Reconocimiento de las caractersticas de Lenguajes de marcas


1.6. GRAMTICAS
1.6.3. RELAX NG

Es un lenguaje de esquema basado en la gramtica, muy intuitivo y ms fcil de entender que el XML Schema. Las aplicaciones de definicin de documentos y validacin para RELAX NG son ms sencillas que las de XML Schema, hacindolo ms fcil de utilizar e implementar. RELAX NG se ha convertido recientemente en un estndar ISO, como la segunda parte de DSDL (Document Schema Definition Language).

FIN

También podría gustarte