Está en la página 1de 10

Unidad de Trabajo 1

CARACTERÍSTICAS DE LOS LENGUAJES DE MARCAS

Contenido

1 Introducción a los lenguajes de marcas.................................................................................................. 2

2 Distintas clasificaciones de los lenguajes de marcado............................................................................. 4

3 Historia de los lenguajes de marcas ....................................................................................................... 5

3.1 SGML ........................................................................................................................................... 6

3.2 Historia de HTML. Ventajas e inconvenientes ............................................................................... 6

Historia del HTML ............................................................................................................................... 6

Ventajas e inconvenientes de HTML .................................................................................................... 7

Ejemplo de HTML ............................................................................................................................... 9

3.3 CSS................................................................................................................................................ 9

4 HTML tutorial .................................................................................................................................... 10

Bibliografía .................................................................................................................................................. 10

Lenguajes de Marcas y Sistemas de Gestión de la Información 1


UT 1. Características de los Lenguajes de Marcas

1 Introducción a los lenguajes de marcas

Uno de los retos iniciales a los que se tuvo que enfrentar la informática fue el de cómo almacenar la
información en los archivos digitales. Como los primeros archivos sólo contenían texto sin formato, la
solución utilizada era muy sencilla: se codificaban las letras del alfabeto en números y estos se almacenaban en
formato binario.

De esta forma, para almacenar un contenido de texto en un archivo electrónico, se utiliza una tabla de
conversión que transforma cada carácter en un número. Una vez almacenada la secuencia de números, el
contenido del archivo se puede recuperar realizando el proceso inverso.

El proceso de transformación de caracteres en secuencias de números se denomina codificación de


caracteres y cada una de las tablas que se definen para realizar la transformación se conoce con el nombre de
página de código. Una de las codificaciones más conocidas (y una de las primeras que se publicaron) es la
codificación ASCII (American Standard Code for Information Interchange – código estándar americano para el
intercambio de información).

Una vez resuelto el problema de almacenar el texto simple, se presenta el reto de almacenar los contenidos de
texto con formato. En otras palabras, ¿cómo se almacena un texto en negrita? ¿Y un texto de color rojo? ¿Y
otro texto azul, en negrita y subrayado?

La solución que se emplea para guardar la información con formato consiste en que el archivo electrónico
almacene tanto los contenidos como la información sobre el formato de esos contenidos. Si, por ejemplo, se
quiere dividir el texto en párrafos y se desea dar especial importancia a algunas palabras, se podría indicar de
la siguiente manera:

<párrafo>
Texto con <importante>algunas palabras</importante> resaltadas de forma especial.
</párrafo>

El principio de un párrafo se indica mediante la palabra <párrafo> y el final de un párrafo se indica mediante
la palabra </párrafo>. De la misma manera, para asignar más importancia a ciertas palabras del texto, se
encierran entre <importante> y </importante>.

Lenguajes de Marcas y Sistemas de Gestión de la Información 2


UT 1. Características de los Lenguajes de Marcas

El proceso de indicar las diferentes partes que componen la información se denomina marcar. Cada una de
las palabras que se emplean para marcar el inicio y el final de una sección se denominan etiquetas.

Un lenguaje de marcado o lenguaje de marcas es "una forma de codificar un documento que, junto con el
texto, incorpora etiquetas o marcas que contienen información adicional acerca de la estructura del texto o su
presentación".

Los lenguajes de marcas


o Son distintos de los lenguajes de programación.
o Tienen una función principal meramente descriptiva.
o Datan de finales de los 60, aunque ha sido en la última década cuando han comenzado a tener aplicación
en múltiples facetas de la Informática.
o Las marcas o etiquetas más empleadas suelen consistir en textos descriptivos entre signos de "menor" (<)
y "mayor" (>)
o Lo habitual es usar pares de marcas: una de principio y otra de fin.
o El almacenamiento suele realizarse en ficheros de texto plano.

Los archivos de texto plano son aquellos que están compuestos únicamente por texto sin formato, sólo
caracteres. Ejemplos serían los ficheros editables con el Vi de UNIX, el bloc de notas (Notepad) de Windows
–ficheros con extensión .txt– o el VIM de Linux.

Ejemplo de un documento generado con un lenguaje de marcas:

<ficha>
<nombre>Pepe</nombre>
<apellido>Pérez</apellido>
<apellido>Rodríguez</apellido>
<datos_profesionales>
<cuerpo>grupo A</cuerpo>
<especialidad>informática</especialidad>
<destino>Ayuntamiento de Burgos</destino>
</datos_profesionales>
</ficha>

Algunas de las ventajas que ofrecen los lenguajes de marcas en el tratamiento de la información son:
• Portabilidad: Los documentos escritos en lenguajes de marcas suelen ser independientes de la
plataforma, lo que significa que se pueden ver y procesar en una variedad de dispositivos y sistemas
operativos sin problemas de compatibilidad.

Lenguajes de Marcas y Sistemas de Gestión de la Información 3


UT 1. Características de los Lenguajes de Marcas

• Facilidad de lectura y escritura: Los lenguajes de marcas están diseñados para ser legibles tanto
por humanos como por máquinas. Utilizan una sintaxis sencilla basada en etiquetas y elementos, lo
que facilita su escritura y comprensión
• Separación de contenido y presentación: Muchos lenguajes de marcas, como HTML, están
diseñados para separar el contenido del documento de su presentación visual. Esto permite que el
mismo contenido se muestre de manera diferente en diferentes dispositivos o se personalice según
las preferencias del usuario.
• SEO (Optimización de motores de búsqueda): En el caso de HTML, los motores de búsqueda
pueden analizar y indexar fácilmente el contenido, lo que mejora la visibilidad en los resultados de
búsqueda. Esto es esencial para sitios web y aplicaciones que desean aumentar su visibilidad en línea
• Amplia adopción: Muchos lenguajes de marcas, como HTML y XML, tienen una base de usuarios y
una comunidad de desarrolladores muy grandes. Esto significa que hay una amplia gama de recursos,
herramientas y bibliotecas disponibles para trabajar con estos lenguajes.
• Son código abierto.
• Documentación clara: Los lenguajes de marcas suelen estar bien documentados, lo que facilita a los
desarrolladores y autores aprender y utilizar estas tecnologías de manera efectiva.
• Versatilidad: Los lenguajes de marcas se utilizan en una variedad de aplicaciones, desde la creación
de páginas web hasta la representación de datos estructurados, la documentación técnica y la
presentación de contenido en formatos diversos.
• Se pueden mezclar con código de otros lenguajes, de marcas o no (php, JavaScript).

2 Distintas clasificaciones de los lenguajes de marcado

Los lenguajes de marcas se pueden clasificar en varias categorías según su funcionalidad y aplicación.
Lenguajes de marcas de marcado estructural:
• HTML (HyperText Markup Language): Utilizado para estructurar el contenido de las páginas web,
definiendo encabezados, párrafos, enlaces, listas y otros elementos.
• XML (Extensible Markup Language): Utilizado para definir estructuras de datos personalizadas y
facilitar la interoperabilidad de datos entre diferentes sistemas.
Lenguajes de marcas de marcado de presentación:
• CSS (Cascading Style Sheets): No es un lenguaje de marcas en sí, pero se utiliza en conjunto con
HTML o XML para controlar la presentación visual de elementos web, como la tipografía, los
colores y el diseño.
• XSL (eXtensible Stylesheet Language): Utilizado para transformar y formatear documentos XML en
diferentes formatos de salida, como HTML o PDF.
Lenguajes de marcas de marcado de hipertexto:
• Markdown: Un lenguaje de marcas ligero utilizado para formatear texto plano con una sintaxis simple
y legible. A menudo se utiliza en la escritura y la documentación en línea.

Lenguajes de Marcas y Sistemas de Gestión de la Información 4


UT 1. Características de los Lenguajes de Marcas

• BBCode: Utilizado en foros en línea para formatear mensajes de texto y agregar enlaces, imágenes y
otros elementos.
Lenguajes de marcas de marcado de documentos científicos y técnicos:
• LaTeX: Utilizado en la composición tipográfica de documentos científicos, académicos y técnicos,
como artículos, informes y tesis.
Lenguajes de marcas de datos:
• JSON (JavaScript Object Notation): Aunque no es un lenguaje de marcas en el sentido tradicional, se
utiliza para estructurar datos en pares clave-valor y es ampliamente utilizado en la comunicación de
datos en aplicaciones web y API.
• YAML (YAML Ain't Markup Language): Similar a JSON, se utiliza para representar datos
estructurados en un formato legible por humanos.
Otros lenguajes de marcas especializados:

3 Historia de los lenguajes de marcas

• En la década de los 60 se empieza a desarrollar la idea de separar presentación y estructura.


• Desde IBM se impulsa la creación del lenguaje GML (Generalized Markup Language – lenguaje de
marcas generalizado; Goldfarb, Mosher & Lorie, 1969)
• En 1978, ANSI creó un comité de lenguajes de ordenador para procesador de texto (Computer
Languages for the Processing of Text)
• En 1980, a partir de GML, se genera la primera versión de SGML (Standard Generalized Markup
Language – lenguaje de marcas estándar generalizado)
• En 1986 se convierte en la norma ISO 8879
• SGML pasa a ser la base del diseño de nuevos lenguajes
• En 1992 se desarrolla HTML (HyperText Markup Language – lenguaje de marcas de hipertexto) como
solución para publicar las investigaciones de diversas fuentes y autores que trabajaban en el CERN
(Organisation Européenne pour la Recherche Nucléaire – Organización Europea para la Investigación
Nuclear)
• En 1987, Microsoft desarrolla RTF como formato de intercambio de documentos multiplataforma
• En 1998, el W3C (World Wide Web Consortium, organismo sin ánimo de lucro) desarrolla XML, que
será el lenguaje de base de una gran cantidad de lenguajes de marcas. Eclosión de los lenguajes de
marcado.
• Década de 2000 - CSS (Cascading Style Sheets): CSS se desarrolló para separar la presentación visual
del contenido en la web. Aunque no es un lenguaje de marcas en sí, desempeña un papel esencial en
el control de la apariencia de los documentos HTML y XML.
• Década de 2010 - Markdown: Markdown, creado por John Gruber en 2004, se popularizó como un
lenguaje de marcas ligero y fácil de usar para escribir documentos en formato de texto plano con una
sintaxis simple. Se utiliza ampliamente en blogs, wikis y plataformas de colaboración en línea.

Lenguajes de Marcas y Sistemas de Gestión de la Información 5


UT 1. Características de los Lenguajes de Marcas

• Década de 2020 - Lenguajes de marcas especializados: Se han desarrollado lenguajes de marcas


especializados para campos específicos, como GML (Geographic Markup Language) para datos
geoespaciales y otros lenguajes adaptados a dominios particulares.
A lo largo de los años, los lenguajes de marcas han desempeñado un papel esencial en la representación
de datos y la comunicación en la era digital. Han evolucionado para satisfacer las necesidades cambiantes
de la tecnología y la comunicación en línea, y continúan siendo una parte fundamental de la informática y
la creación de contenido en la actualidad.

3.1 SGML
Estándar internacional definido por ISO (International Standards Organization – organización internacional de
estándares) para la definición de la estructura y el contenido de documentos electrónicos. Está basado en
GML de IBM. Permite definir lenguajes de marcas orientados al tratamiento de tipos concretos de
documentos, pero, aún así, fácilmente intercambiables. SGML no ofrece un conjunto de etiquetas, sino la
sintaxis mediante la que crear etiquetas propias. El gran problema de SGML es su enorme complejidad.

3.2 Historia de HTML. Ventajas e inconvenientes


Definiéndolo de forma sencilla, "HTML es lo que se utiliza para crear todas las páginas web de Internet". Más
concretamente, HTML es el lenguaje con el que se "escriben" la mayoría de las páginas web. Los diseñadores
utilizan el lenguaje HTML para crear sus páginas web, los programas que utilizan los diseñadores generan
páginas escritas en HTML y los navegadores que utilizamos los usuarios muestran las páginas web después de
leer su contenido HTML.

Aunque HTML es un lenguaje que utilizan los ordenadores y los programas de diseño, es muy fácil de
aprender y escribir por parte de las personas. El lenguaje HTML es un estándar reconocido en todo el mundo
y cuyas normas define el W3C (http://www.w3.org/). Como se trata de un estándar reconocido por todas las
empresas relacionadas con el mundo de Internet, una misma página HTML se visualiza de forma muy similar
en cualquier navegador de cualquier sistema operativo.

El propio W3C define el lenguaje HTML como "un lenguaje reconocido universalmente y que permite
publicar información de forma global". Desde su creación, el lenguaje HTML ha pasado de ser un lenguaje
utilizado exclusivamente para crear documentos electrónicos a ser un lenguaje que se utiliza en muchas
aplicaciones electrónicas como buscadores, tiendas online y banca electrónica.

Historia del HTML

Según el Diccionario de la R.A.E., hipertexto es "texto que contiene elementos a partir de los cuales se puede
acceder a otra información". En 1980 el físico Tim Berners-Lee, trabajador del CERN, propuso un nuevo
sistema de hipertexto para compartir documentos. Junto al ingeniero de sistemas Robert Cailliau, Berners-
Lee ganó una convocatoria organizada para desarrollar un sistema de hipertexto para Internet. Su propuesta
se llamaba World Wide Web (W3).

Lenguajes de Marcas y Sistemas de Gestión de la Información 6


UT 1. Características de los Lenguajes de Marcas

El primer documento formal con la descripción de HTML se publicó en 1991 bajo el nombre HTML Tags
(etiquetas HTML).
https://www.w3.org/History/19921103-hypertext/hypertext/WWW/MarkUp/Tags.html

La primera propuesta oficial para convertir HTML en un estándar se realizó en 1993 por parte del organismo
IETF (Internet Engineering Task Force – grupo de trabajo de ingeniería de Internet). Aunque se consiguieron
avances significativos (en esta época se definieron las etiquetas para imágenes, tablas y formularios) ninguna
de las dos propuestas de estándar, llamadas HTML y HTML+ consiguieron convertirse en estándar oficial.

En 1995 IETF organizó un grupo de trabajo de HTML, publicando el 22 de septiembre de ese mismo año el
estándar HTML 2.0 (primer estándar oficial de HTML a pesar de su número de versión). A partir de 1996 el
W3C se encargaría de publicar los estándares de HTML.

La versión HTML 3.2 se publicó el 14 de enero de 1997. Incorpora los últimos avances de las páginas web
desarrolladas hasta 1996, como applets de Java y texto que fluye alrededor de las imágenes.

HTML 4.0 se publicó el 24 de abril de 1998 (siendo una versión corregida de la publicación original del 18
de diciembre de 1997) y supone un gran salto desde las versiones anteriores. Entre sus novedades más
destacadas se encuentran las hojas de estilos CSS, la posibilidad de incluir pequeños programas o scripts en las
páginas web, mejora de la accesibilidad de las páginas diseñadas, tablas complejas y mejoras en los
formularios.

El 24 de diciembre de 1999 se publicó la especificación denominada HTML 4.01. Se trata de una revisión y
actualización de la versión HTML 4.0, por lo que no incluye novedades significativas.

Desde la publicación de HTML 4.01, la actividad de estandarización de HTML se detuvo y el W3C se centró
en el desarrollo del estándar XHTML. Por este motivo, en el año 2004 las empresas Apple, Mozilla y Opera,
mostrando su preocupación por la falta de interés del W3C en HTML, decidieron organizarse en una nueva
asociación llamada WHATWG (Web Hypertext Application Technology Working Group – grupo de trabajo de
tecnologías de aplicación de hipertexto en web). La actividad actual del WHATWG se centra en el estándar
HTML 5, cuyo primer borrador oficial (https://html.spec.whatwg.org/multipage/ se publicó el 22 de enero
de 2008. Debido a la fuerza de las empresas que forman el grupo WHATWG y a la publicación de los
borradores de HTML 5.0, en marzo de 2007 el W3C decidió retomar la actividad estandarizadora de HTML.

Ventajas e inconvenientes de HTML

☺ Es multiplataforma.
☺ Tiene una curva de aprendizaje muy plana.

Lenguajes de Marcas y Sistemas de Gestión de la Información 7


UT 1. Características de los Lenguajes de Marcas

☺ Gratuito y de código abierto


☺ Existe una gran comunidad de desarrolladores web que comparten conocimientos, recursos y
herramientas relacionados con HTML. Esto facilita la resolución de problemas y el aprendizaje continuo.
☺ HTML es un estándar de la industria respaldado por el World Wide Web Consortium (W3C). Esto
significa que las especificaciones y las reglas para su uso están bien definidas, lo que facilita la consistencia
y la interoperabilidad en la web.
☺ HTML incluye características que permiten la creación de sitios web accesibles para personas con
discapacidades. Esto es importante para garantizar que el contenido en línea sea accesible para todos.
☺ HTML se centra en la estructura y el contenido de una página web, permitiendo la separación de la
presentación visual. Esto se logra en conjunto con CSS (Cascading Style Sheets), lo que facilita la
adaptación del diseño a diferentes dispositivos y tamaños de pantalla.
☺ El uso adecuado de etiquetas HTML, como encabezados, párrafos y metadatos, puede mejorar la
visibilidad de una página web en los motores de búsqueda. Esto es esencial para el marketing en línea y la
promoción de sitios web.
 HTML se centra en la estructura y el contenido, pero no en la presentación visual. Para controlar la
apariencia de una página web, se requiere el uso de CSS (Cascading Style Sheets) en conjunto con HTML.
Esto puede aumentar la complejidad del desarrollo web y requerir más archivos y recursos.
 Las páginas web muy complejas o con una gran cantidad de contenido pueden experimentar problemas de
rendimiento, especialmente en dispositivos con recursos limitados. Esto puede afectar la velocidad de
carga de la página y la experiencia del usuario.
 Aunque los estándares HTML están bien definidos, la interpretación de estos estándares puede variar
entre diferentes navegadores web. Esto puede dar lugar a problemas de compatibilidad y requerir pruebas
y ajustes adicionales.
 HTML por sí solo no es adecuado para la creación de aplicaciones web altamente interactivas. Para lograr
funcionalidades avanzadas, se necesita JavaScript u otros lenguajes de programación.
 Aunque HTML5 es la versión más reciente y ofrece muchas características avanzadas, aún existen páginas
web que utilizan versiones anteriores de HTML, lo que puede complicar la gestión de contenido web.
 HTML no tiene mecanismos incorporados para garantizar la seguridad de una página web. La seguridad se
debe abordar mediante prácticas y tecnologías adicionales, como la validación del lado del servidor y
medidas para prevenir ataques cibernéticos.
 Algunas funcionalidades, como la reproducción de video y audio, pueden requerir el uso de complementos
o extensiones del navegador, lo que puede afectar la experiencia del usuario y la compatibilidad.
 Debido a la evolución rápida de la tecnología web, los desarrolladores deben mantenerse al día con las
nuevas características y estándares de HTML para aprovechar al máximo sus capacidades.

Lenguajes de Marcas y Sistemas de Gestión de la Información 8


UT 1. Características de los Lenguajes de Marcas

Ejemplo de HTML

<html>
<head>
<!--Información que el navegador puede entender -->

<title>Mi página Web</title>


</head>
<body>
<!-- Información para el usuario -->
<p>Contenido de mi página</p>
</body>
</html>

3.3 CSS
CSS es un lenguaje de hojas de estilos creado para controlar el aspecto o presentación de los documentos
electrónicos definidos con HTML y XHTML. CSS es la mejor forma de separar los contenidos y su
presentación y es imprescindible para crear páginas web complejas.

Al crear una página web, se utiliza en primer lugar el lenguaje HTML/XHTML para marcar los contenidos,
es decir, para designar la función de cada elemento dentro de la página: párrafo, titular, texto destacado, tabla,
lista de elementos, etc. Una vez creados los contenidos se utiliza el lenguaje CSS para definir el aspecto de
cada elemento: color, tamaño y tipo de letra del texto, separación horizontal y vertical entre elementos,
posición de cada elemento dentro de la página, etc.

Mediante CSS se pueden crear distintas presentaciones para el mismo documento, facilitando su visualización
en varios tipos de dispositivos (ordenador, teléfono móvil, iPad, impresora, pdf…).

Lenguajes de Marcas y Sistemas de Gestión de la Información 9


UT 1. Características de los Lenguajes de Marcas

4 HTML tutorial

https://www.w3schools.com/html/

Bibliografía
Xml – Juan Diego Gutiérrez Gallardo (Anaya)
HTML y CSS – Christopher Murphy y Nicklas Persson
HTML & XHTML: The Definitive Guide, 6th Edition – Bill Kennedy y Chuck Musciano (O’Reilly)
en.wikipedia.org / es.wikipedia.org
jhh.med.virginia.edu/main/stxml/uploads/SGML.ppt

Lenguajes de Marcas y Sistemas de Gestión de la Información 10

También podría gustarte