Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Vídeo: h ttp://youtu.be/EEttUcYhv30
Hola, soy Sergio Luján Mora, profesor de informática de la Universidad de Alicante, y en este
vídeo que forma parte del curso “Introducción al desarrollo web”, te voy a hablar de la historia
del lenguaje HTML.
Antes de empezar, me gustaría recordarte algunos de los sitios web en los que puedes
encontrar más información sobre mí y sobre mi trabajo, y dos formas de contactar conmigo, a
través de mi correo electrónico sergio.lujan@ua.es y a través de mi cuenta en Twitter
@sergiolujanmora.
Si ya has visto las dos partes del vídeo “Historia de la Web: su nacimiento”, sabrás que Tim
Berners-Lee es considerado el padre de la Web porque desarrolló las tres tecnologías
fundamentales en las que se basa la Web:
HTML, HyperText Markup Language, el lenguaje de marcado o etiquetado que se emplea para
crear, para escribir, los documentos o páginas web.
URL, Uniform Resource Locator, el localizador de recursos uniforme, el sistema de localización
o direccionamiento de los documentos web.
Y HTTP, HyperText Transfer Protocol, el protocolo o lenguaje con el que se comunican el
navegador y el servidor web y que se emplea para transmitir los documentos web por Internet.
Lo que nos interesa para este vídeo es que Tim Berners-Lee desarrolló la primera versión del
lenguaje HTML. En este vídeo te voy a explicar la evolución del lenguaje HTML durante sus
primeros años.
La mejor información sobre los primeros años del lenguaje HTML la podemos encontrar en el
libro “Raggett on HTML4”, del año 1998.
Afortunadamente, existe una versión online del capítulo 2 de este libro, el capítulo que está
dedicado a contar la historia de HTML.
Dave Raggett, uno de los autores de este libro, fue el editor de la especificación del lenguaje
HTML durante muchos años, así que lo que nos cuenta en su libro lo sabe por haber sido
protagonista de ello en primera persona.
Tim Berners-Lee desarrolló el lenguaje HTML a partir de SGML, Standard Generalized Markup
Language, un estándar ISO del año 1986 que se emplea para la organización y etiquetado de
textos.
El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no impone en
sí ningún conjunto de etiquetas en especial. Por tanto, SGML es equivalente al actual XML.
Como podemos ver en este ejemplo, un documento creado según SGML se parece bastante a
HTML, o mejor dicho, HTML se parece a SGML, ya que SGML es anterior a HTML. El uso de una
pareja de etiquetas para marcar partes del texto en HTML está tomado directamente de SGML,
al igual que ciertas etiquetas como <p>, los encabezados <h1>, <h2>, etc., o las etiquetas de
lista como <ol>, <ul> y <li>, que eran muy comunes en lenguajes creados a partir de SGML.
Sin embargo, lo que SGML no incluía, y sí que es una invención propia de Tim Berners-Lee es la
etiqueta <a> con el atributo href para los enlaces o hipervínculos.
Recordemos que noviembre de 1990 se suele fijar como el nacimiento de la Web: Tim
Berners-Lee publicó su primer sitio web y realizó la primera conexión desde un navegador
mientras trabaja en el CERN, el laboratorio europeo de investigación en física de partículas en
Suiza.
Voy a emplear el siguiente diagrama para seguir la evolución del lenguaje HTML. En la parte
superior se muestra la evolución del lenguaje HTML, mientras que en la parte inferior se
muestra la evolución de los navegadores más populares. Por ahora nos vamos a fijar en los
primeros años del lenguaje HTML, hasta la publicación de la versión 4.
Las primeras versiones de HTML no fueron estandarizadas, en parte porque su uso no estaba
muy extendido, así que no era necesaria una estandarización formal.
El primer intento de estandarización lo encontramos en el borrador “Hypertext Markup
Language” de junio de 1993, escrito por Tim Berners-Lee y Daniel Conolly. Este documento se
considera la primera versión del lenguaje HTML, la 1.0. Daniel Conolly desarrolló el primer DTD
de HTML, como podemos leer en este mensaje de junio de 1992. Esta primera versión de HTML
no disponía de algunos elementos que son imprescindibles hoy en día en las páginas web,
como las tablas y los formularios.
Y por otro lado, permitía crear documentos que hoy en día no son válidos, como este ejemplo
en el que no aparecen ni la etiqueta <head> ni la etiqueta <body>, y la etiqueta <title> está
escrita al mismo nivel que el resto del contenido de la página.
En julio de 1993 se comenzó a trabajar en la especificación de la siguiente versión de HTML,
que dio lugar a HTML+ en noviembre de 1993, que nunca llegó a estandarizarse. HTML+ estaba
compuesto de encabezados, párrafos, listas, figuras, tablas, formularios, texto preformateado y
fórmulas matemáticas. La principal novedad de HTML+ es que incorporaba por primera vez las
tablas y los formularios.
Por cierto, si se revisa el documento de HTML+ se pueden encontrar algunas cosas curiosas,
como la propuesta de la etiqueta <FIG> con la etiqueta <CAPTION> para definir figuras. ¿Y por
qué es curioso?
Muy sencillo, estás dos etiquetas finalmente no formaron parte del estándar de HTML, sin
embargo, en HTML5, la nueva versión de HTML, incorpora como novedades las etiquetas
<figure> y <figcaption>, que son muy parecidas a <fig> y <caption>.
Otra curiosidad de HTML+ es que incorporaba la posibilidad de definir ecuaciones matemáticas
en HTML.
Esta característica al final no se incluyó en HTML, pero dio lugar a un lenguaje totalmente
independiente, llamado MathML que ya va por la tercera versión.
Quizás te estés preguntando, ¿llegó a existir un navegador que aceptase las nuevas etiquetas
de HTML+?
Sí, por supuesto, se llamaba Arena, y era un navegador desarrollado como prueba de concepto
para mostrar las nuevas posibilidades de HTML.
En octubre de 1994 se funda el W3C, el World Wide Web Consortium, que a partir de entonces
se encargará del desarrollo de las tecnologías que mueven la Web.
Y por fin llegamos a noviembre de 1995, cuando se publica HTML 2.0, la primera versión de
HTML que fue realmente un estándar, en concreto, fue un Request for Comments, aún no era
una recomendación del W3C.
Mientras tanto, empezó a fraguarse la primera guerra de los navegadores, entre Microsoft y
Netscape.
Un elemento de esa guerra fue la inclusión de ciertas características especiales en los
navegadores para distinguirlos de la competencia. Así, por ejemplo, Netscape inventó la
etiqueta <blink>, mientras que Microsoft inventó la etiqueta <marquee>. Ambas etiquetas no
han formado parte del estándar en ningún momento y no se deben emplear.
En enero de 1997 se publicó HTML 3.2, la primera versión estandarizada por el W3C.
Y en diciembre de 1999 se publicó la última revisión, HTML 4.01.
¿Qué pasó a continuación?
El W3C abandonó el desarrolló de HTML y concentró todos sus esfuerzos en el desarrollo de
XML, un metalenguaje que define unas reglas para definir otros lenguajes.
En enero de 2000 se publicó XHTML 1.0, una reformulación de HTML 4 utilizando como base
XML 1.0. XHTML 1.0 era como HTML 4.01, tenía las mismas etiquetas, pero imponía unas
reglas más estrictas para que los documentos fueran válidos.
Y una revisión de XHTML 1.0 fue publicada en agosto de 2002.
Sin embargo, XHTML no triunfó y la gente seguía usando HTML. ¿Por qué? Seguramente
porque XHTML era muy estricto y la gente no estaba preparada para ello.
Así que, en el año 2004, un grupo llamado WHATWG y formado por Apple, Mozilla y Opera, se
forma y comienza el desarrollo de un HTML más cercano a la gente. El W3C rectifica, cancela el
desarrollo de XHTML, y se une a WHATWG para desarrollar HTML5.
Si quieres saber más sobre el nacimiento de HTML5 y cómo fue que el W3C canceló el
desarrollo de XHTML, te recomiendo la lectura del artículo “The Web is Reborn”.
En la actualidad, enero de 2013, HTML5 se encuentra en el estado de recomendación candidata
y aunque todavía no es un estándar, ya se está trabajando en la siguiente versión 5.1, que
incorporará aquello que no esté incluido en la versión 5.
La hoja de ruta que se ha marcado el W3C establece que HTML 5.0 será una especificación
oficial a finales del año 2014, y la versión 5.1 a finales del año 2016.
Y ya por último, si quieres leer alguna cosa más sobre la historia del lenguaje HTML, por
ejemplo, para contrastar todo lo que te he contado aquí, te recomiendo estas dos lecturas.
Recuerda que este vídeo forma parte del curso “Introducción al desarrollo web” que está
disponible en la dirección idesweb.es.
Muchas gracias por tu atención.
AVISO IMPORTANTE
Este documento, su texto y gráficos e imágenes, puede ser utilizado bajo una licencia Creative Commons de tipo
Atribución, No-Comercial. En caso de utilizarse este material o de la creación de un derivado, la atribución se debe
respetar citando la fuente como “Actívate, Google España 2016” y expresamente, si es posible, mediante un enlace
ttp://google.es/activate. Revisado, enero 2016.
activo a h