Está en la página 1de 31

presentación

En las semanas anteriores, has aprendido los


conceptos básicos sobre la creación de páginas web.
Algunas cosas importantes, como el juego de
caracteres o la validación del código HTML, no las
hemos explicado para facilitarte el aprendizaje.
Pero esta semana ya toca, tienes que aprender a
realizar páginas web correctas. Además, esta semana,
vas a aprender a incluir elementos nuevos en una
página web, vas a aprender a crear tablas para
mostrar datos tabulados y vas a aprender a insertar
imágenes. En las próximas semanas, aprenderás a
insertar otros elementos multimedia, como, por
ejemplo, los vídeos.
Por último, también vas a aprender las principales
novedades que incorpora HTML5, la última versión de
HTML.
Espero que disfrutes aprendiendo todo lo que hemos
preparado.
Crear tablas para datos tabulados te
será de gran ayuda para acumular datos
y llevar a cabo un mejor análisis de
estos. Añadir imágenes puede serte de
gran ayuda ya que hará tu página web
más atractiva al usuario que la visite.
Html: juego de Para que a ti tampoco te produjese pesadillas y

caracteres entendieses correctamente qué es el juego de


caracteres, tendría que empezar por el principio, por la
primera descripción conocida de un sistema de
numeración binario que se debe a un matemático
hindú del siglo tercero antes de nuestra era.
¿Alguna vez el nombre de un fichero o su contenido no Después te tendría que explicar el sistema binario
lo has podido ver bien al moverlo de un sistema moderno fue documentado en su totalidad, por el gran
operativo a otro? ¿Alguna vez has instalado un matemático Leibniz, en el siglo 17.
programa y no se visualizaban correctamente algunos
caracteres? ¿Alguna vez te han dado un justificante, un Leibniz utilizó el 0 y el 1, al igual que el sistema de
extracto bancario o un recibo en el que no se numeración binario actual. Y después, te tendría que
mostraban correctamente algunos caracteres? ¿Alguna contar muchas otras cosas más pero este no es el
vez has entrado en una página web y te aparecían momento. Ya te las contaré en otro vídeo, en este
caracteres chinos cuando la página no estaba en vídeo solo te voy a dar la solución fácil.
chino? Si alguna vez has sufrido un problema parecido La regla más importante es muy fácil de recordar:
y te has sentido solo, porque pensabas que eras el utiliza siempre el mismo juego de caracteres en todo lo
único al que le pasaba, no te preocupes, porque no que hagas. ¿Qué significa esto en una aplicación web?
estaba solo. Mucha gente como tú sufre estos Significa que todos los ficheros que compongan tu sitio
problemas todos los días. web deben estar almacenados en el mismo juego de
Sin duda alguna, en el campo de la informática, el caracteres, tus ficheros HTML, CSS, JavaScript, de
juego de caracteres es de las cosas más simples, que texto, etcétera, pero también en tus páginas PHP y
más problemas ocasiona. Mapa de caracteres, ASCII, cualquier fichero de texto que leas desde PHP, y
ISO-8859-1, Latín-1, ANSI, UTF 8, UTF-8 sin BOM, también los datos que estén almacenados en tu base
Unicode, Cotejamiento… menudo lío. de datos y también la conexión que establezcas con tu
base de datos y, si embocas a un servicio web que te
¿Qué significa toda esta sopa de términos? A muchos devuelve datos en formato xml o json, pues lo mismo,
experimentados informáticos las palabras juego de los datos que te devuelva también tienen que estar en
caracteres les produce horribles pesadillas. el mismo juego de caracteres.
Html: juego de Pero si necesitas escribir el símbolo del euro, entonces

caracteres debes utilizar ISO-8859-15, también llamado Latin9.


Latin1 y Latin9 se diferencian únicamente en 8
caracteres que han cambiado, y el único realmente
Sencillo, ¿verdad? Pues no es tan sencillo porque esto importante para el español, es la sustitución de un
muchas veces es imposible de lograr, no porque no se carácter que seguramente, nunca has usado, por el
pueda, sino porque no depende de nosotros, lo normal símbolo del euro.
es que en un escenario real nos encontremos con algo
parecido a esto. Un escenario en el que no puedes ¿Cómo indicó el juego de caracteres en HTML? Se
utilizar el mismo juego de caracteres en todos los realiza mediante una etiqueta meta, que se escribe en
elementos de tu sistema y, normalmente el problema el head, en la cabecera de la página web, pero
suele convertirse en algo muy grave, con solución, depende de la versión de HTML que estés utilizando. Si
pero muy costosa. estás utilizando HTML 4 debes utilizar esta sintaxis, si
estás utilizando XHTML 1, debes utilizar alguna de
En ese momento es cuando te toca llamar al estas dos sintaxis. Además, si empleas un juego de
informático para que te solucione el problema pero, no caracteres diferente a UTF-8, también tendrás que
a un informático que se dedica a instalar el Windows o indicar el juego de caracteres mediante la declaración
a cambiar tarjetas gráficas, no, a un informático de de documentos xml, al principio de la página web.
verdad.
Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
¿Qué juego de caracteres debo usar? Yo te recomiendo ¿Más fácil, más complicado? En HTML5 se ha
UTF-8 sin BOM, es la solución a todos los problemas y intentado hacer el lenguaje HTML más sencillo, así
te permite mezclar en un mismo documento textos en que, han simplificado la forma de indicar el juego de
cualquier idioma, es decir, te permite mezclar caracteres y ahora es algo tan sencillo como esto, o
caracteres de cualquier alfabeto pero absolutamente esto.
sin ningún problema.
Después de este vídeo, no espero que ya no veas el
Si no puedes utilizar UTF-8 sin BOM por alguna razón, juego caracteres como un lío, en realidad no te
entonces te recomiendo ISO-8859-1 también llamado explicado las razones de que sea un lío, pero sí que te
Latin1. Después de UTF-8 es el mejor juego de he dado dos consejos: utiliza siempre el mismo juego
caracteres para los idiomas de europa occidental, de caracteres en todo lo que hagas y si puedes, utiliza
incluido el español. el juego de caracteres UTF-8 sin BOM.
Después de UTF-8 es el mejor juego de caracteres para

Html: juego de
los idiomas de europa occidental, incluido el español.
Pero si necesitas escribir el símbolo del euro, entonces
debes utilizar ISO-8859-15, también llamado Latin9.

caracteres Latin1 y Latin9 se diferencian únicamente en 8


caracteres que han cambiado, y el único realmente
importante para el español, es la sustitución de un
carácter que seguramente, nunca has usado, por el
Sencillo, ¿verdad? Pues no es tan sencillo porque esto símbolo del euro.
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
Html: el juego de los caracteres
y los editores de texto
En un vídeo anterior, ya te hablé del juego de Y el correo continuaba: “y ahora viene el tema si
caracteres y de los típicos problemas que ocasiona en guardado en UTF-8 sin BOM, cuando cierro el fichero y
las páginas web. En este vídeo te daba dos consejos: lo vuelvo a abrir la codificación que me marca es ANSI.
utiliza siempre el mismo juego de caracteres en todo lo ¿Es normal? También veo convertir a UTF-8 sin BOM,
que hagas y utiliza UTF-8 sin BOM, que te permite además de codificar en UTF-8 sin BOM. ¿Cuál es la
mezclar en un mismo documento, textos en cualquier diferencia?”
idioma. primero vamos a ver qué es eso del BOM. BOM es el
Pero ya te avisé en el otro vídeo, hay que saber mucho, acrónimo de Byte Order Mark, la marca de orden de
mucho más, ya que, cuando las cosas empiezan a ir bytes y es un carácter Unicode que se utiliza para
mal, estos dos consejos no son la solución para todos indicar el orden de los bytes de un fichero de texto al
los problemas. principio del fichero. Básicamente, existen dos órdenes
de bytes, el Little-endian y el Big-endian, que definen
Hace unos días recibí el siguiente correo: “Estoy de qué forma se almacenan los datos que ocupan más
probando lo del juego de caracteres usando notepad de un byte en el ordenador. ¿Confuso? Si, puede ser
Plus Plus, en el vídeo recomiendas usar UTF-8 sin muy confuso, ya sabes para solucionar los problemas
BOM. Resulta que el fichero lo tengo con codificación con los juegos de caracteres hay que saber mucho.
ANSI pero si lo cambio a UTF-8 sin BOM, el disquete de Volviendo al BOM, en el caso de UTF-8, es un carácter
guardar no se me marca, es decir, no se ha modificado unicode que ocupa 3 bytes y que tiene esta
el fichero. Entonces, marco UTF-8, se marca el representación en hexadecimal y aparece
disquete y guardo. Ahora selecciono UTF-8 sin BOM. representado de esta forma como carácter. Quiero que
Se me marca el disquete y guardo (un pequeño te acuerdes muy bien de lo que pone aquí EF, BB, BF y
chanchullo para que me permitiese guardar UTF-8 sin de su representación en forma de carácter porque
BOM)”. ahora después la volveremos a ver.
Html: el juego de los caracteres
y los editores de texto
Y el correo continuaba: “y ahora viene el tema si
¿Cuál es el problema de todo esto? Lo mejor es utilizar guardado en UTF-8 sin BOM, cuando cierro el fichero y
UTF-8, nos evitamos problemas, podemos escribir lo vuelvo a abrir la codificación que me marca es ANSI.
cualquier carácter, podemos mezclar todos los idiomas ¿Es normal? También veo convertir a UTF-8 sin BOM,
del mundo, pero UTF-8 lleva el BOM, esos tres bytes al además de codificar en UTF-8 sin BOM. ¿Cuál es la
principio del fichero y hay programas que no se llevan diferencia?”
muy bien con el BOM. Por ejemplo, PHP 5, no tiene un
soporte completo de UTF-8. Si vamos a trabajar con primero vamos a ver qué es eso del BOM. BOM es el
PHP 5, debemos de utilizar UTF-8 sin BOM. Voy a acrónimo de Byte Order Mark, la marca de orden de
realizar una demostración práctica con el editor bytes y es un carácter Unicode que se utiliza para
Notepad Plus Plus para que lo entiendas mejor. Te voy indicar el orden de los bytes de un fichero de texto al
a mostrar un problema típico que aparece cuando principio del fichero. Básicamente, existen dos órdenes
trabajamos con UTF-8 y con PHP 5. de bytes, el Little-endian y el Big-endian, que definen
de qué forma se almacenan los datos que ocupan más
Estoy en Notepad Plus Plus y he preparado tres de un byte en el ordenador. ¿Confuso? Si, puede ser
ficheros de ejemplo para mostrarte el problema. Por muy confuso, ya sabes para solucionar los problemas
un lado, tenemos este fichero html.html que contiene con los juegos de caracteres hay que saber mucho.
solamente código HTML. Luego, tenemos este fichero Volviendo al BOM, en el caso de UTF-8, es un carácter
php.php que contiene esta instrucción de PHP: un eco, unicode que ocupa 3 bytes y que tiene esta
párrafo (esto lo escribe PHP) que lo único que hace es representación en hexadecimal y aparece
escribir esta cadena de texto, esta cadena HTML. Y por representado de esta forma como carácter. Quiero que
último, tenemos este fichero también en php, te acuerdes muy bien de lo que pone aquí EF, BB, BF y
phpfile.php, que lo único que hace es emplear la de su representación en forma de carácter porque
instrucción include, include de PHP, ahora después la volveremos a ver.
Después de UTF-8 es el mejor juego de caracteres para
los idiomas de europa occidental, incluido el español.
Pero si necesitas escribir el símbolo del euro, entonces

Html: tablas debes utilizar ISO-8859-15, también llamado Latin9.


Latin1 y Latin9 se diferencian únicamente en 8
caracteres que han cambiado, y el único realmente
importante para el español, es la sustitución de un
carácter que seguramente, nunca has usado, por el
Sencillo, ¿verdad? Pues no es tan sencillo porque esto símbolo del euro.
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
Después de UTF-8 es el mejor juego de caracteres para
los idiomas de europa occidental, incluido el español.
Pero si necesitas escribir el símbolo del euro, entonces

Html: imágenes debes utilizar ISO-8859-15, también llamado Latin9.


Latin1 y Latin9 se diferencian únicamente en 8
caracteres que han cambiado, y el único realmente
importante para el español, es la sustitución de un
carácter que seguramente, nunca has usado, por el
Sencillo, ¿verdad? Pues no es tan sencillo porque esto símbolo del euro.
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
Html: validación del código
Sencillo, ¿verdad? Pues no es tan sencillo porque esto
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
Html5: nuevas funcionalidades
en formularios Además, esto supone un ahorro de tiempo y de ancho
de banda, ya que, por un lado, permite que el
formulario no se ha enviado, si no es válido y, por otro
Hola a todos, mi nombre es Mar Martínez soy experta lado, permite informar al usuario de que alguno de los
en e-learning y estándares web y trabajo en la Oficina valores introducidos no cumple los requisitos
para la Armonización del Mercado Interior. En el definidos.
siguiente vídeo os voy a presentar algunas de las
nuevas funcionalidades que HTML5 incorpora para la Para los usuarios, los formularios tienen ahora un
gestión de formularios. comportamiento mucho más intuitivo, donde, por
ejemplo, se pueden mostrar pistas sobre lo que se
Antes de comenzar, deciros que podéis contactar debe introducir en los campos de entrada. Se puede
conmigo la dirección de correo mostrar un calendario interactivo al usuario, para
mmar.martínez.carrascosa@gmail.com, además mi rellenar un campo de fecha o, incluso, se puede
cuenta de Twitter, relacionada con el tema, es seleccionar un color desde una paleta de colores.
@mar_martinez_c.
En la siguiente tabla extraída de la página web del W3C
Una de las características más importantes que nos podemos ver la lista de estados disponibles para el
trae nuevo estándar HTML5 son los nuevos elementos atributo type, en HTML5.
disponibles para el manejo de formularios ya que nos
permite gestionarlos de manera nativa y, por tanto, se En esta primera parte del videotutorial vamos a
puede prescindir de JavaScript para realizar algunas centrarnos en algunos de los nuevos estados del
validaciones de formulario del lado del cliente. atributo type, del elemento input. Al final del vídeo,
además, veremos brevemente cómo los dispositivos
El disponer de controles avanzados nativos facilita móviles están mejorando su usabilidad para adaptarse
mucho el trabajo del desarrollador porque no se tiene a las necesidades del usuario modificando la
que preocupar por problemas de compatibilidad apariencia de su teclado táctil dependiendo del tipo de
entre distintos navegadores. datos que el usuario tenga que rellenar.
Html5: nuevas funcionalidades
en formularios regulares. En el ejemplo, podemos ver como el sistema
En la segunda parte del videotutorial, lo que veremos informa al usuario del error cometido al introducir el
son algunos de los nuevos atributos de contenido que número de teléfono. Cabe destacar que este tipo
introduce HTML5 y, además, hablaremos, brevemente, puede ser útil para el caso de teléfonos móviles
de Modernizr y de los Polyfills. porque se puede crear un autocompletado con el
número de teléfono en cuestión e incluso, se puede
Aquí podéis ver una tabla con todos los nuevos valores mostrar la agenda del teléfono móvil para seleccionar
para input type que vamos a analizar en este primer un número almacenado.
videotutorial, url, tel, email, number, color, search,
range, datetime, datetime-local, date, month, week y El tipo de input email se usa para definir campos en los
time. En cuanto al tipo de input url, como se puede que se deba introducir una dirección de correo
deducir, se usa en aquellos campos que deben electrónica válida, en el ejemplo, podemos ver como el
contener una dirección web. El valor del campo url, es sistema informa al usuario de que la dirección de
automáticamente validado, cuando el formulario es correo electrónica introducida no tiene un formato
enviado. En el ejemplo podemos ver como el sistema correcto.
informa al usuario de que la url introducida no tiene
un formato correcto. El tipo de input number se usa para definir campos en
los que se deba introducir un valor numérico. Este
El tipo de input tel se usa para definir campos en los campo puede contener atributos que permitan realizar
que se debe introducir un número de teléfono. Dada la restricciones sobre el número, como por ejemplo,
variedad de formatos que existe en todo el mundo definiendo un valor mínimo o máximo mediante los
para los números de teléfono, este tipo no impone una atributos min y max de los que hablaremos en la
sintaxis o patrón determinado, así que, para validarlo segunda parte del vídeo tutorial o asignándole un
como un formato numérico en particular, se debe valor específico por defecto mediante el atributo
complementar con pattern, un atributo de contenido value. En el ejemplo, podemos observar que, al
que veremos en detalle en la segunda parte del asignarle un valor por defecto este aparece
videotutorial y que se basa en expresiones automáticamente al mostrarse el campo.
Html5: nuevas funcionalidades
en formularios El tipo de input datetime permite al usuario
seleccionar la hora completa además del día, mes, año
y zona horaria.
El tipo de input color se usa para definir campos en los
que el usuario puede seleccionar un color desde una El tipo de input datetime-local permite al usuario
paleta de colores. Le hemos asignado un color azul seleccionar la hora completa más el día, mes y año,
marino desde base mediante el código hexadecimal pero, en este caso, a diferencia del anterior, no se
aunque, si no se define un valor, por defecto adquiere incluye la zona horaria. Si la zona horaria no es
el color negro. importante para tu aplicación, usa este tipo datetime-
local, en lugar de datetime.
El tipo de input search se usa para definir campos de
búsqueda en formato de texto adquiriendo un aspecto El tipo de input date permite al usuario seleccionar
gráfico más adecuado a su función. Como se puede una fecha completa formada por día, mes y año.
observar en el ejemplo, al introducir texto en este
campo, el navegador muestra una cruz a la derecha El tipo de input month permite al usuario seleccionar
que permite al usuario borrar todo lo escrito hasta el un mes y un año específico.
momento. El tipo de input week permite al usuario seleccionar
El tipo de input range se usa para definir campos que una semana y un año específico.
deban contener un valor numérico que esté dentro de El tipo de input time permite al usuario seleccionar la
un rango específico, rango que definimos con los hora en formato de horas y minutos.
atributos min y max, de los quedaremos en la segunda
parte del videotutorial. También podemos usar otros Hasta ahora hemos tenido en cuenta los navegadores
atributos como, por ejemplo, value, para darle un valor web desde el punto de vista de un ordenador de
por defecto o el atributo step, del que también sobremesa o de un portátil. A continuación, vamos a
hablaremos en la segunda parte del videotutorial y ver las mejoras de usabilidad que introducen los tipos
que sirve para definir los intervalos en los que puede de input tel, email y url cuando lo que estamos usando
variar el valor. es un dispositivo con pantalla táctil.
Html5: nuevas funcionalidades
en formularios

Dentro de un formulario, cuando el foco se sitúa en un


campo de tipo tel, las pantallas táctiles cambiarán su
formato por defecto y se utilizarán para la introducción
de un número de teléfono mostrando un teclado
numérico.
Cuando el foco se sitúa en un campo de tipo email, las
pantallas táctiles se optimizarán para la introducción
de un campo de texto. En este caso, iPhone va más
allá, ya que el teclado incorpora la tecla de acceso
directo de @. En el caso de Android, se usa el tipo de
entrada de texto que existe por defecto.
Por último, cuando el foco se sitúa en un campo de En resumen, los dispositivos móviles están
tipo url, las pantallas táctiles cambiarán y se incorporando mejoras muy interesantes de usabilidad
optimizarán para la introducción de un campo de texto para el usuario, adaptándose en la medida de lo
pero, en este caso, como ocurría en el anterior, iPhone posible a sus necesidades, ahorrándoles así trabajo y
va más allá e incorpora las teclas de acceso directo de tiempo.
barra inclinada y de .com. En el caso de Android, para
url se usa el tipo de entrada de texto que existe por Espero que toda esta información te sea útil. Muchas
defecto. gracias por tu atención y hasta pronto.
Html5: nuevas funcionalidades
en formularios
Sencillo, ¿verdad? Pues no es tan sencillo porque esto
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
Ejemplo de formulario
Sencillo, ¿verdad? Pues no es tan sencillo porque esto
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
¿por qué es importante escribir
el código correcto?
Sencillo, ¿verdad? Pues no es tan sencillo porque esto
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
¿por qué es importante escribir
el código correcto?
Sencillo, ¿verdad? Pues no es tan sencillo porque esto
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
¿por qué es importante escribir
el código correcto?
Sencillo, ¿verdad? Pues no es tan sencillo porque esto
muchas veces es imposible de lograr, no porque no se
pueda, sino porque no depende de nosotros, lo normal ¿Cómo indicó el juego de caracteres en HTML? Se
es que en un escenario real nos encontremos con algo realiza mediante una etiqueta meta, que se escribe en
parecido a esto. Un escenario en el que no puedes el head, en la cabecera de la página web, pero
utilizar el mismo juego de caracteres en todos los depende de la versión de HTML que estés utilizando. Si
elementos de tu sistema y, normalmente el problema estás utilizando HTML 4 debes utilizar esta sintaxis, si
suele convertirse en algo muy grave, con solución, estás utilizando XHTML 1, debes utilizar alguna de
pero muy costosa. estas dos sintaxis. Además, si empleas un juego de
caracteres diferente a UTF-8, también tendrás que
En ese momento es cuando te toca llamar al indicar el juego de caracteres mediante la declaración
informático para que te solucione el problema pero, no de documentos xml, al principio de la página web.
a un informático que se dedica a instalar el Windows o
a cambiar tarjetas gráficas, no, a un informático de Y por fin llegamos a HTML 5, ¿cómo será en HTML 5?
verdad. ¿Más fácil, más complicado? En HTML5 se ha
intentado hacer el lenguaje HTML más sencillo, así
¿Qué juego de caracteres debo usar? Yo te recomiendo que, han simplificado la forma de indicar el juego de
UTF-8 sin BOM, es la solución a todos los problemas y caracteres y ahora es algo tan sencillo como esto, o
te permite mezclar en un mismo documento textos en esto.
cualquier idioma, es decir, te permite mezclar
caracteres de cualquier alfabeto pero absolutamente Después de este vídeo, no espero que ya no veas el
sin ningún problema. juego caracteres como un lío, en realidad no te
explicado las razones de que sea un lío, pero sí que te
Si no puedes utilizar UTF-8 sin BOM por alguna razón, he dado dos consejos: utiliza siempre el mismo juego
entonces te recomiendo ISO-8859-1 también llamado de caracteres en todo lo que hagas y si puedes, utiliza
Latin1. el juego de caracteres UTF-8 sin BOM.
[A+] ¿migrar a un nuevo juego
de caracteres?
“Una duda técnica, después de ver el último vídeo que
Antes de ver este vídeo, te recomiendo que veas los has publicado sobre codificación UTF-8 sin BOM, me
vídeos, "HTML juego de caracteres" y "HTML el juego he dado cuenta de dos cosas. Una de que eso existe,
de caracteres y los editores de texto" que te ayudarán dos que mi editor de HTML, Dreamweaver 8, las
a entender mejor qué es el juego de caracteres. En nuevas páginas están configuradas como tipo de
estos dos vídeos, el consejo que doy, es que lo mejor, documento DTD XHTML 1.0 transitional y codificación
es usar el juego de caracteres UTF-8 sin BOM, ya que encoding europeo occidental. Sobre la codificación, no
es la solución a todos los problemas que pueden hay problema para ponerla en UTF-8 sin BOM pero,
aparecer con el juego de caracteres y permite mezclar con respecto al tipo de documento, ¿cuál de las
en un mismo documento, textos en cualquier idioma, siguientes posibilidades que me ofrece debo escoger?
es decir, te permite mezclar caracteres de cualquier HTML 4.01 Transitional, HTML 4.01 Strict, XHTML 1.0
alfabeto, pero, ¿qué pasa si ya tenemos un sitio web Transitonal, XHTML 1.0 Strict o XHTML Mobile 1.0”, y
con otro juego de caracteres? ¿Debemos migrar el sitio continua, “esto es, más que nada, para hacer la
web al juego de caracteres UTF-8 sin BOM? Vamos a práctica del curso, aunque también me bajaré Notepad
analizarlo con un caso real, la situación que me ha Plus Plus, a ver si me acostumbro. A parte de eso, ya
planteado un amigo que es alumno de este curso. me he dado cuenta de que todo lo que escrito más o
menos desde 2004, está en XHTML 1.0 transitional y
Mi amigo es biólogo y empezó a hacer páginas web en europeo occidental. Supongo que algún día tendré que
el año 1996. Sus primeras páginas web las hacía con el validar y limpiar todo ese código. ¿Es tan simple como
programa Microsoft Frontpage. Desde hace varios guardar las páginas con la nueva codificación o se debe
años, mi amigo mantiene un sitio web sobre rutas de hacer una revisión completa y manual para detectar
montaña, de senderismo muy popular, con un buen errores? Tampoco estoy pensando en revisar todo lo
número de visitas. Mi amigo me mandó el siguiente viejo, sino de aprovechar lo que funcione bien, se
mensaje al ver uno de mis vídeos. entiende”.
[A+] ¿migrar a un nuevo juego
de caracteres?
Mi amigo usa Dreamweaver 8. Cuando se crea un En el vídeo "HTML, tres errores típicos" ya expliqué
nuevo documento, aparece un asistente que permite que cuando se escribe el código así, a veces es muy
elegir la categoría de documento que se quiere crear. difícil de leer. ¿Este código está mal? No, no está mal,
Cuando se elige crear una página web, se tiene que pero si se emplea el juego de caracteres adecuado y,
elegir el tipo de documento, el DTD que se quiere mi amigo está utilizando ISO 8859-1, que es un juego
aplicar. El DTD, el DOCTYPE, indica la versión de HTML de caracteres adecuado, entonces, escribir el texto así
que se usa. Además, en las propiedades de un es totalmente inútil, porque no es necesario y no
documento, también se puede definir la codificación, aporta ninguna ventaja.
el encoding del documento, el juego de caracteres. Al
final, todo esto se traduce en dos cosas en el código Volviendo al correo de mi amigo, le contesté lo
HTML, en el DOCTYPE, en el que se indica la versión siguiente: “Este consejo, utilizar UTF-8 sin BOM es
de HTML y en la etiqueta meta- charset, en la que se para la creación de las páginas nuevas. En tu caso, yo
indica la codificación o juego de caracteres. te aconsejo que sigas como hasta ahora, no te vale la
pena realizar una migración si ahora mismo no tienes
Mi amigo usa el juego de caracteres ISO 8859-1, ningún problema. No hay ningún problema para
también llamado Latin1, que Dreamweaver llama trabajar con Europeo Occidental ISO-8859-1 o Latin1,
Europa Occidental porque es el mejor juego de si no tienes que incluir idiomas con otros alfabetos o
caracteres para los idiomas de europa occidental no te vas a conectar con otros sistemas que tengan
incluido el español. No hay ningún problema en usar otra codificación”. Mi amigo podría tener problemas si
este juego de caracteres, pero mi amigo hace algo que se conecta a una base de datos y no elige el juego de
no es necesario. Mi amigo escribe los caracteres que caracteres adecuado o, si utiliza un servicio web que le
no pertenecen al juego de caracteres ASCII, como las devuelve los datos en un juego de caracteres distinto al
vocales acentuadas y la ñ, como referencias de suyo pero, en principio no tiene planes de hacer nada
carácter con nombre. de esto, y continuaba con mi respuesta.
[A+] ¿migrar a un nuevo juego
de caracteres?
“Digamos que UTF-8 sin BOM es la solución fácil para Y, para terminar, ¿cómo podemos convertir fácilmente
todo y que te asegura que no tendrás problemas en el un conjunto de páginas de una codificación a otra? Es
futuro, pero usar Europa Occidental es una buena decir, ¿cómo puedo migrar un sitio web de una
opción, es más, es lo mejor porque ahorras espacio”. codificación a otra? Pues en Windows no es fácil, en
¿Qué significa ahorrar espacio? Vamos a hacer una Linux y Mac OSX es fácil desde la línea de comandos.
prueba. Me bajo el fichero HTML de la página principal Por un lado, tenemos el comando file, que nos
de la Universidad de Alicante y con el Notepad Plus permite conocer el tipo y la codificación de un fichero
Plus, lo convierto del formato original UTF-8 sin BOM a y, por otro lado, tenemos iconv, que convierte la
ISO 8859-1 o Latin1. Si comparamos los tamaños de los codificación de un fichero, de una codificación a otra.
ficheros, comprobamos que la versión original de la En Windows, el único método que conozco, es utilizar
página web, que está en formato UTF-8 sin BOM, la un editor de textos, como, por ejemplo, pues el
que podemos ver a la izquierda, ocupa 360 bytes más Notepad Plus Plus y convertir fichero a fichero
que la versión en formato Latin1, que aparece a la nuestro sitio web.
derecha. Esto se debe a que ciertos caracteres, las Por último, en el sitio web del W3C dedicado a la
vocales acentuadas o la ñ, ocupan dos bytes en vez de internacionalización podemos encontrar mucha
uno. Y, por último, le decía a mi amigo, “respecto al información sobre el juego de caracteres. Te
DOCTYPE, sí que te aconsejo que utilices DOCTYPE recomiendo la lectura de los artículos: "Codificación de
HTML, para HTML5 en tus nuevas páginas, si no, sigue caracteres, conceptos básicos" y "Selección y
con el XHTML 1.0 Transitional”. ¿Por qué le aconsejo aplicación de codificación de caracteres".
esto? Porque es muy probable que en un plazo corto
de tiempo le interese aprovechar algunas de las Espero que estos vídeos te ayuden a entender qué es
nuevas características de HTML5. el juego de caracteres y lo sepas utilizar un poco mejor.
Para escribir un texto y que se entienda correctamente
se debe utilizar el juego de caracteres adecuado. Las
migraciones se realizan cuando la página web da
problemas o en el momento de conectarse a otro
sistema con otra codificación, pero si no da problemas,
no es aconsejable realizar una migración. Migrar un sitio
web de una codificación a otra es más sencillo en Linux
y macOS X ya que se realiza por línea de comandos. El
comando file permite conocer el tipo y la codificación de
un fichero y el comando iconv convierte la codificación
de un fichero de una codificación a otra.
[A+] XML: HTML y xhtml
XHTML es el lenguaje de marcado pensado para
XHTML es el acrónimo de eXtensible Hypertext sustituir a HTML como estándar para las páginas web.
Markup Language, en castellano, lenguaje extensible En su versión 1.0 XHTML, es solamente la versión XML
de marcado de hipertexto. XHTML es el lenguaje de de HTML, por lo que tiene básicamente las mismas
marcado, pensado para sustituir a HTML como funcionalidades, pero cumple las especificaciones más
estándar para las páginas web. Si XHTML es el sucesor estrictas de XML.
de HTML, ¿qué relación existe con XML? En su versión
1.0 XHTML es solamente la versión de XML de HTML, XHTML incorpora a las páginas web el rigor de XML,
por lo que tiene, básicamente, las mismas etiquetas y lo cual se traduce en un mejor procesamiento, un
funcionalidades pero cumple las especificaciones más mantenimiento más sencillo y es el primer paso hacia
estrictas de XML. Recordemos que HTML, XHTML y la llamada web semántica. Desgraciadamente, todas
XML, son los tres estándares de facto desarrollados estas promesas se pararon en seco a mediados del año
por el World Wide Web Consortium, el W3C, un 2009. En julio del año 2009, el W3C anunció que
consorcio internacional que produce cuando el grupo de trabajo de XHTML 2, la próxima
recomendaciones para la world wide web. versión de XHTML, terminase su trabajo a finales de
2009, no iba a ser renovado, ya que el W3C, quería
Desde la publicación de la primera página web en aumentar los recursos destinados a HTML 5.
diciembre de 1990, el lenguaje HTML ha ido Finalmente, en diciembre de 2010, el grupo de trabajo
mejorando con nuevas versiones. En noviembre de de XHTML 2 fue definitivamente cerrado.
1995, se publicó HTML 2.0. En enero de 1997, HTML
3.2 y en diciembre de 1997, apareció HTML 4. La ¿Y qué es HTML 5? HTML 5 es la quinta y última
última revisión, HTML 4.01, se publicó en diciembre de versión, por ahora, del lenguaje de etiquetado HTML.
1999. En enero de 2000, se publicó XHTML 1.0, una ¿Pero qué pasó con XHTML? XHTML 1.0 fue publicado
reformulación de HTML 4 utilizando XML 1.0. Una en el año 2000 y en los siguientes años se
revisión de XHTML 1.0 fue publicada en agosto de desarrollaron numerosas tecnologías que lo
2002. complementaban o que lo iban a suceder.
[A+] XML: HTML y xhtml
Desgraciadamente todas estas tecnologías
complicaron bastante el desarrollo y el uso de XHTML,
en el año 2004, algunos miembros de Apple, Mozilla
Foundation y Opera Software fundaron el Web
Hypertext Application Technology Working Group,
porque no estaban contentos con la evolución de
XHTML y con la falta de interés del W3C, por las
necesidades reales de los desarrolladores web.
De forma independiente, este grupo empezó a
desarrollar su propia versión de cómo debía ser la
propia versión de HTML. En el año 2006, el W3C,
mostró su interés por participar en el desarrollo de
HTML 5 y en el año 2007 el W3C formó un grupo de
trabajo destinado a trabajar con el WHATWG, en el
desarrollo de la especificación de HTML5. Por tanto, el
W3C abandonó sus trabajos sobre XHTML 2.0 y pasó a
centrar su interés en HTML5.
Entonces ¿está muerto XHTML? No, para nada, no está
muerto, existen millones y millones de sitios web y
miles de herramientas basadas en XHTML, más aún,
HTML 5 se está desarrollando con dos sintaxis, una
basada en XHTML y otra basada en HTML. Por tanto,
tiene mucho sentido seguir trabajando con XHTML los
próximos años.
[A+] XML: HTML y xhtml
A continuación, vamos a ver las principales diferencias
que existen entre HTML y XHTML 1.0.
En HTML 4 existen tres variantes del lenguaje, la
versión estricta, la versión transicional y la versión con
marcos.
En XHTML 1.0 se conservan en las tres variantes pero,
claro está, con sus propios DOCTYPES. Así, tenemos la
versión estricta, la versión transicional y la versión con
marcos. En la página web, lista recomendada de
declaraciones de DOCTYPE del W3C, podemos
encontrar estas declaraciones que acabamos de ver y
algunas más. En esta misma página del W3C, también,
podemos encontrar esta plantilla para crear un nuevo
documento XHTML 1.0. Este documento está
configurado para el juego de caracteres UTF-8. Si se
quisiera utilizar otro juego de caracteres, como, por
ejemplo, ISO-8859-1, también llamado Latín 1, habría
que añadir esta declaración de documento XML y
habría que cambiar el valor del juego de caracteres en
esta etiqueta. Para comprobar si una página XHTML
está correctamente escrita, se puede emplear algún
validador, como, por ejemplo, el que proporciona el
W3C.
[A+] XML: HTML y xhtml
Veamos a continuación, las principales diferencias que
existen entre HTML y XHTML 1.0. Debido a que XHTML
es una aplicación de XML, ciertas prácticas que eran
posibles en XHTML, que está basado en SGML, ahora
no son posibles.
Pero, en primer lugar, recordemos la estructura de un
elemento HTML. Un elemento HTML, se compone de
una etiqueta inicial y una etiqueta final, que tienen el
mismo nombre, la etiqueta inicial puede llevar
atributos, pero la final nunca lleva. En HTML los
atributos pueden llevar un valor. Por último, las
etiquetas pueden tener contenido. El contenido Esto es debido a que XML diferencia las mayúsculas y
puede estar formado por otras etiquetas de HTML o minúsculas. En HTML es posible escribir las etiquetas y
puede ser simplemente texto, como en este ejemplo. atributos en mayúscula y en minúsculas, sin ningún
problema. En XHTML esto es totalmente incorrecto,
En primer lugar, los elementos anidados, deben tener todo tiene que estar escrito en minúsculas.
un correcto orden de apertura-cierre, el que se abre el
último, debe cerrarse el primero. Por ejemplo, en Los elementos vacíos deben cerrarse siempre. O bien,
HTML es posible este ejemplo pero esto es totalmente aparece la etiqueta final, o bien, la etiqueta inicial
incorrecto en XHTML porque los elementos están termina con barra mayor que. En HTML los elementos
superpuestos. La forma correcta de escribirlo en vacíos no llevan etiqueta de cierre, por tanto, se
XHTML sería la siguiente: los elementos, los nombres pueden escribir directamente de esta forma, sin
de elementos y atributos deben de ir siempre en embargo, esto es incorrecto en XHTML. En XHTML o se
minúsculas. cierra la etiqueta, o se escribe con una etiqueta vacía.
[A+] XML: HTML y xhtml
Los elementos no vacíos, también deben de cerrarse El tratamiento de los espacios en blanco en los valores
siempre en XHTML. En HTML se permite no cerrar de los atributos varía en XHTML respecto a HTML. Los
ciertos elementos, ya que se cierran de forma espacios en blanco al principio y al final se eliminan y
implícita, pero esto es totalmente imposible en uno o más espacios en blanco, incluyendo los saltos de
XHTML. Por ejemplo, la etiqueta p, de párrafo, se línea, se traducen en un único espacio en blanco entre
puede no cerrar en HTML, pero esto está mal en las palabras del valor de un atributo.
XHTML. En XHTML, los elementos se tienen que cerrar
siempre. En XHTML el contenido de la etiqueta script y style
está definido como # pc data. Como resultado de ello,
Los valores de los atributos deben siempre ir los símbolos menor que y & se interpretan por parte
encerrados entre comillas simples o dobles. En HTML, del procesador de XML como inicio de etiqueta y
los valores de los atributos se pueden escribir sin como entidad de carácter. Si se encierra el contenido
comillas, sin embargo, esto es incorrecto en XHTML. de script o de estilo con cdata se evita este
Siempre hay que encerrar los valores de los atributos comportamiento. Como alternativa más cómoda,
entre comillas dobles o comillas simples. No está también se pueden almacenar en ficheros separados.
permitida la minimización de atributos. En aquellos
casos en que el atributo no tiene definido un conjunto En SGML se pueden definir exclusiones, evitar que
de valores, sino que simplemente está o no está, se ciertos elementos sean contenidos en otros
usa el nombre del atributo como único valor posible. elementos. Esto no es posible definirlo en XML y por
tanto tampoco en XHTML.
En HTML es posible minimizar los valores de los
atributos y simplemente, se escribe el nombre del En XHTML no se pueden definir de forma formal a
atributo, como vemos aquí, en este ejemplo, dl través del DTD, sino, que sólo se puede proporcionar
compact o option selected o input checked. Esto es en forma de lista de exclusiones. En HTML 4, tanto el
totalmente incorrecto en XHTML. En XHTML se tiene atributo name, como el atributo id, se pueden emplear
que asignar siempre un valor y se toma la regla de para identificar un fragmento de código. En XHTML
asignarle como valor el mismo nombre del atributo. solo es posible emplear el atributo id.
[A+] XML: HTML y xhtml
[A+] XML: HTML y xhtml

En HTML, el tratamiento de los atributos con conjunto


de valores predefinidos como align o type, es no
sensible a mayúsculas y minúsculas, sin embargo, en
XHTML, sí que es sensible a las mayúsculas y
minúsculas y se deben escribir siempre los valores en
minúsculas.
En HTML, las referencias de entidad se pueden escribir
como & x mayúscula y el código hexadecimal o, como
& x minúscula y el código hexadecimal. En XML y por
tanto en XHTML, solo se pueden emplear las versiones
en minúsculas.
Y con esto termina este vídeo tutorial, sobre las
diferencias entre HTML y XHTML. Como hemos visto
estas diferencias están originadas por el hecho de que
XHTML es una aplicación de XML que impone una
serie de reglas más estrictas.
XHTML es el lenguaje de marcado pensado para
sustituir a HTML como estándar para las páginas web.
En su versión 1.0 XHTML es solamente la versión de
XML de HTML por lo que tiene, básicamente, las mismas
etiquetas y funcionalidades, pero cumple las
especificaciones más estrictas de XML. XHTML es más
estricto que HTML por lo que tienen varias diferencias.
Una de ellas es que en XHTML los elementos vacíos
siempre llevan etiqueta de cierre y en HTML no es
necesario. Otra de ellas está relacionada con el valor de
los atributos: en XHTML siempre llevan comillas, cuando
en HTML no es imprescindible.

También podría gustarte