Está en la página 1de 5

Regional Distrito Capital Centro de Electricidad, electrnica y telecomunicaciones ANALISIS Y DESARROLLO DE SISTEMAS DE INFORMACION Sistema de Gestin de la Calidad FASE

DEL PROYECTO: ANALISIS

Fecha: Marzo 8 / 2012

Pgina 1 de 5

Regional Distrito Capital ANALISIS Y DESARROLLO DE SISTEMAS DE INFORMACIN FASE DEL PROYECTO: ANALISIS GUIA DE APRENDIZAJE HTML Caracteres especiales CATERIN ACOSTA CAMACHO ADSI 259128 DURACIN : 8 Horas FORMACIN POR COMPETENCIAS LABORALES METODOLOGIA DE FORMACION POR PROYECTOS
Centro de Electricidad, electrnica y telecomunicaciones

SERVICIO NACIONAL DE APRENDIZAJE - SENA

Bogot D. C., Marzo de 2012

Regional Distrito Capital Centro de Electricidad, electrnica y telecomunicaciones ANALISIS Y DESARROLLO DE SISTEMAS DE INFORMACION Sistema de Gestin de la Calidad FASE DEL PROYECTO: ANALISIS

Fecha: Marzo 8 / 2012

Pgina 2 de 5

GUIA 6 HTML Caracteres especiales Caracteres especiales


Los documentos HTML estn construidos a partir de caracteres Del juego denominado ISO-Latn-1, de 256 elementos. Por ello, el formato de transferencia de informacin entre los clientes y servidores HTTP asocia un nico byte a cada carcter, segn el orden que tienen asociado en la definicin de la tabla. En cada uno de estos sistemas se utilizan tablas de presentacin de caracteres totalmente diferentes, por lo cual el carcter (ASCII 160 en un sistema MSDOS en castellano) tendr una representacin completamente diferente en un sistema americano, o al cambiar entre un PC y un Macintosh. El caso extremo se halla en sistemas que utilicen alfabetos cirlicos o japoneses. Una pgina web se ha de ver en pases distintos, que usan conjuntos de caracteres distintos. El lenguaje HTML nos ofrece un mecanismo por el que podemos estar seguros que una serie de caracteres raros se van a ver bien en todos los ordenadores del mundo, independientemente de su juego de caracteres. Solucionando problemas La solucin a este problema pasa por asignar a cada carcter especial una nueva etiqueta HTML, denominada referencia a carcter, que se puede incluir en un documento de dos formas: Por su nmero, con el formato &#nnn; (nnn es el cdigo decimal del elemento). Por su nombre mnemotcnico, segn se recoge en ISO-LATIN-1. Por ejemplo, la se puede representar como &#225; o &aacute; . (El; indica el final de la etiqueta). Como nota importante, los caracteres < > ; " # " no pueden ser incluidos directamente dentro de un documento ya que seran interpretados como parte del propio cdigo HTML. Por ello, se deben utilizar los siguientes nombres mnemotcnicos: A travs de sus mens de configuracin, es posible hacer que determinado documento se muestre con una tabla de caracteres diferente de la por defecto; adems, los documentos HTML pueden incluir una etiqueta, <META>, para fijar el juego de caracteres necesario para su visualizacin, a partir de una aplicacin de la clasificacin MIME de los documentos HTML. Lgicamente, se debe disponer de una fuente adecuada para presentar el documento (por ejemplo, una fuente True Type de los entornos Windows). <META> debe aparecer en la seccin <HEAD> del documento, y su formato es: <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=juego _de_caracteres">

Regional Distrito Capital Centro de Electricidad, electrnica y telecomunicaciones ANALISIS Y DESARROLLO DE SISTEMAS DE INFORMACION Sistema de Gestin de la Calidad FASE DEL PROYECTO: ANALISIS

Fecha: Marzo 8 / 2012

Pgina 3 de 5

Por ejemplo:

<!-- Juego de caracteres Occidental --> <META HTTP-EQUIV="Content-Type" CONTENT="text/html;charset=us-ascii"> <!-- Juego de caracteres Cirlico --> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=csKOI8R"> <!-- Juego de caracteres Chino Tradicional --> <META HTTP-EQUIV="Content-Type" CONTENT="text;/html; charset=chinese";>

A efectos prcticos, nuestros documentos deberan usar referencias a carcter, segn los identificadores definidos en ISO-LATIN-1, ya que no todos los browsers interpretan la etiqueta <META>. Si se especifica el juego de caracteres, dentro del documento se pueden utilizar directamente los caracteres grficos correspondientes (acentos, etc.), con el riesgo de que algn cliente Web los muestre con el carcter correspondiente de su tabla de cdigos Local. Definiciones de carcter Primeramente pasamos a la definicin de caracteres en una expresin regular. Vamos a detallar las metas caracteres que permiten especificar una plantilla que concuerde con un texto de unas caractersticas concretas. Dentro de las definiciones de caracteres podremos especificar caracteres genricos, rangos de caracteres, exclusin de caracteres, literales y otras caractersticas adicionales.

Meta carcter . () [] [-] [^] | // \

Significado Concuerda con cualquier carcter (salvo fin de lnea en modo multilnea) Subexpresin o grupo Subexpresin o grupo Rango de caracteres Excepto ese conjunto de caracteres Permite una alternativa para elegir entre dos expresiones Delimita una expresin regular Protege el siguiente Metacaracter

Las expresiones permiten tambin especificar caracteres especiales no imprimibles:

Regional Distrito Capital Centro de Electricidad, electrnica y telecomunicaciones ANALISIS Y DESARROLLO DE SISTEMAS DE INFORMACION Sistema de Gestin de la Calidad FASE DEL PROYECTO: ANALISIS

Fecha: Marzo 8 / 2012

Pgina 4 de 5

Metacar cter \a \e \cx \f \n \r \t \xhh \ddd Ejemplos: Expresi n /[a-z]/ /[A-Z]/ /[0-9]/ /[,'! ;:.?]/ /[A-Za-z]/ /[A-Zaz0-9]/ /[^a-z]/ /[^0-9]/

Significado pitido, el carcter BEL (07 en hexadecimal) escape (1B en hexadecimal) "control-x", donde x es el carcter correspondiente nueva pgina (0C hexadecimal) nueva lnea (0A hexadecimal) retorno de carro (0D hexadecimal) tabulador (09 hexadecimal) carcter con cdigo hh hexadecimal carcter con cdigo ddd en octal

Significado Una letra minscula. El "-" indica un rango, que en este caso comienza en "a" y termina en "z". una letras mayscula un dgito un carcter de puntuacin una letra salvo acentuadas y una letra, salvo acentuadas y , o un dgito cualquier carcter salvo una letras minscula Cualquier carcter salvo un nmero.

Clases
Podemos especificar clases de caracteres segn varias sintaxis, POSIX, tradicional o Unicode. Segn la sintaxis de clases POSIX, podemos indicar [:clase:] donde clase puede ser alguna de las siguientes expresiones: Clase [:alph a:] [:alnu m:] [:ascii: ] [:blan k:] [:cntrl: ] [:digit: Significado carcter alfabtico carcter alfanumrico carcter ascii espacio, incluye tabulador (tambin \s segn la sintaxis tradicional) carcter de control un dgito (tambin \d segn la sintaxis tradicional)

Regional Distrito Capital Centro de Electricidad, electrnica y telecomunicaciones ANALISIS Y DESARROLLO DE SISTEMAS DE INFORMACION Sistema de Gestin de la Calidad FASE DEL PROYECTO: ANALISIS

Fecha: Marzo 8 / 2012

Pgina 5 de 5

] [:grap h:] [:lowe r:] [:print :] [:punc t:] [:spac e:] [:uppe r:] [:word :] [:xdigi t:]

carcter grfico letra minscula carcter imprimible carcter de puntuacin espacio (tambin \s segn la sintaxis tradicional) letra mayscula palabra (tambin \w segn la sintaxis tradicional) dgito hexadecimal

En la sintaxis tradicional, adems tenemos: Metacar cter \D \S \w \W Significado cualquier carcter que no sea un dgito decimal (equivalente a [^:digit:]) cualquier carcter que no sea un espacio en blanco (equivalente a [^:blank:] cualquier carcter de de una palabra cualquier carcter que no sea de una "palabra"

También podría gustarte