P. 1
Códigos alfanuméricos

Códigos alfanuméricos

|Views: 6.109|Likes:
Publicado por30011697

More info:

Published by: 30011697 on Nov 10, 2009
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

07/10/2013

pdf

text

original

Códigos alfanuméricos

Permiten codificar caracteres del lenguaje natural en un conjunto de bits. Al igual que con los números, no existe una única norma para codificar los caracteres alfanuméricos. Veamos algunas de ellas: ASCII (ISO 646): ASCII = American Standard Code for Information Interchange. Procede directamente de la definición de byte: 1B = número de bits necesarios para codificar un carácter. Utiliza 7 bits para representar cada carácter, y el octavo como bit de paridad para detectar errores. Las 128 variaciones distintas que se pueden conseguir con 7 bits permiten incluir en esta codificación las mayúsculas y minúsculas del abecedario inglés, además de cifras, puntuación, y algunos caracteres de control (por ejemplo, el retorno de carro, que simbolice el final de una línea y el comienzo de la siguiente), pero el ASCII no incluye ni los caracteres acentuados ni el comienzo de interrogación que se usa en castellano, ni otros símbolos necesarios en muchos contextos. Surge así el ASCII-Extendido.

Figura 1. Tabla ASCII original.

ASCII EXTENDIDO (ISO 8859): Utiliza los 8 bits para codificar un carácter. Formado por varias tablas: ISO 8859-1 Europa occidental, ISO 8859-5 alfabeto cirílico, ISO 8859-6 árabe, ISO 8859-7 griego, ISO 8859-8 Hebreo, ISO 8859-10 Europa occidental con juegos de caracteres nórdicos, incluyendo el de Islandia, ISO 8859-15 añade el símbolo de Euro y otros a ISO 88591, etc. Se gana en rango de caracteres representables, pero esas 256 variaciones son todavía insuficientes para codificar todos los alfabetos del mundo en una sola tabla. Surge así UNICODE.

Figura 2. Tabla ASCII extendida.

UNICODE: Incluye todos los caracteres de uso común en la actualidad. La versión 5.1 contiene 100.713 caracteres. Incluye sistemas de escritura modernos (árabe, braille, cirílico, japonés, latino…), escrituras históricas poco utilizadas o extinguidas (para propósitos académicos), como el cuneiforme, griego antiguo, rúnico… Actualmente se está trabajando en la inclusión de nuevos grupos de símbolos, como los jeroglíficos egipcios y mayas. Otros alfabetos propuestos han sido descartados por distintas razones, como por ejemplo el alfabeto Klingon. Formas de codificación UNICODE: UTF-8  1 a 2 B por carácter UTF-16  2 a 4 B por carácter UTF-32  codificación de 4 B de longitud fija.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->