Está en la página 1de 22

ASCII

El cdigo ASCII (siglas en ingles


para American Standard Code for
Information Interchange, es decir
Cdigo Americano ( Je! lease
estadounidense... ) Estndar para
el intercambio de Informacin )
( se pronuncia Aski ).
Fue creado en 1963 por el Comit
Estadounidense de Estndares o
"ASA", este organismo cambio su
nombre en 1969 por "Instituto
Estadounidense de Estndares
Nacionales" o "ANSI" como se lo
conoce desde entonces.
Este cdigo naci a partir de
reordenar y expandir el conjunto
de smbolos y caracteres ya
utilizados en aquel momento en
telegrafa por la compaa Bell. En

un primer momento solo inclua


letras maysculas y nmeros, pero
en 1967 se agregaron las letras
minsculas y algunos caracteres
de control, formando as lo que se
conoce como US-ASCII, es decir los
caracteres del 0 al 127.
As con este conjunto de solo 128
caracteres fue publicado en 1967
como estndar, conteniendo todos
lo necesario para escribir en
idioma ingles.
En 1981, la empresa IBM
desarroll una extensin de 8 bits
del cdigo ASCII, llamada "pagina
de cdigo 437", en esta versin se
reemplazaron algunos caracteres
de control obsoletos, por
caracteres grficos. Adems se
incorporaron 128 caracteres
nuevos, con smbolos, signos,

grficos adicionales y letras


latinas, necesarias para la
escrituras de textos en otros
idiomas, como por ejemplo el
espaol. As fue como se sumaron
los caracteres que van del ASCII
128 al 255.
IBM incluy soporte a esta pgina
de cdigo en el hardware de su
modelo 5150, conocido como
"IBM-PC", considerada la primera
computadora personal. El sistema
operativo de este modelo, el "MSDOS" tambin utilizaba el cdigo
ASCII extendido.
Casi todos los sistemas
informticos de la actualidad
utilizan el cdigo ASCII para
representar caracteres, smbolos,
signos y textos (449) .
BCD:

Cdigo BCD. Decimal codificado en


Binario
Para poder compartir informacin,
que est en formato digital, es
comn utilizar las
representaciones binaria y
hexadecimal. Hay otros mtodos
de representar informacin y una
de ellas es el cdigo BCD. Con
ayuda de la codificacin BCD es
ms fcil ver la relacin que hay
entre un nmero decimal (base
10) y el nmero correspondiente
en binario (base 2)
El cdigo BCD utiliza 4 dgitos
binarios (ver en los dos ejemplos
que siguen) para representar un
dgito decimal (0 al 9). Cuando se
hace conversin de binario a
decimal tpica no hay una directa

relacin entre el dgito decimal y el


dgito binario.
Ejemplo 1: Conversin directa
tpica entre un nmero en decimal
y uno binario. 8510 = 10101012.
La representacin el mismo
nmero decimal en cdigo BCD se
muestra a la derecha.

Cdigo BDC, decimal codificado en


binario. Ejemplo 1 - Electrnica
Unicrom
Ejemplo 2: Conversin directa
tpica entre un nmero en decimal

y uno binario. 56810 =


10001110002. La representacin
el mismo nmero decimal en
cdigo BCD se muestra a la
derecha

Como se puede ver, de los dos


ejemplos anteriores, el nmero
equivalente decimal no se parece
a la representacin en cdigo BDC.
Para poder obtener el equivalente
cdigo BCD de cada cifra de los
nmeros anteriores, se asigna un
peso o valor segn la posicin
que ocupa. Este peso o valor
sigue el siguiente orden: 8 4 2
1. (Es un cdigo ponderado). Del
ltimo ejemplo se observa que el

nmero 5 se representa como: 0 1


0 1.

El primer 0 corresponde al 8, el
primer 1 corresponde a 4, el
segundo 0 corresponde a 2, y
el segundo 1 corresponde a 1.
De lo anterior: 0 x 8 + 1 x 4 + 0 x
2+1x1=5

Al cdigo BCD que tiene los


pesos o valores antes
descritos se le llama: Cdigo BCD
natural. El cdigo BCD cuenta
como un nmero binario normal
del 0 al 9, pero del diez (1010) al
quince (1111) no son permitidos
pues no existen, para estos
nmeros, el equivalente de una
cifra en decimal. Este cdigo es
utilizado, entre otras aplicaciones,
para la representacin de las cifras
de los nmeros decimales en
displays de 7 segmentos.
Notas: Los subndices 2 y 10, se
utilizan para acotar, en el primer
caso que el nmero es binario y en
el segundo caso que el nmero es
decimal.
GRAY

El cdigo Gray es un tipo especial


de cdigo binario que no es
ponderado (los dgitos que
componen el cdigo no tienen un
peso asignado). Su caracterstica
es que entre una combinacin de
dgitos y la siguiente, sea sta
anterior o posterior, slo hay una
diferencia de un dgito. Por eso
tambin se le llama Cdigo
progresivo. Esta progresin sucede
tambin entre la ltima y la
primera combinacin. Por eso se le
llama tambin cdigo cclico.
El cdigo GRAY es utilizado
principalmente en sistemas de
posicin, ya sea angular o lineal.
Sus aplicaciones principales se
encuentran en la industria y en
robtica. En robtica se utilizan
unos discos codificados para dar la
informacin de posicin que tiene

un eje en particular. Esta


informacin se da en cdigo GRAY.
BAUD a informacin, para ser
transmitida, necesita ser adaptada
al medio de transmisin. Para ello,
generalmente, ser preciso
codificarla de tal forma que pueda
asegurarse una recepcin
adecuada y segura. Si tenemos la
informacin en un determinado
alfabeto fuente y queremos
transformarla en otro alfabeto
destino, podemos definir
codificacin como a la realizacin
de dicha transformacin, siendo el
cdigo la correspondencia
existente entre cada smbolo del
alfabeto fuente y cada conjunto de
smbolos del alfabeto destino.
El cdigo de Baudot, denominado
as por su inventor mile Baudot,

es un juego de caracteres
predecesor del EBCDIC y del ASCII
y fue originalmente utilizado sobre
todo en teletipos.
El cdigo original de Baudot,
desarrollado alrededor del ao
1897, se conoce como Alfabeto
Internacional de Telegrafa N 1, y
en la actualidad ya no est en uso.
Se utilizaba un teclado de cinco
teclas donde cada tecla
representaba un bit de la seal de
cinco estados. Un limpiador
mecnico exploraba el estado del
teclado y liberaba las teclas
permitiendo que el operador
introdujera el carcter siguiente.
Alrededor del 1901, fue modificado
por Donald Murray que reorden
los caracteres, agregando otros

nuevos as como cdigos de


control. Este reordenamiento fue
propiciado por el desarrollo de un
teclado parecido al de una
mquina de escribir. Entonces la
disposicin de los bits fue
disociada de las teclas del
operador. Murray arregl su cdigo
de modo que los caracteres ms
usados produzcan la menor
cantidad de cambios de estado, lo
que reduca al mnimo el desgaste
en el equipo.
Otra modificacin del cdigo de
Murray que fue fomentada sobre
todo por Western Unin consisti
en el descarte de algunos
caracteres. Esta modificacin final
es la que se conoce generalmente
como el cdigo de Baudot,
tambin conocido como Alfabeto

Internacional de Telegrafa N 2
(ITA2). El ITA2 todava se utiliza en
telfonos para sordos, en
radioaficionados, y en RTTY
(radioteletipo)OT
EBCDIC
(Extended Binary Coded Decimal
Interchange Code) es un cdigo
estndarde 8 bits usado por
computadoras mainframe IBM. IBM
adapt el EBCDIC del cdigode
tarjetas perforadas en los aos
1960 y lo promulg como una
tctica customer-control
cambiando el cdigo estndar
ASCII.EBCDIC es un cdigo binario
que representa caracteres
alfanumricos, controles ysignos
de puntuacin. Cada carcter est
compuesto por 8 bits = 1 byte, por

esoEBCDIC define un total de 256


caracteres
UTf-8 El estndar Unicode asigna
un punto de cdigo (un nmero) a
cada carcter en todos los idiomas
admitidos. UTF-8 permite codificar
utilizando tamaos de datos de 8
bits y funciona bien con muchos
de los sistemas operativos
existentes.
Las referencias numricas de
caracteres especifican la posicin
del cdigo de un carcter en el
conjunto de caracteres del
documento. Las referencias
numricas de caracteres pueden
tener dos formas:
La sintaxis "&#D;", donde D es un
nmero decimal
La sintaxis "&#xH;" o "&#XH;",
donde H es un nmero
hexadecimal (Para los nmeros

hexadecimales de referencias de
caracteres numricas no se
distingue entre maysculas y
minsculas.)
Para el intervalo ASCII de
caracteres, UTF-8 es idntico a la
codificacin ASCII y permite un
conjunto mayor de caracteres.
Para scripts espaol y griego, sin
embargo, UTF-8 puede necesitar
dos bytes para cada carcter.
unicode es un sistema para
representar caracteres de todos
los diferentes idiomas en el
mundo. Se dise para
intercambiar documentos en
diferentes idiomas sin problemas y
surge a finales de 1987
Qu es Unicode?

Unicode proporciona un nmero


nico para cada carcter, sin
importar la plataforma, ni el
programa, ni el idioma. Cuando
Python analiza un documento XML,
todos los datos se almacenan en
memoria como Unicode. Python
trabaja con Unicode desde la
versin 2.0 del lenguaje. El
paquete XML utiliza Unicode para
almacenar todos los datos XML,
pero puede usar Unicode en
cualquier parte.
Unicode representa cada carcter
como un nmero de 2 bytes, de 0
a 65535. Cada nmero de 2 bytes
representa un nico carcter
utilizado en al menos un idioma
del mundo (los caracteres que se
usan en ms de un idioma tienen
el mismo cdigo numrico). Hay
exactamente un nmero por
carcter, y exactamente un

carcter por nmero. Los datos de


Unicode nunca son ambiguos.
El establecimiento de Unicode ha
sido un ambicioso proyecto para
reemplazar los esquemas de
codificacin de caracteres
existentes, muchos de los cuales
estn muy limitados en tamao y
son incompatibles con entornos
plurilinges. Unicode se ha vuelto
el ms extenso y completo
esquema de codificacin de
caracteres, siendo el dominante en
la internacionalizacin y
adaptacin local del software
informtico. El estndar ha sido
implementado en un nmero
considerable de tecnologas
recientes, que incluyen XML, Java
y sistemas operativos modernos.
Las computadoras slo trabajan
con nmeros. Almacenan letras y

otros caracteres mediante la


asignacin de un nmero a cada
uno. Antes de que se inventara
Unicode, existan cientos de
sistemas de codificacin distintos
para asignar estos nmeros.
Ninguna codificacin especfica
poda contener caracteres
suficientes: por ejemplo, la Unin
Europea, por s sola, necesita
varios sistemas de codificacin
distintos para cubrir todos sus
idiomas. Incluso para un solo
idioma como el ingls, no haba un
nico sistema de codificacin que
se adecuara a todas las letras,
signos de puntuacin y smbolos
tcnicos de uso comn.
Toda computadora (especialmente
los servidores) necesita ser
compatible con muchos sistemas
de codificacin distintos; sin
embargo, cada vez que los datos

se traspasan entre distintos


sistemas de codificacin o
plataformas, dichos datos siempre
corren el riesgo de sufrir daos.
Unicode proporciona un nmero
nico para cada carcter, sin
importar la plataforma, ni el
programa, ni el idioma.
Para ello, este mtodo utiliza dos
byte por cada carcter. Cmo
referencia, en el formato ASCII
clsico es suficiente un solo byte
para representar cada carcter.
Esta mayor cantidad de espacio,
normalmente est prevista por los
programas y sistemas operativos
que soportan esta codificacin, y
no debera representar un
problema en circunstancias
normales.
Un poco de historia

Antes de Unicode, haba diferentes


sistemas de codificacin de
caracteres para cada idioma, cada
uno usando los mismos nmeros
(0-255) para representar los
caracteres de ese lenguaje.
Algunos (como el ruso) tienen
varios estndares incompatibles
que representan los mismos
caracteres; otros idiomas (como el
japons) tienen tantos caracteres
que precisan ms de un byte.
Intercambiar documentos entre
estos sistemas era difcil porque
no haba manera de que un
computador supiera con certeza
qu esquema de codificacin de
caracteres haba usado el autor
del documento; el computador
slo vea nmeros, y los nmeros
pueden significar muchas cosas.
Para resolver estos problemas se
dise Unicode.

El proyecto Unicode se inici a


finales de 1987, tras
conversaciones entre los
ingenieros de Apple y Xerox: Joe
Becker, Lee Collins y Mark Davis.
Como resultado de su
colaboracin, en agosto de 1988
se public el primer borrador de
Unicode bajo el nombre de
Unicode88. Esta primera versin,
con cdigos de 16 bits, se public
asumiendo que solo se codificaran
los caracteres necesarios para el
uso moderno.
Durante el ao 1989 el trabajo
continu con la adicin de
colaboradores de otras compaas
como Microsoft o Sun
Microsystems. El Consorcio
Unicode se form el 3 de febrero
de 1991 y en octubre de 1991 se
public la primera versin del
estndar. La segunda versin,

incluyendo escritura ideogrfica


Han se public en junio de 1992.

También podría gustarte