Está en la página 1de 10

REPRESENTACIN DE TEXTOS

La informacin se suele introducir en el computador


utilizando el lenguaje escrito:
Caracteres alfabticos: son las letras maysculas y
minsculas del abecedario ingls:
{A, B, C, D, E,..., X ,Y, Z, a, b, c, d,..., x, y, z}

Caracteres numricos: estn constituidos por las diez
cifras decimales:
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
Caracteres especiales son los smbolos no incluidos en los
grupos anteriores, entre otros los siguientes:
{ ) ( , * / ; : + = ! ? .
" & > # < ] [ SP }
Caracteres geomtricos y grficos Son smbolos o mdulos con los
que se pueden representar figuras (o iconos). Ejemplos:
_ | c ( ( !
Caracteres de control representan rdenes de control,
como el carcter indicador de fin de lnea o el carcter
indicador de sincronizacin de una transmisin o de que
se emita un pitido en un terminal, etc.
Al tener que "traducir" toda la informacin suministrada a la
computadora a ceros y unos es necesario establecer una
correspondencia (codificacin) entre 2 conjuntos:
( o {A,B,C,D,...,Z,a,b,...,z,0,1,2,3,...,9,/,+,(,),...} o {O,1}n
de forma tal que a cada elemento de ( le corresponda un elemento
distinto de (n bits).
Estos cdigos se denominan cdigos de E/S o cdigos externos o
cdigos-texto, y pueden definirse de forma arbitraria. No obstante
existen cdigos de E/S normalizados que son utilizados por diferentes
constructores de computadores: BCD de intercambio normalizado,
Fieldata, EBCDIC, ASCII, etc.
Supongamos que utilizamos un nmero fijo, n, de bits para
codificar los smbolos de ( . El valor mnimo de n depender
del nmero de m elementos de (. As:
Con n=2 bits podemos hacer 4 combinaciones =>
se pueden codificar hasta m=4 smbolos.
Con n=3 bits podemos hacer 8 combinaciones =>
se pueden codificar hasta m=8 smbolos.
Con n bits podemos hacer 2n combinaciones =>
se pueden codificar hasta m=2n smbolos.
Es decir, la relacin entre n y m es:
n clog2m= 3.32 log(m) (con n entero)
CODIGOS NORMALIZADOS:
Cdigo "BCD de intercambio
normalizado" (standard
binary coded decimal interchange
code")
Utiliza n=6 bits
se pueden representar m=26=64
caracteres.
A veces se aade a su izquierda un
bit adicional para
verificar posibles errores en la
transmisin o grabacin
del cdigo (bit de paridad, criterio
impar).
Cdigo EBCDIC (Extended Binary
Coded Decimal
Interchange Code)
El cdigo EBCDIC utiliza n=8 bits
para representar cada
carcter
Permite codificar hasta m=28=256
smbolos distintos
Cdigo ASCII (American Standard
Code for Information
Interchange).
Utiliza 7 bits y hoy da es de los
ms usuales.
La mayor parte de las
transmisiones de datos entre
dispositivos se realizan en esta
codificacin.
Usualmente se incluye un octavo
bit para detectar posibles
errores de transmisin o grabacin (bit
de paridad).
Inconvenientes de los cdigos anteriores
(sobre todo con Internet):
Los smbolos codificados son
insuficientes para representar los
caracteres especiales que requieren
numerosas aplicaciones.
Los smbolos y cdigos aadidos en las
versiones ampliadas a 8
bits no estn normalizados.
Estn basados en los caracteres latinos,
existiendo otras culturas
que utilizan otros smbolos muy distintos.
Los lenguajes escritos de diversas culturas
orientales, como la
china, japonesa y coreana se basan en la
utilizacin de
ideogramas o smbolos que representan
palabras, frases o
ideas completas, siendo, por tanto,
inoperantes los cdigos
que slo codifican letras individuales.
Unicode (ISO/IEC 10646) es
propuesto por un consorcio
de empresas y entidades que trata de
hacer posible escribir
aplicaciones que sean capaces de
procesar texto de muy
diversas culturas. Propiedades
buscadas:
Universalidad, trata de cubrir la
mayora de lenguajes
escritos existentes en la actualidad: 16
bits 65.356
smbolos
Unicidad, a cada carcter se le
asigna exactamente un
nico cdigo (idiogramas con imagen
distinta, tienen igual
cdigo), y
Uniformidad, ya que todos los
smbolos se representan
con un nmero fijo de bits (16).
Representacin de nmeros
Si un nmero se va a utilizar en un
programa como un
dato numrico, en la propia
computadora se efecta
una transformacin entre cdigos
binarios, obtenindose
una representacin fundamentada
en el sistema de
numeracin en base 2, y, por tanto,
apta para realizar
operaciones aritmticas.
Datos de tipo entero representados
en binario
A) Enteros sin signo: valor
absoluto.
B) Enteros con signo
b1) Signo y magnitud
b2) Complemento a uno
b3) Complemento a dos
b4) Sesgada
Datos enteros BCD:
1) BCD desempaquetado
2) BCD empaquetado
Cuando se opera con nmeros muy grandes se
suele usar la notacin
exponencial.
13257.3285, por ejemplo, puede
representarse, entre otras, de las
siguientes formas:
13257.3285= 13257.3285100 =
1.32573285104 = 0.132573285105
= 13257328510-4 = 1325732850010-6= ...
N = } M BE
}: signo del nmero
M: mantisa
B: base (en el ejemplo, 10)
E: exponente
Se dice que el numero esta
normalizado cuando la cifra
mas significativa esta en la
posicin de las unidades
Podemos transformar la representacin
de N, conservando su
valor, cambiando el exponente, E, y
reajustando adecuadamente
la mantisa, M: si aumentamos
(disminuimos) en una unidad E,
debemos dividir (multiplicar) M por B.
DENOMINACIN:
notacin exponencial,
notacin cientfica
notacin en punto o coma flotante.
Representacin interna de datos de
tipo real:
normalizacin IEEE 754:
(1) La base del exponente es B=2,
es decir est
predeterminada
N = } M 2E
de esta forma slo es necesario
almacenar, de alguna
forma, el signo, M y E
Se memoriza:
un campo del signo (s) que ocupa 1 bit,
un campo del exponente (o
caracterstica, e), que ocupa ne
bitsy
un campo de la mantisa (m), que ocupa
nm bits.
Se verifica:
n = 1 + ne + nm
El orden de almacenamiento es: campo
de signo (s), campo
de exponente (e) y campo de mantisa (m).
s e m
Campo del signo. El bit de signo es
cero para los
nmeros positivos y uno para los
nmeros negativos.
(4) Campo del exponente. El
exponente se almacena en la
forma de "entero sesgado:
e = S + E = 2 ne-1 - 1+E
de esta forma en los ne bit
reservados para el
exponente se pueden incluir
exponentes positivos o
negativos sin utilizar un bit explicito
de signo.
Campo de la mantisa
Nmero normalizado:
el exponente se ajusta de forma tal que el
1 ms
significativo de la mantisa se encuentre en
la posicin 0
(posicin de las unidades); es decir,
1# M<2.
El campo de la mantisa se obtiene
almacenando slo la
parte fraccionaria del nmero normalizado;
es decir, no se
almacena la informacin ""1. M = [1.m],
con 1# M<2
N = 1101.01 = 1.1010123 m 10101
Nmero denormalizado:
M = [0.m], con M<1
en ambas situaciones slo se almacena m
EJEMPLO: Supngase que nm=5.
Resultado de la ALU Accin Mantisa
redondeada
1.01100 11 sumar 1 1.01101
1.01100 01 truncar 1.01100
1.01100 00 truncar 1.01100
1.01101 10 sumar 1 1.01110
1.01100 10 truncar 1.01100

También podría gustarte