La informacin se suele introducir en el computador
utilizando el lenguaje escrito: Caracteres alfabticos: son las letras maysculas y minsculas del abecedario ingls: {A, B, C, D, E,..., X ,Y, Z, a, b, c, d,..., x, y, z}
Caracteres numricos: estn constituidos por las diez cifras decimales: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Caracteres especiales son los smbolos no incluidos en los grupos anteriores, entre otros los siguientes: { ) ( , * / ; : + = ! ? . " & > # < ] [ SP } Caracteres geomtricos y grficos Son smbolos o mdulos con los que se pueden representar figuras (o iconos). Ejemplos: _ | c ( ( ! Caracteres de control representan rdenes de control, como el carcter indicador de fin de lnea o el carcter indicador de sincronizacin de una transmisin o de que se emita un pitido en un terminal, etc. Al tener que "traducir" toda la informacin suministrada a la computadora a ceros y unos es necesario establecer una correspondencia (codificacin) entre 2 conjuntos: ( o {A,B,C,D,...,Z,a,b,...,z,0,1,2,3,...,9,/,+,(,),...} o {O,1}n de forma tal que a cada elemento de ( le corresponda un elemento distinto de (n bits). Estos cdigos se denominan cdigos de E/S o cdigos externos o cdigos-texto, y pueden definirse de forma arbitraria. No obstante existen cdigos de E/S normalizados que son utilizados por diferentes constructores de computadores: BCD de intercambio normalizado, Fieldata, EBCDIC, ASCII, etc. Supongamos que utilizamos un nmero fijo, n, de bits para codificar los smbolos de ( . El valor mnimo de n depender del nmero de m elementos de (. As: Con n=2 bits podemos hacer 4 combinaciones => se pueden codificar hasta m=4 smbolos. Con n=3 bits podemos hacer 8 combinaciones => se pueden codificar hasta m=8 smbolos. Con n bits podemos hacer 2n combinaciones => se pueden codificar hasta m=2n smbolos. Es decir, la relacin entre n y m es: n clog2m= 3.32 log(m) (con n entero) CODIGOS NORMALIZADOS: Cdigo "BCD de intercambio normalizado" (standard binary coded decimal interchange code") Utiliza n=6 bits se pueden representar m=26=64 caracteres. A veces se aade a su izquierda un bit adicional para verificar posibles errores en la transmisin o grabacin del cdigo (bit de paridad, criterio impar). Cdigo EBCDIC (Extended Binary Coded Decimal Interchange Code) El cdigo EBCDIC utiliza n=8 bits para representar cada carcter Permite codificar hasta m=28=256 smbolos distintos Cdigo ASCII (American Standard Code for Information Interchange). Utiliza 7 bits y hoy da es de los ms usuales. La mayor parte de las transmisiones de datos entre dispositivos se realizan en esta codificacin. Usualmente se incluye un octavo bit para detectar posibles errores de transmisin o grabacin (bit de paridad). Inconvenientes de los cdigos anteriores (sobre todo con Internet): Los smbolos codificados son insuficientes para representar los caracteres especiales que requieren numerosas aplicaciones. Los smbolos y cdigos aadidos en las versiones ampliadas a 8 bits no estn normalizados. Estn basados en los caracteres latinos, existiendo otras culturas que utilizan otros smbolos muy distintos. Los lenguajes escritos de diversas culturas orientales, como la china, japonesa y coreana se basan en la utilizacin de ideogramas o smbolos que representan palabras, frases o ideas completas, siendo, por tanto, inoperantes los cdigos que slo codifican letras individuales. Unicode (ISO/IEC 10646) es propuesto por un consorcio de empresas y entidades que trata de hacer posible escribir aplicaciones que sean capaces de procesar texto de muy diversas culturas. Propiedades buscadas: Universalidad, trata de cubrir la mayora de lenguajes escritos existentes en la actualidad: 16 bits 65.356 smbolos Unicidad, a cada carcter se le asigna exactamente un nico cdigo (idiogramas con imagen distinta, tienen igual cdigo), y Uniformidad, ya que todos los smbolos se representan con un nmero fijo de bits (16). Representacin de nmeros Si un nmero se va a utilizar en un programa como un dato numrico, en la propia computadora se efecta una transformacin entre cdigos binarios, obtenindose una representacin fundamentada en el sistema de numeracin en base 2, y, por tanto, apta para realizar operaciones aritmticas. Datos de tipo entero representados en binario A) Enteros sin signo: valor absoluto. B) Enteros con signo b1) Signo y magnitud b2) Complemento a uno b3) Complemento a dos b4) Sesgada Datos enteros BCD: 1) BCD desempaquetado 2) BCD empaquetado Cuando se opera con nmeros muy grandes se suele usar la notacin exponencial. 13257.3285, por ejemplo, puede representarse, entre otras, de las siguientes formas: 13257.3285= 13257.3285100 = 1.32573285104 = 0.132573285105 = 13257328510-4 = 1325732850010-6= ... N = } M BE }: signo del nmero M: mantisa B: base (en el ejemplo, 10) E: exponente Se dice que el numero esta normalizado cuando la cifra mas significativa esta en la posicin de las unidades Podemos transformar la representacin de N, conservando su valor, cambiando el exponente, E, y reajustando adecuadamente la mantisa, M: si aumentamos (disminuimos) en una unidad E, debemos dividir (multiplicar) M por B. DENOMINACIN: notacin exponencial, notacin cientfica notacin en punto o coma flotante. Representacin interna de datos de tipo real: normalizacin IEEE 754: (1) La base del exponente es B=2, es decir est predeterminada N = } M 2E de esta forma slo es necesario almacenar, de alguna forma, el signo, M y E Se memoriza: un campo del signo (s) que ocupa 1 bit, un campo del exponente (o caracterstica, e), que ocupa ne bitsy un campo de la mantisa (m), que ocupa nm bits. Se verifica: n = 1 + ne + nm El orden de almacenamiento es: campo de signo (s), campo de exponente (e) y campo de mantisa (m). s e m Campo del signo. El bit de signo es cero para los nmeros positivos y uno para los nmeros negativos. (4) Campo del exponente. El exponente se almacena en la forma de "entero sesgado: e = S + E = 2 ne-1 - 1+E de esta forma en los ne bit reservados para el exponente se pueden incluir exponentes positivos o negativos sin utilizar un bit explicito de signo. Campo de la mantisa Nmero normalizado: el exponente se ajusta de forma tal que el 1 ms significativo de la mantisa se encuentre en la posicin 0 (posicin de las unidades); es decir, 1# M<2. El campo de la mantisa se obtiene almacenando slo la parte fraccionaria del nmero normalizado; es decir, no se almacena la informacin ""1. M = [1.m], con 1# M<2 N = 1101.01 = 1.1010123 m 10101 Nmero denormalizado: M = [0.m], con M<1 en ambas situaciones slo se almacena m EJEMPLO: Supngase que nm=5. Resultado de la ALU Accin Mantisa redondeada 1.01100 11 sumar 1 1.01101 1.01100 01 truncar 1.01100 1.01100 00 truncar 1.01100 1.01101 10 sumar 1 1.01110 1.01100 10 truncar 1.01100