Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aritmetica en Coma Flotante PDF
Aritmetica en Coma Flotante PDF
Introduccin.
Hasta ahora hemos visto algoritmos aritmticos para realizar operaciones sobre
representaciones de nmeros en coma fija. Todos ellos se pueden utilizar para las representaciones en
coma flotante a condicin de tener en cuenta el escalado, es decir, conocer la posicin correcta del
punto donde se localiza la separacin entre la parte entera y la parte decimal.
Pero en el computador, todo dato debe ser almacenado en un registro con un nmero finito de
bits. Y la pregunta es cmo almacenamos los datos en coma flotante?.
La respuesta ha esta pregunta comienza preguntndonos primero si es necesaria la notacin en
coma flotante en los ordenadores, y si se implementa con que caractersticas?. John Von Newmann
rechazo incluir la aritmtica en coma flotante en la mquina que construyo en Princentom. Y durante
muchos aos, cada fabricante y prcticamente cada computador utilizaban una aritmtica distinta.
El hardware de punto flotante se populariz al comenzar a ser de utilidad hacia 1957 en el que
una unidad decimal de punto flotante estuvo disponible en el IBM 650, y pronto las series IBM 704,
709, 7090, 7094, etc ..., ofrecieron hardware binario de punto flotante para simple y doble precisin.
Como consecuencia se dispona ya de punto flotante en gran parte de computadores, pero cada
implementacin era diferente.
Sobre 1976 John F. Palmer en Intel comienza el desarrollo de una aritmtica de punto flotante
para toda la lnea de productos de Intel. La aparicin del 8086 era inminente, y se estaba
contemplando la opcin de incorporar un coprocesador de punto flotante, el 8087, para el 8086. El
coprocesador era un chip adicional que aceleraba una parte del trabajo del procesador, en este caso
los clculos en punto flotante. En aquellos tiempos las aritmticas de punto flotante eran ligeramente
diferentes entre los grandes computadores pero una verdadera anarqua entre los microcomputadores,
en los que era necesario albergar una docena de aritmticas diversas en el firmware de la ROM o va
software. Robert G. Stewart, un ingeniero de la IEEE trat de controlar esta anarqua reinante y
propuso que el IEEE disease un estndar aceptable de punto flotante.
Las reuniones de este comit en referencia al punto flotante comenzaron a finales de 1977 con
multitud de borradores que provenan de innumerables fuentes y se alargaron hasta 1985 cuando se
hizo oficial el Standard 754 del IEEE para punto flotante binario, basado en el diseo inicial de
Intel, pero algo simplificado.
En 1980 Intel harta de esperar lanza el 8087 para su uso en el Ibm Pc, paralelamente Motorola
anuncia en 1982 su 68881, utilizado en el Sun 3 y el Macintosh II, al mismo tiempo de estos
lanzamientos el estndar finalmente apareci.
La mantisa M suele ser una representacin en complemento a 2 (con signo). La precisin de las
representaciones numricas va a depender del nmero de bits que utilicemos para la mantisa. Por ello
es fundamental que la mantisa tenga el mayor nmero de bits significativos, para lo cual se debe
normalizar. La normalizacin de la mantisa en base 2 se consigue desplazando hacia la izquierda la
mantisa hasta que el bit a la derecha del punto de la raz sea uno (o el de la izquierda). Por ello, al
colocar el primer uno a la derecha del punto decimal, tendremos que la magnitud de la mantisa en
valor absoluto tiene un valor dentro del rango:
|m| 1
Exponente.
Es un nmero de p bits que utiliza una representacin exceso 2p-1 por las razones que vamos a
exponer.
a) El 0 se podra representar como M=0 y cualquier valor de exponente. Pero puede ocurrir
que al realizar operaciones aritmticas, a causa de los errores de redondeo, apareciera algn 1
en posiciones menos significativas de la mantisa.
Esto sugiere que el exponente ms adecuado para representar el 0 es aquel que tiene el mayor
valor negativo.
De esta forma, se logra que los errores de redondeo de la mantisa, den un nmero tan prximo
a cero como sea posible.
b) La representacin del 0 es una secuencia de 0`s tanto en la mantisa como en el exponente,
de esta forma tenemos una nica representacin del cero.
Suma y Resta.
Cuando sumamos o restamos dos nmeros en coma flotante se deben comparar los exponentes y
hacerlos iguales, para lo cual hay que desplazar o alinear uno de ellos respecto al otro. Dados dos
nmeros en representacin en coma flotante como
x = mx 2xe y = my 2ye
las operaciones de suma y resta se definen de la siguiente forma, suponiendo que xe < ye:
x = 737 y = 267337
Psalos a notacin exponencial y calcula y-x =
Expresa el resultado de forma normalizada
Ejemplo:
Sean x e y los siguientes nmeros en base-2
x = 11000 y = 1010000
Los pasamos a notacin exponencial y realizamos las operaciones: x+y y x-y.
X-Y:
Problema:
Sean x e y los siguientes nmeros en base-2
x = 1110101 y = 11101
Pasarlos a notacin exponencial y realiza las operaciones: x+y, y-x y x-y.
Importante en este caso: expresa el resultado de forma normalizada.
con mayor densidad de nmeros, al acercarnos al cero. Y perdemos precisin al alejarnos hacia ms
o menos infinito.
Algoritmo de la suma-resta.
Por lo visto con anterioridad, para realizar la suma (resta) de dos operandos en representacin coma
flotante debemos realizar previamente la separacin de los exponentes y de las mantisas para su
tratamiento posterior, y despus realizar esta serie de pasos:
1. Seleccionar el nmero con menor exponente y desplazar su mantisa a la derecha tantas veces
como indique la diferencia en mdulo de los exponentes.
2. Hacer que el exponente resultado sea igual al mayor de los exponentes.
3. Realizacin de las operaciones de suma o resta con las mantisas.
4. Normalizacin del resultado. Una vez realizada la suma se debe normalizar desplazando los
bits de la mantisa hacia la izquierda o la derecha con lo cual habr que cambiar el valor del
exponente.
5. Comprobar las condiciones de rebose.
Un diagrama de flujo del algoritmo se muestra en la figura de la pgina siguiente. Se utilizan los
mismos registros que para el caso de la suma resta, y el resultado final que almacenado en los
registros A y E.
Multiplicacin y divisin.
La multiplicacin y la divisin en punto flotante son ms sencillas de realizar. Vemos la formula que
nos permitir realizar estas operaciones manualmente:
Las Unidades aritmticas en como flotante de los computadores se construyen utilizando dos
unidades aritmticas en como fija:
- Unidad de tratamiento de mantisas.
- Unidad de tratamiento de exponente.
Mas una Unidad de Control que conectar
ambas unidades y que se encarga entre otras
cosas de normalizar adecuadamente el
resultado.
IEEE 754
Simple Precisin
El estndar IEEE-754 para la representacin en simple precisin de nmeros en coma flotante exige una
cadena de 32 bits. El primer bit es el bit de signo (S), los siguientes 8 son los bits del exponente (E) y los
restantes 23 son la mantisa (M):
Al estar el dato normalizado, es decir expresado siempre como 1, (uno coma algo ms), el 1
de la parte entera no se almacena, aunque nunca debemos olvidarnos que existe.
El signo de la mantisa est representado en el bit 31.
El campo del exponente (ne) dispone de 8 bits, empezando por el bit 23 hasta el bit 30.
El campo de mantisa (nm) dispone de 23 bits, empezando por el bit 0 hasta el bit 22.
Considerando el valor 1 implcito (oculto) para el primer bit de los nmeros binarios
normalizados la precisin del campo de la mantisa es de 24 bits.
El valor del desplazamiento es de 127, es decir el exceso C = 2 7-1 = 127.
Estos tamaos de exponente y mantisa dan a la aritmtica del computador un rango que cubre
fracciones tan pequeas como 2.0 diez x 10 -38 y nmeros tan grandes como 2.0 diez x 10 38.
El valor V representado por esta cadena puede ser determinado como sigue:
Si E=255 y M es no nulo, entonces V=NaN ("Not a number")
Si E=255 y M es cero y S es 1, entonces V=-Infinito
Si E=255 y M es cero y S es 0, entonces V=Infinito
Si 0<E<255 entonces V=(-1)**S * 2 ** (E-127) * (1.M)
donde "1.M" se emplea para representar el nmero binario creado
por la anteposicin a M de un 1 y un punto binario.
Si E=0 y M es no nulo, entonces V=(-1)**S * 2 ** (-126) * (0.M)
Estos son valores "sin normalizar".
Si E=0 y M es cero y S es 1, entonces V=-0
Si E=0 y M es cero y S es 0, entonces V=0
En particular,
0 00000000 00000000000000000000000 = 0
1 00000000 00000000000000000000000 = -0
Doble precisin
El estndar IEEE-754 para la representacin en doble precisin de nmeros en coma flotante exige una cadena
de 64 bits. El primer bit es el bit de signo (S), los siguientes 11 son los bits del exponente (E) y los restantes
52 son la mantisa (M):
El campo de mantisa (nm) dispone de 52 bits, empezando por el bit 0 hasta el bit 51.
Considerando el valor 1 implcito (oculto) para el primer bit de los nmeros binarios
normalizados la precisin del campo de la mantisa es de 53 bits.
El valor del desplazamiento es de 1023,es decir el exceso C = 2 10- 1 = 1023.
Estos tamaos de exponente y mantisa dan a la aritmtica del computador un rango que cubre
fracciones tan pequeas como 2.0 diez x 10 -308 y nmeros tan grandes como 2.0 diez x 10 308.
El valor V representado por esta cadena puede ser determinado como sigue:
Precisin Extendida
Este formato suele reservarse normalmente para almacenar resultados intermedios, su longitud extra
le permite proteger los resultados finales del redondeo y los clculos intermedios del overflow y
underflow. El bit implcito de los anteriores formatos aqu no se contempla, ya que se encuentra
fsicamente presente en la mantisa.
00010011
+01111111
10010010 entonces el nmero vale:
4 9 5 1 0 0 0 0
Redondeo.
Cuando tenemos un valor no representable, se aproxima a uno de estos 4 casos:
- Redondeo hacia el valor ms prximo.
- Redondeo hacia +
- Redondeo hacia -
- Redondeo hacia 0.
Bit de guarda.
Cualquier operacin aritmtica se realiza sobre formatos ampliados. De esta forma ganamos
precisin en la realizacin de las operaciones aritmticas.
Veamos un ejemplo de la importancia de utilizar representaciones ampliadas, o bits de guarda:
X = 1,00 ... 00 * 21
Y = 1,11 ... 11 * 2o
X-Y X: 1,00 . . . 00 * 21
Y: - 0,11 . . . 11 * 21 (mantisa un bit a la derecha)
0,00 . . . 01 * 21
(17.25)SP = Ox 4 1 8 A 0 0 0 0
En doble precisin:
(17.25)DP = Ox 4 0 3 1 4 0 0 0 0 0 0 0 0 0 0 0
Paso 1: E = E1-E2 = 100 110 = -10 pero es mejor as, usando Complemento-2:
E = E + 1 = -10 + 1 = -1
E = 11111110+(1) = 11111110 + 00000001 = 11111111
E = E + 1 = -1 + 1 = 0
E = 11111111+(1) = 11111111 + 00000001 = 00000000
E<0 no E>0 no
Paso 3: A=A+M
A : 0.011
+ 1.01
1.101
A Rebose? NO
A = 0 ? NO
A Normalizado ??? SI
FIN :
X+Y = 0 10000101 1010000000 . . . 00
X+Y = 0x42D00000
Paso 2: A = A * M
1.1
* 1.01
11
00
11
1.111
E Rebose ? NO
A = 0 ? NO
A Normalizado ? SI
FIN :
X*Y = 0 10001001 1110000000 ... 00
X * Y = 0x44F00000
Comprobacin:
Paso 1: E = E1-E2 = 110 - 100 = 010 pero es mejor hacerlo de esta forma:
Paso 2: A=A/M
1.01 1.1
10 0 0.1101010101...
1 00
...
E Rebose ? NO
A=0? NO
A Normalizado ? NO :
A = 1.10101010101010...
E = E 1 = 10000000
FIN :
Y/X = 0x40555555
P7) Representar el nmero X = -56.320 en formato S.P. y D.P. segn la norma IEEE-754.
Resultado en S. P. : 0xC26147AE
Resultado en D. P. : 0xC04C28F5C28F5C29