Documentos de Académico
Documentos de Profesional
Documentos de Cultura
E
x = ± m × 10 , con 1≤ m <10
Otra forma equivalente:
d t 10 E
x = ± 0. d 1 d 2 . . . ×
Los parámetros que caracterizan el sistema de números flotantes de base diez, son:
• La base B
• La mantisa m, que representa a la parte fraccionaria del número
E
• El exponente E, que varía entre dos cotas: E min ≤ E ≤ max
di di
• La precisión t referida a la cantidad de dígitos donde: 0 ≤ ≤ B-1
Para una palabra de memoria de 32 bits la representación se hace en 3 campos: 1 bit para
el signo; 8 bits para el exponente E; y 23 bits para la mantisa.
b
Si las cifras que siguen a b22 , o sea, 23 , b24 , ... no son todas 0, esta representación del
número flotante x , designado
fl (x) , no es exacta, sino aproximada.
Sin embargo
fl (x)
puede ser expresado en forma aproximada mediante dos técnicas:
truncamiento y redondeo (cifras 7).
Ejemplo:
1110
x= = 101.12
210
2
Este cociente puede multiplicarse y dividirse por 2 , de modo que aparezca el primer
dígito distinto de cero a la izquierda, y después la coma decimal (flotante). En general
esto se obtiene cambiando el exponente de la base convenientemente.
Luego:
fl ( x) = 1.011× 2 2
m = (b0 .b1b2 b3 L) ( 2 , b0 = 1
En el caso general, la expresión de m en binario es: con
0 E=2 1.001…0
1{
bit 8{
bits 23
12bits
3
Ejemplo:
x = 7110 = 10001112
Expresando en forma de número flotante en base B=2, con exponente E=6 al desplazar
f ( x) = (1.000111) 2 × 2 6 , siendo su representación en bits:
Notas:
b b
1) El punto decimal que aparece entre 0 y 1 en el tercer campo de 23 bits es mostrado
a los fines didácticos pero no suele ser almacenado realmente. Por consiguiente, los 23 bits
se enumeran desde
b1 hasta b23 .
1.3.1. Suma
Si se suman las aproximaciones de dos números a y b se tiene un resultado c y el error
absoluto que se comete cumple.
(a * + b* ) − (a + b) = ec ≤ ea + eb
Esto es, la suma de los errores de las aproximaciones de a y b en valor absoluto son
aproximadamente mayores o iguales al error del resultado, conocido como el error
de propagación.
Demostración:
Donde
a * = a + ea
y
b * = b + eb
error = (a + ea + b + eb ) − (a + b) = ea + eb = ec
Esto es:
c * = c + ec
El error absoluto es:
(a * + b* ) − (a + b) = ea + eb ≤ ea + eb
O bien:
ec ≤ ea + eb
(Burden, 1998; Chapra, 1999; Maron, 1995; Nieves, 2003; Sheid, 1995; Wheatley, 2000)
Métodos Numéricos I
UNIDAD 1. ANÁLISIS DEL ERROR
Estrategias para minimizar el error
Ejemplo:
Si a=1.00009 y b=2.00009
c=a+b=3.00018
Si tenemos un equipo que sólo maneje 4 decimales
a*=1.0000, b*=2.0000 y c*=3.0001
ec ≤ ea + eb
.00018 ≤ .00009 + .00009
1.3.2. Resta
Si se restan las aproximaciones de dos números a y b se tiene un resultado c y el error
absoluto que se comete cumple.
( a * − b * ) − ( a − b ) = e c ≤ e a + eb
Esto es, la resta de los errores de las aproximaciones de a y b en valor absoluto son
aproximadamente mayores o iguales al error del resultado, conocido como el error
de propagación.
Demostración:
( )
error = a * − b* − (a − b)
*
Donde a = a + e a
y
b * = b + eb
error = (a + ea − b + eb ) − (a − b) = ea + eb = ec
Esto es:
c * = c + ec
El error absoluto es:
(a * − b * ) − (a − b) = e a + eb ≤ e a + eb
O bien:
ec ≤ ea + eb
Métodos Numéricos I
UNIDAD 1. ANÁLISIS DEL ERROR
Estrategias para minimizar el error
1.3.3. Multiplicación
Si se multiplican las aproximaciones de a y b, el error relativo que se comete cumple:
(a * ⋅b *) − (a ⋅ b ) ≈
eb e a
+
e e
≤ a + b
(a ⋅ b ) b a a b
Esto es, el error de propagación relativo en valor absoluto en la multiplicación es
aproximadamente menor o igual a la suma de los errores relativos de a y b en valor
absoluto.
Demostración:
a ⋅b = c
= =
=
=
El error absoluto es:
Ejemplo:
a= 1.004
b= 3.001
Aproximación:
=1
=3
Operaciones:
a*b=c (1.004)(3.001)= 3.0130
= |3- 3.0130|=-0.0130
1.3.4. División
Si se dividen las aproximaciones de a y b, el error relativo que se comete cumple:
a* a
−
b * b ≈ ea − eb ≤ ea + eb
a a b a b
b
Esto es, el error de propagación relativo del cociente en valor absoluto es
aproximadamente menor o igual a la suma de los errores relativos de a y b en valor
absoluto.
Demostración:
a
=c
b
a* a
−
δa = b * b
a
b
a* a a *− b * a* a* a a a* a
∆a = − ⊂ − ⊂ − − + = .. * −
b* b a b b* b b* b b b
a * a a * b*
− −
∆a b * b a b ea eb e e
δa = = = = − ≤ a + b
a a a a b a b
b b
Ejemplo:
a= 10.0005
b= 3.3300
Aproximación:
= 10
=3
Operaciones:
a 10.0005
=C = 3.0031
b 3.3300
a* a a* b* a* a* a a
∆a = * − = − = * − − + =
b b a b b b b* b
Métodos Numéricos I
UNIDAD 1. ANÁLISIS DEL ERROR
Estrategias para minimizar el error
e f ≈ ea f ′( a*)
Esto es, el error al evaluar una función en un argumento inexacto es proporcional a la
primera derivada de la función en el punto donde se ha evaluado.