Está en la página 1de 45

Introduccin a la Programacin Lineal

Claudia Liliana Daza Garzn


cldaza@universia.net.co

Trabajo de Grado para Optar por el Ttulo de Matemtico

Director: Pervys Rengifo Rengifo


Ingeniero Universidad Nacional de Colombia

Fundacin Universitaria Konrad Lorenz


Facultad de Matemticas

2 de junio de 2005

Tabla de contenido

Introduccin__________________________________________________________ 3
Programacin no lineal_________________________________________________ 4
Optimizacin clsica variable unidimensional_______________________________ 4
Utilizacin de mtodos numricos en la determinacin de puntos crticos___________ 10

Optimizacin clsica variable multidimensional ____________________________ 11


Condiciones necesarias y suficientes para la existencia de puntos ptimos __________ 16
Utilizacin de mtodos numricos en la determinacin de puntos estacionarios______ 19
Mtodo de Newton para sistemas de ecuaciones _____________________________________20

Extremos restringidos. Multiplicadores de Lagrange ___________________________ 23


Mtodo de los multiplicadores de Lagrange ________________________________________24

Optimizacin no clsica variable multidimensional _________________________ 26


Mtodo del gradiente ______________________________________________________ 26
Programacin separable ___________________________________________________ 29
Algoritmos Genticos: un cambio de paradigma _______________________________ 35
Caractersticas de los algoritmos genticos _________________________________________43

Conclusiones ________________________________________________________ 44
Bibliografa _________________________________________________________ 45

Introduccin
Las matemticas prestan su servicio a la sociedad mediante la elaboracin de modelos
matemticos de la realidad. Esta modelacin consiste en crear un objeto conceptual que
refleje las caractersticas relevantes de un fenmeno para, a partir de tal simplificacin,
llegar a extraer conclusiones que enriquezcan, en algn sentido, el conocimiento que
hasta el momento se tiene del fenmeno. Una modelacin de gran importancia y utilidad
el la modelacin lineal, la cual acude al empleo de funciones lineales para conseguir sus
objetivos. Sin embargo, a medida que crece la complejidad de los fenmenos que nos
rodean, comienza a hacerse necesario modelar fenmenos con los cuales las
aproximaciones lineales son notoriamente ineficaces. Por esta razn es necesario
emplear modelos no lineales que se ajustan de una manera ms precisa a las realidades
de alto grado de complejidad.
Uno de los propsitos fundamentales con los cuales se construyen modelos
matemticos es el de obtener respuestas a problemas de ptimizacin, esto es, a la toma
de decisiones inmejorables. La modelacin lineal tiene en los mtodos smplex y del
punto interior (de Karmarkar) unas herramientas de gran poder que le permiten resolver
problemas con grandes cantidades de variables y restricciones. Este no es el caso de los
modelos no lineales, en los cuales, como se ver, los caminos de fcil recorrido
constituyen ms la excepcin que la norma. Sin embargo, el trabajo realizado en este
campo ha estado guiado por unas grandes dosis de ingenio, que han llevado a la
creacin de algoritmos de base puramente matemtica, a otros que mezclan resultados
matemticos con procesos heursticos y, finalmente, como es el caso de los algoritmos
genticos, a emular los procesos de evolucin biolgica, que han llevado a muchas
formas de vida a elevados niveles de complejidad y sosfisticacin, como estrategia para
la resolucin de problemas.
El trabajo, de carcter exploratorio, ha pretendido ser algo ms que una recopilacin
muda de resultados ya plenamente establecidos. No se ha dejado escapar la oportunidad
de hacer, lo que se han considerado, pequeos aportes, en su mayora de tipo
pedaggico. Como su taln de Aquiles puede mencionarse la escasez de los mtodos
tratados, muchos de los cuales ni siquiera estn dentro de los considerados como de alto
rendimiento, sin embargo, la razn ha sido que, como lo indica el nombre, se trata de
una introduccin, que busca llamar la atencin tanto sobre resultados tericos de bajo
nivel que muchas veces se pasan por alto, as como tambin sobre el empleo de las
herramientas informticas, tanto como ayuda para las tcnicas clsicas, as como cuando
son la base de metodologas que estn completamente inspiradas en ellas.
El campo es extenso y fascinante. El trabajo realizado es de dimensiones modestas, pero
aspira a reflejar, al menos en algn momento, algo de la belleza que se encontr en la
etapa exploratoria.

Programacin no lineal
Se puede dar una definicin de programacin no lineal (PNL) por contraposicin con la
programacin lineal (PL). Recurdese que esta ltima trata el problema de optimizar
una funcin lineal f : R n R sujeta a una serie de restricciones tambin lineales. Si el
problema se modifica, cambiando la funcin objetivo y/o, al menos, una de las
restricciones, por no lineales, se cae en el campo de la PNL.
La teora clsica de la optimizacin acude al empleo del clculo diferencial para
determinar los puntos en los cuales la funcin f : R n R asume valores ptimos
(mximos o mnimos).
Luego de unas definiciones esenciales se expondrn algunos resultados tericos as
como ejemplos de solucin de problemas mediante la aplicacin de esta teora. Se
inicia con la teora propia de las variables unidimensionales, pues este campo permite la
comprensin intuitiva de los conceptos y procedimientos empleados, y tambin, porque
algunos de sus resultados tiene aplicacin directa en la extensin de la teora a las
variables multidimensionales.

Definicin 1: se dice que una funcin f : S R, S R n tiene un mximo absoluto

(o global) en un punto

S si

f ( [ ) f (D )

para todo x de S. El nmero f (D) se llama mximo absoluto de f en S.


D

Definicin 2: se dice que una funcin f : S R, S R n tiene un mximo relativo (o

local) en un punto

S si existe r > 0 tal que

f ( [ ) f (D )
para todo x B (D, r ) . El nmero f (D ) se llama mximo relativo de f en S.
De las definiciones 1 y 2 se concluye que todo mximo absoluto es, a su vez, mximo
relativo.
Las definiciones de mnimo absoluto (o global) y mnimo relativo (o local) se hacen
de manera equivalente.

Optimizacin clsica variable unidimensional


Definicin 3: Un punto crtico de una funcin f : R R es un nmero c para el cual
f (c) = 0 o f (c) no existe.

Teorema 1: Si una funcin f : R R tiene un mximo o mnimo relativo en un punto


c, entonces c es un punto crtico.

Demostracin: si f (c) no existe, entonces c es un punto crtico. Supngase ahora que


f (c) existe. Defnase la funcin

g ( x) =

f ( x ) f (c )
para x c
xc
f ' (c )
para x = c

(1)

entonces lim g ( x) = g (c) y, en consecuencia , g es continua en c. Se debe demostrar


x c

que g(c) = 0, para ello se procede por contradiccin: si g(c) > 0, por la propiedad de la
conservacin del signo para funciones continuas, existe un intervalo que contiene a c en
el cual g(x) es positiva. Por lo tanto en (1), para x en el intervalo mencionado, x c, el
numerador tiene el mismo signo que el denominador, lo cual implica que si x > c
entonces f(x) > f(c), y si x < c entonces f(x) < f(c). Esto contradice la hiptesis de que f
tiene un extremo en c. De manera similar se demuestra que suponer que g(c) < 0
conduce a la misma contradiccin, por lo tanto g(c) = 0 y como g(c) = f ' (c) ha
concluido la demostracin.
El resultado anterior garantiza que si f tiene un ptimo en c, entonces c es un punto
crtico. El recproco no es cierto, como lo demuestra el conocido contraejemplo
f ( x) = x 3 , pues f ' ( x) = 3 x 2 y entonces f ' (0) = 0 , con lo cual 0 es un punto crtico de
f y, sin embargo, f no tiene un ptimo en 0 como se ve en la figura 1.

Figura 1
Entonces, para determinar el conjunto de puntos ptimos de una funcin debe hacerse
un trabajo adicional, luego de haber determinado el conjunto de puntos crticos, pues
solo algunos de ellos sern puntos ptimos. El siguiente teorema aporta las herramientas
para realizar este trabajo.

Teorema 2 (criterio de la primera derivada para extremos en un punto


crtico): Supngase que f : R R es continua en un intervalo [a, b] y que existe f '
en todo punto de (a, b), excepto posiblemente en c

(a, b), entonces:

1. Si f es positiva para toda x, con a < x < c, y negativa para toda x, con c < x <
b, entonces f tiene un mximo relativo en c.
5

2. Si f es negativa para toda x, con a < x < c, y positiva para toda x, con c < x <
b, entonces f tiene un mnimo relativo en c.
3. Si f es positiva (negativa) para toda x, con a < x < b, x
un ptimo relativo en c.

c, entonces f no tiene

Demostracin: en el caso 1. f es estrictamente creciente en [a, c] y estrictamente


decreciente en [c, b]. Entonces f(x) < f(c) para todo x c en [a, b] y por lo tanto f
tiene un mximo relativo en c. El caso 2 se demuestra de manera anloga. La
hiptesis del caso 3 implica que f es estrictamente creciente (decreciente) en [a, b] y,
en consecuencia, no puede tener ptimos relativos en el punto interior c.
Ejemplo 1: encuentre los puntos en los cuales f ( x) = x 3 3 x 2 24 x + 2 tiene
valores ptimos y determine de que clase son.

Solucin: segn el teorema 1 los candidatos a ser puntos ptimos son los puntos

crticos, en consecuencia, el primer paso es determinarlos:

f ' ( x) = 3 x 2 6 x 24 = 3( x + 2)( x 4) (2)


la derivada est definida en todo , en consecuencia, se buscan aquellos puntos
crticos para los cuales f (x) = 0.
3( x + 2)( x 4) = 0 (3)
tiene como soluciones x = 4 y x = -2. El producto en (2) es positivo cuando los dos
trminos variables son ambos negativos, o ambos positivos, por lo tanto, f (x) > 0
en (- , -2) y en (4, ), y f (x) < 0 en (-2, 4). Entonces, es posible construir un
intervalo alrededor de -2 tal que f (x) > 0 para x < -2 y, f (x) < 0 para x > -2 en
consecuencia, segn el teorema 2, f tiene un mximo en x = -2, con un valor f(-2) =
30. Un razonamiento anlogo lleva a concluir que f tiene un mnimo en x = 4, con
f(4) = -78. La figura 2 muestra una comprobacin grfica de este hecho.

Figura 2
6

Ejemplo 2: encuentre los puntos en los cuales f ( x) = 3x 2 / 3 + 5 tiene valores


ptimos y determine de que clase son.
2
esta funcin nunca es cero y no est definida en
x
x = 0. En consecuencia x = 0 es el nico punto crtico. Es evidente que para x < 0,
f (x) < 0, y para x > 0, f (x) > 0. Aplicando el teorema 2 se concluye que f tiene un
mnimo en x = 0. La figura 3 ilustra la situacin.

Solucin: f ' ( x) = 2 x 1 / 3 =

Figura 3

Ejemplo 3: encuentre los puntos crticos de f ( x) = x 3 y establezca si en ellos f tiene


ptimos relativos.

Solucin: f ' ( x) = 3x 2 entonces f est definida en todo . El nico punto crtico de f


es entonces x = 0. Sin embargo, f (x) es positiva para todo x
, x 0. Y por el caso
3 del teorema 2 se concluye que f no tiene ptimos relativos en 0, pues es estrictamente
creciente en toda vecindad de 0. Vase la figura 1.
El siguiente teorema, en algunos casos, facilita los clculos que permiten concluir que
tipo de ptimo se presenta en un punto crtico c. Es aplicable nicamente cuando c es tal
que f (c) = 0 y f (c) 0. Es til para funciones como la del ejemplo 1; no puede ser
usado en funciones como la del ejemplo 2. Para funciones como la del ejemplo 3, para
la cual f (c) = 0, se expondr un teorema especial ms adelante.

Teorema 3 (criterio de la segunda derivada para extremos en un punto


crtico): Supngase que c (a, b) y que f (c) = 0. Supngase, adems, que f (c)

existe, entonces:

1. Si f (c) < 0, f tiene un mximo relativo en c.


2. Si f (c) > 0, f tiene un mnimo relativo en c.

Demostracin: En el caso 1, al ser f negativa en c, f es estrictamente decreciente


en una vecindad alrededor de c y como f (c) = 0 entonces f pasa de positivo a negativo
en c, aplicando el caso 1 del teorema 2 se concluye que f tiene un mximo relativo en c.
El caso 2 se demuestra de manera anloga.

Ejemplo 4: En el ejemplo 1 se estableci que x = 4 y x = -2 son los puntos crticos de


f ( x) = x 3 3 x 2 24 x + 2 , tales que f (-2) = 0 y f (4) = 0. Empleando el teorema 3,
determine que clase de valores ptimos son.

Solucin:

f ' ( x) = 3 x 2 6 x 24

f ' ' ( x) = 6 x 6

f (4) = 18 > 0, entonces f tiene un mnimo relativo en 4.


f (-2) = -18 < 0, entonces f tiene un mximo relativo en -2.
El teorema 3 no dice que ocurre en el caso de que f (c) = 0. Este es el caso de
f ( x) = x 3 y f ( x) = x 4 . El siguiente teorema resuelve este problema.

Teorema 4: Sea f que posee n-sima derivada continua en el intervalo (a, b).
(a, b) se tiene:

Supngase que para un cierto punto c

f ' (c) = f ' ' (c) = ... = f

( n 1)

(c) = 0 , pero f ( n ) (c) 0 .

entonces para n par, f posee un mnimo local en c si f


c si f

(n)

(n)

(c) > 0 , y un mximo local en

(c) < 0 . Si n es impar, no existe ptimo en c.

Demostracin: Como f ( n ) (c) 0 existe un intervalo (a, b) que contiene a c, tal que
para cada x
(a, b) la derivada f ( n ) ( x) tiene el mismo signo que f ( n ) (c) . Por la
frmula de Taylor con resto (con el resto en la forma de Lagrange) se tiene
f ( x ) f (c ) =

(n)

( x1 )
( x c) n , donde x1 (a, b)
n!

Si n es par, esta ecuacin implica que f(x) f(c) cuando f


(n)

(n)

(c) > 0, y f(x) f(c)

(n)

cuando f (c) < 0. Si n es impar y f (c) > 0, entonces f(x) > f(c) cuando x > c, y
f(x) < f(c) cuando x < c, en consecuencia no existe ptimo en c. Se llega a una
conclusin anloga cuando n es impar y f ( n ) (c) < 0.
Ntese que el teorema 3 es un caso particular del teorema 4. Este hecho puede ser
empleado como nemotecnia para recordar el resultado.

Ejemplo 5: En el ejemplo 3 se estableci que 0 es el nico punto crtico de f ( x) = x 3 ,


emplee el teorema 4 para determinar que clase de punto crtico es.

Solucin:

f ' ( x) = 3x 2

entonces

f (0) = 0

f ' ' ( x) = 6 x

entonces

f (0) = 0

f ( 3) ( x ) = 6 0
como 3 es impar y la funcin constante 6 es continua se concluye que en x = 0 no se
presentan ptimos relativos.

Ejemplo 6: Determine los puntos crticos de f ( x) = x 4 y establezca de que clase son.


Solucin:

f ' ( x) = 4 x 3
f ' ' ( x) = 12 x

entonces
2

entonces

f ( 3) ( x) = 24 x
f

entonces
( 4)

f (0) = 0
f (0) = 0
f

( 3)

( 0) = 0

( x) = 24 0

como 4 es par y como, adems f ( 4) (0) > 0 , entonces en x = 0 la funcin tiene un


mnimo relativo.
Hasta el momento no se ha tratado el caso en el cual la funcin a optimizar se encuentra
restringida en su dominio. En tales casos los extremos del intervalo, o los intervalos, son
candidatos a ser puntos ptimos. Este caso es tratado en el ejemplo siguiente.

Ejemplo 7: Determine los puntos ptimos de

f ( x) = x 2 cuando su dominio se

restringe segn los casos: a) [-1, 2] b) [2,3].

Solucin: La figura ilustra el efecto, sobre los puntos ptimos, de restringir el dominio

de una funcin. En el caso a) el mnimo absoluto es el mismo que cuando no hay


restriccin, y aparece un mximo absoluto que no existe en el caso irrestricto. Para b)
tanto el mximo como el mnimo absolutos no existen en el caso irrestricto y, en este
caso, coinciden con los extremos del intervalo.

Figura 4

Utilizacin de mtodos numricos en la determinacin de puntos


crticos
En algunos casos la solucin de la ecuacin f (x) = 0 no puede calcularse por medios
algebraicos y es necesario recurrir a algn mtodo numrico para llevar a cabo esta
labor. En el siguiente ejemplo se ilustra esta situacin.

Ejemplo 8: Determine los puntos en los cuales la funcin g ( x) = x 3 sen( x) presenta


ptimos relativos.

Solucin: En primer lugar se grafca la funcin para tener una idea de donde pueden
localizarse los ptimos relativos.

Figura 5
La figura 5 permite concluir que, efectivamente, existen ptimos y que estos se
encuentran, el primero en [-1, 0] y el segundo en [0, 1]. El procedimiento a seguir es
similar al de los ejemplos anteriores.
g ' ( x) = 3 x 2 - cos(x)
Esta funcin est definida en todo , entonces, los puntos crticos son las soluciones de
3x - cos(x) = 0
para resolver esta ecuacin es necesario acudir a los mtodos numricos. En este caso se
emplear el mtodo de Newton. Este mtodo consiste en la aplicacin de la ecuacin
recursiva
f ( xn )
x n +1 = x n
f ' ( xn )

10

en donde x0 es un nmero prximo a la raz buscada. Para este caso se tiene


f ( x) = 3 x 2 - cos(x)
f ' ( x) = 6 x + sen(x)
tomando x1 = -0.8 los clculos son los siguientes:
Iteracin
0
1
2
3
4
5

xi
f ( xi )
-0.8
1.22329329
-0.5782827 0.16583011
-0.53699325 0.00583458
-0.53543049 8.3762E-06
-0.53542824 1.7364E-11
-0.53542824
0
Tabla 1

f ' ( xi )
-5.517356091
-4.016282878
-3.733514265
-3.722794298
-3.722778863
-3.722778863

Se tiene entonces, que x = -0.53542824 es el punto crtico que se encuentra en [-1, 0].
En virtud de la simetra de f se concluye que el punto crtico en [0, 1] es
x = 0.53542824. Para determinar que clase de ptimo es x = -0.53542824 evaluamos g
en puntos cercanos a x uno a la izquierda y el otro a la derecha:
g (-0.54) = 1.7*10 2 > 0 y g (-0.52) = -5.6*10 2 < 0
haciendo analoga con el caso 2 del teorema 2 se concluye que en x = -0.53542824
g tiene un mximo local. Un procedimiento anlogo permite concluir que en
x = 0.53542824 g tiene un mnimo local. Estos resultados confirman lo observado en la
figura 5. (En este ejemplo hemos incurrido en una imprecisin terica al afirmar que x
es igual al nmero encontrado con el mtodo numrico, sin embargo, para efectos
prcticos, este hecho es irrelevante pues la solucin puede ser calculada con la
precisin requerida por el problema que se este resolviendo en el momento. Como
ejemplo se muestra el resultado que se obtiene al emplear Matemtica con una precisin
de 40 decimales: x = -0.5354282441646569523641119303647428750992).

Optimizacin clsica variable multidimensional


Definicin 4 (Derivadas direccional y parcial): Sea f : S R, S R n . Si y es
un vector unitario y a es un punto interior a S, la derivada

f ' (D \ ) = lim


h 0

f ( D + h\ ) f ( D )
, h>0
h

se llama derivada direccional de f en a en la direccin de y. Si y = H k (el k-simo


f ' (a; H k ) se denomina
derivada parcial respecto a x k y se representa mediante el smbolo
vector de la base cannica de R n ) la derivada direccional

11

f
(a1 ,..., a n ) .
x k
En el caso de la variable bidimensional el significado geomtrico de esta derivada es
una generalizacin del caso unidimensional. La figura 6 ilustra la situacin

Figura 6
las alturas de f (a) y f (a + hy) son perpendiculares a la hoja y pasan por los puntos a y
a + hy respectivamente. Como y es unitario la longitud del segmento que une a con
a + hy tiene una longitud igual a h. Los cuatro puntos: a, a + hy, f (a) y f (a + hy) estn
todos contenidos en un plano perpendicular al plano xy que sigue la direccin del
segmento que une a con a + hy. Con esto en mente se puede concluir que la derivada
direccional representa la pendiente de la recta tangente a la curva que se forma al
intersecar la superficie con el plano que es perpendicular al plano xy, que pasa por a y es
paralelo a y.

Definicin 5: El vector
f ( D ) =

f (D) f (D )
f (D )
,
, ... ,
x1
x 2
x n

se conoce como el gradiente de f en a.

Teorema 5: Sea f : S R, S R n . Una condicin necesaria para que f tenga un


ptimo en a es que f (D ) =  .

Demostracin : Si f tiene un ptimo en a, al dejar constantes n-1 variables y analizar

la situacin en la variable restante, digamos x k , debe tenerse que, para esta, la


proyeccin de la funcin tiene un ptimo en a k y, como se estara en el caso
unidimensional, segn el teorema 1 la derivada de la funcin proyeccin debe ser igual
a cero. Como este resultado se tiene para todas y cada una de las variables,
necesariamente f (D ) =  .
El teorema 5 motiva un mtodo, anlogo al empleado en el caso de variable
unidimensional, para encontrar puntos ptimos. Este mtodo consiste en determinar los
puntos en los cuales el gradiente se hace cero. Sin embargo, como en el caso

12

unidimensional, la anulacin del gradiente es una condicin necesaria, pero no


suficiente, para la existencia de ptimos. La definicin 6 introduce la terminologa que
se emplea para clasificar los diferentes casos. Mas adelante se establece un criterio,
tambin anlogo al del caso unidimensional, basado en las segundas derivadas para
establecer que clase de ptimo (si lo es) es un punto en el cual se anula el gradiente.

Definicin 6: Un punto a para el cual f (D) =  se conoce como punto estacionario


de f. Un punto estacionario se llama de silla (o de ensilladura) si toda n-bola B(a)
contiene puntos x tales que f(x) < f(a) y otros para los cuales f(x) > f(a).

Ejemplo 9 (mtodo de los mnimos cuadrados): Cada planeta, con una nica

excepcin, se halla entre 1,3 y 2,0 veces tan alejado del Sol en relacin al siguiente
planeta ms cercano. La nica excepcin es Jpiter, el quinto planeta, que se halla 3,4
veces ms alejado de lo que est Marte. Este hecho intrig notablemente a los
astrnomos Podra existir un planeta en el hueco entre Marte y Jpiter? Heinrich
Wilhelm Mathias Olbers, astrnomo alemn, reclut un grupo que planeaba emprender
la bsqueda sistemtica del planeta faltante. Sin embargo, en la noche del 31 de
diciembre de 1800 Giuseppe Piazzi, astrnomo italiano, quien desconoca la existencia
y los propsitos del grupo de Olbers, localiz, en el mencionado hueco, un objeto
celeste que variaba de posicin de un da al siguiente. Lo denomin Ceres y fue el
primer asteroide de que se tuvo noticia. Un mes despus Ceres desapareci detrs del
Sol. En los meses posteriores fue buscado infructuosamente en los cielos. Tres meses
despus apareci exactamente en el lugar en el cual Carl Friedrich Gauss, matemtico
alemn, empleando un mtodo de su invencin para analizar las observaciones hechas,
haba predicho que lo hara. El mtodo inventado por Gauss se denomina de los
mnimos cuadrados, y consiste en una tcnica que se utiliza para encontrar la curva que
se ajusta mejor a un conjunto de resultados experimentales, de manera que sea mnima
la suma de los cuadrados de las diferencias entre las ordenadas de dichos puntos y las de
la curva que tienen la misma abscisa. El ejemplo que sigue desarrolla la idea del
mtodo.

Dadas n parejas ordenadas distintas ( x1 , y1 ), ( x 2 , y 2 ), ... , ( x n , y n ) no siempre es posible


encontrar una recta f ( x) = mx + b que pase por todos los puntos ( xi , y i ) . Sin embargo,
pueden calcularse las constantes m y b de tal manera que la recta f ( x) = mx + b se
ajuste de la mejor manera a la coleccin de puntos.
Antes de resolver el problema se considerar el mejor criterio segn el cual se puede
afirmar que la recta se ajusta de la mejor manera. En cada punto el error cometido
ser igual a la diferencia entre el valor generado por la frmula f ( x) = mx + b y el valor
tabulado, esto es, ei = f ( xi ) y i = mxi + b y i . Vase la figura 7.

Figura 7

13

Cualquier mtodo debe, de alguna manera, minimizar el total de los errores cometidos.
En un primer momento podra pensarse en minimizar la suma de todos los errores, esto
es, minimizar
n
i =1

f ( xi ) y i

La figura 8 muestra que no es una buena idea, pues lo mnimo que se espera de la recta
de ajuste es que, cuando se tienen exactamente dos puntos, pase por ambos. Este no es
el caso, pues cualquier recta que pase por el punto medio, con la nica excepcin de una
vertical, cumple la condicin de minimizar la suma de los errores, hacindola igual a
cero (ntese que los errores son iguales en magnitud pero de signo contrario).

Figura 8
Una solucin alternativa sera intentar minimizar la suma de los valores absolutos de los
errores, o sea, minimizar
n
i =1

f ( xi ) y i

la dificultad de este enfoque radica en que es necesario calcular derivadas parciales pero
el valor absoluto es una funcin que se define por partes y que, adems, no es derivable
en 0. Todas estas dificultades son superadas con el enfoque de los mnimos cuadrados,
el cual consiste en minimizar la suma de los errores al cuadrado, esto es, minimizar
n
i =1

( f ( x i ) y i )2 =

n
i =1

(mxi + b yi )2

El problema se concreta entonces a determinar las constantes m y b de tal manera que se


minimice

S(m, b) =

n
i =1

Solucin:

(mxi + b yi )2
n
S
= 2 (mxi + b yi )xi
m
i =1
n
S
= 2 (mxi + b y i )
b
i =1

igualando estas derivadas parciales a cero se obtiene


14

xi2 + b

i =1

xi =

i =1

xi + nb =

i =1

xi y i

i =1
n

yi

i =1

Este es un sistema lineal de dos ecuaciones con dos incgnitas, resolviendo por el
mtodo de sustitucin, de la segunda ecuacin se obtiene
n

b=

yi m

i =1

x +

i =1

2
i

yi m

i =1

xi

i =1

reemplazando en la primera
n

xi

i =1

xi =

i =1

xi y i

i =1

despejando m
n
n

m=

xi y i

i =1

i =1

i =1

yi

i =1

n
xi

i =1

x
2
i

n
n

xi

n
i =1

xi y i
n

i =1

2
i

n
i =1

xi

n
i =1

n
i =1

yi
2

xi

resumiendo
n

n
m=

i =1

xi yi
n

i =1

xi

i =1

i =1

i =1

yi
y

2
i

b=

xi

i =1

yi m

n
i =1

xi

es la solucin pedida. Cualquier hoja de clculo o calculadora cientfica genera ests


cantidades a partir de los datos introducidos. En consecuencia, la recta de regresin es

f ( xi ) = Yi = mxi + b

Ejemplo 10: Demuestre que para la recta de regresin encontrada en el ejemplo


anterior se tiene

f ( xi ) y i = 0

i =1

Solucin:

f ( xi ) y i =

i =1

n
i =1

xi + nb

n
i =1

n
i =1

Yi y i =

yi =

15

n
i =1

mxi + b y i =

n
i =1

xi +

n
i =1

yi m

n
i =1

xi

n
i =1

yi = 0

Aunque se ha trabajado nicamente la regresin de tipo lineal en dos variables, el


enfoque de los mnimos cuadrados puede extenderse directamente a polinomios de
grado n (en el caso de que se tengan n + 1 puntos el polinomio de regresin ser
precisamente el polinomio de colocacin), el grado del polinomio puede establecerse
por algn resultado terico, alguna expectativa o por la aplicacin que se le pretenda
dar. Mediante transformaciones, problemas no lineales pueden adaptarse para hacer
regresin lineal a datos que, por ejemplo, se ajusten aproximadamente a una
exponencial del tipo y = ab cx , ya que, evaluando en ambos lados logaritmos de base b
se obtiene log b y = log b a + cx y haciendo las sustituciones Y = log b y y A = log b a se
llega a una ecuacin de tipo lineal. Tambin es posible trabajar en ms de dos
dimensiones encontrando, ya no la recta, sino el hiperplano que mejor se ajusta a una
nube de puntos en R n .

Condiciones necesarias y suficientes para la existencia de puntos


ptimos
El mtodo empleado en el ejemplo 9 se limit a determinar un punto estacionario de f.
Las derivadas parciales estn definidas en todo el plano y, en consecuencia, este punto
estacionario es nico. Consideraciones tericas propias del caso particular que se estaba
tratando permitan concluir que la solucin exista. Por lo tanto se asumi que en este
punto se presenta el mnimo buscado. Este procedimiento es lcito. Sin embargo, este no
es siempre el caso: la existencia de varios puntos estacionarios puede hacer necesario
que se clasifiquen en mximos, mnimos o puntos de silla. Tambin puede ocurrir que el
modelo matemtico no garantice la existencia de la solucin y, en consecuencia, en los
puntos estacionarios hallados pueden presentarse puntos de silla u ptimos de naturaleza
contraria a los buscados. Estas consideraciones hacen que sea necesario contar con un
criterio de clasificacin de los puntos estacionarios. Las definiciones y el teorema, sin
demostracin, que se presentan en seguida suplen esta necesidad.

Definicin 7: La matriz n x n de las segundas derivadas parciales de f es llamada


matriz hessiana y se designa por H(x). As, se tiene
2 f ([ )
x12
2 f ([ )
H ( [ ) = x x
2
1

2 f ([ )
x1x 2
2 f ([ )
2
x 2

2 f ([)
x1x n
2 f ([)
x 2 x n

2 f ([ )
x n x1

2 f ([ )
x n x 2

2 f ([)
2
x n

16

Definicin 8: Dada la matriz A n x n se define el k-simo menor principal de A como


a11
a 21

a12
a 22

a1k
a2k

a k1

ak 2

a kk

k = 1,2, . . . , n

Definicin 9: Dada la matriz simtrica A n x n se dice que A es:


1. definida positiva si los valores de los menores principales de A son positivos
(no negativos).
2. definida negativa si el valor del k-simo menor principal tiene signo (1) k

Teorema 6: sea a un punto estacionario de f entonces


1. Si H(a) es definida positiva f tiene un mnimo en a.
2. Si H(a) es definida negativa f tiene un mximo en a.

Ejemplo 11: encuentre los puntos ptimos de la funcin


2
2
f ( x1 , x 2 , x3 ) = x1 + 2 x3 + x 2 x3 x12 x 2 x3

Solucin: el sistema

f
= 1 2 x1 = 0
x1
f
= x3 2 x 2 = 0
x 2
f
= 2 + x 2 2 x3 = 0
x3

tiene como solucin el vector a = (1/2, 2/3, 4/3), entonces

2
H (D) =
D

0
0

2 1
1 2

los menores principales de H tienen valores -2, 4, -6. Segn la definicin 9, H es


definida negativa. Aplicando el teorema 6 se concluye que f tiene un mximo en a.

Ejemplo 12: Determine el punto del plano x + 2y + z = 1 ms cercano al origen.


Solucin: El problema puede representarse como
minimizar f (x, y, z) = x 2 + y 2 + z 2

17

sujeto a

x + 2y + z = 1

despejando z en la restriccin se tiene z = 1- x - 2y , reemplazndola en la funcin


objetivo queda
f = x 2 + y 2 + (1 x 2 y ) 2
calculando las derivadas parciales e igualando a cero
f
= 2 x 2(1 x 2 y ) = 0
x
f
= 2 y 4(1 x 2 y ) = 0
y
o

f
= 4x + 4 y 2 = 0
x
f
= 4 x + 10 y 4 = 0
y

que tiene como solucin y = 1/3, x = 1/6. En consecuencia z = 1/6. As, el punto
estacionario a es igual a (1/6, 1/3). Como ya se mencion, caractersticas propias del
problema en particular (en este caso el hecho de que la distancia mnima de un punto a
un plano siempre existe) garantizan que el punto encontrado corresponde a la solucin.
Sin embargo, se harn los clculos que verifican este hecho.
H (D) =

4 10

Los menores principales de H son 4 y 24. Por consiguiente H es definida positiva y f


tiene un mnimo en a. Hecha esta confirmacin se puede afirmar que el punto solucin
es (1/6, 1/3, 1/6).

Ejemplo 13: encuentre los puntos estacionarios de


f (x, y, z) = 2xyz - 4xz - 2yz + x + y + z - 2x - 4y + 4z.

Solucin: calculando las derivadas parciales e igualando a cero


f
= 2yz - 4z +2x - 2 = 0
x
f
= 2xz - 2z + 2y - 4 = 0
y

Nota: este problema pude resolverse acudiendo exclusivamente a argumentos geomtricos. La distancia
mnima de un punto a un plano es la perpendicular del punto al plano. La solucin se halla, entonces,
intersecando la recta (x, y, z) = t (1, 2 ,1) =(t, 2t, t), t
que es perpendicular al plano con el plano.
Para ello se resuelve para t la ecuacin t + 2(2t) + t = 1. La solucin es t = 1/6 y el punto es 1/6*(1, 2, 1) =
(1/6, 1/3, 1/6).

18

f
= 2xy 4x - 2y + 2z + 4 = 0
z
Para resolver este sistema no lineal de 3 ecuaciones con 3 incgnitas se emplea el
mtodo de sustitucin.
Despejando x en la primer ecuacin
x = 1 yz + 2z

reemplazando en la segunda

2(1 yz + 2z)z - 2z + 2y - 4 = 0
haciendo el producto, simplificando y factorizando
z(4 - 2y) + 2y 4 = 0

factorizando de nuevo

(4 2y)(z - 1) = (4 2y)(z - 1)(z + 1) = 0


de esta ltima igualdad se concluye que
y = 2 o z = 1 o z = -1.
Reemplazando x en la segunda ecuacin
2(1 yz + 2z)y 4(1 yz + 2z) - 2y + 2z + 4 = 0
simplificando y factorizando
en consecuencia

z(y - 4y + 3) = z(y 3)(y - 1) = 0


z = 0 o y = 3 o y = 1.

Se escogen las parejas (y, z) de tal manera que se cumplan las 2 condiciones, por
ejemplo, si se escoge y = 3 en la segunda condicin entonces, por la primera condicin,
z = 1 o z = -1. Se tienen, por lo tanto, las parejas (3, 1) y (3, -1). Consideraciones
anlogas dan como resultado las parejas (1, 1), (1, -1) y (2, 0). Tomando, por ejemplo,
la pareja (3, 1) se obtiene x = 1 3*1 + 2*1 = 0, con lo cual se tiene la tripla (0, 3, 1).
El mismo procedimiento conduce a la obtencin de los puntos (1, 2, 0), (2, 3, -1), (2, 1,
1) y (0, 1, -1) como puntos estacionarios de f.

Utilizacin de mtodos numricos en la determinacin de puntos


estacionarios
El ejemplo 13, de fcil solucin, ilustra las bondades de un problema artificial, esto es,
un problema que ha sido creado para que tenga una solucin relativamente fcil. En este
caso la solucin del sistema de ecuaciones, originado al igualar el gradiente a cero, se
pudo realizar acudiendo nicamente al lgebra elemental. Sin embargo, este tipo de

19

problemas constituyen la excepcin y no la regla cuando se presentan como parte de la


solucin de un problema real de aplicacin. En estos casos, de manera similar a lo visto
en el trabajo con variable unidimensional, hay que recurrir a algn mtodo numrico
para resolver el sistema. El mtodo que se tratar aqu es el de Newton para sistemas de
ecuaciones no lineales.

Mtodo de Newton para sistemas de ecuaciones


Dado el sistema de n ecuaciones F(x) = 0, donde

)( [ ) =

f1 ( [ )
f 2 ([ )
f n ([ )

El mtodo de Newton para sistemas consiste en la aplicacin de la ecuacin recursiva

[ k = [ k 1 [J ( [ k 1 )] )( [ k 1 )
1

en donde [ 0 es un punto prximo a la raz buscada y

f 1 ( [ )
x1
f 2 ( [ )
J ( [ ) = x1

f1 ( [ )
x 2
f 2 ( [ )
x 2

f 1 ( [ )
x n
f 2 ( [ )
x n

f n ( [ )
x1

f n ( [ )
x 2

f n ( [ )
x n

Ejemplo 14: Encuentre los puntos estacionarios de


f (x, y, z) = 2x + y + z + 6(x + y + z) + 2xyz

Solucin: Calculando las derivadas parciales e igualando a cero


f
= 4x + 2yz + 6 = 0
x
f
= 2y + 2xz + 6 = 0
y
f
= 2z + 2x y + 6 = 0
z
Para aplicar el mtodo de Newton se construye la matriz J

20

2z 2 y

J ([ ) = 2 z 2 2 x
2 y 2x 2
Comenzando con [ 0 =(0, 0, 0) se tiene

4 0 0
J (0,0,0) = 0 2 0
0 0 2

1/ 4

[J (0,0,0)]

0
0

1/ 2 0
0 1/ 2

adems

6
F(0, 0, 0) = 6

6
se tiene entonces

1/ 4

[ 1 = (0, 0, 0) -

Iteracin (i)
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14

0
0

1/ 2 0
0 1/ 2

Xi
0
-1.5
-0.31578947
6.5843733
3.11386779
1.82175404
-1.38308621
0.95034839
-1.33794065
-3.47952806
-2.88978861
-2.83385015
-2.83556311
-2.83557496
-2.83557496

6
6 = (-3/2, -3, -3)
6

Yi
0
-3
-1.10526316
6.76180141
2.69855772
0.11834204
-0.92876013
2.17392051
1.01241321
2.46146365
1.79535061
1.6406222
1.63437
1.63436529
1.63436529

Tabla 2

Zi
0
-3
-1.10526316
6.76180141
2.69855772
0.11834204
-0.92876013
2.17392051
1.01241321
2.46146365
1.79535061
1.6406222
1.63437
1.63436529
1.63436529

La tabla 2 resume los clculos. Ntese que los valores en la iteracin 14 coinciden con
los de la 13 esto se debe a que F(x) = 0. As, partiendo del punto (0, 0, 0) se ha
encontrado una solucin al sistema consistente en x = -2.83557496, y = 1.63436529 y
z = 1.63436529. Sin embargo, en el ejemplo 13 se encontraron 5 puntos estacionarios (5
soluciones al sistema no lineal de ecuaciones) por lo tanto es probable que tambin en
este caso existan varias soluciones. Un procedimiento intuitivo consiste en ejecutar las
iteraciones a partir de diferentes puntos en busca de las otras races del sistema, por
ejemplo, a partir del punto (15, -15, 5) se obtiene la solucin x = 1, y = - 4.1925824 y
z = 1.1925824. Como los papeles de y y z en el sistema son simtricos, a partir de esta
ltima solucin se deduce que x = 1, y = 1.1925824 y z = - 4.1925824 tambin es
solucin. Obviamente esta tcnica de ensayo y error no constituye un mtodo de

21

aplicacin general y adems las simetras son extraas. Para evadir estas dificultades, se
puede, en el caso particular del sistema que se est resolviendo, disminuir la dimensin
del problema despejando x en la primera ecuacin y reemplazndola en las otras 2 con
lo cual se obtiene:
x = -(yz + 3)/2
y el sistema se reduce a
y(2 - z ) - 3z + 6 = 0
- yz - 3y + 2z + 6 = 0
como para una solucin cualquiera deben satisfacerse simultneamente las dos
ecuaciones, las soluciones se localizan en los puntos de interseccin de las 2 grficas.
Esta situacin se ilustra en la figura 9

Figura 9
As, es posible verificar de forma grfica que las races encontradas son todas las
existentes. Es importante insistir que la tcnica empleada para la resolucin de este
ejemplo no siempre es aplicable. En general es difcil determinar el nmero exacto de
races, como tambin el lugar aproximado en donde se encuentran. Lo que se desea
indicar es que, en la resolucin de cada problema en particular, es aconsejable acudir a
todas las herramientas que sea lcito emplear en el momento.
De manera anloga al caso unidimensional los ptimos de una funcin f de variable
multidimensional, f : S R, S R n , tambin pueden presentarse en aquellos puntos
para los cuales no existen las derivadas parciales o que corresponden a la frontera. El
propsito del ejemplo 15 es ilustrar esta situacin.

Ejemplo 15: Dada f ( x, y ) = x 2 + y 2 definida en {(x, y) / x + y 4} que aparece


graficada en la figura 10

22

Figura 10
es evidente que presenta un mnimo en (0, 0), punto en el cual las derivadas parciales

f
=
x

x
x +y
2

f
=
y

y
x + y2
2

no existen. Adems f toma un valor mximo de 2 en todos y cada uno de los puntos de
la frontera.

Extremos restringidos. Multiplicadores de Lagrange


De la misma manera que la derivada unidimensional f (a) representa la pendiente de la
recta tangente a la curva f(x) en el punto (a, f(a)), el vector gradiente tiene una
interpretacin geomtrica que es til en el momento de dar una motivacin del mtodo
conocido como de los multiplicadores de Lagrange. El vector gradiente f (D ) es un
vector normal (perpendicular) al plano tangente a la superficie f(x) en el punto (a, f(a)).
Este hecho se ilustra en la figura 11.

Figura 11
Se introducen las ideas del mtodo mediante la solucin de un problema de aplicacin.

23

Ejemplo 15: Encuentre los puntos de la superficie z - xy = 1 ms prximos al origen.


Solucin: Al plantear el problema de la forma

Minimizar (x + y + z) 2
Sujeto a z - xy = 1
Se hace evidente que se trata de un problema de optimizacin con restricciones. Un
punto (x, y, z) se encuentra a una distancia r del origen si, y solo si, est en la esfera

x + y + z = r
Esta esfera es una superficie de nivel de la funcin f(x, y, z) = x + y + z que hay que
minimizar. Como la superficie z - xy = 1 no pasa por el origen, la idea de la solucin
consiste en comenzar con r = 0 e ir aumentando hasta que la esfera sea tangente a la
superficie. Cada punto de contacto ser una solucin del problema. En el punto de
tangencia las dos superficies tienen el mismo plano tangente y, en consecuencia,
gradientes paralelos. El paralelismo de los gradientes se traduce en que uno es mltiplo
del otro. Definiendo
g ( x, y, z ) = z 2 xy 1
se tiene que la superficie queda definida por g(x, y, z) = 0 y que

f = g
en consecuencia

( 2 x, 2 y , 2 z ) = ( y , x, 2 z )

que equivale a las 3 ecuaciones

2x = -y
2y = -x
2z = 2z

la cuarta ecuacin est dada por g(x, y, z) = 0 o sea z 2 xy 1 = 0 . Este sistema tiene
como solucin: = 1, x = y = 0, z = 1 o z = -1. Se tienen, en consecuencia, las dos
soluciones (0, 0, 1) y (0, 0, -1).
El mtodo empleado en la solucin del ejemplo 15 se generaliza de la siguiente manera.

Mtodo de los multiplicadores de Lagrange


Si f : S R, S R n tiene un ptimo relativo cuando est sometida a m condiciones

g1 ( x1 ,..., x n ) = 0,..., g m ( x1 ,..., x n ) = 0

24

con m < n, existen entonces m escalares 1 ,..., m tales que

f = 1g 1 +

+ n g n

Los escalares 1 ,..., m que se introdujeron para resolver este tipo de problemas se
denominan multiplicadores de Lagrange.

Ejemplo 16: Encuentre las dimensiones de la cubeta que aparece en la figura 12 de tal
manera que se minimice el material empleado y se cumplan las dos restricciones:

1. cada uno de los espacios debe tener una seccin horizontal cuadrada.
2. el volumen total (sin tener en cuenta las particiones) debe ser igual a 12 pulgadas
cbicas.

Figura 12

Solucin:
El problema se plantea de la siguiente manera:
Minimizar 3xz + xy + 6yz
Sujeto a
x/5-y/2=0
xyz-12 = 0
en donde f (x, y, z) = 3xz + xy + 6yz, g1 ( x, y, z ) = x / 5 y / 2 y g 2 ( x, y, z ) = xyz 12 .
Entonces

f = (3 z + y, x + 6 z ,3 x + 6 y ) , g1 = (1 / 5,1 / 2,0) y g 2 = ( yz , xz , xy )
El sistema

f = 1g1 + 2 g 2
g 1 ( x, y , z ) = 0
g 2 ( x, y , z ) = 0

es un sistema de 5 ecuaciones con 5 incgnitas de solucin dispendiosa. Sin embargo,


empleando un paquete matemtico (en este caso Derive) se obtiene la solucin:

25

3 * 60 3
3 * 60 3
2 * 60 3
x=
, y=
y z=
2
5
9
Al no contarse con un paquete matemtico este problema puede simplificarse
despejando x en la primera restriccin y reemplazndola en la funcin objetivo y en la
segunda restriccin, con lo cual se obtiene un problema en dos variables con una
restriccin. An ms, este nuevo problema puede a su vez simplificarse despejando z y
se tiene un problema en una sola variable sin restricciones. Sin embargo, el mtodo de
los multiplicadores de Lagrange est concebido para resolver problemas en los cuales es
imposible hacer tales simplificaciones.

Optimizacin no clsica variable multidimensional


Hasta el momento los mtodos empleados han sido fruto de la aplicacin de resultados
tericos como, por ejemplo, igualar el gradiente a cero o emplear el mtodo de los
multiplicadores de Lagrange, las dificultades han aparecido al momento de atacar el
problema de resolver los sistemas de ecuaciones no lineales que aparecen al aplicar los
resultados tericos. Para ello se ha acudido al mtodo de Newton, el cual es un mtodo
iterativo de aproximaciones sucesivas a partir de un punto inicial. Lo que se har ahora
es emplear una idea similar para encontrar directamente el ptimo: comenzando con un
punto inicial, adecuado segn algn criterio, iterar hasta estar lo suficientemente cerca
del ptimo.

Mtodo del gradiente


Existe una relacin fundamental entre la derivada direccional y el gradiente la cual es
expresada en la siguiente frmula

f ' (D; \ ) = f (D ) \ = f (D ) \ cos = f (D ) cos


donde es el ngulo formado por f (a) e y. La figura 13 proporciona una ilustracin
grfica del hecho

Figura 13

26

Al tener la derivada direccional la forma f (D ) cos es claro que esta asume un valor
mximo cuando = 0 y un valor mnimo cuando = . O sea que, el valor mximo de
la derivada direccional es f (D ) y ocurre cuando y tiene la misma direccin del
gradiente y el valor mnimo es - f (D ) que ocurre cuando y tiene direccin opuesta al
gradiente. En otras palabras, el gradiente de f en a apunta en la direccin de mximo
crecimiento de f a partir de a, en tanto que f (D ) apunta en la direccin del mximo
decrecimiento de f.
Este importante hecho constituye la base del mtodo del gradiente el cual consiste en
comenzar a partir de un punto inicial, y avanzar en la direccin del gradiente, en el caso
de maximizacin, o en la direccin contraria, en el caso de minimizacin. Una vez
determinada la direccin de avance es necesario escoger la longitud de dicho avance (o
tamao del paso) lo cual constituye, a su vez, un problema de optimizacin de variable
unidimensional. El siguiente ejemplo ilustra el procedimiento.

Ejemplo 17: Maximice la funcin


f(x, y) = 4x + 6y 2x -2xy 2y

Solucin: comenzando en el punto inicial (0, 0) y considerando que


f (x, y) = (4 4x 2y, 6 2x 4y)
entonces el vector f (0,0) = (4, 6) determina la direccin que debe tomarse a partir de
(0, 0). Si p controla la longitud del paso, el punto de llegada ser (0, 0) + p(4, 6) = (4p,
6p) para determinar el mejor p se optimiza f (4p, 6p), se tiene entonces

f (4p, 6p) = 16p + 36p 32p - 48p - 72p = 52p 152p


derivando e igualando a cero
52 304p = 0 entonces p = 52/304 = 13/76
con lo que el nuevo punto es (13/19, 39/38). Evaluando f (13/19, 39/38) = 169/38 =
4.447368421que representa una mejora frente a f (0,0) = 0. Se hacen los clculos para
dar el siguiente paso.
f (13/19, 39/38) = (-15/19, 10/19)
con lo que el nuevo punto es
(13/19, 39/38) + p(-15/19, 10/19) = (13/19 - 15p/19, 39/38 + 10p/19)
entonces

f (13/19 - 15p/19, 39/38 + 10p/19) = -( 700p - 650p 3211) / 722


derivando, igualando a cero y despejando se obtiene p = 13/28 con lo que el nuevo
punto es (169/532, 169/133) con f (169/532, 169/133) = 169/38 = 4.656361297.
27

Este proceso es engorroso, sin embargo, como en este caso en el proceso de


optimizacin la p se obtiene de manera explcita, pueden hacerse los clculos para
cualquier punto genrico (a, b), con lo cual se obtiene

f (a, b) = (4 4a 2b, 6 2a 4b)


entonces el nuevo punto es
(a, b) + p(4 4a 2b, 6 2a 4b) = (4 p +(1 4 p)a 2pb, 6p 2pa + (1 4 p)b)
evaluando f (4 p +(1 4 p)a 2pb, 6p 2pa + (1 4 p)b), derivando, igualando a cero y
despejando p se obtiene

p=

5a 2 + 2a (4b 7) + 5b 2 16b + 13
4(7 a 2 + a (13b 22) + 7b 2 23b + 19)

con lo cual el procedimiento se puede automatizar mediante una hoja de clculo para
obtener la tabla
Iteracin
0
1
2
3
4
5
6
7
8
9
10
11
12

f(X)

X
0
0.68421053
0.54916898
0.47572532
0.42700188
0.39495765
0.37387564
0.3600059
0.35088108
0.3448779
0.34092844
0.33833012
0.33662069

0
1.02631579
1.11634349
1.19097172
1.23966398
1.27170903
1.29279102
1.30666076
1.31578559
1.32178876
1.32573822
1.32833655
1.33004598

0
4.44736842
4.57299572
4.62612436
4.64911892
4.65907156
4.66337931
4.66524381
4.66605082
4.66640011
4.6665513
4.66661673
4.66664505

f(X)

4
-0.78947368
-0.42936288
-0.28484473
-0.1873355
-0.12324868
-0.08108462
-0.05334514
-0.03509549
-0.02308914
-0.01519022
-0.00999357
-0.00657472

6
0.52631579
0.43628809
0.28466249
0.1873403
0.12324856
0.08108462
0.05334514
0.03509549
0.02308914
0.01519022
0.00999357
0.00657472

32

0.33333409 1.33333257 4.66666667

-1.52E-06

1.52E-06

33

0.33333383 1.33333283 4.66666667

-9.98E-07

9.98E-07

Tabla 3

0.1710526
0.4642857
0.499936
0.4999999
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5

En la tabla 3 se ve que el algoritmo converge efectivamente hacia la solucin (1/3, 4/3)


la cual puede encontrarse de forma analtica- mientras que el gradiente tiende a cero
como es de esperarse que ocurra en un punto ptimo.

28

Programacin separable
La idea de la programacin separable para resolver un problema de P.N.L. es construir
una aproximacin lineal del problema, esto es, un problema de programacin lineal, y
resolver este para encontrar una aproximacin a la solucin de aquel.

Definicin 10: Una funcin f (x) donde [ = ( x1 , x 2 ,..., x n ) se dice separable si cumple
la condicin:
n

f ([ ) =

Ejemplo 18:
escribirse
donde

La funcin

i =1

f i ( xi )

(4)

f ( x1 , x 2 ) = 2 x12 + 3 x1 + 4 x 2 es separable pues puede

f ( x1 , x 2 ) = f 1 ( x1 ) + f 2 ( x 2 )
f 1 ( x1 ) = 2 x12 + 3 x1 y f 2 ( x 2 ) = 4 x 2

Supongamos que en el problema de optimizacin


Maximizar z = f (x)
Sujeto a
<
g j ( [ ) b j j = 1,..., m
>
xi 0 i = 1,2,..., n

(5)

la funcin objetivo y las restricciones son separables. El problema adquiere entonces la


forma
Maximizar z =

n
i =1

f i ( xi )

Sujeto a
n
i =1

Al hacer la descomposicin f ( [ ) =

<
g ji ( xi ) b j j = 1,..., m
>
xi 0 i = 1,2,..., n
n
i =1

(6)

f i ( xi ) cada f i puede ser lineal o no. En caso de

no serlo se le hace una aproximacin lineal de la siguiente manera: sea f (x), definida en
[a, b], como aparece en la figura 14

29

Figura 14
Se toma la particin a = x0 < x1 < x 2 <

< x k < x k +1 <

__________ ______

< x r 1 < x r = b . La funcin

________________

f ( x) definida por la poligonal f ( x0 ), f ( x1 ), f ( x1 ), f ( x 2 ),


aproximacin lineal de la funcin f (x).

__________ ______

, f ( x r 1 ), f ( x r ) es una

Para estudiar f ( x) se selecciona el intervalo arbitrario [ x k , x k +1 ] para el cual se tiene

f ( x) = f ( x k ) +

f ( x k +1 ) f ( x k )
( x x k ) (7)
x k +1 x k

Por otra parte si x


[ x k , x k +1 ] entonces x puede ser representado como combinacin
convexa de los extremos del intervalo. Se tiene entonces

x = x k +1 + (1 ) x k 0 1 (8)
Sustituyendo (8) en (7) queda

f ( x) = f ( x k ) +

f ( x k +1 ) f ( x k )
(x k +1 + (1 ) x k x k ) 0 1
x k +1 x k

f ( x) = f ( x k ) +

f ( x k +1 ) f ( x k )
( x k +1 x k ) 0 1
x k +1 x k

Simplificando y factorizando

f ( x) = f ( x k +1 ) + (1 ) f ( x k ) 0 1 (9)
Como se est analizando el intervalo [ x k , x k +1 ] se definen k +1 = y k = 1 con lo
cual (8) y (9) toman la forma

30

x = k x k + k +1 x k +1

f ( x) = k f ( x k ) + k +1 f ( x k +1 )
donde k + k +1 = 1, k , k +1 0 .
En general para cualquier x

[a, b] se puede escribir

x=

r
k =0

k xk y

f ( x) =

k =0

k f ( xk )
(10)

donde

k =0

i = 1 y k 0 k = 0,1,

,r

con la condicin de que mximo dos k sean positivos, en cuyo caso deben ser
adyacentes.
Empleando (10) en el problema (6) se obtiene un problema aproximado de naturaleza
lineal el cual tiene la siguiente representacin:
n

Maximizar z =

i =1 k = 0

ik f i ( xik )

Sujeto a
n

i =1
r

k =0

k =0

<
>

ik g ji ( xik ) b j j = 1,..., m

ik = 1 i = 1,

ik 0, k = 0,

(11)

,n
, r , i = 1,

,n

con la condicin de que para cada i mximo dos ik sean positivos, en cuyo caso deben
ser adyacentes. Este problema es casi lineal, no lo es por la propiedad de adyacencia que
se acaba de mencionar, en consecuencia, se resuelve (11) por el mtodo smplex (o
algn mtodo equivalente) y se verifica que la solucin satisfaga dicha propiedad.

Ejemplo 18: Dado el problema separable


Maximizar z = 2 x1 x12 + x 2
Sujeto a
2
2 x12 + 3 x 2 6
x1 , x 2 0
constryase y resulvase el problema lineal aproximado.

Solucin: en primer lugar se separan la funcin objetivo y la restriccin as:

31

f 1 ( x1 ) = 2 x1 x12
f 2 ( x2 ) = x2
g1 ( x1 ) = 2 x12
2
g 2 ( x2 ) = 3x2

es necesario tambin encontrar los intervalos de definicin de x1 y x 2 . De la restriccin


2
2 x12 + 3 x 2 6

se tiene, por una parte

2
6 3x 2
2

x1
2
de donde 6 3 x 2 0 o x 2 2 1.4142 .

De manera anloga

x2

6 2 x12
3

de donde 6 2 x12 0 o x1 3 1.7320 . Por comodidad se toman los rangos


0 xi 2 i = 1, 2.
Para r = 8 se tiene la tabla 4
k
0
1
2
3
4
5
6
7
8

Xk
0
0.25
0.5
0.75
1
1.25
1.5
1.75
2

f1(x1)
0
0.4375
0.75
0.9375
1
0.9375
0.75
0.4375
0

f2(x2)
0
0.25
0.5
0.75
1
1.25
1.5
1.75
2

Tabla 4

g1(x1)
0
0.125
0.5
1.125
2
3.125
4.5
6.125
8

g2(x2)
0
0.1875
0.75
1.6875
3
4.6875
6.75
9.1875
12

con lo cual (11) para este caso particular asume la forma:


Maximizar
z = 010 + 0.437511 + 0.7512 + 0.937513 + 14 + 0.937515 + 0.7516 + 0.437517 + 018 +
0 20 + 0.25 21 + 0.5 22 + 0.75 23 + 24 + 1.25 25 + 1.5 26 + 1.75 27 + 2 28
Sujeto a
010 + 0.12511 + 0.512 + 1.12513 + 214 + 3.12515 + 4.516 + 6.12517 + 818 +
020 + 0.187521 + 0.7522 + 1.687523 + 324 + 4.687525 + 6.7526 + 9.187527 + 1228 6

32

10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 + 18 = 1
20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 = 1
Para resolver este problema se han renombrado las variables de la siguiente manera

x0 = 10 ,

, x8 = 18 , x9 = 20 ,

, x17 = 28

La salida de MPL con la solucin de este problema es:

se tiene entonces que

13 = 1, 2 5 = 0.9091 y 2 6 = 0.0909

se ve que la solucin satisface la propiedad de adyacencia. De acuerdo con (10) se tiene


entonces que la solucin aproximada es:

x1 = 1 0.75 = 0.75 y x 2 = 0.9091 1.25 + 0.0909 1.5 = 1.272725


con

z = 2.2102 .

El problema tambin puede ser resuelto por un mtodo grfico anlogo al empleado en
Programacin Lineal. En primer lugar se grafica la regin factible (conjunto de puntos
que satisfacen simultneamente todas las restricciones), luego se grafican las diversas
curvas que se obtienen al asignar algunos valores a la funcin objetivo y, finalmente,
observando el comportamiento de estas ltimas se determina la solucin. La figura 15
ilustra el procedimiento.
33

Figura 15
Se observa que a medida que z va tomando valores cada vez ms grandes la grfica de
la funcin objetivo se desplaza hacia arriba, por lo tanto el punto ptimo es el ltimo
punto de contacto que tiene la regin factible con la funcin objetivo en su camino de
ascenso, este punto cumple la condicin de que en l las dos grficas la de la funcin
objetivo que asciende y la que delimita la regin factible son tangentes. Aplicando lo
aprendido en la seccin dedicada a los Multiplicadores de Lagrange se tiene que en el
punto de tangencia las dos funciones deben tener la misma derivada. Despejando x 2 en
la funcin objetivo y en la restriccin se tiene

x 2 = z 2 x1 + x

2
1

entonces

dx 2
= 2 + 2 x1
dx1

x2 =

6 2 x12
3

dx 2
2 x1
=
dx1
3 6 2 x12

igualando las derivadas se obtiene la ecuacin

2 + 2 x1 +

2 x1
3 6 2 x12

=0

aplicando el mtodo de Newton con un valor inicial de 1 se obtiene

de donde

x1 = 0.7905721355
x 2 = 1.258304599

y z = 2.214444568

La tabla 4 contiene una comparacin entre la solucin del problema lineal aproximado y
la solucin del problema original
34

Tabla 4
La precisin del mtodo puede mejorarse resolviendo dos problemas consecutivos, el
primero con menos divisiones en los intervalos de definicin de las variables (una
aproximacin no tan refinada) con el objetivo de determinar una aproximacin al
ptimo. El segundo, con divisiones ms finas, en un entorno del punto encontrado en el
primer problema, incluyendo las restricciones necesarias.

Algoritmos Genticos: un cambio de paradigma


A finales de los 50 y comienzos de los 60 del siglo pasado, bilogos evolutivos, en un
intento de simular los mecanismos de la evolucin biolgica, programaron los primeros
algoritmos que hoy se conocen como genticos. Sin embargo, en un primer momento no
pensaron que estas tcnicas podran emplearse en la solucin de problemas de bsqueda
u optimizacin. En 1965 surgi un desarrollo ms exitoso, cuando Ingo Rechenberg,
entonces de la Universidad Tcnica de Berln, introdujo una tcnica que llam estrategia
evolutiva. En esta tcnica no haba poblacin ni cruzamiento; un padre mutaba para
producir un descendiente, y se conservaba el mejor de los dos, convirtindose en el
padre de la siguiente ronda de mutacin.
En 1962 John Holland sent las bases para estudios posteriores sobre sistemas
adaptativos, tambin fue el primero en proponer explcitamente el cruzamiento y otros
operadores de recombinacin. Sin embargo, el trabajo fundamental en el campo de los
algoritmos genticos apareci en 1975, con la publicacin del libro Adaptacin en
Sistemas Naturales y Artificiales. Basado en investigaciones y publicaciones anteriores
del propio Holland y de colegas de la Universidad de Michigan, este libro fue el
primero en presentar sistemtica y rigurosamente el concepto de sistemas digitales
adaptativos utilizando la mutacin, la seleccin y el cruzamiento.
Un algoritmo gentico (AG) es una tcnica de programacin que imita a la evolucin
biolgica como estrategia para resolver problemas. Dado un problema especfico a
resolver, la entrada del AG es un conjunto de soluciones potenciales a ese problema,
codificadas de alguna manera, y una funcin de aptitud que permite evaluar
cuantitativamente a cada candidata. Estas candidatas pueden ser soluciones que ya se
sabe que funcionan, con el objetivo de que el AG las mejore, pero tambin pueden
haber sido generadas de manera aleatoria.
Luego el AG evala cada candidata de acuerdo con la funcin de aptitud. En un
conjunto de candidatas generadas de manera aleatoria, muchas tendrn desempeos
poco satisfactorios y sern eliminadas. Sin embargo, por puro azar, unas pocas pueden
ser prometedoras.

35

Estas candidatas prometedoras se conservan y se les permite reproducirse. Tambin se


realizan copias de ellas, pero las copias no son perfectas; se introducen cambios
aleatorios durante el proceso de copia (mutaciones). Esta descendencia constituye un
nuevo conjunto de soluciones candidatas que se convierte en una nueva entrada al AG.
Tras sucesivas generaciones (generalmente una gran cantidad) este proceso evolutivo
debe converger hacia una solucin ptima (hasta el momento esta ltima afirmacin es
heurstica).
Los conceptos de codificacin, cruzamiento y mutacin, as como algunas de las
ventajas de los AG sern discutidos de manera simultnea con la solucin de un
ejemplo.

Ejemplo 19 Maximizar
f ( x1 , x 2 ) = 21.5 + x1 sen(4x1 ) + x 2 sen(20x 2 )
Sujeto a

3 x1 12.1
4.1 x 2 5.8

Solucin: en primer lugar se hace una grfica de la funcin objetivo

Figura 15
En la figura 15 puede apreciarse la gran cantidad de mximos y mnimos relativos que
presenta la funcin en su dominio. El procedimiento clsico nos lleva a igualar las
derivadas parciales a cero, con lo cual se tiene el sistema no lineal
4 x cos(4 x) + sen(4 x) = 0
20 x cos(20 x) + sen(20 x) = 0

36

La tabla 5 contiene los resultados obtenidos al emplear el mtodo de Newton as como


los diferentes puntos iniciales usados en cada conjunto de iteraciones
Punto inicial (x, y)
Solucin encontrada
Clase de P. Est
-3
4.1 -0.390978477 1.025247045 Fuera del dominio
-2.5
4.5 -0.634922044 1.125225098 Fuera del dominio
-2.5
4.7 -0.634922044 1.175215524 Fuera del dominio
0
5
0 0.625404935 Fuera del dominio
5
5 0.634922044 0.625404935 Fuera del dominio
12.1
5.8 12.12552224 0.725349159 Fuera del dominio

Tabla 5

A pesar de que la grfica indica la existencia de una gran cantidad de ptimos en el


dominio, para todos los puntos iniciales dados el mtodo de Newton converge en puntos
que estn por fuera del dominio.
Ahora se mostrar la manera de emplear un algoritmo gentico para resolver el
problema.

Codificacin: la codificacin se hace mediante numeracin binaria (cadenas de bits).


Para el intervalo [a, b] con una precisin de cinco cifras decimales, se tiene un total de
(b a ) 10 5
puntos a codificar. Para ello se determina m tal que
2 m 1 < (b a ) 10 5 2 m 1
Lo cual puede hacerse fcilmente empleando logaritmos en base 2. Si x
[ a, b]
entonces x puede escribirse como x = a + (b - a) donde 0 1 (combinacin
convexa). El mayor valor decimal que puede tener una cadena de n bits es 2n 1, por
lo tanto 0 valor decimal(cadena n bits) / (2n 1) 1, entonces, para cualquier cadena
de n bits, se tiene que el nmero

x= a+

valor _ decimal (cadena n bits )


(b a )
2n 1

est en [a, b]. De esta manera se establece una relacin entre las cadenas de n bits y el
intervalo [a, b]. En el ejemplo, para el intervalo de x1 se tiene
(12.1 (3)) 10 5 = 151.000

log 2 (151.000) = 17.204189


entonces 217 < 151.000 218 1 con lo cual se necesitarn 18 bits para codificar el
intervalo [-3, 12.1]. De manera anloga, para el intervalo [4.1, 5.8] sern necesarios 15
bits. Se emplearn cadenas de 33 bits, los 18 primeros para x1 y los 15 restantes para x2.

37

Figura 16

Poblacin inicial: se emplear una poblacin inicial de 10 individuos generada de


manera aleatoria
1. 1 1 1 0 0 0 1 1 1 0 0 0 0 1 1 1 1 1 1 1 0 1 0 1 1 1 0 0 1 1 0 1 1
2. 0 1 0 1 0 1 1 0 1 0 1 0 0 1 1 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 1 0 0
3. 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1
4. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1
5. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0
6. 0 0 1 1 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0
7. 0 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0
8. 1 0 0 1 0 0 1 1 0 0 1 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1
9. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1
10. 1 0 0 0 0 1 0 0 1 1 0 1 1 1 1 1 1 0 0 0 1 0 1 0 1 1 0 1 0 1 1 1 1
Cada cadena de 33 bits es descompuesta en dos, una de 18 y otra de 15 bits
respectivamente y para cada una de ellas se calcula su valor decimal.
1. 232991
2. 88730
3. 31095
4. 237217
5. 66030
6. 53784
7.
6895
8. 150766
9. 134710
10. 136062

27547
6412
17829
5027
14262
22562
402
16493
14787
5551

Mediante la frmula

x= a+

valor _ decimal (cadena n bits )


(b a )
2n 1

cada nmero de la lista anterior es llevado al correspondiente intervalo de definicin. Se


obtiene:
1. 10.4208 5.52918
2. 2.11104 4.43266
3. -1.20886 5.02499
4. 10.6642 4.36081

38

5. 0.80347
6. 0.098074
7. -2.60283
8. 5.68445
9. 4.75959
10. 4.83746

4.83993
5.27055
4.12086
4.95568
4.86717
4.38799

Evaluacin: la funcin objetivo es evaluada en cada pareja para medir su desempeo.


1. f(10.4208 , 5.52918 ) = 18.0964
2. f(2.11104 , 4.43266 ) = 27.5072
3. f(-1.20886 , 5.02499 ) = 27.1225
4. f(10.6642 , 4.36081 ) = 28.1568
5. f(0.80347 , 4.83993 ) = 23.8611
6. f(0.098074 , 5.27055 ) = 16.5267
7. f(-2.60283 , 4.12086 ) = 27.9845
8. f(5.68445 , 4.95568 ) = 23.9393
9. f(4.75959 , 4.86717 ) = 16.638
10. f(4.83746 , 4.38799 ) = 14.1858

Seleccin: la aptitud de un individuo se determina de acuerdo a su comportamiento en


la funcin objetivo. Si se representa el desempeo de acuerdo a la longitud de un
segmento de recta se tiene, para el caso de 3 individuos

Figura 17

luego se escalan las cantidades para que la suma sea 1.

Figura 18

Se colocan los segmentos, uno a continuacin del otro, de manera que llenen el
intervalo [0, 1]. Acto seguido, se generan 10 nmeros aleatorios en [0, 1], el individuo
al que pertenece el intervalo en el cual cay el nmero generado de manera aleatoria
pasa a la siguiente generacin.

39

Figura 19
Para el caso de la figura 19 el individuo elegido para pasar a la siguiente generacin es
b.
Volviendo al ejemplo se tiene que la suma total de las imgenes es 224.018 y para cada
individuo su desempeo escalado (dividido por 224.018) es
1. 0.0807811
2. 0.12279
3. 0.121073
4. 0.12569
5. 0.106514
6. 0.0737738
7. 0.124921
8. 0.106863
9. 0.0742706
10. 0.0633242
Ahora se coloca un intervalo a continuacin del otro sumando sus longitudes
1. 0.0807811
2. 0.203571
3. 0.324644
4. 0.450334
5. 0.556848
6. 0.630622
7. 0.755542
8. 0.862405
9. 0.936676
10. 1
Se generan 10 nmeros aleatorios y de acuerdo a su valor se indica que individuo pasa a
la siguiente generacin.
1.
2.
3.
4.
5.
6.
7.

0.353679
0.562273
0.911527
0.865902
0.714621
0.378155
0.222755

40

4
6
9
9
7
4
3

8. 0.290262 3
9. 0.462966 5
10. 0.781793 8
Se tiene la nueva poblacin
1. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1
2. 0 0 1 1 0 1 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0
3. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1
4. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1
5. 0 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0
6. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1
7. 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1
8. 0 0 0 1 1 1 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1
9. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0
10. 1 0 0 1 0 0 1 1 0 0 1 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1

Cruce: por cada individuo se genera un nmero aleatorio en [0, 1], si el resultado es
menor que 0.25 (probabilidad de cruce) el individuo es elegido para ser cruzado. Si se
obtiene un nmero impar de padres se repite la eleccin. Por este mtodo fueron
elegidas para ser cruzadas las parejas 3 y 7, 8 y 10. El mecanismo de cruce se ilustra en
la figura 20.

Figura 20

Se determina de manera aleatoria un punto de corte y a partir de l las cadenas padres


intercambian sus bits para obtener las cadenas hijos. Los hijos reemplazan a los padres
en la poblacin. En este caso se seleccionaron los puntos de corte 5 y 11.
Poblacin luego del cruce de 3 con 7 (punto de corte 5) y 8 con 10 (punto de corte 11).
1.
2.
3.
4.
5.
6.
7.

111001111010100001001001110100011
001101001000011000101100000100010
100000100101110111100010110100101
100000111000110110011100111000011
000001101011101111000000110010010
111001111010100001001001110100011
000111111000110110011100111000011
41

8. 0 0 0 1 1 1 1 0 0 1 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1
9. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0
10. 1 0 0 1 0 0 1 1 0 0 1 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1

Mutacin: por cada gen (bit) se genera un nmero aleatorio, si resulta inferior a 0.01
(probabilidad de mutacin) el gen muta. El mecanismo de mutacin se ilustra en la
figura 21

Figura 19
y consiste simplemente en trocar el bit elegido de 0 a 1 o viceversa (puede hacerse
simplemente aplicando la frmula gen_nuevo = 1-gen_original). En este caso fue
elegido para mutar el gen 6 del cromosoma (individuo) 2.
Poblacin luego de la mutacin
1. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1
2. 0 0 1 1 0 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0
3. 1 0 0 0 0 0 1 0 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1
4. 1 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1
5. 0 0 0 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 0 0 1 0
6. 1 1 1 0 0 1 1 1 1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 1 1 0 1 0 0 0 1 1
7. 0 0 0 1 1 1 1 1 1 0 0 0 1 1 0 1 1 0 0 1 1 1 0 0 1 1 1 0 0 0 0 1 1
8. 0 0 0 1 1 1 1 0 0 1 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 1
9. 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 0
10. 1 0 0 1 0 0 1 1 0 0 1 1 1 1 0 1 1 1 1 0 0 0 1 0 1 1 0 1 0 0 1 0 1
Con la obtencin de esta nueva generacin termina una iteracin del algoritmo. Los
nuevos valores (convertidos al intervalo de definicin) y sus respectivas imgenes por la
funcin objetivo son:
1. f(10.6648 , 4.36109 )= 28.0581
2. f(-0.137743 , 5.27078 )= 16.5494
3. f(4.68953 , 5.02526 )= 29.755
4. f(4.7602 , 4.8674 )= 16.569
5. f(-2.60279 , 4.12111 )= 28.0005
6. f(10.6642 , 4.36108 )= 28.0984
7. f(-1.13902 , 4.86738 )= 18.3006
8. f(-1.20905 , 4.95594 )= 20.2886
9. f(0.803744 , 4.84019 )= 23.7965
10. f(5.68524 , 5.02522 )= 30.6572
Se ha ejecutado el algoritmo 3 veces y en cada una de ellas se han realizado 1000
generaciones (iteraciones), el resultado se muestra en la tabla 5

42

x
11.6302
11.629
11.6273

Obtenido en
f(x, y)
la iteracin
38.8278
381
38.6348
426
38.7508
490

y
5.7246
5.52438
5.72797

se ve que el punto ptimo se localiza alrededor de (11.6, 5.7) empleando este punto para
iniciar el mtodo de Newton se obtiene que el algoritmo converge al punto
(11.62554470, 1.425177726) el cual est fuera del dominio. Sin embargo, empleando el
punto inicial (11.6, 5.72) el algoritmo converge a (11.62554470, 5.725044244) y se
tiene que f (11.62554470, 5.725044244) = 38.85029448. Este hecho parece explicar
cual es la razn por la cual, a pesar de que la grfica revela la existencia de una gran
cantidad de ptimos, el mtodo de Newton converge a puntos por fuera del dominio, y
esta es que el valor inicial debe estar muy cerca del ptimo. Hemos encontrado as el
mximo global combinando el algoritmo gentico con la teora clsica.
Las probabilidades de cruce y mutacin no son restrictivas, al resolver un problema en
particular puede ejecutarse varias veces el algoritmo, variando estos parmetros y
observando los resultados.

Caractersticas de los algoritmos genticos


1.
2.
3.
4.

Son independientes del problema particular que se est resolviendo.


El proceso de mutacin evita que caigan en mnimos locales.
Son de fcil programacin.
Solo pueden emplearse cuando la optimizacin se restringe a un rea concreta.

43

Conclusiones
Durante el desarrollo del trabajo fue surgiendo, de manera natural, la necesidad de
emplear hojas de clculo, paquetes matemticos y lenguajes de programacin, para
lograr aplicar la teora desarrollada. Este hecho permite concluir que la PNL est
compuesta, fundamentalmente, de dos elementos complementarios: el anlisis
matemtico y la implementacin de algoritmos en herramientas informticas. La
carencia de uno de estos elementos, as este acompaada de una abundante dosis del
otro, tendr como consecuencia el fracaso de todo intento de lograr resultados
fructferos.
Otro elemento a tener en cuenta es el hecho de que los textos de clculo, y los cursos
que con base en ellos se dictan, en un afn pedaggico, emplean problemas artificiales,
esto es, problemas que no presentan dificultad alguna en el momento de aplicar la teora
para resolverlos. En el desarrollo del trabajo se ha hecho evidente que tales problemas
artificiales son la excepcin, y no la regla, en las aplicaciones reales. Este punto es
fundamental, pues el enfoque pedaggico encierra un peligro soterrado: que quien
aprende con l adquiere la certeza de estar dotado con las herramientas suficientes para
enfrentar cualquier tipo de problema. Esta certidumbre lo aleja de ver la necesidad de,
en el momento dado, completar por si mismo la teora para adaptarla a una situacin en
particular o en otras palabras, lo aleja de considerar la posibilidad de convertirse en
investigador.
Karl Popper en alguna ocasin afirm que: Los grandes progresos solo tienen lugar
cuando confluyen las disciplinas esta afirmacin motiva llamar la atencin sobre otra
gran carencia de la literatura sobre PNL: a diferencia de la forma como es tratada la PL
en la cual se muestran situaciones que al ser modeladas conducen a problemas lineales,
los textos de PNL se limitan, en la mayora de los casos, a proponer la optimizacin de
una funcin objetivo en presencia de algunas restricciones sin previamente mostrar la
realidad cuya modelacin condujo a ese planteamiento. Algunos mtodos, como el del
gradiente y el de Newton, necesitan comenzar a partir de un punto inicial. Un
conocimiento mas general sobre la realidad modelada permitira poder inferir la regin
en la cual debe ubicarse dicho punto inicial as como sacar conclusiones una vez
obtenida la solucin matemtica.
Resumiendo: la PNL es un rea fascinante, en la cual hay mucho por hacer. Los
requisitos para trabajar de manera exitosa en ella incluyen: conocimientos no
superficiales de anlisis matemtico y de algoritmia; dominio de herramientas
informticas; adems del conocimiento del rea en la cual surgen los problemas de
optimizacin.

44

Bibliografa

1. [All88] Allen W, Anlisis Numrico, Naucalpan de Jurez, Edo. de


Mjico: Prentice Hall (1988).
2.

[Apo77] Apostol Tom, Anlisis matemtico, Barcelona Espaa: Revert


(1977).

3. [Apo86] Apostol Tom, Calculus, Barcelona Espaa: Revert


(1986).
4. [Arm85]Armitano Orlando, Programacin no lineal, Mjico, D.F.: Limusa
(1985).
5. [Bur98] Burden Richard, Anlisis Numrico, Mjico, D.F.: Thomsom
(1998).
6. [Pra00] Prawda Juan, Mtodos y modelos de Investigacin de Operaciones,
Mjico, D.F.: Limusa (2000).
7. [Tah95] Taha Hamdy, Investigacin de Operaciones, Mjico, D.F.:
Alfaomega (1995).

45

También podría gustarte