Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 2:
Caracterización de
máximos y mínimos
Para tratar de explicar del modo más fácil posible éste método, recordemos los siguientes
conceptos del cálculo variacional. Sea J una funcional diferenciable que mapea algún
conjunto del espacio de Hilbert H sobre los reales R , entonces a partir del concepto de
derivada direccional podemos establecer:
v́=−∇ J ( ẃ)
Lo cual quiere decir que si nos acercamos a un valor de t según una sucesión de valores,
generalmente se cumplirá que:
2
J ( ẃ−t ∇ J ( ẃ ) ) −J ( ẃ )=−t ‖∇ J ( ẃ )‖ + σ (t)
La cual es una sucesión monótona decreciente. Para el caso de una funcional como en
(3), una variación en J implica (forma reducida):
Si se satisfacen las condiciones dadas por (5) y (7), podremos escribir esta última
ecuación como:
t t T T
∂h ∂H ∂H
δJ = [ ∂ x́ ]
−λ δ x́ +∫ λ́+
t
{[
∂ x́ ] [ ]δ x́+
∂ ú
T
}
δ ú + [ f́ − x́ ] δt dt
Máximo Global y Local
De manera más general, los máximos y mínimos de un conjunto (como se define en teoría
de conjuntos) son los elementos mayores y menores en el conjunto, cuando existen. El
localizar valores extremos es el objetivo básico de la optimización matemática.
Análogamente se dice que el punto es un mínimo local de si existe un entorno
reducido de centro , en símbolos , donde para todo elemento de se
cumple .
Máximo absoluto de .
Análogamente, P es un mínimo absoluto de f si, para todo x distinto de perteneciente
al subconjunto A, su imagen es mayor o igual que la de . Esto es:
Uno de los teoremas de Fermat asegura que los óptimos de los problemas irrestrictos son
encontrados en los puntos estacionarios, donde la primera derivada de la función objetivo
es cero (o su gradiente nulo). De forma más general, también pueden ser encontrados en
los puntos críticos donde la primera derivada o el gradiente de la función objetivo no están
definidos, o en la frontera del conjunto de elección. Una ecuación (o conjunto de
ecuaciones) indicando que la(s) primera(s) derivada(s) es(son) igual(es) a cero en un
óptimo interior se llama una condición de primer orden o un conjunto de condiciones de
primer orden.
Dirección de Ascenso
Cada componente del gradiente le dice cuán rápido cambia su función con respecto a la
base estándar. No es demasiado descabellado entonces preguntarse, ¿cuán rápido
podría estar cambiando la función con respecto a alguna dirección arbitraria? Dejando
que v́ denotan un vector unitario, podemos proyectar a lo largo de esta dirección de forma
natural, es decir, a través del producto punto grad ( f ( a ) ) . ⃗v . Esta es una definición
bastante común de la derivada direccional.
Podemos entonces preguntar ¿En qué dirección es esta cantidad máxima? Recordará
que
Desde ⃗v es la unidad, tenemos ¿ grad (f )∨cos (θ) que es máximo cuando cos ( θ )=1 en
particular cuando ⃗v apunta en la misma dirección que grad (f (a)) .
Mientras la prueba de la primera derivada identifica los puntos que pueden ser extremos,
esta prueba no distingue si un punto es mínimo, máximo, o ninguno de los dos. Cuando la
función objetivo es dos veces diferenciable, estos casos pueden ser distinguidos
estudiando la segunda derivada o la matriz de las segundas derivadas (llamada matriz
Hessiana),en problemas irrestrictos, o la matriz de las segundas derivadas de la función
objetivo y las restricciones llamada la matriz Hessiana orlada, en problemas restrictos.
Las condiciones que distinguen a los máximos, o mínimos, de otros puntos estacionarios
son llamadas condiciones de segundo orden. Si un candidato a solución satisface las
condiciones de primer orden y las condiciones de segundo orden también, es suficiente
para establecer, al menos, optimalidad local.
Dada una función, f(x), se llama máximo o máximo absoluto al mayor valor que toma
dicha función. Se habla de máximo relativo, cuando se restringen los valores de la
variable a un cierto entorno de un determinado punto.
Por lo tanto:
A los puntos donde se anula la primera derivada se les conoce como puntos críticos, y en
ellos puede haber: un mínimo, un máximo o un punto de inflexión.
Si la función hasta ese punto crítico crece y a partir de él decrece, estaremos ante un
máximo, la función se dice que es convexa o cóncava negativa en este punto.
Tomando, ahora, dos puntos, tales que, (x0 - k), (x0 + k) ∈ E(x0); ∀ k > 0, entonces
el punto x0 es un máximo relativo si: f(x0 - k) < f(x0) > f(x0 + k).
Es decir, la función f presenta un máximo en el punto x0, si es creciente antes de
él, en (x0-k), y decreciente después del mismo, en (x0+k). Así, la pendiente de la
recta tangente en x0 será cero, en (x0-k) mayor que cero y en (x0+k) menor.
Si la función de referencia es derivable en un intervalo (a, b), tal que x 0 ∈ (a,b) y f
´(x0)=0 entonces f presenta un máximo en x0 si:
Matriz Hessiana
2. Calcular las primeras derivadas parciales de la función con respecto a cada una de
las variables que se tiene la función original.
5. Teniendo los puntos críticos que se encontraron en el paso 4, se tiene que calcular
las segundas derivadas parciales en el punto crítico de modo que asignemos los
valores de cada elemento de la matriz Hessiana, ya sea matriz 2 x 2 (si la función
es de 2 variables), 3 x 3 (si la función es de 3 variables), 4 x 4 (si la función es de 4
variables), n x n (si la función es de n variables).
Con el objetivo de explicar cada detalle con la mayor claridad posible, se expresa el
significado de cada uno de los elementos que aparecen dentro de la matriz:
Significa que se deriva la función original por primera vez con respecto a x y luego
ese resultado se deriva por segunda vez pero ahora con respecto a y.
Significa que se deriva la función original por primera vez con respecto a x y
luego ese resultado se deriva por segunda vez, pero ahora con respecto a z.
Significa que se deriva la función original por primera vez con respecto a y y
luego ese resultado se deriva por segunda vez, pero ahora con respecto a x.
Significa que se deriva la función original por primera vez con respecto a y y luego
ese resultado se deriva por segunda vez con respecto a y nuevamente.
Significa que se deriva la función original por primera vez con respecto a y y
luego ese resultado se deriva por segunda vez, pero ahora con respecto a z.
Significa que se deriva la función original por primera vez con respecto a z y
luego ese resultado se deriva por segunda vez, pero ahora con respecto a x.
Significa que se deriva la función original por primera vez con respecto a z y
luego ese resultado se deriva por segunda vez, pero ahora con respecto a y.
Significa que se deriva la función original por primera vez con respecto a z y
luego ese resultado se deriva por segunda vez con respecto a z nuevamente.
, , , …
Teorema de Taylor
f ' ' ( a) f (k ) ( a ) k k
f ( x )=f ( a ) + f ' ( a )( x−a )+ ( x−a)2 +…+ ( x−a ) +h k ( x ) ( x −a ) ,
2! k!
Con lim
x→ a
hk ( x ) =0. Esta es la llamada forma de Peano del resto.
El polinomio que aparece en el teorema de Taylor,
Rk ( x )=f ( x )−P k ( x ) ,
k
Rk ( x )=o (|x−a| ) , x → a .
Una función que es cóncava es a menudo también llamada cóncava hacia abajo, mientras
que una función convexa es llamada cóncava hacia arriba.
f ( x +2 y ) ≥ f ( x) +2f ( y )
Para cualquier x e y en C.