Está en la página 1de 4

Examen Final del Curso LATEX Básico- Intermedio

Autor: Manuel Antonio Merino Huaman

1. Introducción
En este examen se evaluará todo lo aprendido durante la segunda parte del curso, es decir, desde la
clase 4 hasta la clase número 7.
El alumno deberá reflejar sus conocimientos adquiridos es el examen para ası́ poder ser evaluado sa-
tisfactoriamente. El uso de unidades seccionales, los paquetes correctos en el preámbulo y el uso entornos
de una manera correcta son claves para la calificación.

2. Problemas de Optimización en un Espacio Euclidiano


2.1. Un ejemplo de Problema de Optimización
Ejemplo 2.1 Supongamos que tenemos dos segmentos de recta u1 u2 y v1 v2 en el plano XY (ver figura
1). La distancia entre los dos puntos u ∈ u1 u2 y v ∈ v1 v2 esta denotado como d(u, v). Buscaremos los
puntos u∗ y v ∗ tales que la distancia d(u, v) se miniminice en (u∗ , v ∗ ) sobre las restricciones u ∈ u1 u2 y
v ∈ v1 v2 .
Este problema puede ser formulado como un problema de optimización. Los puntos u sobre el seg-
mento u1 u2 y v sobre v1 v2 pueden ser representados como

u = αu1 + (1 − α)u2 , α ∈ [0, 1] (1)


y
v = βv1 + (1 − β)v2 , β ∈ [0, 1] (2)
respectivamente. Ası́ la distancia entre u y v esta una función de (α, β)

f (α, β) = ku − vk2 = a11 α2 − 2a12 αβ + a22 β 2 + b1 α + b2 β + c, (3)


donde los coeficientes estan dados por

a11 = ku1 − u2 k2 , a12 = (u1 − u2 )T (v1 − v2 ), a22 = kv1 − v2 k2 ,


(4)
b1 = 2(u1 − u2 ) (u2 − v2 ), b2 = 2(v1 − v2 )T (v2 − u2 ),
T
c = ku2 − v2 k2 .
Nosotro debemos encontrar (α∗ , β ∗ ) en la que la función f (α, β) obtiene su mı́nimo. Debemos tener
en cuenta que las variables α y β están restringidos en el intervalo [0, 1]. Por lo tanto el problema puede
ser formulado como

min f (α, β) = a11 α2 − 2a12 αβ + a22 β 2 + b1 α + b2 β + c (5)


s.a 0 ≤ α ≤ 1, (6)
0 ≤ β ≤ 1, (7)

donde los coeficientes aij , i, j = 1, 2, bi , i = 1, 2 y c son dados por (4). Aquı́ ”min” significa ”mi-
nimizar”, y ”s.a.” significa ”sujeto a”. El problema principal es encontrar el minimizador (α∗ , β ∗ ) de la
función f (α, β) sobre las restricciones (6) y (7). Teniendo (α∗ , β ∗ ), los puntos u∗ y v ∗ con las distancia
más cercana se puede obtener

u∗ = α∗ u1 + (1 − α∗ )u2 v ∗ = β ∗ v1 + (1 − β ∗ )v2 (8)

1
Y

v2

v1 u2

u1

X
O

Figura 1: Dos segmentos de recta en R2

Lo que nos preocupa ahora es el problema (5) ∼ (7). Introduciendo a 2 dimensiones, x = (x1 , x2 ) =
(α, β)T , el problema puede ser reescrito como

min f0 (x) = a11 x21 − 2a12 x1 x2 + a22 x22 + b1 x1 + b2 x2 + c, (9)


s.a − x1 ≤ 0 (10)
x1 − 1 ≤ 0 (11)
− x2 ≤ 0 (12)
x2 − 1 ≤ 0 (13)

donde ai,j , i, j = 1, 2, bi , i = 1, 2 y c son constantes.

Teorema 2.1 Si S1 y S2 son conjuntos convexos, entonces la interseción es también un conjunto con-
vexo.

2.2. Funciones Convexas


Definición 2.1 (Función Convexa) Sea f una función definida sobre Rn . La función f es llamada una
función convexa sobre Rn si para cualquier par de puntos x1 , x2 ∈ Rn , el gráfico de f se encuentra
por debajo del segmento de recta determinado por (x1 , f (x2 )). Esto es, para cualquier λ ∈ [0, 1],

f (λx1 + (1 − λ)x2) ≤ λf (x1 ) + (1 − λ)f (x2 ). (14)

La función f es llamada estrictamente convexa sobre Rn si la desigualdad es estricta en (14) cuando


x1 6= x2 y λ ∈ (0, 1)

2
y y
(x2 , f (x2 ))
(x2 , f (x2 ))

(x1 , f (x1 ))

(x1 , f (x1 ))

O x1 x2 x O x1 x2 x

(a) Función Convexa (b) Función No Convexa

Figura 2: Ilustración geométrica de una función convexa y no convexa

Ejemplo 2.2 Suponga que la presión diastólica (sangre) y el nivel de colesterol son determinantes fuertes
de la enfermedad cardı́aca. Los registros clı́nicos de diez pacientes se enumeran en la Tabla 2.1. Aquı́,
yi = 1 indica que el i-ésimo paciente pertenece a la clase positiva que tiene enfermedad cardı́aca; yj = −1
(no 0) indica que el j-ésimo paciente pertenece a una clase negativa que no tiene enfermedad cardı́aca.
 T
(1) (1)
El registro clı́nico para el primer paciente es un vector bidimensional x1 = x1 , x2 = (73, 150)T
 T
(2) (2)
y y1 = −1, para el segundo paciente es x2 = x1 , x2 = (85, 165)T , y2 = −1, · · · y para el décimo
 T
(10) (10)
paciente es x10 = x1 , x2 = (110, 190)T , y10 = 1. El i-ésimo paciente corresponde a (xi , yi ) quien
es llamado un punto de entrenamiento; los diez puntos de entrenamiento consisten en un conjunto de
entrenamiento T
T = {(x1 , y1 ), (x2 , y2 ), · · · , (x10 , y10 )}. (15)

Cuadro 1: Reporte de 10 pacientes


Número de Presión Nivel de Tiene enferme-
Paciente Diastólica Colesterol dad del corazón
(x1 mmHg) x2 mg/dL (y)
(1) (1)
1 x1 = 73 x2 = 150 y1 = −1
(2) (2)
2 x1 = 85 x2 = 165 y2 = −1
.. .. .. ..
. . . .

(10) (10)
10 x1 = 110 x2 = 190 y10 = 1

El problema es que, dada la presión diastólica y el nivel de colesterol para un nuevo paciente (un
vector bidimensional x = (x1 , x2 )T ), cómo deducir si el paciente tiene enfermedad cardı́aca o no ( para
deducir si el y correspondiente es 1 o −1), basado en el conjunto de entrenamiento T .
Este es un problema de clasificación en el espacio bidimensional que se puede mostrar en la Figura
2.1. Cada paciente está representado por un punto de entrenamiento en el plano de coordenadas. La
ubicación del punto de entrenamiento i-ésimo corresponde al i-ésimo vector bidimensional xi , y si yi = 1,
es decir, el paciente tiene enfermedad cardı́aca, el punto se representa como ” + ”, de lo contrario ”
”. El nuevo paciente corresponde a un nuevo punto en el plano y el problema es deducir si este punto
pertenece a la clase positiva o negativa. En otras palabras, necesitamos separar el plano en dos regiones:
región A y región B; si el punto cae en la región A, pertenece a la clase positiva, de lo contrario a la
clase negativa. La clave es cómo separar el avión en dos regiones.

3
x2
+

190− + x10 (110, 190)


+ +

165− x2 (85, 165)

150− x1 (73, 150)



p p p p p p
60 70 80 90 100 110 x1

Figura 3: Datos para problemas cardiácos

Sabemos que cualquier lı́nea recta (w · x) + b = 0 (donde (w · x) es el producto de punto entre


w = (w1 , w2 )T y x = (x1 , x2 )T ) separará el plano en dos regiones: (w · x) + b > 0 y (w · x) + b < 0. Es
decir, podemos determinar el valor de y correspondiente de cualquier punto x por

y = f (x) = sgn((w · x) + b), (16)


Un valor de 1 indica la clase positiva y un valor de −1 la clase negativa.
En lugar de la función lineal (w · x) + b, sin embargo, podemos usar funciones no lineales con mucha
flexibilidad.

También podría gustarte