Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Programación Dinámica y
Teoría de Juegos
Integrantes:
Ali Parra, Argenis Alejandro
V-27.920.045
Bustamante Villamizar, Jaime Alexis
V-22.677.673
Dueñez Contreras, Valeria Andrea
V-26.289.030
Jaimes Moreno, Yuliana Alexandra
V-28.061.967
Prato Miranda, Merly Loreidy
V-27.052.295
Mayo, 2020
1
Índice de Contenido
INTRODUCCIÓN…………………………………………………………………….3
CONCEPTOS BÁSICOS PROGRAMACIÓN DINÁMICA…………………………4
CARACTERÍSTICAS DE LA PROGRAMACIÓN DINÁMICA……………………4
RESOLUCIÓN DE UN PROBLEMA DE PROGRAMACIÓN DINÁMICA………..5
EJERCICIO CLÁSICO DE PROGRAMACIÓN DINÁMICA: EL VIAJERO……….5
DEFINICIÓN TEORÍA DE JUEGOS……………………………………………….11
CONCEPTOS BÁSICOS DE TEORÍA DE JUEGOS……………………………….11
CARACTERÍSTICAS DE TEORÍA DE JUEGOS…………………………………..12
EJERCICIOS DE TEORÍA DE JUEGOS……………………………………………13
- JUEGOS DE SUMA CERO O SUMA CONSTANTE………………………13
- JUEGO DE SUMA NO CERO O SUMA VARIABLE……………………...14
CONCLUSIÓN………………………………………………………………………19
REFERENCIAS BIBLIOGRÁFICAS……………………………………………….20
2
Introducción
El juego es una de las principales actividades que realizamos todos y cada uno de
nosotros desde nuestra infancia. La Teoría de Juegos ha demostrado una gran
versatilidad para la resolución de problemas actuales. Partió de la Teoría Económica y
la Teoría Matemática para estudiar la interacción entre los agentes económicos y
analizar el resultado que tendrían sobre los participantes. En términos generales,
podemos decir que la Teoría de Juegos estudia los dilemas que se le presentan al
hombre en la vida cotidiana.
3
Programación Dinámica
Variables de decisión: son aquellas sobre las cuales se debe definir su valor, de modo
que se pueda optimizar el beneficio acumulado y modificar el estado de la próxima
etapa.
Relación recursiva: es el producto que provoca una fórmula que pertenecen a varios
valores de S basado en el principio de optimalidad.
4
de control (elecciones) durante un período inicial, las variables de control (o de
decisión) elegidas durante el período restante debe ser óptimo para el problema
restante, siendo la condición inicial el estado resultante de las primeras
decisiones tomadas.
Ejercicio 1:
5
Cada nodo representa una ciudad, los números en las líneas es la distancia entre una
ciudad y otra.
Donde,
dk= variable de decisión k que refleja a que punto nos dirigimos en la etapa k. (destino)
f*= optimo ( en este caso como hablamos de distancia el óptimo será el valor mínimo)
Paso 1:
Dividimos la cantidad de etapas. Cada etapa será una intersección entre los nodos
existentes que pueden ser origen o destino dependiendo de la etapa donde nos
encontremos.
N=3 etapas.
6
Paso 2:
Planteamos la etapa 1
N=1
3 18 18 8
6 40 40 8
7 9 9 8
7
Paso 3:
N=2
2 - -
4 -
5 -
Los guiones en los recuadros representan que no existe comunicación entre nodos. Por
ejemplo, nos fijamos en la imagen del nodo 2 al 6 no hay ningún enlace, lo mismo
ocurre del 2 al 7, del 4 al 7 y del 5 al 3, por lo tanto, inhabilitamos la casilla.
8
S2/d2 3 6 7 f2* d2*
2 28 - - 28 3
4 38 49 - 38 3
5 - 44 24 24 7
f2*(2,3)= 10+18=28
F2*(4,3)= 20+18=38
F2*(4,6)= 9+40=49
F2*(5,6)= 4+40=44
F2*(5,7)= 15+9=24
N=3
9
S3/d3 2 4 5 f3* d3*
1 35 63 29 29 5
F3*(1,2)= 7+28=35
F3*(1,4)= 25+38=63
F3*(1,5)= 5+24=29
Después de tener todas las etapas procedemos a realizar la interpretación, para ello
necesitamos las tres tablas bien desarrolladas.
10
Teoría de Juegos
Concepto de Jugadores: son los individuos que toman las decisiones tratando de
obtener el mejor resultado posible.
Concepto de Acción: es una de las opciones que el jugador tiene disponible para
alcanzar el objetivo buscado.
11
Concepto de Resultados: son las conclusiones que el moderador obtiene una vez se
ha llevado a cabo el juego.
Equilibrio de Nash: es una situación en la cual todos los jugadores han puesto en
práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas
las estrategias de los otros. Consecuentemente, ningún jugador tiene ningún incentivo
para modificar individualmente su estrategia.
Matriz de Pagos: es una matriz que resume la información dada por las funciones de
pago en un juego rectangular o en un juego extensivo en su forma normal.
12
Ejercicios de Teorías de Juegos
Juegos de Suma Cero o Suma Constante: son juegos en que los intereses de los
jugadores son contrapuestos. La ganancia para un jugar siempre se equilibra
exactamente por una perdida correspondiente para el otro jugador. Por lo tanto, la
perdida de cada jugador es igual al beneficio de su contrincante. A su vez la forma más
sencilla de resolución de juegos de suma cero es la siguiente:
➢ MAXIMIN-MINIMAX. EJEMPLO:
JUGADOR B
Estrategias 1 2 3 maximin
1 1 4 -1
JUGADOR A
2 1 -3 -2
3 3 3 2
minimax
Paso 1.
• Estrategia 1: -1
• Estrategia 2: -3
• Estrategia 3: 2
• Estrategia 1: 3
• Estrategia 2: 4
• Estrategia 3: 2
JUGADOR B
Estrategias 1 2 3 maximin
1 1 4 -1 -1
JUGADOR A 2 1 -3 -2 -3
3 3 3 2 2
minimax 3 4 2
13
Paso 2.
Paso 3.
Por lo tanto, quiere decir que provienen de la misma celda y ocurre un punto de
equilibrio.
JUGADOR B
Estrategias 1 2 3 maximin
1 1 4 -1 -1
JUGADOR A 2 1 -3 -2 -3
3 3 3 2 2
minimax 3 4 2
Juegos de Suma No Cero o Suma Variable: son juegos donde no existen resultados
simples, donde un jugador gana y el otro pierde. Sino que existen otras posibilidades:
✓ Juegos en los que uno de los oponentes gana y el otro pierde: ganar-perder.
14
➢ MAXIMIN. EJEMPLO:
En la siguiente tabla se muestran 2 prisioneros por un mismo delito con las siguientes
opciones que se encuentran distribuidas de la siguiente manera:
PRISIONERO 2
Minimo
Estrategias Delata No delata
Prisionero 2
Delata (-7,-7) (0,-10)
PRISIONERO 1
No Delata (-10,0) (-1,-1)
Minimo
Prisionero 1
Paso 1.
PRISIONERO 2
Minimo
Estrategias Delata No delata
Prisionero 2
PRISIONERO 1 Delata (-7,-7) (0,-10) -10
No Delata (-10,0) (-1,-1) -1
Minimo
-10 -1
Prisionero 1 15
Paso 2.
Paso 3.
Por lo tanto, quiere decir que provienen de la misma celda y ocurre un punto de
equilibrio.
PRISIONERO 2
Minimo
Estrategias Delata No delata
Prisionero 2
PRISIONERO 1 Delata (-7,-7) (0,-10) -10
No Delata (-10,0) (-1,-1) -1
Minimo
-10 -1
Prisionero 1
16
➢ Estrategias Dominadas. EJEMPLO:
En la siguiente tabla se muestran 2 prisioneros por un mismo delito con las siguientes
opciones que se encuentran distribuidas de la siguiente manera:
PRISIONERO 2
Estrategias Delata No delata
PRISIONERO 1 Delata (-7,-7) (0,-10)
No Delata (-10,0) (-1,-1)
Paso 1.
PRISIONERO 2
Estrategias Delata No delata
PRISIONERO 1 Delata (-7,-7) (0,-10)
No Delata (-10,0) (-1,-1)
17
Paso 2.
Resultado: punto de equilibrio donde los dos cumplirían condena por 7 años (-7,-7).
PRISIONERO 2
Estrategias Delata No delata
PRISIONERO 1 Delata (-7,-7) (0,-10)
No Delata (-10,0) (-1,-1)
18
Conclusión
La razón del éxito de la Teoría de Juegos es que la gente se dio cuenta que,
en escenarios muy diversos, siempre es más útil emplear el pensamiento formal y
sistemático, ante cualquier interacción estratégica.
19
Bibliografía
20