Está en la página 1de 32

Teora de Juegos

Terminologa bsica
Jugadores. Son los participantes en el juego que toman decisiones con el fin de maximizar su utilidad. Son dos o ms. Acciones de cada jugador. Son las decisiones que puede tomar cada jugador en cada momento en que le toque jugar. El conjunto de acciones de un jugador en cada momento del juego puede ser finito o infinito. Resultados del juego. Son los distintos modos en que puede concluir un juego. Cada resultado lleva aparejadas unas consecuencias para cada jugador. Pagos. Cada jugador recibe un pago al acabar el juego, que depende de cul haya sido el resultado del juego. El significado de dicho pago es la utilidad que cada jugador atribuye a dicho resultado, es decir, la valoracin que para el jugador tienen consecuencias de alcanzar un determinado resultado en el juego. Estrategias. Perfiles de estrategias. Una estrategia de un jugador es un plan completo de acciones con las que ste podra proponerse participar en dicho juego. Un perfil de estrategias es un conjunto de estrategias, una por cada jugador. Forma estratgica y forma extensiva. Son formas de describir un juego. Ambas especifican los jugadores, las acciones y los pagos. La forma estratgica (o forma normal) organiza la descripcin en forma rectangular, centrando su nfasis en las estrategias de los jugadores (como si stos fueran capaces de tomar todas sus decisiones de una vez), mientras que la forma extensiva lo hace en forma de rbol, resaltando la secuencia del juego, es decir, la manera en que se desarrollan o podran desarrollarse las acciones de los jugadores para alcanzar los posibles resultados del juego.

Juegos de dos personas y suma cero


En stos juegos participan slo dos adversarios o jugadores. Son llamados juegos de suma cero porque un jugador gana lo que el otro pierde, de manera que la suma de sus ganancias netas es cero. En general, general un juego de dos personas se caracteriza por: Las estrategias del jugador 1. Las estrategias del jugador 2. La matriz de pagos.

Un objetivo primordial de la teora de juegos es desarrollar criterios racionales para seleccionar una estrategia, los cuales implican dos supuestos importantes: 1. Ambos jugadores son racionales. 2. Ambos jugadores eligen sus alternativas slo para promover su propio bienestar (sin compasin por el oponente).

Enfoque de la Estrategia Dominada Una estrategia es dominada por una segunda estrategia si esta ltima es siempre al menos tan buena como la primera, sin que importe lo que haga el oponente. Enfoque del Criterio Minimax Se trata de un lnea de razonamiento en que cada jugador debe jugar de tal manera que minimice su prdida mxima, siempre que el resultado de su eleccin no pueda ser aprovechado por su oponente para mejorar su posicin. Este es un criterio estndar que propone la teora de juegos para elegir una estrategia.

Juegos de estrategia mixta Los juegos de estrategia mixta no tienen un punto de silla de montar (el valor minimax de un jugador no es igual al maximn del otro).

Enfoque Grfico para solucin de juegos

Solucin de juegos con programacin lineal

Cadena de Markov
La cadena de Markov es un tipo especial de proceso estocstico que tiene la propiedad particular de que las probabilidades que describen la forma en que el proceso evolucionar en el futuro dependen slo del estado actual en que se encuentra el proceso, por lo tanto, son independientes de los eventos que ocurrieron en el pasado.

Estados
Los estados son la caracterizacin de la situacin en que se halla el sistema en un instante dado, la cual puede ser tanto cuantitativa como cualitativa. El estado de un sistema en un instante t es una variable cuyos valores solo pueden pertenecer al conjunto de estados en el sistema. El sistema modelizado por la cadena, por lo tanto, es una variable que cambia con el valor del tiempo, cambio al que llamamos transicin.

Matriz de transicin

Una matriz de transicin es el arreglo numrico donde se encuentran las probabilidades de un estado a otro. Dicha matriz es cuadrada con tantas filas y columnas como estados que tiene el sistema, y los elementos de matriz representan la probabilidad de que el estado prximo sea el correspondiente a la columna si el estado actual es el correspondiente a la fila.

Matriz de transicin
La matriz debe cumplir con ciertos requisitos: La suma de las probabilidades de los estados debe ser igual a 1, la matriz de transicin debe ser cuadrada las probabilidades de transicin deben estar entre 0 y 1.

Diagrama de transicin

Tipos de estados.
Estado estable.
Se puede decir que el estado estable es la distribucin de probabilidades que en cierto punto quedar fija para el vector P y no presentar cambios en perodos posteriores.

Estado absorbente. Estado transitorio.

Un estado se llama estado absorbente si, despus de haber entrado ah, el proceso nunca saldr de l. Por consiguiente, el estado i es un estado absorbente si y solo si Pij= 1. Un estado se llama estado transitorio si, despus de haber entrado a este estado, el proceso nunca regresa a l.

Estado recurrente.

Se dice que un estado es recurrente si, despus de haber entrado a este estado, el proceso definitivamente regresara a ese estado. Por consiguiente, un estado es recurrente si y solo si no es transitorio.

Propiedad de Markov
Una cadena de Markov es una secuencia X1, X2,X3,... de variables aleatorias. El valor de Xn es el estado del proceso en el tiempo n. Si la distribucin de probabilidad condicional de Xn+1 en estados pasados es una funcin de Xn por s sola, entonces:

Donde xi es el estado del proceso en el instante i. Esta identidad es la denominada propiedad de Markov : El estado en n + 1 slo depende del estado en n y no de la evolucin anterior del sistema .

Programacin dinmica

Programacin dinmica
La programacin dinmica es una tcnica matemtica til para la resolucin de problemas de optimizacin donde una solucin est formada por una serie de decisiones. La programacin dinmica no slo tiene sentido aplicarla por razones de eficiencia, sino porque adems presenta un mtodo capaz de resolver de manera eficiente problemas cuya solucin ha sido abordada por otras tcnicas y ha fracasado.

Programacin dinmica (Cont)


La programacin dinmica se basa en el principio de optimalidad de Bellman: En una secuencia de decisiones ptimas toda subsecuencia ha de ser tambin ptima. La efectividad de esta tcnica consiste en resolver los llamados subproblemas almacenando estos resultados en una tabla, calculando primero las soluciones para los problemas pequeos, y llegando hasta el tamao deseado con un proceso iterativo. Con esto se pretende evitar la repeticin de clculos para problemas ms pequeos.

Requerimientos
Para que un problema pueda ser abordado por esta tcnica ha de cumplir dos condiciones: La solucin al problema ha de ser alcanzada a travs de una secuencia de decisiones, una en cada etapa. Dicha secuencia de decisiones ha de cumplir el principio de optimalidad.

Aplicacin del algoritmo


El algoritmo de programacin dinmica consta de los siguientes pasos: Planteamiento de la solucin como una sucesin de decisiones y verificacin de que esta cumple el principio de optimalidad. Definicin recursiva de la solucin.

Clculo del valor de la solucin ptima mediante una tabla en donde se almacenan soluciones a problemas parciales para reutilizar los clculos.
Construccin de la solucin ptima haciendo uso de la informacin contenida en la tabla anteriormente establecida.

Ejemplo de la ruta ms corta

Descomposicin del problema en etapas

Etapa 1:
1-4 = 5

Etapa 2: 4-5 = 7

Etapa 3: 5-7 = 9

3
Ruta mas corta = 21

Ecuacin recursiva:

Etapa 3:

Etapa 2:

Etapa 1

Solucin final

Ruta ms corta: 1 4 5 7

Distancia asociada : 21 millas