Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los inventarios, existencias o stocks son los materiales que la empresa tiene almacenados para
facilitar la continuidad del proceso productivo.
La gestión de inventarios tiene como objetivo determinar la cantidad de existencias que se han de
mantener y el ritmo de pedidos para cubrir las necesidades de producción.
TIPOS DE EXISTENCIAS
- Productos semiterminados: productos que la empresa fabrica pero no destina a la venta hasta
otra posterior elaboración
- Obtener grandes descuentos: al comprar materiales en gran cantidad y reducir costes totales
Costes de ruptura de stocks: costes que tiene la empresa cuando se queda sin existencias, no
puede producir o no puede entregar el pedido a un cliente.
LOGISTICA DE APROVISIONAMIENTO
COMPRA
(Inventarios de MP)
LOGISTICA DE OPERACIONES
PRODUCCION
(Inventarios en proceso)
LOGISTICA DE DISTRIBUCION Y
TRANSPORTE
COMERCIO Y VENTAS
(Inventarios productos terminados)
MODELOS DE INVENTARIOS
D(anual)= 12000
Q(cantidad a pedir) Número de veces que voy a Tiempo e que las cantidades
pedir (N=D/Q) pedidas llegan a cero (t=Q/D)
1000 12 1/12
2000 6 1/6
3000 4 1/4
4000 3 1/3
6000 2 1/2
12000 1 1
Como podemos ver en la gráfica las cantidades Q descienden hasta cero en un tiempo t 1,
entonces la relación entre las cantidades pedidas y el tiempo en que consumen está dado por
el área de la región sombreada y representa la cantidad total de inventario existente en un
intervalo de tiempo:
t 1∗Q
2
Entonces la ecuación que representa este modelo de compra C(Q) por periodo es:
t 1∗Q
C(Q)= Cu*Q + Cp + Cmi*( 2 )
Donde:
t 1∗Q
N*(C(Q))= [Cu*Q + Cp + Cmi*( 2 )]*N
D D t 1∗Q D
CTA(Q)= Cu*Q* Q + Cp * Q + Cmi*( 2 )* Q
2 Cp∗D
Q´=
√ Cmi
Con esta ecuación podemos hallar las cantidades optimas que podemos pedir (productos,
materiales, etc.) minimizando los costos totales.
Es normal que ocurran pequeños faltantes cuando por ahorrar dinero en el tiempo de
preparación se pida un lote que no alcance para cubrir todo el ciclo. Sin embargo también
existirá un costo asociado a los faltantes, que llevará a que estos no sean excesivos.
t 1∗Imax∗Cmi t 2∗S∗Cf
C(Q;S)=Cu*Q + Cp + 2
+ 2
Donde:
Imax= (Q-S)
Se hace una relación de triángulos para hallar t1 y t2 en función de las variables Q y S, con
estos tenemos las siguientes relaciones:
t 1 Imax
=
t Q
( Q−S )
∗Q
Q
t 1=
D
Q−S
t 1=
D
t2 S
=
t Q
S
∗Q
Q
t 2=
D
S
t 2=
D
Ahora esta ecuación la multiplicamos por N para que nos dé el costo total y posteriormente la
derivamos para optimizarla, como podemos darnos cuenta tenemos dos variables (Q, S) que son
justo lo que necesitamos optimizar para disminuir los costos, entonces derivamos parcialmente:
Derivada con respecto a S:
SCf
Q= +S
Cmi
SCf
( Q−S )=
Cmi
SCf SCf 2
0=
−CpD Cmi
+
( )
∗Cmi
−
Cmi ( )
∗Cmi
−
S 2 Cf
Q2 Q 2 Q2 2 Q2
Simplificando
S 2∗Cf 2 S2 Cf
−CpD +SCfQ− − =0
2Cmi 2
S 2 Cf Cf
−CpD +SCfQ−
2 (∗
Cmi )
+1 =0
Cf S2 Cf Cf
S2 Cf ∗( Cmi
+1 −) 2
∗
Cmi ( )
+1 =CpD
S 2 Cf Cf
2
∗ (
Cmi )
+ 1 =CpD
S 2 Cf Cf +Cmi
2
∗ (
Cmi
=CpD )
Cmi
2
S=
( Cf +Cmi )
∗2 CpD
Cf
Organizando
S= 2 (√ Cf2(Cmi+Cf
CmiCpD
))
MODELO LEP (SIN FALTANTES)
En este caso se prohíben los faltantes, estableciendo el costo por faltantes como infinito. Las
condiciones para el aprovisionamiento instantáneo de los suministros se modifican ligeramente
cuando los mismos se manufacturan al recibir la orden, en vez que se surtan de existencias de
artículos ya manufacturados. La diferencia está en que los suministros se embarcan
instantáneamente conforme se manufacturan.
El gasto principal de adquisición es el costo de preparación cuando una empresa produce sus
propios suministros.
d
Imax= Q(1 - R )
Cmi (t 1+ t 2 )I max
C(Q)= CuQ + Cop +
2
d
Reemplazando los valores de (t1+t2) por t y el Imax por Q(1 - R ) tenemos:
Cmi (t) d
C(Q)= CuQ + Cop + 2 (
Q 1−
R )
Q
Ahora como t = la ecuación final será:
R
Cmi Q2 d
C(Q)= CuQ + Cop +
2D (
1−
R )
Multiplicando por N=D/Q para hallar el costo total de los pedidos (CTA):
D Cmi Q d
( )
CTA(Q)= CuD + C op Q + 2
1−
R ( )
Ahora derivamos la ecuación con respecto a Q:
dCTA −Cop D C mi d
dQ
=
Q 2
+
2
1−
R ( )
Igualando a cero y despejando Q tenemos:
2 C op D
Q=
√ C mi 1− ( d
R )
Esta es la expresión final que nos da las cantidades óptimas de Q a pedir.
Los parámetros de la función de costo total son similares a las del modelo EOQ.
En lugar del Costo de ordenar, existe un costo de setup fijo para el costo de la corrida
producción corrida (Cop).
Además, se necesita conocer la tasa de producción anual (R) en el modelo.
Tenemos que la ecuación que representa el costo de este modelo es:
Cmi C
C(Q;S)= CuQ + Cop + (t1+t2)Imax + f (t3+t4)S (1)
2 2
Donde:
S=t3D (4)
S=t4(R-d) (5)
t1+t4=Q/R (6)
Para deducir la ecuación de costo total debemos reemplazar t1 , t2 , t3 , t4 e Imax por las
variables que conocemos en función de Q y S:
Q
t1= −t
R 4
De la ecuación 5 despejamos t4 y lo reemplazamos en la ecuación anterior:
Q S
t1= −
R R−d
t1(R-d)=(R-d) ( QR − R−d
S
)
Imax
Reduciendo términos nos quedaría finalmente:
d
(
Imax= Q 1− R )−S (7)
Cmi 1 1 C S2 1 1
C(Q;S)= CuQ + Cop + (
2 R−d D )
+ ¿ Imax)2 + f
2
+
D R−d ( )
Reemplazamos ahora la ecuación que representa el inventario máximo en la función de costos
anterior:
2
Cmi 1 1 d Cf S2 1 1
C(Q;S)= CuQ + Cop + ( +
2 R−d D
Q 1− −S
R )[ ( ) ] +
2 (
+
D R−d )
Multiplicando por N=D/Q tenemos la función de costo total a derivar:
2
Cop D Cmi D 1 1 d Cf S2 D 1 1
CTA(Q;S)= CuD +
Q
+ ( +
2Q R−d D
Q 1− −S
R )[ ( ) ]+ (
2 Q D R−d
+ )
dCTA −Cmi D 1 1 d C f SD 1 1
dS
=
Q
+
R−d D (
Q 1− −S
R )[ ( ) ] +
Q ( +
D R−d )
Igualando a cero y factorizando tenemos:
d Cf
(
Q 1−
R
=S 1+ ) (
C mi ) (8)
Cf R
Q=S 1+ ( C mi )( )
R−d
dCTA −Cop D
dQ = Q2
2
−Cmi D 1 1 d C D 1 1 d d
2Q 2
+
R−d D )[ (R(
Q 1− −S + mi +
Q R−d D
Q 1− −S 1−
R R ) ] ( )[ ( ) ]( )
2
−C S D 1 1
2Q (
f
D R−d )
+2
2
−Cmi 1 1 d 1 1 d d
0= −C op
2
+
R−d D( R )[ (
Q 1− −S + Cmi Q +
R−d D )
Q 1− −S 1−
R R ] ( )[ ( ) ]( )
−C f S 2 1 1
2
+
D R−d ( )
Dividiendo entre ( D1 + R−d
1
):
−Cop 2
−Cmi d d d −C f S 2
0=
( 1
+
R−d D
1
) 2 [( ) ]
Q 1− −S +Cmi Q Q 1− −S 1−
R R R [ ( ) ]( ) 2
d
(
Q 1−
R )
d
De la ecuación 8 reemplazamos Q 1− ( R):
2
−Cop D ( R−d ) −Cmi C C C −C f S 2
0=
( R−d + D ) 2 Cmi [( ) ] [( ) ]( )
S 1+ f −S +Cmi S 1+ f −S S 1+ f
C mi Cmi 2
2 C op D R−d Cmi
S=
√ Cf √ √
R−d+ D C f +C mi
2 C op D R−d Cmi
S=
√ Cf √ √ R−d+ D C f +C mi
2 C op D R−d C mi
S=
√ Cf √ √ R C f +C mi
2 C op D D C mi
S=
√ Cf
1−
√ √
R C f +Cmi
2 Cp∗D
Q´=
√ Cmi
Donde:
Para dar respuesta a esta situación se propone seguir los siguientes pasos:
PASO 1: Determinar el tamaño óptimo de pedido (Q*) para cada nivel o quiebre de precios.
PASO 2: Ajustar la cantidad a pedir en cada quiebre de precio en caso de ser necesario. En
nuestro ejemplo para el tramo 1 Q(1)=700 unidades esta en el intervalo por tanto se mantiene;
para el tramo 2 Q(2)=714 está por debajo de la cota inferior del intervalo, por tanto se
aproxima a esta cota quedando Q(2)=1.000; finalmente en el tramo 3 Q(3)=718 que también
está por debajo de la cota inferior del intervalo, por tanto se aproxima a esta cota quedando
Q(3)=2.000
PASO 3: Calcular el costo asociado a cada una de las cantidades determinadas (utilizando la
fórmula de costo total presentada anteriormente)
Se concluye que el tamaño óptimo de pedido que minimiza los costos totales es 1.000
unidades, con un costo total anual de $24.725.
MODELO CON DEMANDA PROBABILÍSTICA
Cu rv a de dist ri bu ci ón n ormal: P( Z ≤ a)
Anteriormente se asociaba este modelo con el método de las urnas, en el cual las unidades para
un producto se colocaban en dos urnas. La capacidad de una es igual al punto de reorden. Las
unidades se extraen primero de la otra urna. Una vez que este contenedor se vacía es señal para
colocar un pedido nuevo. Durante el tiempo de entrega hasta que se recibe el nuevo pedido, las
unidades son extraídas de la primea urna, como una especie de stock de seguridad.
Éste modelo se basa en los criterios “R”, el cual se identifica como punto de reorden y “Q”, que
denota la cantidad a ordenar.
Una política de inventario basada en estos dos números críticos es sencilla. Siempre que el nivel de
inventario de un producto baje a “R” unidades, se coloca una orden de “Q” unidades para
reabastecer el inventario.
Las suposiciones que se deben cumplir al aplicar este modelo según Hillier y Liberman son:
1. Cada aplicación se refiere a un solo producto. Lo que significa que no se pueden incluir dos o
más productos a la vez.
2. El nivel de inventario está bajo revisión continua, por lo que su valor actual se conoce.
3. Debe usarse una política (R,Q), entonces las únicas decisiones que deben tomarse son las
selecciones de R y Q.
5. La demanda para retirar unidades del inventario y venderlas durante este tiempo de entrega es
incierta. Sin embargo, se conoce o se puede estimar la distribución de probabilidad de la
demanda.
8. Se incurre en un costo de mantener (denotado por h) por cada unidad en inventario por unidad
de tiempo.
9. Cuando ocurren faltantes, se incurre en un costo por faltantes (denotado por p) por cada unidad
que falta por unidad de tiempo hasta que se satisface la demanda pendiente.
Un enfoque común para elegir el punto de reorden R se basa en el nivel deseado por la
administración de servicio al cliente, el cual se puede definir de varias formas, como se describe a
continuación:
Nivel de servicio: Probabilidad de que no ocurra un faltante durante el tiempo de entrega. Por
ejemplo, un nivel de servicio de 90% significa que existe la posibilidad de 10% de un faltante de
almacén.
REGLAS DE LOS INVENTARIOS
Un conjunto pequeño de ítems concentran el costo mayor en el total de los inventarios. Este es el
principio de Paretto aplicado a los inventarios, es decir, existen prioridades en inventario.
CLASIFICACION ABC
Estos artículos no son necesariamente ni los de mayor precio unitario, ni los que se consumen en
mayor proporción, sino aquellos cuyas valorizaciones (precio unitario x consumo o demanda)
constituyen % elevados dentro del valor del inventario total.
Generalmente sucede que, aproximadamente el 20% del total de los artículos, representan un
80% del valor del inventario, mientras que el restante 80% del total de los artículos inventariados,
alcanza el 20% del valor del inventario total.
El gráfico ABC (o regla del 80/20 o ley del menos significativo) es una herramienta que permite
visualizar esta relación y determinar, en forma simple, cuáles artículos son de mayor valor,
optimizando así la administración de los recursos de inventario y permitiendo tomas de decisiones
más eficientes.
Según este método, se clasifican los artículos en clases, generalmente en tres (A, B o C),
permitiendo dar un orden de prioridades a los distintos productos:
ARTICULOS A: Los más importantes a los efectos del control.
La designación de las tres clases es arbitraria, pudiendo existir cualquier número de clases.
También el % exacto de artículos de cada clase varía de un inventario al siguiente. Los factores más
importantes son los dos extremos: unos pocos artículos significativos y un gran número de
artículos de relativa importancia. Esta relación empírica formulada por Vilfredo Pareto, ha
demostrado ser una herramienta muy útil y sencilla de aplicar a la gestión empresaria. Permite
concentrar la atención y los esfuerzos sobre las causas más importantes de lo que se quiere
controlar y mejorar.
• Las ventas de la empresa y los clientes con los que se efectúan las mismas (optimización de
pedidos).
Los beneficios de la empresa y los artículos que los producen (determinar aquellos productos que,
teniendo una alta penetración en el mercado -facturación-, disponen de baja rentabilidad;
detectar por prioridades aquellos productos que, teniendo una baja penetración-
comercialización- disponen de alta rentabilidad).
Ejemplo de aplicación
A continuación se desarrollará un ejemplo que permitirá visualizar cómo se determinan las tres
zonas (A-B-C) en un inventario constituido por 20 artículos:
Resolución
1. Se debe determinar la participación monetaria de cada artículo en el valor total del inventario.
Para ello se debe construir una tabla de acuerdo a lo siguiente:
• Columna nº 4: Nos muestra el % que representa cada una de las valorizaciones en el valor
total del inventario.
3. Ahora se deben reordenar las columnas 1 y 4, tomando las participaciones de cada artículo
en sentido decreciente, lo que dará origen a la tabla nº 3:
4. Trazado de la gráfica y determinación de zonas ABC:
A partir de los datos de la tabla 3 y la gráfica se puede observar que unos pocos artículos son los
de mayor valorización. Si solo se controlaran estrictamente los tres primeros, se estaría
controlando aproximadamente el 60% del valor del inventario. Asignamos la zona A para estos
artículos. Controlando también los art. 3, 6 y 11, se estaría controlando, en forma aproximada, el
82% del valor del inventario. (Zona B)
Se ve claramente en la gráfica que el 15% del inventario justifica el 60% del valor, mientras que el
30% del mismo justifica el 82% de dicho valor; a su vez, el 70% del inventario justifica el 18% del
valor. Si se tiene en cuenta los costos de mantenimiento y de control de estos últimos, se llega a la
conclusión que no es necesario controlarlos estrictamente, ya que son de poca valorización, y que
debe mantenerse el mínimo stock posible de los mismos.
CADENAS DE MARKOV
Fundamentos básicos:
Para todo n y para cualquier i, j.
Si para alguna pareja de estados y para algún tiempo n la propiedad antes mencionada no se
cumple diremos que la cadena de Markov es no homogénea.
Probabilidades de transición y matriz de transición
,
En la probabilidad de transición en un paso se omite el superíndice de modo que queda
Cuando la cadena de Markov es homogénea, muchas de sus propiedades útiles se pueden obtener
a través de su matriz de transición, definida entrada a entrada como Ai,j = pij esto es, la entrada i, j
corresponde a la probabilidad de ir del estado i a j en un paso.
Del mismo modo se puede obtener la matriz de transición en n pasos como:
, donde .
Diremos que un vector de probabilidad (finito o infinito numerable) es invariante para una cadena
de Markov si:
Para dos estados i,j en el espacio de estados E, diremos que de i se accede a j (y se
denotará ) si:
Para algún n,
Si y entonces diremos que i comunica con j y se denotará i↔j.
La propiedad "↔" es una relación de equivalencia. Esta relación induce una partición en el
espacio de estados. A estas clases de equivalencia las llamaremos clases de comunicación.
Dado un estado x, denotaremos a su clase de comunicación como C(x).
Diremos que un subconjunto C del espacio de estados (al que denotaremos E) es cerrado si ningún
estado de E-C puede ser accedido desde un estado de C, es decir, si para todo x∈C,
para todo y∈E-C y para todo natural m>0.
Tiempos de entrada
Si , definimos el primer tiempo de entrada a C como la variable aleatoria
Recurrencia
En una cadena de Markov con espacio de estados E, si x∈E se
define y diremos que:
• x es estado recurrente si Lx = 1.
• x es transitorio si Lx < 1
• x es absorbente si px,x = 1
• Una clase de comunicación es clase recurrente si todos sus estados son recurrentes. Sea
, si x∈Ediremos que:
• x es cero-recurrente si
• x es positivo-recurrente si
El real μx se interpreta como el tiempo promedio de recurrencia.
Periodicidad
Cadenas irreducibles
Cadenas positivo-recurrentes
Donde W es una matriz con todos sus renglones iguales a un mismo vector de probabilidad w, que
resulta ser el vector de probabilidad invariante de la cadena. En el caso de cadenas regulares, éste
vector invariante es único.
Cadenas absorbentes
Una cadena de Markov con espacio de estados finito se dice absorbente si se cumplen las dos
condiciones siguientes:
Tal que
Meteorología
Si consideramos el clima de una región a través de distintos días, es claro que el estado actual solo
depende del último estado y no de toda la historia en sí, de modo que se pueden usar cadenas de
Markov para formular modelos climatológicos básicos.
Modelos epidemiológicos
Internet
El pagerank de una página web (usado por Google en sus motores de búsqueda) se define a través
de una cadena de Markov, donde la posición que tendrá una página en el buscador será
determinada por su peso en la distribución estacionaria de la cadena.
Simulación
Las cadenas de Markov son utilizadas para proveer una solución analítica a ciertos problemas de
simulación tales como el Modelo M/M/1.
Juegos de azar
Son muchos los juegos de azar que se pueden modelar a través de una cadena de Markov. El
modelo de la ruina del jugador, que establece la probabilidad de que una persona que apuesta en
un juego de azar finalmente termine sin dinero, es una de las aplicaciones de las cadenas de
Markov en este rubro.
Economía y Finanzas
Las cadenas de Markov se pueden utilizar en modelos simples de valuación de opciones para
determinar cuándo existe oportunidad de arbitraje, así como en el modelo de colapsos de una
bolsa de valores o para determinar la volatilidad de precios. En los negocios, las cadenas de
Márkov se han utilizado para analizar los patrones de compra de los deudores morosos, para
planear las necesidades de personal y para analizar el reemplazo de equipo.
Ejemplo:
En un país como Colombia existen 3 operadores principales de telefonía móvil como lo son tigo,
Comcel y movistar (estados).
Los porcentajes actuales que tiene cada operador en el mercado actual son para tigo 0.4 para
Comcel 0.25 y para movistar 0.35. (Estado inicial)
La suma de las probabilidades de cada estado en este caso operador deben ser iguales a 1
Como podemos ver la variación en el periodo 4 al 5 es muy mínima casi insignificante podemos
decir que ya se a llegado al vector o estado estable.
TEORIA DE JUEGOS
La Teoría de Juegos se desarrollo con el simple hecho de que un individuo se relacione con otro u
otros. Hoy en día se enfrenta cotidianamente a esta teoría, en cualquier momento. Para el hombre
la importancia que representa la Teoría de Juegos es evidente, pues a diario se enfrenta a
múltiples situaciones que son juegos.
Actualmente la Teoría de Juegos se ocupa sobre todo de que ocurre cuando los hombres se
relacionan de forma racional, es decir, cuando los individuos se interrelacionan utilizando el
raciocinio. Sin embargo, la Teoría de Juegos tiene todas las respuestas a los todos problemas del
mundo.
La Teoría de Juegos consiste en razonamientos circulares, los cuales no pueden ser evitados al
considerar cuestiones estratégicas. Por naturaleza, a los humanos no se les va muy bien al pensar
sobre los problemas de las relaciones estratégicas, pues generalmente la solución es la lógica a la
inversa.
En la Teoría de Juegos la intuición no es muy fiable en situaciones estratégicas, razón por la que se
debe entrenar tomando en consideración ejemplos instructivos, sin necesidad que los mismos
sean reales.
El principal objetivo de la teoría de los juegos es determinar los papeles de conducta racional en
situaciones de "juego" en las que los resultados son condicionales a las acciones de jugadores
interdependientes.
Un juego es cualquier situación en la cual compiten dos o más jugadores. El Ajedrez y el Póker son
buenos ejemplos, pero también lo son el duopolio y el oligopolio en los negocios. La extensión con
que un jugador alcanza sus objetivos en un juego depende del azar, de sus recursos físicos y
mentales y de los de sus rivales, de las reglas del juego y de los cursos de acciones que siguen los
jugadores individuales, es decir, sus estrategias.
Se supone que, en un juego, todos los jugadores son racionales, inteligentes y están bien
informados. En particular, se supone que cada jugador conoce todo el conjunto de estrategias
existentes, no solo para él, sino también para sus rivales, y que cada jugador conoce los resultados
de todas las combinaciones posibles de las estrategias.
La teoría de juegos está básicamente ligada a las matemáticas, ya que es principalmente una
categoría de matemáticas aplicadas, aunque los analistas de juegos utilizan asiduamente otras
áreas de esta ciencia, en particular las probabilidades, la estadística y la programación lineal en
conjunto con la teoría de juegos. Pero la mayoría de la investigación fundamental es desempeñada
por especialistas en otras materias.
Esta teoría tiene aplicaciones en numerosas áreas, como las ciencias políticas o la estrategia
militar, que fomentó algunos de los primeros desarrollos de esta teoría. La biología evolutiva,
donde se ha utilizado ampliamente para comprender y predecir ciertos resultados de la evolución,
como el concepto de estrategia evolutiva estable introducido por John Maynard Smith; o la
psicología, donde puede utilizarse para analizar juegos de simple diversión o aspectos más
importantes de la vida y la sociedad también son claros ejemplos de aplicaciones..
Pero sin duda, su principal aplicación la encontramos en las ciencias económicas porque intenta
encontrar estrategias racionales en situaciones donde el resultado depende no solamente de la
estrategia de un participante y de las condiciones del mercado, sino también de las estrategias
elegidas por otros jugadores, con objetivos distintos o coincidentes.
La Teoría de Juegos fue creada por Von Neumann y Morgenstern, y descriptas en su libro clásico
The Theory of Games Behavior, publicado en 1944. Otros habían anticipado algunas ideas. Los
economistas Cournot y Edgeworth fueron particularmente innovadores en el siglo XIX. Otras
contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo. El
mismo Von Neumann ya había puesto los fundamentos en el artículo publicado en 1928. Sin
embargo, no fue hasta que apareció el libro de Von Neumann y Morgenstern que el mundo
comprendió cuán potente era el instrumento descubierto para estudiar las relaciones humanas.
Von Neumann y Morgenstern investigaron dos planteamientos distintos de la Teoría de Juegos. El
primero de ellos el planteamiento estratégico o no cooperativo.
Von Neumann y Morgenstern resolvieron este problema en el caso particular de juegos con dos
jugadores cuyos intereses son diametralmente opuestos. A estos juegos se les llama estrictamente
competitivos, o de suma cero, porque cualquier ganancia para un jugador siempre se equilibra
exactamente por una pérdida correspondiente para el otro jugador. El ajedrez, el backgammon y
el póquer son juegos tratados habitualmente como juegos de suma cero.
Puesto que éste es un problema mucho más difícil, no es de sorprender que sus resultados fueran
mucho menos precisos que los alcanzados para el caso de suma cero y dos jugadores. En
particular, Von Neumann abandono todo intento de especificar estrategias óptimas para
jugadores individuales. En lugar de ello se propuso clasificar los modelos de formación de
coaliciones que son consistentes con conductas racionales.
CONCEPTOS BÁSICOS
En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre
unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su
contrincante.
MATRIZ DE PAGO
La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las
acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el
"jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de
que el jugador renglón usa acción i y el jugador columna usa acción j.
ESTRATEGIA MIXTA, VALOR ESPERADO
Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa
una estrategia mixta si en cada turno escoge al azar una acción para que cada acción se esté
usando una fracción determinada del tiempo.
Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo
renglón (vector probabilidad):
R = [a b c . . . ]
Con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de
tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y
donde a + b + . . . = 1.
Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar,
pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por
vectores probabilidad con un solo 1 y el resto de las entradas 0.
VALOR ESPERADO
El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es
dado por
e = RPC
El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta
especificada por R y C después de un gran número de turnos.
CRITERIO MINIMAX
Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias
posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia
óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el
contrincante.
Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos
jugadores:
2. Cada jugador sabe que su contrincante está también haciendo la acción mejor posible.
Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes
declaraciones se aplican a los juegos estrictamente determinados:
A. Todos los puntos de silla en un juego tienen los mismos valores de pago.
B. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias
minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas
estrategias puras.
ESTRATEGIA ALEATORIA
Es aquella en donde el jugador renglón elige un renglón al azar, de acuerdo con cierta distribución
de probabilidad. Por ejemplo, el jugador renglón podría la siguiente distribución de probabilidad:
RESULTADO PROBABILIDAD
Renglón1 2/3
Renglón 2 1/3
Si el jugador renglón utiliza esta distribución de forma predecible, como cuando selecciona
repetidamente el renglón 1 dos veces y luego el renglón 2 una vez, el jugador columna podría
descubrir la estrategia de responder con el fin de reducir al mínimo su eficacia. Por lo tanto, el
jugador renglón debe emplear algún dispositivo aleatorio, como la rueda giratoria que se mostro
anteriormente (ruleta de pueblo), con el cual elegiría 1 dos terceras partes del tiempo.
Los juegos de punta de silla están estrictamente determinados; es decir, los jugadores adoptan
estrategias puras, y el curso del juego se determina por adelantado (suponiendo que los jugadores
son agresivos y capaces). Los juegos sin punto de silla no están estrictamente determinados; si un
jugador emplea una estrategia aleatoria, el curso del juego estará sujeto al azar, y todo puede
suceder. No hay valor fijo para el juego; solo hay un valor muy probable o esperado.
Esta clase de juegos tiene más de una alternativa de juego por la que los jugadores podrian ganar,
por lo que no están obligados a siempre jugar con la misma estrategia, no presentan un punto silla
por que el número menor de todos los máximos de las columnas no es igual al número mayor de
los menores de los renglones, dando como resultado un juego no estrictamente determinado.
EJEMPLO:
Para ilustrar las características básicas de un modelo de teoría de juegos, considérese el juego
llamado pares y nones. Éste consiste nada más en que los dos jugadores muestran al mismo
tiempo uno o dos dedos. Si el número de dedos coincide, el jugador que apuesta a pares (por
ejemplo, el jugador 1) gana la apuesta (digamos $l) al jugador que va por nones (jugador II). Si el
número no coincide, el jugador 1 paga $l al jugador II.
Entonces, cada jugador tiene dos estrategias: mostrar uno o dos dedos. La tabla a continuación
contiene el pago en dólares que resulta para el jugador 1 en una matriz de pagos.
En general, un juego de dos personas se caracteriza por:
3. La matriz de pagos.
Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su
oponente y la matriz de pagos. Una jugada real en el juego consiste en que los dos jugadores elijan
al mismo tiempo una estrategia sin saber cuál es la elección de su oponente.
Una estrategia puede constituir una acción sencilla, como mostrar un número par o non de dedos
en el juego de pares y nones. Por otro lado, en juegos más complicados que llevan en sí una serie
de movimientos, una estrategia es una regla predeterminada que especifica por completo cómo se
intenta responder a cada circunstancia posible en cada etapa del juego. Por ejemplo, una
estrategia de un jugador de ajedrez indica cómo hacer el siguiente movimiento para todas las
posiciones posibles en el tablero, de manera que el número total de estrategias posibles sería
astronómico. Las aplicaciones de la teoría de juegos involucran situaciones competitivas mucho
menos complicadas que el ajedrez pero las estrategias que se manejan pueden llegar a ser
bastante complejas.
Por lo general, la matriz de pagos muestra la ganancia (positiva o negativa) que resultaría con cada
combinación de estrategias para el jugador 1. Se da de esta manera, ya que la matriz del jugador II
es el negativo de ésta, debido a la naturaleza de la suma cero del juego.
Los elementos de la matriz pueden tener cualquier tipo de unidades, como dólares, siempre que
representen con exactitud la utilidad del jugador 1 en el resultado correspondiente. Debe hacerse
hincapié en que la utilidad no necesariamente es proporcional a la cantidad de dinero (o cualquier
otro bien) cuando se manejan cantidades grandes. Por ejemplo, para una persona pobre $2
millones (después de impuestos) tal vez vale mucho más que el doble de $1 millón. En otras
palabras, si a una persona se le da a elegir entre: 1) recibir, con el 50% de posibilidades, $2
millones en lugar de nada y 2) recibir $1 millón con seguridad, ese individuo tal vez prefiriera este
último. Por otro lado, el resultado que corresponde a un elemento 2 en una matriz de pagos debe
"valer el doble" para el jugador 1 que el resultado correspondiente a un elemento 1. Así, dada la
elección, debe serle indiferente un 50% de posibilidades de recibir el primer resultado (en lugar de
nada) y recibir en definitiva el último resultado.
2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin compasión
para el oponente).
La teoría de juegos se contrapone al análisis de decisión, en donde se hace la suposición de que el
tomador de decisiones está jugando un juego contra un oponente pasivo, la naturaleza, que elige
sus estrategias de alguna manera aleatoria.
Se desarrollará el criterio estándar de teoría de juegos para elegir las estrategias mediante
ejemplos ilustrativos. En particular, a continuación se presenta un ejemplo prototipo que ilustra la
formulación de un juego y su solución en algunas situaciones sencillas. Después se desarrollará
una variación más complicada de este juego para obtener un criterio más general.
http://www.frm.utn.edu.ar/ioperativa/TJuegos.pdf
http://www.ecpunr.com.ar/Docs/Teoria_de_Juegos%20II.pdf
TEORIA DE DECISIONES
DEFINICIÓN
Una decisión es una elección consciente y racional, orientada a conseguir un objetivo, que se
realiza entre diversas posibilidades de actuación (o alternativas). Antes de tomar una decisión
deberemos calcular cual será el resultado de escoger una alternativa. En función de las
consecuencias previsibles para cada alternativa se tomará la decisión. Así, los elementos que
constituyen la estructura de la decisión son: los objetivos de quién decide y las restricciones para
conseguirlos; las alternativas posibles y potenciales; las consecuencias de cada alternativa; el
escenario en el que se toma la decisión y las preferencias de quien decide.
Existen diversas situaciones en las que deben tomarse decisiones empresariales: situaciones de
certeza, incertidumbre y riesgo.
Una situación de certeza es aquella en la que un sujeto tiene información completa sobre una
situación determinada, sobre cómo evolucionará y conoce el resultado de su decisión. Ej:
decisiones sobre compras cuando se conoce la demanda, de distribución de personal cuando se
conoce el coste por persona y operación, etc. La toma de decisiones en un marco de certeza no
implica dificultad alguna, más allá de las relacionadas con la gestión empresarial.
Decisiones no competitivas
En las decisiones no competitivas nadie se opone a la estrategia del sujeto que decide.
Ej: vendedores de periódicos (se quiere conocer la cantidad a adquirir de acuerdo con las ventas).
Para decidir existen una serie de criterios de elección:
- Coeficiente de optimismo-pesimismo
a) El criterio maximin supone maximizar el resultado mínimo, es decir el decisor quiere asegurarse
la elección mejor en caso que se dé la situación más desfavorable. Es pesimista. Es útil en
situaciones muy inciertas, si quieren evitarse riesgos o si existe conflicto.
b) El criterio maximax consiste en maximizar el máximo; escoger el resultado máximo entre los
mejores de cada alternativa. El decisor es optimista.
c) El criterio del coeficiente de optimismo-pesimismo se sitúa entre los dos anteriores. Partimos de
un grado de optimismo y de pesimismo relacionados del siguiente modo:
d) El criterio del principio de razón suficiente espera que todas las situaciones de futuro tendrán la
misma probabilidad de suceder. Ante esta situación se elige el resultado medio más elevado.
e) El criterio minimax plantea elegir en función de lo que se dejará de ganar. Por tanto, en primer
lugar debe calcularse el máximo coste de oportunidad de cualquier opción y, en segundo lugar,
elegir el menor de ellos.
EJEMPLO:
Supongamos que una empresa quiere realizar una campaña publicitaria. Se le presentan 3
posibilidades: radio (15 minutos de lunes a jueves en un espacio), TV (1 spot cada semana sobre
las 12h) y prensa (1 anuncio 2 días a la semana los lunes y los jueves). Como han hecho campañas
anteriormente se han podido valorar los resultados de las diferentes posibilidades del siguiente
modo:
Ej: si la demanda de mercado se mantiene alta, la campaña publicitaria en la radio garantiza los
mejores resultados. Si la demanda de mercado se mantiene baja, la campaña publicitaria que
garantiza los mejores resultados es la prensa. ¿Qué medio de comunicación elegiríais?
(p). Si suponemos p= 60% = 0,6 ; q=0,4: Radio : p * max + q * min = 100 * 0,6 + 20 * 0,4 = 68
d) Si creemos que todas las situaciones tienen la misma posibilidad de suceder se escogerá el
resultado medio más elevado (LAPLACE).
Resultado medio radio = (100+40+20)/3 = 53,3
Escogerá RADIO