Está en la página 1de 11

Clase Nº8: Gestión de sistemas de espera

Curso: Habilidades Analíticas para una Gestión Moderna

Profesores

Juan Carlos Ferrer

Mathias Klapp

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
1
Clase Nº8: Gestión de Sistemas de espera
La espera está presente en múltiples actividades de nuestro diario vivir. Podemos esperar en la mañana por
el bus que nos lleva al trabajo, o al pasar por una zona de alto tráfico. Esperamos en la oficina descargando
un archivo de la web, en la fila de la cafetería a la hora de almuerzo, y al llamar al banco al solicitar hablar
con un ejecutivo. Hay incontables situaciones cotidianas en donde nos enfrentamos a un sistema de espera
y, en particular, a una fila. A veces la fila es real y otras veces es virtual, como sucede cuando nos dejan en
espera telefónica. Los sistemas de espera son fundamentales en servicios de atención al cliente y en sistemas
productivos de diversas organizaciones. Hay sistemas de espera en un call center, en servicios de atención
médica, en la oficina de un notario, en un servicio de entrega a domicilio, y en el procesamiento de piezas en
una máquina industrial, entre múltiples otros ejemplos. En esta clase estudiaremos algunas herramientas
analíticas que permiten gestionar eficientemente los sistemas de espera.

Modelación del sistema de espera


Consideremos el siguiente ejemplo:

Suponga que en su casa falla el servicio de internet y decide llamar a su proveedor para que solucione el
problema. El proveedor dispone de un servicio telefónico en el que atiende un técnico calificado las 24 horas
del día. El técnico puede atender a un cliente a la vez y, mientras lo está atendiendo, el resto de las llamadas
son puestas en espera telefónica hasta que él se desocupa y toma otro cliente en espera por orden de llamado.
¿Cuántos clientes puede atender en promedio por hora? ¿Cuánto esperará en promedio un cliente como usted
antes de ser atendido?

Para responder estas preguntas comenzaremos describiendo los componentes principales de un sistema de
espera ilustradas en la siguiente Figura. Son tres: proceso de arribo, proceso de atención, y buffer.

1. El proceso de arribo modela la llegada de entidades. Por “entidad”, nos referiremos al cliente,
individuo, tarea, pieza, u otro ente que solicita servicio. En el ejemplo del técnico telefónico, cada
llamado es una entidad. El tiempo que ocurre entre llegadas consecutivas se denomina 𝑡𝑎 y puede
ser o no aleatorio. Por ejemplo, podría ser que 𝑡𝑎 = 20 minutos, es decir, cada 20 minutos llama un
cliente al servicio telefónico. La tasa de arribo 𝜆 = 60/𝑡𝑎 es una medida equivalente a la cantidad de
60
arribos de entidades por hora. En el ejemplo se tendría 𝜆 = 20 = 3 llamados por hora.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
2
2. El proceso de atención modela el servicio ofrecido en el sistema de espera que es ejecutado por uno
o más servidores. Entre muchos ejemplos, los servidores pueden representar individuos que
atienden clientes (por ejemplo, un cajero o vendedor), una página web para comprar online (e-
commerce) o una máquina que procesa piezas en un proceso de manufactura. Un servidor puede
atender una entidad a la vez y un sistema con múltiples servidores puede atender viarias entidades
simultáneamente. Nuestro ejemplo posee un servidor, el técnico. Cada servidor posee un tiempo de
atención 𝑡𝑠 que puede ser o no aleatorio, mientras que la tasa de atención 𝜇 = 60/𝑡𝑠 representa lo
mismo en capacidad de atenciones por hora. Supongamos que el técnico telefónico atiende a un
cliente en 𝑡𝑠 = 15 minutos, su capacidad de atención es, en promedio, 𝜇 = 4 llamados por hora.

3. El buffer del sistema de espera almacena entidades arribadas esperando por atención. En nuestro
ejemplo, el buffer está compuesto de las llamadas puestas en espera. Hay principalmente dos tipos
de buffer: la fila y la pila. Una fila es un sistema FIFO (first in - first out), pues la primera entidad que
arriba al sistema de espera es la primera en ser atendida. Es el tipo de buffer más común en el servicio
de clientes, pues suele ser el más justo. En cambio, una pila es un sistema LIFO (last in - first out)
donde el último arribo es el primero en atenderse. Se llama así, pues es análogo a un montón (o pila)
de documentos puestos sobre el escritorio, donde el primer documento a revisar es el que está arriba
(que fue el último en llegar).

Hay varios indicadores que suelen preocupar a los tomadores de decisiones en sistemas de espera. El
primero, es la capacidad del sistema, es decir, la cantidad de órdenes que el sistema es capaz de procesar
por hora. Este indicador mide que tan rápido el sistema procesa entidades por hora. Otro objetivo busca
minimizar el tiempo de espera y el tiempo de ciclo (tiempo total que pasa cada entidad en el sistema,
incluyendo espera y atención). En servicios de atención a clientes el tiempo de espera es cada vez más
importante, pues se relaciona directamente con el nivel de servicio otorgado al cliente. En sistemas de
manufactura importa más el tiempo de ciclo, pues determina en cuánto tiempo una pieza o insumo de
producción pasa por un proceso antes de ser transformado en un producto final; veremos que se relaciona
directamente con el nivel de inventario. Otro indicador es la tasa de pérdida o el porcentaje de entidades
dejan el sistema debido a un mal nivel de servicio o un buffer que se encuentra a su capacidad.

A continuación, analizaremos en detalle un sistema de espera simple con un servidor y sin pérdida de
entidades (es decir, siempre esperan hasta ser atendidas), entregando intuición básica sobre la capacidad y
el tiempo promedio de espera en el sistema. Luego, desarrollaremos algunas herramientas analíticas que
permiten calcular indicadores y gestionar el sistema.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
3
Intuición básica sobre capacidad y tiempos de espera
Supongamos que el técnico atiende en promedio a una llamada en 𝑡𝑠 = 15 minutos, pero existe variabilidad.
Es decir, algunos llamados pueden resolverse fácilmente en menos de 15 minutos, mientras que otros más
complejos pueden tardar más de 15 minutos.
60
¿Cuántos llamados por hora, en promedio, podría atender el sistema? Podría atender a 𝜇 = 15 = 4 por hora,
es decir, uno cada 15 minutos en promedio.

Pero ¿cuántos llamados por hora, en promedio, puede atender sin generar espera? La intuición diría que
podría atender a cuatro. Si llegan más llamados por hora el técnico estaría sobrecargado y la gente tendría
que esperar, mientras que con menos llamados por hora el técnico estaría subutilizado. ¿Cierto?

¡NO! El argumento anterior está equivocado, pues asume que cada atención demora exactamente 15
minutos cada una y que las llamadas ocurren espaciadas en el tiempo exactamente cada 15 minutos. Es
improbable, pues los tiempos de atención y entre llamadas sucesivas son típicamente aleatorios. En el
ejemplo, podría ser que no llamen en el primer cuarto de hora y que luego lleguen dos llamados seguidos
durante el segundo cuarto. También, algunas atenciones serán rápidas, mientras que otras requerirán más
de 15 minutos.

Supongamos que a las 1:00pm el técnico está desocupado. Luego, tres clientes llaman entre las 1:00pm y las
2:00pm con los siguientes tiempos de llamado: 1:20, 1:25 y 1:45 (promedio de tres llamados por hora o de
20 minutos entre llamadas). El primero es atendido durante 20 minutos, el segundo durante 15 minutos, y el
tercero durante 10 minutos (atención promedio de 15 minutos cada uno).

Sucederá lo siguiente:

• El primer cliente será atendido de inmediato a las 1:20 hrs y se desocupará a las 1:40 hrs.
• El segundo cliente tendrá que esperar 15 minutos (desde las 1:25 hrs hasta las 1:40 hrs) y terminará
su atención a las 1:55 hrs.
• El tercer cliente esperará 10 minutos (desde las 1:45 hrs hasta las 1:55 hrs) y terminará a las 2:05 hrs.

La congestión promedio del sistema se define como 𝝆 = 𝟏𝟎𝟎 ⋅ 𝝀/𝝁. En nuestro ejemplo, el sistema posee
3
una congestión igual a 𝜌 = 100 ⋅ 4 = 75%, pues arriban en promedio 𝜆 = 3 llamados por hora y la capacidad
de atención del técnico es 𝜇 = 4 llamados por hora. A pesar de que el sistema no está 100% congestionado,
dos de los tres clientes tienen que esperar, y la espera promedio por persona (incluyendo el que no espera)
es de (0 + 15 + 10)/3 = 8,33 minutos.

Del ejemplo se concluye que un sistema de espera no puede ser estudiado sólo en base a congestión y a
valores “promedio”. La espera es generada por la variabilidad del sistema.

¿Por qué la variabilidad afecta al tiempo de espera? Por una parte, el primer llamado tardío hizo que el
técnico estuviese desocupado sin atender por 20 minutos, es decir, tiene un 66,6% = (60 − 20)/60 de
ocupación real entre las 1:00 hrs y las 2:00 hrs. Y, por otra parte, la concentración inusual de tres llamados
en un periodo de 25 minutos (1:20 hrs a 1:45 hrs), y el tiempo de atención de 20 minutos (5 minutos sobre

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
4
el promedio) del primer cliente generó espera para los clientes que llamaron más tarde. La espera, en este
caso, además impactará la atención entre las 2pm y 3pm (impacto aguas abajo), pues el técnico estará
ocupado hasta las 2:05 hrs terminando la atención del tercer cliente.

Representación gráfica de sistemas de espera FIFO


El siguiente diagrama de curvas cumulativas (o curvas de conteo) ayuda a analizar el funcionamiento de un
sistema FIFO. En el eje horizontal registra el tiempo y en el vertical el conteo de clientes. La curva azul cuenta
el total de llamados en cada momento del día y la curva verde cuenta el número de atenciones completadas
por el técnico a lo largo del día. Ambos datos pueden ser registrados mediante mediciones en terreno.
También, pueden ser registradas de forma automática. El ejemplo anterior con tres llamados se detalla en la
figura.

En cada momento del tiempo, la diferencia vertical entre estas dos curvas es el número de clientes en el
sistema de espera, ya sea esperando o siendo atendidos. Por ejemplo, en 𝑡 = 1: 30 la diferencia es dos, pues
hay dos clientes en el sistema (el primero que está siendo atendido y el segundo que está en cola). En cambio,
en 𝑡 = 1: 42 hay una persona en el sistema siendo atendida y nadie en la cola. La diferencia horizontal entre
el tiempo de la primera llamada y el término de la primera atención representa el tiempo de ciclo de la
primera persona en el sistema (espera + atención) que es igual a 20min de atención. Lo mismo sucede con la
diferencia horizontal entre la segunda llamada y el término de la segunda atención (30min) que detalla el
tiempo que pasó el segundo cliente en el sistema (15min de espera + 15min de atención). Finalmente, la
diferencia horizontal es de 20min para el tercer llamado (10 min de espera + 10min de atención).

En general, el tiempo de ciclo de la 𝒊-ésima entidad es la diferencia horizontal de curvas entre el 𝒊-ésimo
arribo y el 𝒊-ésimo término de atención. El área gris cubierta entre estas dos curvas (igual a 70min = 20min
+ 30min + 20min) es igual al tiempo en el sistema de todos los clientes. Como hay tres llamadas, el tiempo
70
de ciclo promedio es 3
= 23,33 min. Si restamos la atención promedio (15min), la espera promedio por
persona en el sistema es 8,33min, tal como la calculamos antes.

¿Qué sucede si logramos reducir la variabilidad del proceso de atención? El siguiente diagrama ilustra un
ejemplo análogo con un tiempo de atención fijo, es decir, siempre igual a 15min. La congestión promedio
sigue siendo 𝜌 = 75%, pues los tiempos promedio de llegada y de atención no han cambiado. Sin embargo,
60
el área entre las dos curvas es igual a 15 + 25 + 20 = 60min, es decir, la espera promedio es 3
− 15 =
5min. Esta reducción del tiempo de espera (de 8,33 a 5) se debe a una reducción de variabilidad en la atención
del sistema.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
5
¿Qué sucede si logramos reducir la variabilidad en el proceso de arribo? Si también eliminamos la
variabilidad del tiempo entre llegadas, entonces el técnico se desocupará siempre 5 minutos antes de cada
llamado provocando que nunca exista espera tal como detalla la siguiente figura.

Tanto la variabilidad en los tiempos de atención como en los tiempos entre llegadas de clientes sucesivos
genera tiempo de espera. Esto explica que sistemas de espera tan diferentes como un servicio de autolavado
y la atención en la consulta de un médico tengan esperas. En el primer caso, el tiempo de atención de un
autolavado es bastante regular y podría decirse que casi no tiene variabilidad. La espera en este sistema es
generada principalmente por la variabilidad del proceso de llegadas de clientes que buscan lavar su auto. En
el segundo caso, los pacientes agendan su hora con el médico y, si son puntuales, arriban dinámicamente en
el tiempo con tiempos entre llegadas bastante regulares. En este caso la espera es generada principalmente
por la variabilidad en el tiempo de consulta del médico que a veces demora muy poco y otras veces demora
más de lo esperado.

Estabilidad
Con o sin espera, un sistema con congestión menor a 100% se dice estable, pues posee suficiente capacidad
de atención en promedio para atender la llegada de clientes. En este caso, la salida efectiva del sistema ocurre
a la tasa de arribos, es decir, completa 𝜆 servicios por hora. En el ejemplo anterior, el sistema (si es ejecutado
durante mucho tiempo) atiende, en promedio, a 3 personas por hora.

Por el contrario, supongamos que el call center recibe en promedio más llamados por hora que la capacidad
promedio de atención del servidor, es decir, posee una congestión 𝜌 sobre 100%. Por ejemplo, si 𝜆 = 6
clientes por hora (una llegada cada 10min) y sigue teniendo 𝜇 = 4 como capacidad de atención por hora,
entonces 𝜌 = 150%. En este caso, el sistema se dice que es inestable y completará como máximo 𝜇 servicios
por hora (no tiene capacidad para atender todas las llegadas por hora). Este tipo de sistema siempre produce
esperas, incluso sin variabilidad en el sistema. La siguiente figura ilustra este ejemplo de sistema inestable
sin variabilidad.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
6
El primer cliente que arriba a las 1:00 hrs será atendido al instante, pero el segundo que arriba a las 1:10 hrs
tendrá 5 minutos de espera, luego el tercero tendrá 10min de espera, el cuarto 15min, el quinto 20min y así
sin que la cola deje de crecer. Un servicio con congestión superior a 100% será un desastre en la práctica,
pues el tiempo de espera promedio del sistema crecerá sin control. Un sistema estable, en cambio, puede
tener espera debido a variabilidad, pero controlada, sin tendencia al crecimiento descontrolado en el largo
plazo.

Estudio del tiempo de espera en estado de régimen


El análisis de curvas cumulativas permite estudiar en detalle un sistema de espera, pero requiere de
mediciones. Si el sistema de esperas lleva operando mucho tiempo sin cambiar la distribución de los tiempos
entre llegadas y de atención, entonces se encuentra en estado de régimen. En este caso la teoría de colas
brinda fórmulas analíticas para estimar tiempos promedio de espera y de ciclo.

Considere que el tiempo entre llamadas es de 𝑡𝑎 =20 minutos en promedio y que posee una desviación
𝜎𝑎
estándar entre llamadas igual a 𝜎𝑎 = 20min, es decir, un coeficiente de variación igual a 𝑐𝑎 = = 1.
𝑡𝑎
Supongamos también, que el tiempo promedio de atención del técnico es de 𝑡𝑠 = 15 minutos con un
coeficiente de variación de 𝑐𝑠 = 0,2. La congestión es 𝜌 = 75%. En estado de régimen, ¿cuánto esperará en
promedio una llamada antes de ser atendida? La fórmula de Kingman1 estima el tiempo promedio de espera
en cola (𝑊𝑞 ) para una entidad cualquiera si el sistema es estable (𝜌 < 100%) de la siguiente forma:

𝑐𝑎 + 𝑐𝑠 𝜌
𝑊𝑞 ≈ 𝑡𝑠 ⋅ ( )⋅( )
2 100 − 𝜌

La fórmula de Kingman dice que la espera promedio en cola es aproximadamente igual a la multiplicación de
tres cantidades. La primera cantidad es el tiempo promedio de atención del servidor. La espera crece a
medida que el tiempo de atención lo hace y, en particular, es cero si toma un instante atender a cada cliente
e infinito si nunca termina de atenderse al primer cliente.

1
Hopp, Wallace J., and Mark L. Spearman. Factory physics. Waveland Press, 2011.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
7
1+0,2
La segunda cantidad es la variabilidad promedio del sistema, que en este caso es ( ) = 0,6. Tal como
2
discutimos gráficamente, a mayor variabilidad del sistema hay mayor tiempo de espera promedio. Además,
no hay espera si la variabilidad es cero.

75
El tercer término es el factor de congestión del sistema que en nuestro ejemplo sería (100−75 ) = 3. La
congestión del sistema exacerba los efectos negativos de la variabilidad sobre los tiempos de espera y a igual
variabilidad, el tiempo de espera es mayor con mayor congestión 𝝆 . La espera es cero si no existe
congestión (ya que 𝜆 es cero) y crece explosivamente a medida que la congestión se acerca a 100%. Al
sobrepasar 100%, el sistema se torna inestable y el tiempo promedio en cola se torna infinito, lo que significa
que la espera promedio en cola crece en cada hora que pasa.

La lección es clara, un sistema con alta variabilidad en los tiempos de atención y de llegada debe funcionar a
baja congestión para mantener un tiempo promedio de espera bajo. Un ejemplo de donde esto es deseable
es un servicio de emergencia en un hospital.

Con los tres números ya calculados, la espera promedio del sistema es 𝑊𝑞 ≈⋅ 15 ⋅ 0,6 ⋅ 3 = 27min. Luego, el
tiempo de ciclo promedio de un llamado en el sistema será de 𝑊 = 27 + 15 = 42 min.

Hay otra lección: Un aumento marginal de congestión es relativamente mucho peor en sistemas de espera
más congestionados. Por ejemplo, si nuestro sistema congestionado al 75% aumenta su congestión a 85%
(aumento de 10%), entonces el tiempo de espera crece de 27 a 51 minutos (88,9% de crecimiento). Si el
sistema parte más congestionado (digamos al 85%) y aumenta su congestión en el mismo 10% hasta 95%,
entonces el tiempo de espera crece hasta 171 (un 235,3% de crecimiento), lo que es relativamente mucho
peor.

¿Cómo reducir el tiempo promedio de espera en cola? Según la fórmula de Kingman, hay tres formas para
reducir la espera en cola:

1. Atender a los clientes más rápido en promedio, es decir, reducir 𝑡𝑠 . En el ejemplo, se podría lograr
contratando a un técnico experto que, en promedio, atienda más rápido.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
8
2. Reducir variabilidad en la llegada de clientes y en los tiempos de atención de estos. Por ejemplo,
entrenar mejor a los técnicos para que no se queden pegado en problemas nunca vistos o
implementar un sistema de agendamiento de llamadas para distribuirlas en el tiempo.
3. Reducir congestión, esto se logra reduciendo la tasa de llamadas por hora o mediante la primera
política. Una forma de reducir la tasa de llamadas es educar al cliente para que pueda resolver sus
propios problemas solo o brindarle información adicional en la página web.

Otra lección interesante es que una reducción de variabilidad permite aumentar la tasa de arribo de
entidades manteniendo el tiempo de espera promedio inalterado. Supongamos que, en el ejemplo se
implementa un sistema de agendamiento de llamadas que reduce la variabilidad del tiempo entre llegadas
de 𝑐𝑎 = 1 a 𝑐𝑎 = 0,2. Si deseamos mantener el tiempo de espera en 27min por llamada en promedio se
puede concluir que:

𝜆
0,2 + 0,2
27 = 15 ⋅ ( )⋅( 4 ) → 𝜆 = 3,6
2 𝜆
1−4

Es decir, al reducir la variabilidad promedio del sistema, se podría aumentar su tasa de arribo de 𝜆 = 3 a
𝜆 = 3,6 entidades por hora y brindar el mismo nivel de servicio de 27min de espera en promedio por
cliente.

Ley de Little
El tiempo de espera promedio y el número promedio de entidades (i.e. clientes) en el sistema de espera
también están intrínsicamente relacionados a través de una ley demostrada por el profesor John D.C. Little.
Esta ley señala que, en estado estacionario, el número promedio de entidades (𝐿) dentro un sistema de
espera es igual a la tasa de arribo por unidad de tiempo (𝜆) multiplicada por el tiempo promedio de ciclo de
las entidades en el sistema (𝑊). Es decir:

𝐿=𝜆⋅𝑊

En el ejemplo anterior, el tiempo de ciclo era de 𝑊 = 27 + 15 = 42min y la tasa de arribo promedio de 3


1
llamados por hora, es decir, 20 llamados por minuto. Esto quiere decir que el número promedio de entidades
1 𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔
en el sistema es igual a 𝐿 = 20 [ 𝒎𝒊𝒏
]⋅ 42[min] = 2,1 clientes.

Esta relación es notablemente simple y general. Sólo requiere que el sistema esté en estado estacionario,
pero no requiere conocer el número de servidores que están atendiendo en paralelo, ni conocer la
distribución o variabilidad de tiempos entre llegadas o de atención del servidor. De hecho, ni siquiera necesita
conocer los tiempos promedio de atención del servidor.

De la misma forma, se puede derivar una fórmula alternativa para el tiempo de espera en cola (𝑊𝑞 ) y el
número promedio de clientes en cola (𝐿𝑞 ) en un sistema:

𝐿𝑞 = 𝜆 ⋅ 𝑊𝑞

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
9
1
En el ejemplo, la cola promedio de los clientes en el sistema será 𝐿𝑞 = 20 ⋅ 27 = 1,35 clientes.

Otro ejemplo
Carolina es una entusiasta del Vino, y ocasionalmente compra una botella que guarda en su cava personal en
casa. A veces, cuando Carolina desea darse un gusto descorcha una botella y la comparte con sus amigos.
Supongamos que Carolina viene haciendo esto desde hace tiempo, y que su cava en promedio tiene 160
botellas. Muchos vinos mejoran con el periodo de guarda, por lo que a Carolina le interesa saber cuánto
tiempo, en promedio, guarda cada vino antes de consumirlo. Ella no sabe cuándo descorchó cada vino, pero
desde sus recibos concluye que compró 8 botellas en promedio al mes el último año. ¡Esta es una tarea para
la Ley de Little!

La cava de Carolina podría ser interpretada como un sistema de espera en donde las entidades son botellas
de vino. El servidor sería Carolina y su tiempo de atención sería el tiempo entre descorches. La tasa de arribo
de los objetos a la cava sería de 𝜆 = 8 [𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠]/[𝑚𝑒𝑠] y el número promedio de objetos en el sistema
sería 𝐿𝑞 = 160 [𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠]. Con ello, se puede estimar el tiempo promedio de los vinos en la cava (𝑊𝑞 )
mediante la ley de Little:
𝐿𝑞 160 [𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠]
𝑊𝑞 = 𝜆
= 8 [𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠]/[𝑚𝑒𝑠] = 20 [𝑚𝑒𝑠𝑒𝑠],

Es decir, en promedio un vino de Carolina pasa 1 año y 8 meses en la cava.

Aplicación de la Ley de Little en procesos de manufactura


Esta Ley ha sido pieza fundamental para estudiar y gestionar sistemas de manufactura modernos. En su libro
“Factory Physics”, Hopp y Spearmann reformulan la ley de Little así:

𝑊𝐼𝑃
𝑇𝐻 =
𝐶𝑇

Esta reformulación señala que en estado estacionario y bajo condiciones de estabilidad la tasa de producción
de un proceso productivo (𝑇𝐻 o through mput) es equivalente al inventario promedio en el sistema (𝑊𝐼𝑃 o
work in progress) divido por el tiempo de ciclo de un objeto en el sistema (𝐶𝑇 o cicle time). Básicamente 𝑇𝐻
sería λ, 𝑊𝐼𝑃 sería 𝐿 y 𝐶𝑇 sería 𝑊 y tendríamos 𝜆 = 𝐿/𝑊.

Ejemplo:
Considere que un distribuidor de smartphones posee un inventario promedio de 45.000 smartphones diarios
(bodega + en viaje hacia sus clientes). Este fabricante ha estimado que desde que termina de fabricar un
smartphone, pasan en promedio 50 días hasta que el smartphone llega a las manos del cliente. ¿Cuántos
smartphones vende al día? La respuesta es sencilla, sería TH=WIP/CT = 45000/50 = 900 unidades al día.

Ejemplo 2:
Un profesor de clase ejecutiva desea saber cuánto tarda en promedio en responder un nuevo correo en su
cuenta de correo electrónico, pero no ha registrado explícitamente el tiempo de respuesta de cada correo.
En promedio, el profesor responde 30 e-mails por día y en su casilla generalmente tiene 60 correos sin
responder.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
10
En este caso el inventario promedio del sistema es 𝑊𝐼𝑃 = 60 correos y la tasa de producción es 𝑇𝐻 = 30
𝑊𝐼𝑃
correos/día. Luego, el tiempo de ciclo (tiempo promedio que pasa un correo sin responderse) es 𝐶𝑇 = 𝑇𝐻
=
60
= 2 días.
30

Extensiones
El estudio de sistemas de espera puede generalizarse aún más, pero su análisis es más complejo y queda
fuera de los alcances de esta clase. Se puede incorporar al estudio múltiples servidores o condiciones
adicionales como pérdida de entidades debido a un mal nivel de servicio (tiempo de espera) o debido a una
cola excesiva.

Otra extensión es considerar redes de colas en donde existen sistemas de espera en serie y en paralelo. El
análisis puede también detallarse y calcularse la probabilidad exacta de ver el sistema vacío o teniendo 𝑥
entidades en cola. Todo gracias a una gestión moderna.

Es muy relevante también considerar el aspecto psicológico al diseñar un sistema de espera. Varias de las
siguientes hipótesis se dan en muchos contextos por lo que se deben tener presentes.

• Tiempo de espera se percibe más largo que tiempo ocupado en atención


• Esperas inciertas parecen más largas que las conocidas
• Esperas inexplicadas parecen ser más largas que aquellas con explicación
• Esperas injustas se hacen más largas que esperas justas
• Mientras más valioso el servicio, más tiempo estará el cliente dispuesto a esperar
• La ansiedad hace que las esperas parezcan más largas
• Esperas individuales se perciben más largas que esperas grupales

Lecciones finales sobre sistemas de espera


Hay que tener mucho cuidado con los sistemas de espera inestables el tiempo, ya que la cola tiende a infinito.

En condiciones de estabilidad, la espera en cola es generada por la variabilidad de los tiempos de arribo y de
atención, y es exacerbada por la congestión del sistema.

Reducir la variabilidad produce un efecto similar al de un aumento de velocidad de atención, pues aumenta
la capacidad de entrada a un sistema de espera sin aumentar los tiempos promedios de espera.

En régimen estacionario, existe una relación fundamental que señala que el tiempo en cola es igual el número
promedio de objetos en un sistema de espera por la tasa de llegada.

Algunos de los ejemplos vistos en esta clase fueron obtenidos de los capítulos 4 y 5 del Libro:

• Chhajed, D. and Lowe, T.J. eds., 2008. Building intuition: insights from basic operations management
models and principles (Vol. 115). Springer Science & Business Media.

Pontificia Universidad Católica de Chile © Juan Carlos Ferrer & Mathias Klapp
11

También podría gustarte