Está en la página 1de 13

1.

INTRODUCCIÓN
Si es esto una economía de servicios, ¿por qué estoy todavía en espera? Pregúntele a Frances Frei y Anne
Morriss en su libro “Uncommon Service: How to Win” poniendo a los clientes en el centro de su
negocio. Este es solo un ejemplo de espera que puede haber experimentado. ¿Has esperado
recientemente en una fila para pagar en el supermercado? ¿En un restaurante de comida "rápida"? ¿Para
descargar una página web? Todos estos son ejemplos del fenómeno de las colas: el acto de esperar a que
comience un servicio. Las colas son una preocupación importante para los gerentes operativos tanto en
entornos de servicio como de fabricación. A menudo necesitan tomar decisiones con respecto a los
niveles de capacidad, la dotación de personal y la tecnología que afectan el tiempo que los clientes o
bienes pasan esperando un servicio.

Las líneas de espera, o colas, a menudo se forman debido a la variabilidad en un sistema. En la mayoría
de las empresas de servicios, así como en algunos entornos de fabricación, el trabajo del gerente
operativo se ve complicado por la incapacidad de especificar la hora de llegada de una solicitud del cliente
o el contenido del servicio que se prestará. En un negocio de comida rápida, por ejemplo, los clientes
llegan a horarios impredecibles y aleatorios durante el día y esperan poder ordenar de una amplia
variedad de artículos. El desafío para el gerente del restaurante es cumplir con las expectativas de los
clientes y consumir la menor cantidad de recursos posible. El gerente debe determinar el nivel de
personal adecuado, la tecnología adecuada para preparar los alimentos y el objetivo del tiempo de espera
del cliente. Por ejemplo, muy poco personal y una parrilla que toma una cantidad excesiva de tiempo para
cocinar hamburguesas puede resultar en un tiempo de espera demasiado largo. Demasiado personal y
una parrilla que cocina las hamburguesas más rápidamente (y es más costosa) puede proporcionar un
tiempo de espera corto pero disminuir la rentabilidad.

Las colas también pueden formarse en un entorno de fabricación, donde, por ejemplo,
las partes físicas pueden tener que esperar a que una máquina esté disponible. En esta lectura, utilizamos
principalmente ejemplos de servicio para explicar los fenómenos de colas. Los interesados en la
fabricación pueden aplicar fácilmente los marcos de trabajo y modelos discutidos aquí.

Las líneas de espera pueden ocasionar demoras. Las consecuencias de estos retrasos dependen
del contexto. Un retraso más corto en una sala de emergencias de un hospital puede
prevenir complicaciones médicas graves para pacientes con ataques cardíacos. Los tiempos de respuesta
más rápidos para el procesamiento del préstamo pueden aumentar el número de solicitudes de
préstamos y la rentabilidad de la entidad crediticia. Las largas esperas en un restaurante pueden hacer
que los clientes potenciales vayan a otra parte a comer. Los retrasos más cortos resultan, en muchos
casos, en un mejor uso de mano de obra, equipo e instalaciones, y una mayor capacidad para
proporcionar a los clientes un excelente nivel de servicio.

En esta lectura, presentamos marcos y herramientas que los gerentes pueden usar para comprender las
características de los sistemas de línea de espera y mejorar las operaciones donde se pueden formar
colas. Primero discutimos las preguntas relacionadas con las colas que los gerentes hacen al diseñar una
operación de servicio y la naturaleza de los sistemas de línea de espera. Luego presentamos algunos
supuestos básicos sobre esos sistemas y describimos varias características de ellos.

También presentamos una fórmula para aproximar la longitud de línea en un sistema, algunas de las ideas
sobre los sistemas de colas que surgen de esta fórmula y algunas aplicaciones adicionales de la fórmula.
En la lectura complementaria, abordamos formas de administrar las percepciones de espera de los
clientes

2 LECTURA ESENCIAL
2.1 Objetivos de gestión y la naturaleza de las líneas de espera
El objetivo de los gerentes al aplicar los cálculos en esta lectura es comprender y estimar los diversos
costos y características de rendimiento de los sistemas de línea de espera en procesos de servicio
específicos para que puedan tomar las decisiones de diseño apropiadas. Los costos pueden estar
relacionados con la cantidad y el tipo de servidores; Las características de rendimiento
incluyen consideraciones como el tiempo de espera del cliente y la longitud de la línea.

Por lo tanto, al diseñar un servicio, los gerentes pueden hacer las siguientes preguntas relacionadas con
la cola:
• En promedio, ¿cuántos clientes estarán esperando el servicio? ¿Cuánto tiempo, en promedio,
esperará un cliente?
• ¿Cuántos servidores son necesarios para alcanzar un límite específico para el tiempo de espera
del cliente?
• ¿Qué número de servidores (en una situación particular) conduce a un tiempo de
espera promedio para los clientes y un tiempo de inactividad promedio para los servidores
que minimiza el costo total del sistema de servicio?
• ¿Deben combinarse los servidores en una o más áreas centralizadas?
• ¿Qué mejoras de proceso deberían implementarse dadas las diferentes tarifas de servicio, costos
operativos y costos objetivo y objetivos de servicio?
• ¿Cuál es el impacto de una reducción en la variabilidad del tiempo entre llegadas de clientes o los
tiempos de servicio?

Las respuestas dependen claramente de los costos relativos (en una situación particular) de clientes y
servidores. Como implican las preguntas anteriores, un sistema de línea de espera en un entorno de
servicio tiene tres componentes básicos:

1. Servidores
2. Clientes, que pueden llegar en horarios aleatorios o no programados
3. Encuentros de servicio, que generalmente varían en sus tiempos de finalización

A veces, el tiempo de espera de un cliente y el tiempo de inactividad de un servidor incurren en costos de


bolsillo fácilmente medibles. Por ejemplo, cada minuto que un cliente potencial espera por teléfono a un
representante de servicio al cliente le cuesta a la organización los cargos telefónicos de larga
distancia. Pero en otras ocasiones, no hay costos claros asociados con un cliente que espera. Los clientes
que hacen cola en restaurantes, oficinas de correos, bancos, aeropuertos, etc., no imponen costos
directos al proveedor de servicios, pero si las filas se vuelven demasiado largas, algunos clientes pueden
irse antes de completar la transacción o elegir un competidor la próxima vez Necesito ese servicio. Por lo
tanto, un gerente de operaciones debe planear para las líneas de espera y hacer que sta decisiones ffing
accordingly-- todo el tiempo tratando de gestionar el comercio en curso fuera entre la capacidad de
servicio y de espera excesivo innecesario.

Es importante que los gerentes comprendan que se puede formar una línea incluso si la capacidad de los
servidores excede la demanda del cliente. El tiempo de espera no se puede eliminar por completo debido
a la variabilidad que mencionamos anteriormente. Un gran número de clientes puede llegar en un corto
período de tiempo, o puede haber algunos encuentros de servicio poco espaciados que toman una
cantidad excesiva de tiempo. Por el contrario, incluso si hay pocos servidores presentes y las líneas
de espera prevalecen, los servidores pueden estar inactivos en algún momento si hay una gran brecha
entre las llegadas o hay algunos encuentros de servicio cortos sucesivos.

La ilustración interactiva 1 muestra una representación gráfica de un sistema de colas.

Hay un servidor y el tiempo de servicio es siempre exactamente 4 minutos por cliente. Por lo
tanto, durante un intervalo de 25 minutos, el servidor podría atender a 5 clientes y tener 5 minutos de
tiempo de inactividad. Del mismo modo, es posible atender a los 5 clientes sin tener que esperar
el servicio. Sin embargo, esa situación ocurre solo si las llegadas de los clientes están espaciadas de
manera uniforme durante el intervalo de 25 minutos.

Para ejecutar la simulación, haga clic en "Inicio" y luego haga clic en "Llegada del cliente" cuatro veces, una
para cada cliente. Cuando finalizan los 25 minutos simulados, puede ver datos sobre la longitud de las
colas que forman el tiempo de espera por cliente. Pruebe diferentes patrones de llegada para ver el efecto
en las métricas de rendimiento.

ILUSTRACIÓN INTERACTIVA 1 (ver en archivo original)

2.2 Supuestos básicos, símbolos y definiciones


Los cálculos discutidos en esta lectura dependen de los siguientes supuestos sobre situaciones de línea
de espera:

1- Primero en llegar, primero servido. Los clientes forman colas individuales mientras esperan
el servicio y son atendidos por orden de llegada. Los clientes pasan a un canal de servidor (por
ejemplo, la ventana de un cajero en un banco) a medida que está disponible.
2- Los servidores realizan servicios idénticos. Los servidores también pueden denominarse canales
que prestan servicios; por lo tanto, el número de servidores es igual al número de canales. Puede
haber múltiples servidores operando en paralelo para dar servicio a una línea.
3- Llegadas aleatorias y servicio. Las llegadas de clientes ocurren al azar a una tasa promedio, llamada
tasa de llegada. Los servicios se realizan a una tasa promedio, llamada tasa de servicio, en cada
uno de los servidores. Tenga en cuenta que las unidades de tasa de llegada promedio y tasa de
servicio promedio son clientes por unidad de tiempo. El valor recíproco de la tasa de servicio, el
tiempo de servicio, es el tiempo promedio para atender a un cliente y se mide en unidades de
tiempo. Del mismo modo, el valor recíproco de la tasa de llegada promedio es el tiempo
promedio entre llegadas, llamado tiempo entre llegadas, y también se mide en unidades de
tiempo.
4- Equilibrio estadístico (estado estacionario). En promedio, la capacidad de procesar a los clientes
debe ser mayor que la velocidad a la que llegan; de lo contrario, los clientes que lleguen podrían
tener que esperar en la línea b indefinidamente. La capacidad promedio del sistema para
procesar clientes por unidad de tiempo viene dada por la tasa de servicio total promedio, que es
igual a (número de servidores) · (tasa de servicio por servidor). El número promedio de clientes
que requieren servicio por unidad de tiempo viene dado por la tarifa de llegada. En situaciones
transitorias, como el inicio del sistema ----- por ejemplo, cuando un parque de diversiones abre
por primera vez en la mañana ----- el número en la cola y en servicio depende de la cantidad de
clientes que esperaron a que el sistema entrar en funcionamiento y en cuanto tiempo el sistema
ha estado en funcionamiento. Con el tiempo, el impacto de las condiciones iniciales tiende a
disminuir, y el número de clientes en el sistema y en línea es independiente del tiempo. Los
cálculos descritos en esta lectura no son apropiados para situaciones transitorias.
5- Fuente infinita de clientes potenciales. Asumimos una fuente infinita de clientes
potenciales. También podemos usar estos cálculos cuando la población del sistema de colas no
sea mayor al 1% de la población de la fuente de clientes potenciales.
6- Comportamiento apropiado de la cola. Suponemos que la tasa de llegada es igual a la tasa
de demanda. Esta suposición no implica instancias de: a) balking (destinatarios potenciales que
se niegan a unirse a la cola) b) renegar (los clientes en la cola se van antes de ser
atendidos) c) ciclismo (los destinatarios del servicio regresan a la cola después del servicio)
7- Efectividad de servicio uniforme. La efectividad del servicio en cada canal del servidor es uniforme
en el tiempo y en todo el sistema.

Los cálculos en esta lectura también usan los símbolos y definiciones descritos en la Tabla 1.

2.3 Características de rendimiento de los sistemas de línea de espera


Ahora que hemos establecido los supuestos y definiciones proporcionados en la sección anterior,
podemos describir las características de rendimiento de los sistemas de línea de espera (factor de
utilización, número promedio de clientes en servicio, número promedio de clientes que esperan en la
cola, número promedio de clientes en el sistema, tiempo de espera esperado en la cola, tiempo promedio
total esperado en el sistema y costos esperados) y explore las relaciones entre ellos.
Factor de utilización (u): el factor de utilización mide el porcentaje de tiempo que los servidores están
ocupados con los clientes.

A = u / mS

Tenga en cuenta que u es un porcentaje y es un número sin unidad. Considere un sistema con una tasa
de llegada de 10 personas por hora, donde cada servidor puede dar servicio a 11 por hora. Para m =
1 servidor, la utilización es u = 10/11 = 91%. Esto indica que el servidor está ocupado el 91%
del tiempo. Como puede ver en la Figura 1, el factor de utilización disminuye a medida que aumenta el
número de servidores.

Número promedio de clientes en servicio (Ns): el número promedio de clientes en servicio es A / S,


derivado de multiplicar el factor de utilización (u) por el número de servidores (m). (Esto no incluye la
cantidad de clientes que esperan en la fila

Ns variará como una función de dirección de la utilización, que es una función de las tasas de llegada y
servicio del sistema, como se muestra arriba.

Número promedio de clientes que esperan en la cola (Lq): el número promedio de clientes que esperan
en la cola excluye a los clientes que están siendo atendidos. Para la mayoría de los sistemas, Lq no puede
calcularse directamente debido a las complejas interacciones causadas por las distribuciones de
probabilidad que describen los procesos de llegada y servicio; su valor debe ser aproximado. En la
siguiente sección se presenta una fórmula de aproximación (o aproximación de cola) para
esta característica de rendimiento. Mostraremos que la longitud de la cola es función del número de
servidores, el factor de utilización y la variabilidad de llegada y servicio.

Las características de rendimiento restantes de los sistemas de línea de espera dependen del valor de Lq,
ya sea observado empíricamente o estimado a partir de la fórmula de aproximación descrita en la
siguiente sección.

Número promedio de clientes en el sistema (L): por definición, el número promedio de clientes en el
sistema es igual al número promedio de clientes en línea más el número promedio de clientes en
servicio. Es decir:

Tiempo de espera esperado en la cola (Wq): El tiempo de espera esperado se puede determinar
dividiendo la longitud promedio de la cola por la tasa de llegada promedio:
La fórmula que relaciona el tiempo de espera y la longitud de las líneas se conoce comúnmente como Ley
de Little. Esta relación, Lq = A * Wq para la cola y L = A * W para todo el sistema, fue inicialmente probada
por Jhon DC Little. La fórmula establece que la longitud de una línea está directamente relacionada con
el tiempo pasado en la línea (o que el número de clientes o artículos en el sistema está directamente
relacionado con el tiempo total pasado en el sistema). Dados cualquiera de los dos parámetros, el tercero
puede determinarse. Por ejemplo, si sabemos que la longitud promedio de la línea de una tienda de donas
es de 3.5 clientes, y sabemos que el tiempo promedio de espera en línea es de dos minutos, podemos
inferir que la llegada a la tienda viene dada por:

La Figura 2 muestra el impacto de los cambios en la longitud de la cola en el tiempo de espera


promedio. Obviamente, cuanto más larga es la línea, más larga es la espera. La pendiente de la línea es la
tasa de llegada. La pendiente no es la tasa de servicio porque la Ley de Little trata con el tiempo de espera
promedio y las longitudes de cola en estado estacionario. La tasa de salida de un sistema de estado estable
debe ser igual a la tasa de llegada. Por lo tanto, la relación entre la longitud de la línea y el tiempo de cola
es una función de la tasa promedio a la que disminuye la línea. Esta tarifa promedio debe ponderar los
tiempos ocupados y no ocupados.

Tiempo promedio total esperado en el sistema (W): debido a que el tiempo promedio de servicio por
elemento personal es igual a la cantidad 1 / S, el tiempo promedio total esperado en el sistema es:

W = Wq + (1 / S)

Las relaciones anteriores entre Wq, Lq, A y S no dependen de ninguna suposición sobre la distribución de
los tiempos de llegada y servicio, sino que son ciertas en general.

Costos esperados : los costos esperados de un sistema de colas para la organización generalmente están
determinados por alguna función por alguna función del número de servidores y el tiempo de espera
esperado de los clientes o el número de clientes en el sistema. El costo de la espera puede ser un gasto
de bolsillo o un costo de oportunidad. Cuando se conoce el costo de la espera, el costo de proporcionar
el servicio se puede agregar al costo de la espera para obtener un costo total del sistema. Por ejemplo,
considere un sistema de colas con tres canales y con un costo por canal de $ 25 por hora. El costo total
del canal es de $ 75 por hora. Si el tiempo de espera promedio por cliente es de 15 minutos (0.25 horas),
y el costo de oportunidad de esperar a la empresa es de $ 15 por hora por cliente, la llegada de cada
cliente costaría (0.25 horas) · $ 15 = $ 3.75 por cliente. Si llegaran 10 clientes por hora, el costo de la espera
sería de $ 37.50 por hora. Sumado al costo de servicio de $ 75, el costo total sería de $ 112.50 por hora.

Agregar un servidor adicional costaría $ 25 por hora. El servidor se agregaría si el costo total del sistema
se redujera a menos de $ 112.50 por hora. Dado que el costo de los servidores ahora es 4 · $ 25 = $ 100,
cuatro servidores serían óptimos si el costo de oportunidad total de la espera ahora es menor de $ 12.50
por hora porque el nuevo costo total del sistema es de $ 100 + el costo de la espera. Esto implica que el
tiempo de espera promedio para un cliente debería ser inferior a 0.0833 horas ($ 12.50 / [$ 15 de costo
de espera por hora por cliente · 10 clientes por hora]). Tenga en cuenta que a 0.0833 horas por cliente, el
costo de espera por cliente sería (0.0833 horas) · $ 15 = $ 1.25 por cliente. Multiplicar por los 10 clientes
por hora produce un costo total de espera de $ 12.50 por hora. A menudo, se desconoce el costo de
espera para los clientes. Aunque puede haber un costo de oportunidad para las personas o artículos en
línea, puede que no haya un costo directo para la empresa. En estos casos, los gerentes pueden establecer
objetivos para el tiempo de espera promedio o para las probabilidades de esperar no más de un período
de tiempo especificado. También pueden considerar algunas compensaciones. Considere el ejemplo
anterior. Si no supiéramos o no pudiéramos estimar el costo del tiempo de espera de $ 15 / hora,
podríamos preguntar: "¿Gastaría $ 25 / hora para reducir el tiempo de espera promedio de 0.25 horas a
x horas?" (Donde x es el estimado tiempo de espera promedio para clientes en el nuevo sistema). Tenga
en cuenta que, en lugar de tener una respuesta numérica explícita a esta pregunta, debemos confiar en
el juicio administrativo. También se podría tener en cuenta la pérdida de ingresos por cliente y la
probabilidad de perder clientes si las líneas son excesivamente largas.

Hemos ignorado el costo del cliente (s) en servicio (es decir, clientes que están siendo atendidos y, por lo
tanto, no están esperando en la cola) en nuestros cálculos. Esto puede incluirse, pero no afectará la
cantidad de servidores que los administradores deciden incluir en el sistema porque el tiempo de servicio
no es una función del número de servidores en estos ejemplos. (Recuerde que Ns = A / S, y ni A ni S son
función del número de servidores). Si los gerentes tuvieran que decidir la tasa de servicio real en cada
canal, sería necesario incluir el tiempo dedicado en el servicio como parte del costo total del sistema.

2.4 Una fórmula de aproximación para Lq


En esta sección, presentamos una fórmula de aproximación para calcular el valor de Lq. Recuerde que una
vez que tengamos este valor para la longitud de la línea, se pueden determinar otras características
de rendimiento importantes, como Wq, W y L. Las relaciones entre Wq, Lq, W, L, A y S, descritas en la
sección anterior, no dependen de la naturaleza o la forma de las distribuciones de probabilidad que
describen los procesos de llegada y servicio. Los valores de las medidas Wq, Lq, W y L dependen en gran
medida de los supuestos con respecto a estas distribuciones, como veremos.

La siguiente fórmula de aproximación Lq se puede usar para aproximar la longitud de la línea de un


sistema de colas. A menudo se le conoce como la aproximación Sakasegawa.3 Aunque existen muchas
fórmulas de aproximación disponibles para los sistemas de colas, presentamos esta fórmula particular por
su relativa facilidad de uso, su uso para desarrollar información sobre los sistemas de colas y la calidad
relativa de su aproximación a valores "verdaderos" para sistemas con líneas de espera significativas.

El coeficiente de variación de una distribución de probabilidad proporciona una medida relativa de


su variabilidad y se define como la desviación estándar de una distribución dividida por su media. Se utiliza
en reconocimiento del hecho de que la magnitud de la desviación estándar de una distribución es más
relevante con respecto al tamaño de su media que como una medida absoluta. Por lo tanto, una
distribución del tiempo de servicio con una desviación estándar de 10 minutos es mucho más significativa
si la media es de 10 minutos que si la media es de 50 minutos.

Mientras que los principios generales de la gestión de colas ----- como la Ley de Little, los efectos del
aumento de la variabilidad y la naturaleza de la agrupación o la combinación de colas (que discutiremos
más adelante ) ----- son aplicables en un En una amplia variedad de situaciones, la fórmula de
aproximación Lq es más limitada y debe usarse solo en situaciones con llegadas por orden de llegada; un
solo tipo de cliente; sin límite en la sala de espera; y condiciones estacionarias de estado
estacionario. Para sistemas con áreas de espera finitas, colas prioritarias, diferentes tipos de clientes y
colas de desbordamiento, hay disponibles modelos más sofisticados y herramientas de simulación. Por
ejemplo, la fórmula de pérdida de Erlang se puede usar para sistemas en los que los clientes son
rechazados cuando el sistema está lleno.4 Muchos complementos de Excel que manejan situaciones
específicas se pueden descargar de Internet (consulte, por ejemplo, Queuing ToolPak de la Universidad
de la Escuela de Negocios de Alberta). El paquete de simulación Extender también se usa a menudo para
modelar situaciones complejas de colas.
Además, la aproximación Lq es útil para calcular la longitud promedio de la línea y el tiempo de espera. En
muchos casos, estamos interesados en la probabilidad de que las longitudes de línea o los tiempos de
espera excedan un cierto umbral. Por ejemplo, el objetivo de un centro de llamadas puede ser tener un
tiempo de espera promedio de 30 segundos, con una probabilidad de no más del 5% de esperar 45
segundos o más. En esta situación, se necesitarían resultados más detallados sobre la forma de
la distribución del tiempo de espera para determinar los requisitos de personal.

2.5 Algunas ideas sobre los sistemas de línea de espera


A primera vista, la fórmula Lq parece intimidante; sin embargo, su forma proporciona información general
sobre los sistemas de colas. Aquí discutimos estos y los ilustramos usando la fórmula Lq.

La utilización creciente degrada el rendimiento a una tasa creciente Al observar la fórmula de


aproximación Lq, vemos que el primer término tiene el factor (1 - u) en el denominador. A medida que el
sistema se vuelve más ocupado, el término (1 - u) (el porcentaje de tiempo de inactividad) se hace más
pequeño; por lo tanto, la longitud de la línea crece a un ritmo creciente. De hecho, cuando u se acerca a 1
y (1 - u) se acerca a 0, la longitud de la línea crece sin límites.

Para ilustrar los efectos de los cambios en la utilización en un sistema de línea de espera, considere
una instalación con un canal, una tasa promedio de llegada de 15 clientes por hora y una tasa promedio
de servicio de 20 clientes por hora. El tiempo de servicio promedio, Ts = 1 / tasa de servicio = 1/20 de una
hora (3 minutos). Por lo tanto, tasa de llegada = 15 / hora; m = número de canales de servicio = 1; y tarifa
de servicio = 20 / hora. Suponga que el coeficiente de variación tanto de la distribución del tiempo
de servicio como de la distribución del tiempo de llegada es 1.0.

• El índice de utilización, u = tasa de llegada / (m · tasa de servicio) = A / ( m · S), es [[15 / (1 · 20)] o


0.75.
• El número promedio de clientes en servicio viene dado por Ns = A / S = 15/20 = 0.75.
• El número promedio de espera (Lq), excluyendo a aquellos que están siendo atendidos, es 2.25
usando la fórmula anterior.
• El número promedio de clientes en el sistema (L) es 3.00 (Lq + Ns). El tiempo de espera promedio
(Wq) es de 0.15 horas, o 9 minutos usando la Ley de Little, Wq = Lq / A.
• El tiempo promedio del sistema (W) es de 0.2 horas o 12 minutos (Wq + [1 / S]).

Las tablas de datos de Excel se pueden usar para medir la sensibilidad de las medidas de rendimiento a
los parámetros de entrada. La Ilustración interactiva 2 también se puede utilizar para probar la
sensibilidad a la tasa de llegada y la utilización. Mueva el control deslizante para la tasa de llegada para
ver cómo cambia el tiempo promedio en la cola. Wq crece exponencialmente a medida que aumenta la
tasa de llegada y la utilización, u, se aproxima al valor 1. Las longitudes de línea crecen drásticamente
porque el impacto de la variabilidad es mucho mayor a tasas de utilización más altas. Un tiempo de
servicio más largo o las llegadas que ocurren más juntas intuitivamente tienen un efecto mayor en la
longitud promedio de la línea cuando los sistemas están más llenos. El beneficio marginal de cada servidor
adicional disminuye a medida que se agregan servidores.

ILUSTRACIÓN INTERACTIVA 2 (ver archivo original)

La variabilidad creciente degrada el rendimiento a una tasa creciente Observando el segundo término de
la fórmula Lq, vemos que cuando los coeficientes de variación tanto de la tasa de servicio como de la tasa
de llegada son iguales a 1, el segundo término no tiene efecto (porque el segundo término es igual a 1 en
ese caso). Esta es una situación común porque la distribución de probabilidad exponencial describe con
precisión los tiempos de llegada y servicio observados empíricamente de muchos sistemas de
colas. La distribución exponencial tiene un CV de 1.

La longitud de la línea aumenta con la variabilidad relativa en el tiempo entre llegadas o en el tiempo de
servicio. De hecho, como hemos dicho, una de las causas de las líneas en los sistemas es
la variabilidad inherente del tiempo de servicio y el tiempo entre llegadas. Cuando observamos el
segundo término, los sistemas con coeficientes de variación más bajos tienen colas más cortas, todas las
demás cosas son iguales, ya que el segundo término se vuelve menor que 1; cuando los coeficientes de
variación exceden 1, la cola es más larga, todas las demás cosas son iguales. En ambos casos, la magnitud
del cambio se ve afectada por el factor de cuadratura. Así que una reducción del 25% en el CV reduce
la cola por menos de 25%, pero un aumento del 25% en el CV aumenta la cola por más moreno 25%.

Para ilustrar los efectos de los cambios en la variabilidad, observe nuevamente la Ilustración interactiva 2
y vea qué sucede cuando cambia los coeficientes de variación del tiempo entre llegadas y el tiempo de
servicio. Para cualquier factor de utilización dado, según lo determinado por la tasa de llegada media y
representada en el gráfico por el gran punto rojo, el tiempo promedio en la cola (y por la Ley de Little, la
longitud de la cola) aumenta con un aumento en la variabilidad del sistema, medido por los coeficientes
de variación. El cuadro también muestra los valores para las desviaciones estándar de los tiempos entre
llegadas y los tiempos de servicio como puntos de referencia.

Todas las demás cosas son iguales, más grande es mejor Para los mismos valores de utilización y
variabilidad, un sistema más grande (es decir, uno con más servidores) puede manejar mejor la
variabilidad. Sabemos esto intuitivamente porque un sistema más grande puede "agrupar" la variabilidad
entre múltiples servidores y puede "absorber" mejor los períodos con un gran número de llegadas en
poco tiempo. Por lo tanto, en sistemas más grandes, un tiempo de servicio prolongado en uno o más de
los canales no tiene un impacto tan grande porque los otros canales pueden servir a los clientes
adicionales. Este efecto es evidente a partir de la fórmula al inspeccionar nuevamente el primer
término. Observe que m, el número de canales, ingresa en el exponente de u, que es un valor menor que
1, de modo que a medida que m se hace más grande, el primer término se hace más
pequeño (proporcional a la raíz cuadrada de m), y la longitud de la línea es más pequeño para sistemas
más grandes con la misma utilización. Tenga en cuenta las implicaciones de esto: si dos sistemas más
pequeños se pueden agrupar (combinar) en un sistema más grande, la longitud promedio de la línea
disminuye mientras se mantiene la misma utilización. Alternativamente, el sistema agrupado se puede
ejecutar con una utilización más alta que los sistemas individuales más pequeños mientras se mantiene
la misma longitud de línea promedio que el sistema más pequeño.

La Ilustración interactiva 3 muestra los efectos de los cambios en el tamaño del sistema. El gráfico muestra
un sistema con una tasa de servicio de 20 clientes por hora y le permite cambiar el número de servidores,
la tasa de llegada media y los coeficientes de variación para el tiempo entre llegadas y el tiempo de
servicio. Tenga en cuenta el efecto de cambiar el número de servidores. Para cualquier utilización dada,
la longitud promedio de la cola es menor para un mayor número de servidores. A medida que aumenta el
número de servidores, el gráfico de tiempo de cola se mueve hacia abajo y hacia la derecha. Esto se
investigará con más detalle en un ejemplo a continuación.

ILUSTRADOR INTERACTIVO 3 (ver archivo original)

2.6 Aplicaciones de muestra de Lq - Fórmula de aproximación


La sección anterior describió ideas que se pueden desarrollar a partir de la fórmula Lq con respecto a la
utilización, la variabilidad y la agrupación. En esta sección proporcionamos ejemplos detallados de cómo
se puede usar la fórmula con datos de muestra y cómo se puede usar para evaluar una decisión de
consolidación en un banco y para tomar una decisión de personal para un centro de llamadas telefónicas.

Uso de la fórmula con datos de muestra La clave para aplicar la fórmula de aproximación Lq es
comprender la diferencia entre la distribución de probabilidad que describe el número de clientes que
llegan en un período de tiempo (tasa de llegada) y la distribución de probabilidad del tiempo entre los
clientes que llegan (entre hora de llegada). El cálculo de la utilización requiere información sobre la tasa
de llegada promedio y la tasa de servicio promedio, medida en clientes por período de tiempo.

Los coeficientes de variación en la fórmula Lq se determinan observando el tiempo entre llegadas y los
tiempos de servicio reales. Si bien la tasa de llegada puede determinarse a partir de los tiempos entre
llegadas, no es necesariamente cierto que la distribución entre llegadas pueda derivarse de las tasas de
llegada. Del mismo modo, si se conoce la distribución del tiempo de servicio, se puede calcular la tasa de
servicio y el coeficiente de variación de los tiempos de servicio.

Conocer el número de personas atendidas en un período de tiempo dado no necesariamente produce la


distribución del tiempo de servicio.
Considere los datos del centro de llamadas presentados en la Tabla 2, que muestra los horarios de llegada
y servicio para los clientes que llamaron entre las 8 am y las 10 am una mañana.

Treinta y cinco clientes llegaron en el intervalo de dos horas. El tiempo medio entre llegadas fue de 3.43
minutos con una desviación estándar de 0.95. Debido a que 35 clientes llegaron en un intervalo de dos
horas, la tasa de llegada es 35/2 = 17.5 clientes por hora. El tiempo de servicio promedio fue de 2.89
minutos, por lo que la tasa de servicio es de 60 / 2.89 = 20.76 por hora.

• Si hay un servidor, la utilización viene dada por 17.5 / 20.76 = 0.84, o 84%.
• El coeficiente de variación de los tiempos entre llegadas está dado por CVIAT = 0.95 / 3.43 =
0.28. Debido a que el tiempo de servicio promedio fue de 2.89 minutos con una desviación
estándar de 0.99 minutos, el coeficiente de variación del tiempo de servicio viene dado por
Se puede predecir que la longitud promedio de la línea será igual a 0.58 clientes. Efectos de la
agrupación En la sección anterior, afirmamos que más grande es mejor. Si es así, un sistema que es
una combinación de varias colas más pequeñas debería tener longitudes de línea y tiempos de espera más
pequeños que las colas individuales. El siguiente ejemplo ilustra este fenómeno, conocido como
agrupación.

Considere un banco que está evaluando una decisión de consolidar tres centros regionales de solicitud
de préstamos en un solo centro centralizado. Los datos para las tres regiones y el centro centralizado
propuesto se muestran en la Tabla 3.

Para cada región, el tiempo promedio en la cola se calculó utilizando la aproximación Lq . La Ley de Little
se usó para calcular el tiempo de espera promedio. Tenga en cuenta que el sistema tiene un promedio de
28.2 clientes en espera, con un tiempo promedio de 26.7 horas. ¿Qué pasa si consolidamos las
regiones? La consolidación produce una tasa de llegada de 1.06 por hora (la suma de las tres regiones
individuales). La utilización se convierte en u = (A / mS) = 1.06 / (6 · 0.2) = 0.8833. La fórmula Lq da como
resultado una longitud de línea de 5.4. Wq = Lq / 1.06 = 5.08 horas. Tenga en cuenta el tremendo efecto
de combinar las regiones. En el sistema original, había 28.2 (17.6 + 2.9 + 7.7) personas esperando en las
tres regiones. Por lo tanto, la combinación de las tres regiones da como resultado una reducción del 81%
en el número de préstamos en espera de servicio ([28.2 - 5.4] /28.2 = 0.81) . Esto ocurre por dos razones:
(1) Ya no hay una región con una alta utilización (Región A) y (2) ya no existe la posibilidad de que una
región tenga varios préstamos en espera de procesamiento mientras que otra región está inactiva.

Call Center Staffing


Un centro de llamadas telefónicas para un catálogo de pedidos por correo tiene el patrón de demanda
que se muestra en la Tabla 4 para los días laborables entre las 8:00 a.m. y el mediodía.

El tiempo promedio por llamada del cliente es de 5 minutos, con una desviación estándar de 6 minutos. El
coeficiente de variación para los tiempos entre llegadas ha sido históricamente 1.

El gerente del centro de atención telefónica desea saber la cantidad de personal requerido en cada bloque
de 1 hora para tener un tiempo de espera promedio de menos de 1 minuto.
Podemos usar la fórmula Lq para responder esta pregunta. Primero, tenga en cuenta que, en lugar de
utilizar la tasa de llegada promedio para todo el período de cuatro horas, deberíamos determinar un nivel
de personal para cada uno de los períodos de cuatro horas; es decir, resolveremos cuatro problemas
separados.

Si se agregan los datos, se sobreestimaría el nivel de personal para períodos con llegadas por debajo del
promedio y se subestimaría el nivel de personal para períodos con rivales por encima del promedio .

Utilizaremos un enfoque de prueba y error con la fórmula Lq para determinar los niveles de personal
adecuados para los tiempos de espera promedio esperados. Los valores darán A , en clientes por hora, en
la Tabla 4. Como el tiempo de servicio promedio es de 5 minutos, la tasa de servicio por miembro del
personal es 60/5 = 12 clientes por hora. CVIAT = 1, como se indica, y CVST = 6/5 = 1.2. Los resultados se
muestran en la Tabla 5.

CUADRO 5

Los valores de m se determinaron aumentando m hasta que los tiempos de espera promedio
fueron inferiores a 1 minuto. Al observar los factores de utilización, podemos ver que más grande es
realmente mejor porque los sistemas más grandes pueden ejecutarse en usos más altos por el mismo
valor objetivo de 1 minuto de tiempo de espera promedio. El administrador puede realizar análisis de
sensibilidad del número de servidores (y la utilización) frente al tiempo de espera promedio objetivo para
ver si el objetivo es viable.

3 LECTURA SUPLEMENTARIA
Percibido versus tiempo de espera real
Una de las referencias clásicas sobre la espera es La psicología de las líneas de espera de 1985 de David
Maister, que hizo el argumento intuitivo pero, en ese momento, novedoso de que la percepción subjetiva
de la calidad del servicio del cliente está influenciada por la experiencia subjetiva de esperando en una
cola tal como está por las medidas objetivas de la experiencia de espera (como la cantidad de minutos
que pasa en la fila). Maister formuló la primera y segunda leyes de servicio ---- es decir, las empresas
pueden influir en la satisfacción del cliente en una línea de espera trabajando en lo que el cliente espera
y lo que el cliente percibe, especialmente en las primeras partes del encuentro de servicio. Maister
también identificó ocho factores psicológicos que aumentan la percepción negativa de un cliente de una
espera, haciéndolo sentir más tiempo:

• El tiempo libre se siente más tiempo que el tiempo ocupado (distracción).


• Las esperas previas al proceso se sienten más largas que las esperas en proceso (momento).
• La ansiedad hace que las esperas parezcan más largas (ansiedad).
• Las esperas inciertas son más largas que ciertas esperas (incertidumbre).
• Las esperas inexplicables son más largas que las explicadas (explicación).
• Las esperas injustas son más largas que las esperas equitativas (equidad).
• Cuanto más valioso sea el servicio, más tiempo esperarán las personas (valor).
• La espera en solitario se siente más tiempo que esperar en un grupo (espera en solitario).

Maister propuso que las empresas remediaran estos factores instituyendo los elementos de servicio al
cliente que la mayoría de los clientes dan por sentados hoy, incluida la actualización de su estado en la
cola, dándoles una sensación de control, proporcionando actividades de valor agregado (o distracción)
para ocupar tiempo de espera (como examinar los menús en un restaurante), promover un sentido de
equidad (por ejemplo, utilizando un sistema de tickets para determinar la prioridad del pedido ) y
establecer expectativas. Especialmente si los clientes deben pasar por una serie de esperas, las compañías
deben reconocer que han "ingresado al sistema" (a través de un procedimiento de registro, como el que
se encuentra en una clínica sin cita previa), aunque puedan tener otro período de espera antes de que se
pueda realizar el servicio (la consulta médica). Las empresas también deben abordar incluso las fuentes ''
irracionales '' de ansiedad de los clientes: si cambio de línea, ¿la próxima se moverá más rápido? ¿Hay
suficientes asientos en el avión para todos los pasajeros con boleto?

Los argumentos de Maister eran teóricos, pero en 1984, el primer estudio de campo empírico
sobre espera (en la industria minorista) había verificado un vínculo entre las condiciones en que
los consumidores esperan y su percepción subjetiva de la espera. Por ejemplo, el estudio mostró que las
personas sobreestimaron el tiempo de espera en un 36% en promedio (una espera de cinco minutos
se siente como siete minutos) .7 A principios de la década de 1990, una encuesta de clientes de hoteles y
restaurantes realizada por un grupo de hoteles del Reino Unido Forte Los gerentes confirmaron de forma
independiente muchos de los factores propuestos por Maister.8 Más del 70% de los encuestados estaban
preocupados por los tiempos de espera. Sin embargo, la encuesta reveló un matiz: aunque los
clientes creían que valía la pena esperar por la calidad y el valor, en cierto momento una espera
sería inaceptable y disminuiría su percepción de la calidad. Esto fue especialmente cierto para los clientes
del hotel encuestados. En sus operaciones, los gerentes del hotel identificaron seis puntos clave en los
que los clientes tienen que esperar durante una noche (check-in, equipaje, línea telefónica, mensajes,
servicio de habitaciones y check-out) y nueve puntos durante una comida de restaurante. Todo esto
brinda oportunidades para establecer estándares operativos y administrar las percepciones de los
clientes.

Una revisión de la literatura de 1999 de 18 estudios empíricos de gestión de la espera apoyó el marco
conceptual básico de Maister, pero también identificó una jerarquía de factores que influyen en el
comportamiento de los consumidores.9 Los autores de la revisión clasificaron su importancia
como factores temporales (tiempo real / duración esperada) primero, factores individuales (disposición
del cliente) segundo, y factores situacionales (controlados por la empresa) tercero. Los
estudios enfatizaron la importancia de las expectativas personales de las esperas, aunque los autores de
los 18 artículos utilizaron diferentes medidas del concepto de expectativa, desde " duración probable "
hasta "duración razonable" y "duración máxima tolerable". Si bien hay muchos factores individuales que
las empresas no pueden controlar, deben tratar de identificar a los clientes cuyas preferencias pueden
acomodar (como proporcionar varias opciones de pago en los supermercados) y aquellos que se
preocupan más por las esperas. La única revisión real de la revisión al marco de Maister fue reclasificar la
"ansiedad" como una variable dependiente, no un factor causal.

Diferentes empresas adoptan diferentes enfoques para compartir información con los clientes. Algunos
dan los tiempos de espera esperados reales: Disney lo hace por sus atracciones en el parque de
atracciones, lo que ayuda a las familias a planificar su día. Otras compañías '' ocultan
'' información visual al, por ejemplo, envolviendo una línea a la vuelta de la esquina. Sobreestimar
también es común; Por ejemplo, un restaurante puede decirles a los clientes que tendrán una espera de
diez minutos, pero luego sentarlos después de ocho minutos para que se sientan satisfechos con el
" servicio rápido".

Dependiendo de la configuración de sus operaciones, los gerentes deben decidir la mejor disciplina de la
cola. ¿Procesarán las solicitudes a la llegada, de acuerdo con la prioridad (como el triaje hospitalario) o
con cita previa? Programar citas implica un buen equilibrio entre dejar a los proveedores de servicios
improductivos (si las citas se programan demasiado separadas) y no cumplir con las altas expectativas de
los consumidores (si las citas se programan tan juntas que el proveedor llega tarde).

Es importante no solo proporcionar a los clientes que esperan información de estado, sino
también mostrarles el trabajo en progreso mientras esperan que se realice su servicio. De hecho, según
una investigación reciente, incluso la "apariencia de esfuerzo" mejora la satisfacción del cliente ----- los
clientes que tienen que esperar pero reciben señales visuales (ya que los clientes que están delante de
ellos) pueden ser más felices que clientes que no tienen que esperar en ausencia de señales visuales.11
Ejemplos de esta ilusión laboral, como la llaman los autores, muestran los nombres de las aerolíneas
buscadas en el sitio web de viajes de Kayak o humean la leche para cada pedido individual de café en
Starbucks.

En su investigación sobre el impacto de la cultura en el comportamiento de las colas, Graham Gillam, Kyle
Simmons y Elliott Weiss señalan que la cultura puede afectar la forma en que un individuo percibe una
cola y, por lo tanto, puede afectar su experiencia de servicio. Sobre la base de otras investigaciones que
demuestran que la justicia social, o un sentido de equidad, a menudo informa de un cliente actitud hacia
esperar en una línea particular, observan que este sentido de la justicia varía , con la cultura. En algunos
países, es común que las personas de mayor estatus sean conducidas al frente de las líneas y sean
atendidas de inmediato. Esto se considera "justo" en lugares menos preocupados por la igualdad entre
las personas. Malcolm Gladwell observa:

En culturas que no están obsesionadas con la puntualidad o el tiempo "perdido", las líneas caóticas para
los servicios se consideran menos problemáticas. Cuando Robert Levine, psicólogo de la Universidad
Estatal de California en Fresno, estudió a los brasileños notoriamente no curiosos, descubrió que tenían
muchos menos relojes y relojes per cápita que las sociedades desarrolladas de manera similar, y que
tenían menos probabilidades de ser precisos.

La British Broadcasting Corporation (BBC) también arroja luz sobre algunas actitudes culturales hacia las
colas:
• En India, aunque por orden de llegada, las líneas de primer servicio son comunes en los aeropuertos,
los que compiten por el puesto a menudo reciben el primer servicio en las estaciones de
ferrocarril y autobús.
• Aunque los rusos generalmente forman líneas ordenadas, pueden ocurrir excepciones en
los consultorios médicos cuando las personas piden "un minuto con un médico, solo para
obtener su firma". Un minuto a menudo se convierte en media hora. Gillam, Simmons y Weiss
concluyen que las empresas que intentan diferenciar sus marcas en los mercados internacionales
deben considerar los desafíos y las oportunidades que presentan las preferencias de colas
locales. En particular, deberían
• comprender lo que es importante para la satisfacción de los clientes con las colas
• determinar los pasos que optimizan la experiencia para los clientes de manera rentable
• investigar qué están haciendo los pares de la industria y cómo responden los clientes a sus colas
• Adaptar continuamente el sistema de gestión de colas en función de las experiencias pasadas y las
necesidades cambiantes de los clientes.

4 TÉRMINOS CLAVE
Tiempo de inactividad: la cantidad de tiempo que un servidor está inactivo mientras espera que lleguen
los clientes.

Longitud de línea: la cantidad de clientes o artículos que esperan en la cola para que comience un servicio.

Ley de Little: una fórmula que mide la relación entre la longitud de la línea, la tasa de llegada y el tiempo
de espera.

Aproximación de cola: una fórmula que estima el número promedio de clientes que esperan en la fila. La
fórmula es una función de la utilización, el número de servidores y la variabilidad en las llegadas y el
servicio, medida por el coeficiente de variación de los tiempos del cliente y el coeficiente de variación de
los tiempos de servicio.

Factor de utilización: el porcentaje de tiempo que un servidor está ocupado con clientes o artículos en
servicio.

Tiempo de espera: la cantidad de tiempo que un cliente o un artículo pasa en línea antes de que comience
un servicio.

También podría gustarte