Documentos de Académico
Documentos de Profesional
Documentos de Cultura
org/wiki/Teor%C3%ADa_de_colas#Historia
La teoría de colas
es el estudio matemático de las colas o líneas de espera dentro de un sistema.
Esta teoría estudia factores como el tiempo de espera medio en las colas o la
capacidad de trabajo del sistema sin que llegue a colapsar. Dentro de
las matemáticas, la teoría de colas se engloba en la investigación de
operaciones y es un complemento muy importante a la teoría de sistemas y
la teoría de control. Se trata así de una teoría que encuentra aplicación en una
amplia variedad de situaciones
como negocios, comercio, industria, ingenierías, transporte y logística o teleco
municaciones.
En el caso concreto de la ingeniería, la teoría de colas
permite modelar sistemas en los que varios agentes que demandan cierto
servicio o prestación, confluyen en un mismo servidor y, por lo tanto, pueden
registrarse esperas desde que un agente llega al sistema y el servidor atiende
sus demandas. En este sentido, la teoría es muy útil para modelar procesos
tales como la llegada de datos a una cola en ciencias de la computación, la
congestión de red de computadoras o de telecomunicación, o la
implementación de una cadena productiva en la ingeniería industrial.
En el contexto de la informática y de las tecnologías de la información y la
comunicación las situaciones de espera dentro de una red son más frecuentes.
Así, por ejemplo, los procesos enviados a un servidor para su ejecución forman
colas de espera mientras no son atendidos; la información solicitada, a través
de Internet, a un servidor Web puede recibirse con demora debido a
la congestión en la red; también se puede recibir la señal de línea de la que
depende nuestro teléfono móvil ocupada si la central está colapsada en ese
momento, etc.
Modelo de formación de colas
Se forman debido a un desequilibrio temporal entre la demanda del servicio y la
capacidad del sistema para suministrarlo.
En las formaciones de colas se habla de clientes, tales como máquinas
dañadas a la espera de ser rehabilitadas. Los clientes pueden esperar en cola
debido a que los medios existentes sean inadecuados para satisfacer la
demanda del servicio; en este caso, la cola tiende a ser explosiva, es decir, a
ser cada vez más larga a medida que transcurre el tiempo. Los clientes puede
que esperen temporalmente, aunque las instalaciones de servicio sean
adecuadas, porque los clientes llegados anteriormente están siendo atendidos.
Objetivos
Los objetivos de la teoría de colas consisten en:
Identificar el nivel óptimo de capacidad del sistema que minimiza su coste.
Evaluar el impacto que las posibles alternativas de modificación de la
capacidad del sistema tendrían en su coste total.
Establecer un balance equilibrado (“óptimo”) entre las consideraciones
cuantitativas de costes y las cualitativas de servicio.
Prestar atención al tiempo de permanencia en el sistema o en la cola de
espera.
Elementos existentes en la teoría de colas
Figura 1.
Proceso básico de colas: Los clientes que requieren un servicio se generan
en una fase de entrada. Estos clientes entran al sistema y se unen a una cola.
En determinado momento se selecciona un miembro de la cola, para
proporcionarle el servicio, mediante alguna regla conocida como disciplina de
servicio. Luego, se lleva a cabo el servicio requerido por el cliente en un
mecanismo de servicio, después de lo cual el cliente sale del sistema de colas.
Fuente de entrada o población potencial: Una característica de la fuente de
entrada es su tamaño. El tamaño es el número total de clientes que pueden
requerir servicio en determinado momento. Puede suponerse que el tamaño es
infinito o finito.
Cliente: Es todo individuo de la población potencial que solicita servicio como
por ejemplo una lista de trabajo esperando para imprimirse.
Capacidad de la cola: Es el máximo número de clientes que pueden estar
haciendo cola (antes de comenzar a ser servidos). De nuevo, puede suponerse
finita o infinita.
Disciplina de la cola: La disciplina de la cola se refiere al orden en el que se
seleccionan sus miembros para recibir el servicio. Por ejemplo, puede ser:
FIFO (first in first out) primero en entrar, primero en salir, según la cual se
atiende primero al cliente que antes haya llegado.
LIFO (last in first out) también conocida como pila que consiste en atender
primero al cliente que ha llegado el último.
RSS (random selection of service) que selecciona los clientes de manera
aleatoria, de acuerdo a algún procedimiento de prioridad o a algún otro orden.
Processor Sharing – sirve a los clientes igualmente. La capacidad de la red se
comparte entre los clientes y todos experimentan con eficacia el mismo retraso.
Mecanismo de servicio: El mecanismo de servicio consiste en una o más
instalaciones de servicio, cada una de ellas con uno o más canales paralelos
de servicio, llamados servidores.
Redes de colas: Sistema donde existen varias colas y los trabajos fluyen de
una a otra. Por ejemplo: las redes de comunicaciones o los sistemas operativos
multitarea.
El proceso de servicio: Define cómo son atendidos los clientes.
Notación Kendall
David G. Kendall introdujo una notación de colas A/B/C en 1953. La notación
de Kendall para describir las colas y sus características puede encontrarse en
Tijms, H.C,Algorithmic Analysis of Queues, Capítulo 9 en A First Course in
Stochastic Models, Wiley, Chichester, 2003. Ha sido desde entonces extendida
a 1/2/3/(4/5/6) donde los números se reemplazan con:
Un código que describe el proceso de llegada. Los códigos usados son:
M para "Markoviano" (la tasa de llegadas sigue una distribución de Poisson),
significando una distribución exponencial para los tiempos entre llegadas.
D para unos tiempos entre llegadas deterministas, es decir, no siguen un
proceso probabilista a la hora de su determinación.
G para una "distribución general" de los tiempos entre llegadas, o del régimen
de llegadas.
Un código similar que representa el proceso de servicio (tiempo de servicio). Se
usan los mismos símbolos.
El número de canales de servicio (o servidores).
La capacidad del sistema, o el número máximo de clientes permitidos en el
sistema incluyendo esos en servicio. Cuando el número está al máximo, las
llegadas siguientes son rechazadas. Un caso particular de esta situación es el
modelo M/M/n/n o Erlang-B, en el cual no hay cola de espera, sino n recursos
(servidores) y hasta n usuarios como máximo; si llega el usuario n+1, es
rechazado. Este último modelo es el que se aplica en telefonía convencional.
Otro caso particular es el modelo Erlang-C o M/M/n, donde la capacidad del
sistema es ilimitada, aunque haya sólo n recursos; en caso de llegar el recurso
número n+1, pasará a una cola de espera, pero no es rechazado.
El orden de prioridad en la que los trabajos en la cola son servidos:
First Come First Served (FCFS) o First In First Out (FIFO)
Last Come First Served (LCFS) o Last In First Out (LIFO)
Service In Random Order (SIRO)
Processor Sharing
El tamaño del origen de las llamadas. El tamaño de la población desde donde
los clientes vienen. Esto limita la tasa de llegadas.
Estructuras típicas
Figura 2.
El primer sistema que se muestra en la figura, se llama un sistema de un
servidor y una cola. El segundo, una línea con múltiples servidores. El tercer
sistema, aquel en que cada servidor tiene una línea de separación. El cuarto
sistema, es una línea con servidores en serie. Este modelo puede aplicarse a
trabajos ordenador que esperan tiempo de procesador.
Medidas de desempeño de estado estable.
En teoría de colas se utilizan comúnmente las siguientes medidas de
desempeño, estas se calculan de forma diferente según el modelo de la línea
de espera:
Ls = Cantidad esperada de clientes en un sistema
Lq = Cantidad esperada de clientes en una cola
Ws = Tiempo de espera en el sistema
Wq = Tiempo de espera anticipado en la cola
ρ = Factor de utilización del sistema
Modelos
M/M/1
En este modelo, según la notación de Kendall, la tasa de llegadas y la tasa de
servicio siguen una distribución de Poisson. Y hay un solo servidor. Las
medidas de desempeño de estado estable se calculan de la siguiente forma:
Donde λ es la tasa promedio de arribos al sistema y μ la tasa promedio de
servicio.
Cabe resaltar que si λ ≥ μ el sistema es explosivo, además, Wq nunca será
mayor que Ws.2
M/M/s
Este modelo supone que existen en el sistema s (entero positivo) servidores,
en este caso las medidas de desempeño se calcularán así:
Las limitaciones del acercamiento matemático
La teoría de formación de una cola es a menudo demasiado restrictiva
matemáticamente para ser capaz de modelar todas las situaciones verdaderas
a nivel mundial. Por ejemplo; los modelos matemáticos a menudo asumen el
número de clientes, o la capacidad de la cola infinitos, cuando es evidente que
deben estar limitados. Los medios alternativos del análisis de la teoría de colas
consisten generalmente en simulaciones de ordenador o en el análisis de datos
experimentales.
Aplicación a la telefonía
Las redes telefónicas se diseñan para acomodar la intensidad ofrecida del
tráfico con solamente una pequeña pérdida. El funcionamiento de los sistemas
depende de si la llamada es rechazada, de si está perdida, etc. Normalmente
los sistemas de desbordamiento hacen uso de rutas alternativas e incluso estos
sistemas tienen una capacidad de carga finita o máxima de tráfico. Sin
embargo, el uso de las colas permite que los sistemas esperen por las
peticiones de su cliente hasta que los recursos libres estén disponibles. Esto
significa que si los niveles de la intensidad del tráfico exceden de la capacidad
disponible, las llamadas del cliente se perderían. La disciplina de colas
determina la manera de cómo manejar las llamadas de los clientes. Define la
manera en que les servirán, la orden de las cuales se sirven, y la manera en la
que los recursos se dividen entre los clientes.
https://www.um.es/or/ampliacion/apuntes.html
Características de un sistema de colas
Definición 1 (Teoría de Colas)
Se entiende por Teoría de Colas el estudio de las líneas de espera que se
producen cuando llegan clientes demandando un servicio, esperando si no se
les puede atender inmediatamente y partiendo cuando ya han sido servidos.El
creador de la Teoría de Colas fue el matemático danés A. K. Erlang por el año
1909. Ha tenido un fuerte auge por su utilidad en el modelado del
comportamiento estocástico de gran número de fenómenos, tanto naturales
como creados por el hombre. Se puede aplicar en problemas relacionados con
redes de teléfonos, aeropuertos, puertos, centros de cálculo, supermercados,
venta mediante máquinas, hospitales, gasolineras...
Características
A lo largo del tiempo se producen llegadas de clientes a la cola de un sistema
desde una determinada fuente demandando un servicio. Los servidores del
sistema seleccionan miembros de la cola según una regla predefinida
denominada disciplina de la cola. Cuando un cliente seleccionado termina de
recibir su servicio (tras un tiempo de servicio) abandona el sistema, pudiendo o
no unirse de nuevo a la fuente de llegadas.
Fuente
Recibe el nombre de fuente el dispositivo del que emanan las unidades que
piden un servicio. Si el número de unidades potenciales es finito, se dice que la
fuente es finita; en caso contrario se dice que es infinita.
Proceso de llegada
Aunque a veces se sabe exactamente cuándo se van a producir las llegadas al
sistema, en general el tiempo que transcurre entre dos llegadas consecutivas
se modela mediante una variable aleatoria. En particular, cuando la fuente es
infinita se supone que las unidades que van llegando al sistema dan lugar a un
proceso estocástico llamado de conteo; si todos los tiempos entre llegadas son
variables aleatorias independientes idénticamente distribuidas (vv.aa.ii.ii.dd.),
se dice que es un proceso de renovación. Usualmente, por razones que se
verán posteriormente, el proceso que se utiliza es un proceso de Poisson.
Cuando la fuente es finita se suele asumir que la probabilidad de que se
produzca una llegada en un intervalo de tiempo es proporcional al tamaño de la
fuente en ese instante. En general, nos restringiremos al estudio de sistemas
de colas con fuentes infinitas.
Mecanismos de servicio
Se llama capacidad del servicio al número de clientes que pueden ser servidos
simultáneamente. Si la capacidad es uno, se dice que hay un solo servidor (o
que el sistema es monocanal) y si hay más de un servidor, multicanal. El
tiempo que el servidor necesita para atender la demanda de un cliente (tiempo
de servicio) puede ser constante o aleatorio; en este último caso supondremos,
por lo general, que los tiempos de servicio son vv.aa.ii.ii.dd. Además,
supondremos que son independientes de los tiempos entre llegadas. A veces el
servidor sólo está disponible durante una parte del tiempo de funcionamiento
del sistema.
Disciplina de la cola
En sistemas monocanal, el servidor suele seleccionar al cliente de acuerdo con
uno de los siguientes criterios (prioridades):
el que llegó antes (disciplina FIFO),
el que llegó el último (LIFO),
el que menos tiempo de servicio requiere,
el que más requiere...
Incluso puede interrumpirse un servicio para empezar otro que corresponda a
un cliente recién llegado con mayor prioridad (fenómeno de anticipación); de no
ser así, la prioridad se llama de cabeza de línea.
En sistemas multicanal puede haber asignación a un servidor (elección de cola)
y cambios de servidor forzosos o aleatorios (cambio de cola).
Otros fenómenos frecuentes son el rechazo (si la cola tiene una capacidad
máxima, el cliente no es admitido en ella), el abandono (por ejemplo, si se
excede un tiempo de espera), etcétera.
Colas en tándem
Este proceso se produce cuando a la salida de un servicio hay una o más colas
(porque se necesitan varios servicios en un determinado orden).
Notación (Kendall, 1953)
Para especificar un tipo de cola se escribe:
proceso de llegada / proceso de servicio / nº de canales / capacidad /
disciplina / ...
Objetivos
Los objetivos son dos: en primer lugar, describir adecuadamente el sistema, y
en segundo lugar, tratar de optimizarlo.
La efectividad del sistema viene resumida a través de las medidas siguientes
(generalmente variables aleatorias):
N(t)= número de clientes en el sistema en el instante t.
L(t)= número de clientes en la cola en el instante t.
V(t)= tiempo de espera virtual en el instante t: el tiempo que se necesitaría para
atender a todos los clientes del sistema en este momento (y sólo a ellos).
n = cliente n-ésimo que ha sido admitido en el sistema.
Para cada cliente se tiene:
(que puede ser una variable aleatoria), se dice que el sistema alcanza el estado
estacionario. Mientras se llega a este estado, se está en el estado transitorio.
En estado estacionario las otras variables de interés son
Little demostró que, bajo ciertas condiciones poco restrictivas, se tiene las
igualdades
Respecto a la optimización del sistema, ésta se lleva a cabo fijando una función
objetivo y actuando sobre un conjunto de variables de decisión (por ejemplo, el
número de canales).
Modelos de colas determinísticos
En el modelo determinístico los tiempos de servicio son conocidos con
exactitud (no son aleatorios). Con la notación que se introdujo anteriormente,
se estudiará el modelo D/D/1/k-1, donde:
supondrá , pues en caso contrario todo cliente puede ser servido sin
problema y no se produce el fenómeno de cola.
Por lo tanto .
Suponiendo que se tiene disciplina FIFO, vamos a definir los valores asociados
a cada cliente.
Si entonces Wn+1=0.
Si entonces Wn+1=Wn+Sn-Tn.
por lo que
Si , entonces cualquier cliente que sea aceptado será servido después de
que hayan sido atendidos los k-2 que le preceden (y no los k-1, pues su llegada
ha coincidido con una salida). Así
En resumen:
aleatorias , con .
t es el parámetro que se asocia al tiempo y X(t) representa el estado del
proceso en el instante t.
Ejemplo:
Si X(t) representa la distancia entre dos puntos que se mueven aleatoriamente
se tiene que
pues
Teorema 1
.
4.
.
Demostración:
( )
Si es un proceso de Poisson entonces, por definición, se cumplen las
condiciones 1) y 2). Veamos que se verifican también 3) y 4).
3)
ya que
4)
pues
( )
Sea ahora el resultado cierto para 1, 2,...,n-1 y veamos que lo sigue siendo
para n. Por el teorema de la probabilidad total:
Pn(t+h)=P(N(t+h)=n)=
P(N(t)=0,N(t+h)-N(t)=n)=
(como para )
=Pn(t) P(N(h)=0)+Pn-1(t) P(N(h)=1)+o(h )=
De donde
Definición 9
.
4.
.
Definición 10
.
2.
.
Definición 11
2.
para
3.
para
4.
P(N(t+h)-N(t)=0|N(t)=0) P(N(t)=0) +
P(N(t+h)-N(t)=-1|N(t)=1) P(N(t)=1) +
n>0
Ahora se presentan tres posibilidades con probabilidades no despreciables:
1.
En el instante t había n individuos y no ha habido ni nacimientos ni muertes.
2.
En el instante t había n-1 individuos y ha habido un nacimiento (y ninguna
muerte).
3.
En el instante t había n+1 individuos y ha habido una muerte (y ningún
nacimiento).
Por lo tanto:
Pn(t+h) = P(N(t+h)=n) = P(N(t+h)=n|N(t)=n-1) P(N(t)=n-1)+
P(N(t+h)=n|N(t)=n) P(N(t)=n) +
P(N(t+h)=n|N(t)=n+1) P(N(t)=n+1) + o(h) =
Al tomar límites cuando h tiende hacia cero:
se tendrá que
siendo .
1.
Compruébese que el número de elementos de la población en el instante t es
Solución:
Como la división o muerte de cada elemento es independiente de las otras,
Si , entonces E[N]=0.
Si , entonces .
Si , entonces .
El modelo M/M/1
En primer lugar, se describe el modelo:
1.
entonces .
Demostración:
y tasa de muerte , .
Debe observarse que la distribución exponencial tiene ausencia de memoria,
Luego
se tiene
Luego
Análisis de los ciclos de ocupación y desocupación
Sea T0= la longitud de un ciclo de desocupación y sea T1= la longitud de un
ciclo de ocupación. La longitud (media) de un ciclo de ocupación y
desocupación (en estado estacionario) será E(T0+T1). Como, por la propiedad
Ahora vemos que se obtienen las mismas ecuaciones que se tenían
anteriormente, pues considerando que se produce una conservación de flujos
en el grafo se tiene:
Interpretación: como y son, respectivamente, el número medio de
(Nodos de abajo)
En definitiva:
Si se define
entonces
G(s) = G0(s) + G1(s).
Como además
se tiene que
por lo que
Así
Buscamos el valor donde f alcance su mínimo; si Q tomara valores reales,
Como
Ecuaciones de equilibrio:
Así
P0(t)=P(N(t)=0)
y
P1(t)=P(N(t)=1)=1-P0(t).
Se tiene que .
Evaluando en t=0:
luego
valga .
El modelo M/G/1
En este caso, los tiempos de servicio son variables aleatorias independientes,
no necesariamente exponenciales, aunque sí idénticamente distribuidas e
independientes de los tiempos entre llegadas.
Entonces
Nn+1 = Nn + A - Un,
siendo A el número de llegadas al sistema en S unidades de tiempo (A también
es v.a.) y
notación .
Y tomando límites:
considerar .
Caso 1: .
Caso 2: .
Razonando como antes, pero teniendo en cuenta que en esta ocasión deben
llegar j:
Así
Al tomar límites en n:
siendo kl=0 si l<0.
En notación matricial:
Ahora
Luego
Como
entonces
Gn)(0)=n! P(N=n).
Así que
parámetro .
servicio Exp .
De nuevo, definimos .
Entonces
En general, se tiene
Teniendo ahora en cuenta que la suma de las probabilidades debe ser uno y
Luego
Así
Entonces
por lo que