Está en la página 1de 47

https://es.wikipedia.

org/wiki/Teor%C3%ADa_de_colas#Historia

La teoría de colas
es el estudio matemático de las colas o líneas de espera dentro de un sistema.
Esta teoría estudia factores como el tiempo de espera medio en las colas o la
capacidad de trabajo del sistema sin que llegue a colapsar. Dentro de
las matemáticas, la teoría de colas se engloba en la investigación de
operaciones y es un complemento muy importante a la teoría de sistemas y
la teoría de control. Se trata así de una teoría que encuentra aplicación en una
amplia variedad de situaciones
como negocios, comercio, industria, ingenierías, transporte y logística o teleco
municaciones.
En el caso concreto de la ingeniería, la teoría de colas
permite modelar sistemas en los que varios agentes que demandan cierto
servicio o prestación, confluyen en un mismo servidor y, por lo tanto, pueden
registrarse esperas desde que un agente llega al sistema y el servidor atiende
sus demandas. En este sentido, la teoría es muy útil para modelar procesos
tales como la llegada de datos a una cola en ciencias de la computación, la
congestión de red de computadoras o de telecomunicación, o la
implementación de una cadena productiva en la ingeniería industrial.
En el contexto de la informática y de las tecnologías de la información y la
comunicación las situaciones de espera dentro de una red son más frecuentes.
Así, por ejemplo, los procesos enviados a un servidor para su ejecución forman
colas de espera mientras no son atendidos; la información solicitada, a través
de Internet, a un servidor Web puede recibirse con demora debido a
la congestión en la red; también se puede recibir la señal de línea de la que
depende nuestro teléfono móvil ocupada si la central está colapsada en ese
momento, etc.
Modelo de formación de colas
Se forman debido a un desequilibrio temporal entre la demanda del servicio y la
capacidad del sistema para suministrarlo.
En las formaciones de colas se habla de clientes, tales como máquinas
dañadas a la espera de ser rehabilitadas. Los clientes pueden esperar en cola
debido a que los medios existentes sean inadecuados para satisfacer la
demanda del servicio; en este caso, la cola tiende a ser explosiva, es decir, a
ser cada vez más larga a medida que transcurre el tiempo. Los clientes puede
que esperen temporalmente, aunque las instalaciones de servicio sean
adecuadas, porque los clientes llegados anteriormente están siendo atendidos.
Objetivos
Los objetivos de la teoría de colas consisten en:
Identificar el nivel óptimo de capacidad del sistema que minimiza su coste.
Evaluar el impacto que las posibles alternativas de modificación de la
capacidad del sistema tendrían en su coste total.
Establecer un balance equilibrado (“óptimo”) entre las consideraciones
cuantitativas de costes y las cualitativas de servicio.
Prestar atención al tiempo de permanencia en el sistema o en la cola de
espera.
Elementos existentes en la teoría de colas

Figura 1.
Proceso básico de colas: Los clientes que requieren un servicio se generan
en una fase de entrada. Estos clientes entran al sistema y se unen a una cola.
En determinado momento se selecciona un miembro de la cola, para
proporcionarle el servicio, mediante alguna regla conocida como disciplina de
servicio. Luego, se lleva a cabo el servicio requerido por el cliente en un
mecanismo de servicio, después de lo cual el cliente sale del sistema de colas.
Fuente de entrada o población potencial: Una característica de la fuente de
entrada es su tamaño. El tamaño es el número total de clientes que pueden
requerir servicio en determinado momento. Puede suponerse que el tamaño es
infinito o finito.
Cliente: Es todo individuo de la población potencial que solicita servicio como
por ejemplo una lista de trabajo esperando para imprimirse.
Capacidad de la cola: Es el máximo número de clientes que pueden estar
haciendo cola (antes de comenzar a ser servidos). De nuevo, puede suponerse
finita o infinita.
Disciplina de la cola: La disciplina de la cola se refiere al orden en el que se
seleccionan sus miembros para recibir el servicio. Por ejemplo, puede ser:
FIFO (first in first out) primero en entrar, primero en salir, según la cual se
atiende primero al cliente que antes haya llegado.
LIFO (last in first out) también conocida como pila que consiste en atender
primero al cliente que ha llegado el último.
RSS (random selection of service) que selecciona los clientes de manera
aleatoria, de acuerdo a algún procedimiento de prioridad o a algún otro orden.
Processor Sharing – sirve a los clientes igualmente. La capacidad de la red se
comparte entre los clientes y todos experimentan con eficacia el mismo retraso.
Mecanismo de servicio: El mecanismo de servicio consiste en una o más
instalaciones de servicio, cada una de ellas con uno o más canales paralelos
de servicio, llamados servidores.
Redes de colas: Sistema donde existen varias colas y los trabajos fluyen de
una a otra. Por ejemplo: las redes de comunicaciones o los sistemas operativos
multitarea.
El proceso de servicio: Define cómo son atendidos los clientes.

Notación Kendall
David G. Kendall introdujo una notación de colas A/B/C en 1953. La notación
de Kendall para describir las colas y sus características puede encontrarse en
Tijms, H.C,Algorithmic Analysis of Queues, Capítulo 9 en A First Course in
Stochastic Models, Wiley, Chichester, 2003. Ha sido desde entonces extendida
a 1/2/3/(4/5/6) donde los números se reemplazan con:
Un código que describe el proceso de llegada. Los códigos usados son:
M para "Markoviano" (la tasa de llegadas sigue una distribución de Poisson),
significando una distribución exponencial para los tiempos entre llegadas.
D para unos tiempos entre llegadas deterministas, es decir, no siguen un
proceso probabilista a la hora de su determinación.
G para una "distribución general" de los tiempos entre llegadas, o del régimen
de llegadas.
Un código similar que representa el proceso de servicio (tiempo de servicio). Se
usan los mismos símbolos.
El número de canales de servicio (o servidores).
La capacidad del sistema, o el número máximo de clientes permitidos en el
sistema incluyendo esos en servicio. Cuando el número está al máximo, las
llegadas siguientes son rechazadas. Un caso particular de esta situación es el
modelo M/M/n/n o Erlang-B, en el cual no hay cola de espera, sino n recursos
(servidores) y hasta n usuarios como máximo; si llega el usuario n+1, es
rechazado. Este último modelo es el que se aplica en telefonía convencional.
Otro caso particular es el modelo Erlang-C o M/M/n, donde la capacidad del
sistema es ilimitada, aunque haya sólo n recursos; en caso de llegar el recurso
número n+1, pasará a una cola de espera, pero no es rechazado.
El orden de prioridad en la que los trabajos en la cola son servidos:
First Come First Served (FCFS) o First In First Out (FIFO)
Last Come First Served (LCFS) o Last In First Out (LIFO)
Service In Random Order (SIRO)
Processor Sharing
El tamaño del origen de las llamadas. El tamaño de la población desde donde
los clientes vienen. Esto limita la tasa de llegadas.
Estructuras típicas

Figura 2.
El primer sistema que se muestra en la figura, se llama un sistema de un
servidor y una cola. El segundo, una línea con múltiples servidores. El tercer
sistema, aquel en que cada servidor tiene una línea de separación. El cuarto
sistema, es una línea con servidores en serie. Este modelo puede aplicarse a
trabajos ordenador que esperan tiempo de procesador.
Medidas de desempeño de estado estable.
En teoría de colas se utilizan comúnmente las siguientes medidas de
desempeño, estas se calculan de forma diferente según el modelo de la línea
de espera:
Ls = Cantidad esperada de clientes en un sistema
Lq = Cantidad esperada de clientes en una cola
Ws = Tiempo de espera en el sistema
Wq = Tiempo de espera anticipado en la cola
ρ = Factor de utilización del sistema

Modelos
M/M/1
En este modelo, según la notación de Kendall, la tasa de llegadas y la tasa de
servicio siguen una distribución de Poisson. Y hay un solo servidor. Las
medidas de desempeño de estado estable se calculan de la siguiente forma:
Donde λ es la tasa promedio de arribos al sistema y μ la tasa promedio de
servicio.
Cabe resaltar que si λ ≥ μ el sistema es explosivo, además, Wq nunca será
mayor que Ws.2
M/M/s
Este modelo supone que existen en el sistema s (entero positivo) servidores,
en este caso las medidas de desempeño se calcularán así:
Las limitaciones del acercamiento matemático
La teoría de formación de una cola es a menudo demasiado restrictiva
matemáticamente para ser capaz de modelar todas las situaciones verdaderas
a nivel mundial. Por ejemplo; los modelos matemáticos a menudo asumen el
número de clientes, o la capacidad de la cola infinitos, cuando es evidente que
deben estar limitados. Los medios alternativos del análisis de la teoría de colas
consisten generalmente en simulaciones de ordenador o en el análisis de datos
experimentales.
Aplicación a la telefonía
Las redes telefónicas se diseñan para acomodar la intensidad ofrecida del
tráfico con solamente una pequeña pérdida. El funcionamiento de los sistemas
depende de si la llamada es rechazada, de si está perdida, etc. Normalmente
los sistemas de desbordamiento hacen uso de rutas alternativas e incluso estos
sistemas tienen una capacidad de carga finita o máxima de tráfico. Sin
embargo, el uso de las colas permite que los sistemas esperen por las
peticiones de su cliente hasta que los recursos libres estén disponibles. Esto
significa que si los niveles de la intensidad del tráfico exceden de la capacidad
disponible, las llamadas del cliente se perderían. La disciplina de colas
determina la manera de cómo manejar las llamadas de los clientes. Define la
manera en que les servirán, la orden de las cuales se sirven, y la manera en la
que los recursos se dividen entre los clientes.

Modelos de colas con distribuciones no exponenciales


En particular, el supuesto de tiempos entre llegadas exponenciales implica que
las llegadas ocurren al azar (proceso de entrada de Poisson), lo cual es una
aproximación razonable en muchas situaciones pero no cuando las llegadas
están programadas o reguladas con todo cuidado. Todavía más, las
distribuciones de tiempos de servicio reales con frecuencia se desvían bastante
de la forma exponencial, en particular cuando los requerimientos de servicio de
los clientes son muy parecidos. Por ello, es importante disponer de otros
modelos de colas que usen otras distribuciones de probabilidad.
Desafortunadamente, el análisis matemático de los modelos de colas con
distribuciones no exponenciales es mucho más difícil. Sin embargo, se han
podido obtener algunos resultados útiles con algunos modelos.

https://www.um.es/or/ampliacion/apuntes.html
Características de un sistema de colas
Definición 1 (Teoría de Colas)
Se entiende por Teoría de Colas el estudio de las líneas de espera que se
producen cuando llegan clientes demandando un servicio, esperando si no se
les puede atender inmediatamente y partiendo cuando ya han sido servidos.El
creador de la Teoría de Colas fue el matemático danés A. K. Erlang por el año
1909. Ha tenido un fuerte auge por su utilidad en el modelado del
comportamiento estocástico de gran número de fenómenos, tanto naturales
como creados por el hombre. Se puede aplicar en problemas relacionados con
redes de teléfonos, aeropuertos, puertos, centros de cálculo, supermercados,
venta mediante máquinas, hospitales, gasolineras...
Características
A lo largo del tiempo se producen llegadas de clientes a la cola de un sistema
desde una determinada fuente demandando un servicio. Los servidores del
sistema seleccionan miembros de la cola según una regla predefinida
denominada disciplina de la cola. Cuando un cliente seleccionado termina de
recibir su servicio (tras un tiempo de servicio) abandona el sistema, pudiendo o
no unirse de nuevo a la fuente de llegadas.
Fuente
Recibe el nombre de fuente el dispositivo del que emanan las unidades que
piden un servicio. Si el número de unidades potenciales es finito, se dice que la
fuente es finita; en caso contrario se dice que es infinita.

Proceso de llegada
Aunque a veces se sabe exactamente cuándo se van a producir las llegadas al
sistema, en general el tiempo que transcurre entre dos llegadas consecutivas
se modela mediante una variable aleatoria. En particular, cuando la fuente es
infinita se supone que las unidades que van llegando al sistema dan lugar a un
proceso estocástico llamado de conteo; si todos los tiempos entre llegadas son
variables aleatorias independientes idénticamente distribuidas (vv.aa.ii.ii.dd.),
se dice que es un proceso de renovación. Usualmente, por razones que se
verán posteriormente, el proceso que se utiliza es un proceso de Poisson.
Cuando la fuente es finita se suele asumir que la probabilidad de que se
produzca una llegada en un intervalo de tiempo es proporcional al tamaño de la
fuente en ese instante. En general, nos restringiremos al estudio de sistemas
de colas con fuentes infinitas.

Mecanismos de servicio
Se llama capacidad del servicio al número de clientes que pueden ser servidos
simultáneamente. Si la capacidad es uno, se dice que hay un solo servidor (o
que el sistema es monocanal) y si hay más de un servidor, multicanal. El
tiempo que el servidor necesita para atender la demanda de un cliente (tiempo
de servicio) puede ser constante o aleatorio; en este último caso supondremos,
por lo general, que los tiempos de servicio son vv.aa.ii.ii.dd. Además,
supondremos que son independientes de los tiempos entre llegadas. A veces el
servidor sólo está disponible durante una parte del tiempo de funcionamiento
del sistema.
Disciplina de la cola
En sistemas monocanal, el servidor suele seleccionar al cliente de acuerdo con
uno de los siguientes criterios (prioridades):
 
el que llegó antes (disciplina FIFO),
el que llegó el último (LIFO),
el que menos tiempo de servicio requiere,
el que más requiere...
Incluso puede interrumpirse un servicio para empezar otro que corresponda a
un cliente recién llegado con mayor prioridad (fenómeno de anticipación); de no
ser así, la prioridad se llama de cabeza de línea.
En sistemas multicanal puede haber asignación a un servidor (elección de cola)
y cambios de servidor forzosos o aleatorios (cambio de cola).
Otros fenómenos frecuentes son el rechazo (si la cola tiene una capacidad
máxima, el cliente no es admitido en ella), el abandono (por ejemplo, si se
excede un tiempo de espera), etcétera.
Colas en tándem
Este proceso se produce cuando a la salida de un servicio hay una o más colas
(porque se necesitan varios servicios en un determinado orden).
Notación (Kendall, 1953)
Para especificar un tipo de cola se escribe:
proceso de llegada / proceso de servicio / nº de canales / capacidad /
disciplina / ...

En el proceso de llegada puede aparecer:


 
M: los tiempos entre llegadas siguen una distribución exponencial.
GI: los tiempos entre llegadas son vv.aa.ii.ii.dd.
D: corresponde a un tiempo entre llegadas determinístico.
De forma análoga se identifican los procesos de servicio con M, G y D. Cuando
la capacidad es infinita y la disciplina FIFO, se suelen omitir estos campos.
Ejemplo: Si se escribe

significa que el tiempo entre llegadas es exponencial, el tiempo de servicio es


determinístico (normalmente vendrá dado por una lista o vector), el número de
canales es 2, la capacidad es infinita y la disciplina es FIFO.

Objetivos
Los objetivos son dos: en primer lugar, describir adecuadamente el sistema, y
en segundo lugar, tratar de optimizarlo.
La efectividad del sistema viene resumida a través de las medidas siguientes
(generalmente variables aleatorias):
N(t)= número de clientes en el sistema en el instante t.
L(t)= número de clientes en la cola en el instante t.
V(t)= tiempo de espera virtual en el instante t: el tiempo que se necesitaría para
atender a todos los clientes del sistema en este momento (y sólo a ellos).
n = cliente n-ésimo que ha sido admitido en el sistema.
Para cada cliente se tiene:

 = tiempo de estancia en el sistema del n-ésimo cliente.

 = tiempo de espera en la cola del n-ésimo cliente.


Si existe

(que puede ser una variable aleatoria), se dice que el sistema alcanza el estado
estacionario. Mientras se llega a este estado, se está en el estado transitorio.
En estado estacionario las otras variables de interés son
 
 

Little demostró que, bajo ciertas condiciones poco restrictivas, se tiene las
igualdades

Respecto a la optimización del sistema, ésta se lleva a cabo fijando una función
objetivo y actuando sobre un conjunto de variables de decisión (por ejemplo, el
número de canales).
Modelos de colas determinísticos
En el modelo determinístico los tiempos de servicio son conocidos con
exactitud (no son aleatorios). Con la notación que se introdujo anteriormente,
se estudiará el modelo D/D/1/k-1, donde:

 significa que el tiempo entre llegadas es constantemente igual a 

,  . (Luego   denota el número de llegadas por unidad de tiempo,


llamado tasa de llegadas)

 significa que el tiempo de servicio es constantemente igual a  ,  ,

de donde   es el número de servicios por unidad de tiempo en período de


ocupación, llamado tasa de servicio.

 indica que hay un servidor.

 es la capacidad del sistema, el número máximo de clientes que


admite el sistema. Cuando un cliente está en el servicio sólo puede haber k-2
clientes en cola, y el k-ésimo cliente que aspire a entrar en el sistema es
rechazado.
Observación: Salvo que se diga lo contrario, de aquí en adelante se

supondrá  , pues en caso contrario todo cliente puede ser servido sin
problema y no se produce el fenómeno de cola.

Interesa conocer el estado del sistema en el instante t, es decir, conocer N(t) y

L(t) y los tiempos que afectan al cliente n, es decir, Wn y  .

N(t) denota el número de clientes en el sistema, es decir, el número de clientes


en cola más el número de clientes que están siendo servidos en el instante t.

Suponemos que en t=0 no hay clientes (N(0)=0).

Definimos   como el instante de tiempo en el que se produce el primer


rechazo, es decir, llega un cliente cuando en el sistema ya hay k-1 clientes.

Si  , no ha llegado todavía ningún cliente, por lo que en este intervalo


de tiempo no hay clientes en el sistema.

Si  , entonces N(t) es igual al número de llegadas menos el número de


salidas hasta t, donde

"nº de llegadas hasta t" =  .

"nº de salidas hasta t" =  .

Por lo tanto  .

Para  , vamos a restringirnos al caso más sencillo: el tiempo de servicio es


un múltiplo entero del tiempo entre llegadas, es decir,
En este caso, siempre que se produce la salida de un cliente hay una llegada
simultánea. Así, no puede suceder que haya simultáneamente una salida y un
rechazo, pues si un cliente sale, se deja una plaza libre en el sistema para el
otro cliente que llega en ese momento. En consecuencia, el número de clientes
es creciente hasta que a partir del instante   es constantemente igual a la
capacidad del sistema, k-1. Por lo tanto, se tiene

Suponiendo que se tiene disciplina FIFO, vamos a definir los valores asociados
a cada cliente.

Wn= es el tiempo de espera en cola del cliente n-ésimo.

Sn= es el tiempo del n-ésimo servicio.

Tn= es el tiempo entre la n-ésima y la (n+1)-ésima llegada aceptadas.

Expresemos Wn+1 en función de Wn, Sn y Tn.

Si   entonces Wn+1=0.

Si   entonces Wn+1=Wn+Sn-Tn.

Aunque esto es cierto en general, en el caso del sistema que estamos

estudiando, si  , entonces

por lo que
Si  , entonces cualquier cliente que sea aceptado será servido después de
que hayan sido atendidos los k-2 que le preceden (y no los k-1, pues su llegada
ha coincidido con una salida). Así

En resumen:

Introducción a los procesos estocásticos

Definición 2 (Proceso estocástico)


Un proceso estocástico (P.E.) es una colección de variables

aleatorias  , con  .
t es el parámetro que se asocia al tiempo y X(t) representa el estado del
proceso en el instante t.
Ejemplo:
Si X(t) representa la distancia entre dos puntos que se mueven aleatoriamente

sobre una recta, entonces   y  .


Si X(t) representa el piso en el que está un ascensor después de la t-ésima

parada, entonces   y  .


Si X(t) es el número de llamadas a un número de teléfono hasta el instante de

tiempo t, entonces   y  .


Definición 3
Si T es un conjunto numerable, entonces el proceso estocástico se dice que
es en tiempo discreto.
Si T es un intervalo, entonces el proceso estocástico se dice que es en tiempo
continuo.
Definición 4
Se llama camino muestral a una muestra de la variable aleatoria X(t) para cada
valor de t.
Definición 5
Un proceso estocástico en tiempo continuo se dice que es de incrementos
independientes (i.i.) o de renovación, si para valores

se tiene que

son variables aleatorias independientes. Por lo tanto, en un proceso de


renovación, los cambios en intervalos de tiempo que no se solapan son
independientes.
Definición 6
Un proceso estocástico en tiempo continuo es de incrementos
estacionarios (i.e.) si la distribución, fijado t, de X(s+t)-X(s) es la misma para
todo s tal que s+t pertenezca a T.
En un proceso de incrementos estacionarios, cambios en el proceso de igual
tamaño son iguales en distribución.
Definición 7

Un proceso estocástico en tiempo continuo  , se dice puntual o de


conteo si N(t) representa el número de veces que ocurre un suceso hasta el
instante de tiempo t.
En particular:

 si s<t. (Los incrementos son no negativos)


En consecuencia, un proceso de conteo es de incrementos independientes si el
número de sucesos que tienen lugar en intervalos de tiempo que no se solapan
son variables aleatorias independientes. Y será de incrementos estacionarios si
el número de sucesos que tienen lugar en un intervalo de tiempo es el mismo
en intervalos de igual longitud.
Definición 8

Un proceso de conteo se dice de Poisson (homógeneo de tasa  ), si


1.
N(0)=0.
2.
Es de incrementos independientes.
3.

(El proceso es de incrementos estacionarios, y los incrementos siguen una


distribución de Poisson de parámetro   para intervalos de tiempo de amplitud
t). Así, el número medio de sucesos hasta el instante t es

pues

Teorema 1

Un proceso de conteo,   es de Poisson homogéneo con tasa   si y


sólo si se verifica:
1.
N(0)=0.
2.
Es de incrementos independientes y estacionarios.
3.

.
4.

.
Demostración:

( )
Si es un proceso de Poisson entonces, por definición, se cumplen las
condiciones 1) y 2). Veamos que se verifican también 3) y 4).
3)

ya que

4)

pues

( )

Como se verifican 1) y 2), basta probar que  . Razonemos por


inducción sobre n.
Para n=0:
Sea
Pn(t):=P(N(t)=n).

Se trata de ver que


Tomando
P0(t+h)=P(N(t+h)=0)=P(N(t)=0,N(t+h)-N(t)=0)=

(los incrementos son independientes)


=P(N(t)=0) P(N(t+h)-N(t)=0)=

(los incrementos son estacionarios)

Tomando límites cuando h tiende hacia cero:

Como N(0)=0, entonces P0(0)=1, por lo que c=1 y

Sea ahora el resultado cierto para 1, 2,...,n-1 y veamos que lo sigue siendo
para n. Por el teorema de la probabilidad total:
Pn(t+h)=P(N(t+h)=n)=

P(N(t)=0,N(t+h)-N(t)=n)=

(por ser los incrementos independientes)

(como   para  )
=Pn(t) P(N(h)=0)+Pn-1(t) P(N(h)=1)+o(h )=
De donde

Al tomar límites cuando h tiende hacia cero:

Por la hipótesis de inducción, Pn-1(t) es conocido:

Se trata de una ecuación diferencial lineal no homogénea, cuya solución es

Como N(0)=0, entonces c=Pn(0)=0. Luego

Definición 9

Un proceso de Poisson no homogéneo con función de intensidad (tasa)   

es un proceso de conteo   que cumple:


1.
N(0)=0.
2.
Es de incrementos independientes.
3.

.
4.
.
Definición 10

Un proceso de nacimiento (puro) con tasa de nacimiento   

es un proceso de conteo   que cumple:


1.

.
2.

.
Definición 11

Un proceso de nacimiento y muerte con tasa de nacimiento   y tasa de

muerte   es un proceso estocástico   que cumple:


1.

2.

 para 
3.

 para 
4.

Tratemos de obtener las ecuaciones diferenciales asociadas a un proceso de


nacimiento y muerte:
n=0
Teniendo en cuenta que la probabilidad de que se produzcan dos o más
sucesos en un intervalo pequeño de tiempo es despreciable (por la última
condición de la definición), si en el instante t+h hay 0 individuos, sólo deben
considerarse dos posibilidades:
1.
En el instante t había 0 individuos y no ha habido ni nacimientos ni muertes.
2.
En el instante t había 1 individuo y ha habido una muerte (y ningún nacimiento).
Así:
P0(t+h) = P(N(t+h)=0) = P(N(t+h)=0,N(t)=0) +

P(N(t+h)-N(t)=0|N(t)=0) P(N(t)=0) +
P(N(t+h)-N(t)=-1|N(t)=1) P(N(t)=1) +

Al tomar límites cuando h tiende hacia cero:

n>0
Ahora se presentan tres posibilidades con probabilidades no despreciables:
1.
En el instante t había n individuos y no ha habido ni nacimientos ni muertes.
2.
En el instante t había n-1 individuos y ha habido un nacimiento (y ninguna
muerte).
3.
En el instante t había n+1 individuos y ha habido una muerte (y ningún
nacimiento).
Por lo tanto:
Pn(t+h) = P(N(t+h)=n) = P(N(t+h)=n|N(t)=n-1) P(N(t)=n-1)+
P(N(t+h)=n|N(t)=n) P(N(t)=n) +
P(N(t+h)=n|N(t)=n+1) P(N(t)=n+1) + o(h) =
Al tomar límites cuando h tiende hacia cero:

Supongamos que existe

Ya que si existen los límites en el infinito, entonces Pn(t) es constante en el


infinito y

se tendrá que

Estas ecuaciones son las que están asociadas al proceso en estado


estacionario.
Ejemplo: (Crecimiento lineal)
Una población consta de elementos que pueden dividirse en dos partes iguales
o morir. La probabilidad de que un elemtento se divida en el intervalo (t,t+h]

es  . En ese mismo período, la probabilidad de que muera es  ,

siendo  .
1.
Compruébese que el número de elementos de la población en el instante t es

un proceso de nacimiento y muerte y calcúlense  .


2.
Utilícense las ecuaciones diferenciales para calcular

 
 Solución:
Como la división o muerte de cada elemento es independiente de las otras,

Luego   para n=0,1,2,3... y   para n=1,2,3...


Sustituyendo en las ecuaciones del estado estacionario obtenidas
anteriormente:
 

Resolviendo este sistema, se tiene

quedando P0 indeterminado. Si P0<1, entonces se extingue la población con


probabilidad P0 y crece ilimitadamente con probabilidad 1-P0. Si P0=1, entonces
la población se extingue casi seguramente.
Aunque N(t) es una variable aleatoria desconocida, es posible calcular su
esperanza:

Si se multiplica la ecuación n-ésima por n y se suman todas, como


se tiene

Al sustituir en t=0, se observa que c es la población inicial.

Si  , entonces E[N]=0.

Si  , entonces  .

Si  , entonces  .
El modelo M/M/1
En primer lugar, se describe el modelo:
1.

: El proceso de llegadas es de Poisson homógeneo con tasa  .


Sea T la variable aleatoria que representa el tiempo entre dos llegadas
consecutivas.
Sea t>0 y representemos por n(t) el número de llegadas al sistema hasta el
instante t.
Como los incrementos son independientes:

luego  . Recíprocamente, se tiene el siguiente resultado:

Si   son independientes, siendo Ti  el tiempo transcurrido entre las

llegadas (i-1)-ésima e i-ésima, todas ellas con distribución  ,

entonces  .
Demostración:
 
 

(El último paso se hace considerando la expresión de la función gamma)


 
2.

: Siempre que el servidor esté ocupado, el proceso de salida es de

Poisson homogéneo de tasa  .


Razonando como antes, se tiene que los tiempos de servicio son  .
3.

: El sistema tiene un único servidor y capacidad infinita.

Se trata de un proceso de nacimiento y muerte con tasa de nacimiento  ,

 y tasa de muerte  , .
Debe observarse que la distribución exponencial tiene ausencia de memoria,

es decir, si   Exp( ), entonces

La demostración de esta propiedad es inmediata observando la expresión de la


función de distribución asociada.
Ahora se puede proceder a analizar el comportamiento del sistema. Se define
la intensidad del tráfico como

Si  , no se alcanza el estado estacionario, mientras que si  , entonces


sí que se llega a este estado.
Sea Pn(t)=P(N(t)=n) la probabilidad de que en el instante t haya n clientes en el
sistema. Yendo a las ecuaciones que se obtuvieron para un proceso de
nacimiento y muerte, tenenos que

En el estado estacionario (a partir de aquí suponemos ya  ) se tiene el


siguiente sistema, denominado ecuaciones de equilibrio:
Así, como la suma de todas las probabilidades debe ser uno y  , se tiene

Luego

En consecuencia, la variable N (distribución estacionaria del número de clientes

en el sistema) sigue una distribución geométrica  . Se sigue que

De igual modo, si por L se representa el número de clientes en cola en el estdo


estacionario, entonces

Las probabilidades asociadas son

La esperanza de esta variable es

Finalmente, consideremos la variable V, tiempo de espera virtual en estdo


estacionario. Se trata de una variable mixta:
S'1 es el tiempo de servicio restante del cliente que está en el servidor.
Haciendo uso de la propiedad de pérdida de memoria de la variable

exponencial (pues  ) se tiene

por lo que   y es indistinto considerar la variable S1 o la variable S'1 a


efectos de calcular probabilidades.
Ahora ya podemos calcular la función de distribución FV  asociada a la variable
V.
Si v=0 entonces

Si v>0, haciendo uso del teorema de la probabilidad compuesta (pues el valor n


asociado a v es aleatorio) y del hecho de que

se tiene

Luego
Análisis de los ciclos de ocupación y desocupación
Sea T0= la longitud de un ciclo de desocupación y sea T1= la longitud de un
ciclo de ocupación. La longitud (media) de un ciclo de ocupación y
desocupación (en estado estacionario) será E(T0+T1). Como, por la propiedad

de pérdida de memoria, se tiene que  , entonces  . Por otra


parte, como P0 representa la proporción de tiempo que el servidor está
desocupado (o lo que es lo mismo, el sistema está vacío) en estado
estacionario, entonces

Diagrama de flujos para M/M/1


Definimos un grafo como sigue:
cada nodo representa un estado,
cada arco representa una transición entre estados,
en los arcos se indica la tasa de cambio.

 
Ahora vemos que se obtienen las mismas ecuaciones que se tenían
anteriormente, pues considerando que se produce una conservación de flujos
en el grafo se tiene:
Interpretación: como   y   son, respectivamente, el número medio de

llegadas y el de servicios por unidad de tiempo, entonces  ,  

y   son a su vez el número de llegadas, el de servicios y el de


sucesos por unidad de tiempo en el estado n.
 
Control de una cola con un solo servidor
Vamos a tratar de optimizar el funcionamiento de un sistema M/M/1 en el que el
servidor se ausenta a veces.
El servidor está atendiendo clientes hasta que el sistema se vacía. Entonces él
se retira y no vuelve a ofrecer su servicio hasta que en la cola hay un número Q
de clientes.

La tasa de llegadas es   y la de servicio es  , siendo .


Se definen los siguientes costes del sistema:
coste de k unidades monetarias cada vez que el servidor vuelve (es un coste
fijo).
coste de h unidades monetarias por cada cliente en el sistema y unidad de
tiempo (coste de mantenimiento).
Se trata de determinar el valor de Q para que el sistema funciona a coste
mínimo por unidad de tiempo.

El coste de mantenimiento por unidad de tiempo (en promedio) es  .

El coste fijo por unidad de tiempo es  , pues E(T0+T1) es la longitud


media de un ciclo de ocupación y desocupación.
Así, la función objetivo es

El diagrama de flujos asociado es el siguiente:


 
 
Además, para este problema se usa la siguiente notación:
Pn=P(N=n),
Pn(1)=P(N=n y hay servidor),
Pn(0)=P(N=n y no hay servidor).
Es inmediato que Pn=Pn(0)+Pn(1).
Se obtienen las siguientes ecuaciones:
(Nodos de arriba)
 
 

(Nodos de abajo)
 
 

En definitiva:

Para resolver este sistema vamos a utilizar la función generatriz de


probabilidades G(s) asociada a la variable aleatoria N.
Sea  .

Si se define

entonces
G(s) = G0(s) + G1(s).

Como además

se tiene que

Si ahora se multiplica por sn+1 la ecuación n-ésima en el sistema que se obtuvo:

Sumando ahora todas estas igualdades:


Por otra parte,

Así, evaluando G(s) en s=1 se tiene que

por lo que

Ahora debemos calcular E(N) y E(T0+T1).

E(T0)= tiempo medio para que el sistema pase de 0 a Q clientes.

Como el tiempo entre llegadas sigue una   y esta distribución tiene


pérdida de memoria, entonces es equivalente a calcular Q veces el tiempo
medio para que llegue un cliente.

 probabilidad de que haya 0,1,..., Q-1 clientes en el sistema en


estado estacionario y no haya servidor

Así
Buscamos el valor donde f alcance su mínimo; si Q tomara valores reales,

Como

entonces   sería mínimo local y global.


Como Q sólo toma valores naturales y la función f es convexa, entonces la
solución óptima Q* será la que dé el mínimo de entre f([Q*]) y f([Q*]+1).
El valor

se denomina tamaño de lote de Wilson


El sistema M/M/1/k
Diagrama de flujo en estado estacionario :
 
 

Ecuaciones de equilibrio:
 

Su solución es  , n=0,1,..., k.


En estado estacionario se tendrá

Así

Distribución del número de clientes en cola ( )


 
 

Número medio de clientes en el sistema

Comportamiento transitorio de M/M/1/1


Sea N(t) el número de clientes en el sistema en el instante t. Sean

P0(t)=P(N(t)=0)
y
P1(t)=P(N(t)=1)=1-P0(t).

Se tiene que  .

Determinemos ahora las ecuaciones que rigen el sistema:

Ambas ecuaciones son equivalentes.

Evaluando en t=0:

luego

Si el sistema está inicialmente vacío, entonces P0(0)=1.

Si t tiende hacia infinito, entonces


Por lo tanto, se alcanza el estado estacionario independientemente de lo que

valga  .

El modelo M/G/1
En este caso, los tiempos de servicio son variables aleatorias independientes,
no necesariamente exponenciales, aunque sí idénticamente distribuidas e
independientes de los tiempos entre llegadas.

Sea tn el instante en que se produce la n-ésima salida del sistema.


Justo después de tn, sea Nn el número de clientes en el sistema. Son variables

aleatorias con valores enteros (y no negativos):   es un proceso


estocástico en tiempo discreto.
Si existe el estado estacionario, entonces existirá

N es el número de clientes tras una salida en estado estacionario. Se pretende


calcular E(N).

Entonces
Nn+1 = Nn + A - Un,
siendo A el número de llegadas al sistema en S unidades de tiempo (A también
es v.a.) y

Sabiendo que S=s, entonces  . Además, usaremos la

notación  .

El estado estacionario existe si  .


Como Nn+1 = Nn + A - Un, tomando esperanzas:

Y tomando límites:

(Probabilidad de que queden clientes en el sistema tras una salida en estado


estacionario)
Ahora, como paso previo para el cálculo de E(N), interesa determinar P(Nn+1=j|

Nn=i). Es obvio que P(Nn+1=j|Nn=i)=0 si  . Basta ahora

considerar  .

Caso 1:  .
 

Este valor no depende de n: son probabilidades estacionarias (sólo dependen


del estdo del sistema). Vienen en función de la diferencia j-i. Lo llamaremos kj-
i+1 .
Una vez conocida la distribución de S, ya se puede determinar el valor anterior.

Caso 2:  .
Razonando como antes, pero teniendo en cuenta que en esta ocasión deben
llegar j:

Éste es el valor que toma kj .


Calculemos ahora E(N). Se parte de
Nn+1=Nn + A - Un.
Elevamos al cuadrado y tomamos esperanzas:
E(Nn+12)=E(Nn2)+E(A2)+E(Un2)+2E(NnA)-2E(NnUn)-2E(UnA).
Ahora se observa que por definición de Un es E(Un2)=E(Un) y E(NnUn)=E(Nn).
Además, A y Nn son independientes (el proceso de llegadas y el proceso de
salidas son independientes). De igual modo, A y Un son independientes.
E(Nn+12)=E(Nn2)+E(A2)+E(Un)+2E(Nn)E(A)-2E(Nn)-2E(Un)E(A)

Tomando límites en n y usando  :

Como  , basta conocer Var(A).


Para su cálculo se necesita de estos resultados previos:
1.
Si X es una variable aleatoria, entonces Var(X)=E(X2)-E2(X).
2.
Si E(X) es finita y  ,
EY[EX(h(X)|Y=y)]=EX(X).
3.
Si E(X2) es finita, entonces
VarY[EX(X|Y=y)]=VarX(X) - EY[VarX(X|Y=y)].
Los dos primeros resultados son de inmediata demostración, así como el
tercero usando el segundo. Ahora, haciendo

y teniendo en cuenta que la variable (A|S=s) sigue una distribución  , se


tiene:

Así

Finalmente, calculemos P(N=n). Sea Pj=P(N=j).


Por el teorema de la probabiliad total,

Al tomar límites en n:

siendo kl=0 si l<0.
En notación matricial:

La entrada (i,j) representa la probabilidad de pasar del estado i al estado j en


estado estacionario.

Si P=PK para cierto  , entonces existirá el estado estacionario.


Las entradas de P vienen dadas por
Multiplicando por sj+1 la j-ésima ecuación:

Sumando todas las igualdades obtenidas (y representado por G la función


generatriz de probabilidades de N):

Como G(1)=1, utilizando la regla de l'Hôpital se tiene

Caso particular: El modelo M/D/1

Los tiempos de servicio son constantes:  .


kj = P(haya j llegadas en   unidades de tiempo) =

Ahora

Luego

Como

entonces
Gn)(0)=n! P(N=n).
Así que

Caso particular: el modelo M/M/1

Los tiempos de servicio son  .


 

(Distribución geométrica) Ahora


Función generatriz de una distribución geométrica)
Así

Modelos de colas estocásticos con más de un servidor


Modelo M/M/c
Se tiene una única cola a la que se llega según un proceso de Poisson de

parámetro  .

Los c servidores trabajan independientemente, pero todos con tiempo de

servicio Exp .

Se sabe que existe el estado estacionario si, y sólo si, se cumple

De nuevo, definimos  .

Para cada servidor ocupado se tiene

Entonces

Así, si hay n clientes en el sistema,  ,


Con   clientes en el sistema:

El diagrama de flujos asociado es el siguiente:

Las ecuaciones que se obtienen son:

Por su estructura, este sistema puede resolverse de forma descendente.


Resolviendo la primera ecuación:

Si ahora sustituimos en la segunda:

En general, se tiene
Teniendo ahora en cuenta que la suma de las probabilidades debe ser uno y

que   podemos calcular P0:

Número medio de servidores ocupados


Se define ahora la variable aleatoria M como el número de servidores
ocupados en estado estacionario. Escribiendo M en función de N:

Luego

Entonces, el número medio de servidores ocupados será


Número medio de clientes en cola

Así

Entonces

Haciendo ahora   se tiene

por lo que

Simulación de procesos en tiempo discreto


Cuando el modelo de colas es complejo, el método que hemos estado
utilizando hasta ahora (obtener unas ecuaciones y resolverlas) deja de ser
válido. Es entonces cuando se recurre a simular el proceso para tener al menos
una visión aproximada de lo que ocurre. Por supuesto, este procedimiento
también es válido para cualquiera de los sistemas vistos en los capítulos
precedentes. Supongamos que tenemos un modelo GI/G/1 y queremos calcular
el tiempo medio de espera en cola. En una simulación tenemos una lista de
tiempos entre llegadas y una lista de tiempos de servicio generados al iniciarse
la simulación de modo que los únicos instantes de tiempo interesantes (cuándo
llega un cliente determinado, cuándo entra en el servicio y cuándo se va) son
ya conocidos. Como entre dos de estos instantes consecutivos no sucede nada
que afecte al sistema, a la hora de efectuar cálculos, avanzamos en el tiempo
de forma discreta saltando de uno de estos tiempos al siguiente. Por ejemplo,
el tiempo de espera del cliente k-ésimo se obtiene a partir del instante en que
llega al servicio y el instante en que el cliente (k-1)-ésimo sale del sistema. Si
hacemos la media de los tiempos de espera de los primeros 100 clientes,
tendremos una aproximación del tiempo de espera medio en esa cola. El
siguiente organigrama muestra cómo implementar este método en cualquier
lenguaje de programación.

También podría gustarte