Está en la página 1de 12

Introducción a las Cadenas de Markov

Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que


ocurra un evento depende del evento inmediato anterior. En efecto, las cadenas de
este tipo tienen memoria, "Recuerdan" el último evento y esto condiciona las
posibilidades de los eventos futuros. Esta dependencia del evento anterior distingue
a las cadenas de Markov de las series de eventos independientes, como tirar una
moneda al aire o un dado. En los negocios, las cadenas de Markov se han utilizado
para analizar los patrones de compra, los deudores morosos, para planear las
necesidades de personal y para analizar el reemplazo de equipo. El análisis de
Markov, llamado así en honor de un matemático ruso que desarrollo el método en
1907, permite encontrar la probabilidad de que un sistema se encuentre en un
estado en particular en un momento dado. Algo más importante aún, es que permite
encontrar el promedio a la larga o las probabilidades de estado estable para cada
estado. Con esta información se puede predecir el comportamiento del sistema a
través del tiempo. La tarea más difícil es reconocer cuándo puede aplicarse. La
característica más importante que hay que buscar en la memoria de un evento a
otro.

Considere el problema siguiente: la compañía K, el fabricante de un cereal para el


desayuno, tiene un 25% del mercado actualmente. Datos del año anterior indican
que el 88% de los clientes de K permanecían fieles ese año, pero un 12% cambiaron
a la competencia. Además, el 85% de los clientes de la competencia le permanecían
fieles a ella, pero 15% de los clientes de la competencia cambiaron a K. Asumiendo
que estas tendencias continúen determine

Procedimiento de solución

Observe que, cada año, un cliente puede estar comprando cereal de K o de la


competencia. Podemos construir un diagrama como el mostrado abajo donde los
dos círculos representan a los dos estados en que un cliente puede estar y los arcos
representan la probabilidad de que un cliente haga una cambio cada año entre los
estados. Note que los arcos curvos indican una "transición" de un estado al mismo
estado. Este diagrama es conocido como el diagrama de estado de transición (notar
que todos los arcos en ese diagrama son arcos dirigidos).

Dado ese diagrama nosotros podemos construir la matriz de la transición


(normalmente denotada por el símbolo P) la qué nos dice la probabilidad de hacer
una transición de un estado a otro estado. Sea:

Estado 1 = cliente que compra cereal de K y

Estado 2 = cliente que compra cereal de la competencia

Tenemos así la matriz de transición P para este problema, dada por

Para estado 1 2

Del estado 1 | 0.88 0.12 |

2 | 0.15 0.85 |

Note aquí que la suma de los elementos en cada fila de la matriz de la transición es
uno.

Por datos de este año sabemos que actualmente K tiene un 25% del mercado.
Tenemos que la fila de la matriz que representa el estado inicial del sistema dada
por:
Estado

12

[0.25, 0.75]

Normalmente denotamos esta fila de la matriz por s1 indicando el estado del sistema
en el primer periodo (años en este ejemplo en particular). Ahora la teoría de Markov
nos dice que, en periodo (año) t, el estado del sistema está dado por el st de la fila
de la matriz, donde:

st = st-1(P) =st-2(P)(P) = ... = s1(P)t-1

Tenemos que tener cuidado aquí al hacer la multiplicación de la matriz ya que el


orden de cálculo es importante (i.e. st-1(P) no es igual a (P)st-1 en general). Para
encontrar st nosotros podríamos intentar hallar P directamente para la potencia t-1
pero, en la práctica, es mucho más fácil de calcular el estado del sistema en cada
sucesivo año 1,2,3 ,..., t.

Nosotros ya sabemos el estado del sistema en el año 1 (s1) tal que el estado del
sistema en el año dos (s2) está dado por:

s2 = s1P

= [0.25,0.75] |0.88 0.12 |........|0.15 0.85 |

= [(0.25)(0.88) + (0.75)(0.15), (0.25)(0.12) + (0.75)(0.85)] = [0.3325, 0.6675]

Note que este resultado tiene sentido intuitivo, e.g. del 25% comprando actualmente
al cereal de K, 88% continúan haciéndolo, aunque del 75% comprando el cereal del
competidor 15% cambia a comprar cereal de K - dando un (fracción) total de
(0.25)(0.88) + (0.75)(0.15) = 0.3325 comprando cereal de K.
De lo anterior, en el año dos 33.25% de las personas están en estado 1 - esto es,
está comprando cereal de K. Note aquí que, como un chequeo numérico, los
elementos de st deben sumar siempre uno.

En el año tres el estado del sistema se da por:

s3 = s2P

= [0.3325, 0.6675] |0.88 0.12 |

............... |0.15 0.85 |

= [0.392725, 0.607275]

Por lo tanto en el año tres 39.2725% de las personas están comprando al cereal de
K.

Recalcar que está pendiente la cuestión hecha sobre la porción que K comparte del
mercado en el largo plazo. Esto implica que necesitamos calcular st cuando t se
hace muy grande (se acerca al infinito).

La idea de la largo plazo es basada en la suposición de que, en el futuro, el sistema


alcance un "equilibrio" (a menudo llamado el "estado sustentable") en el sentido de
que el st = st-1. Ésto no quiere decir que las transiciones entre estados no tengan
lugar, suceden, pero ellos tienden "al equilibrio global" tal que el número en cada
estado permanece el mismo.

Hay dos enfoques básicos para calcular el estado sustentable:

Computacional: - encontrar el estado sustentable calculando st para t=1,2,3,... y se


detiene cuando st-1 y st son aproximadamente el mismo. Esto es obviamente muy
fácil para una computadora y este es el enfoque usado por un paquete
computacional.
Algebraico: - para evitar cálculos aritméticos largos necesarios para calcular st para
t=1,2,3,... tenemos un atajo algebraico que puede usarse. Recalcar que en el estado
sustentable st = st-1 (= [x1,x2] para el ejemplo considerado anteriormente).
Entonces como st = st-1P tenemos eso

[x1,x2] = [x1,x2] | 0.88 0.12 |

.............| 0.15 0.85 |

(y también notar que x1 + x2 = 1). De esto tenemos tres ecuaciones que podemos
resolver.

Note aquí que hemos usado la palabra suposición anteriormente. Esto es porque
no todos los sistemas alcanzan un equilibrio, esto es, no cualquier sistema tiene
matriz de transición

|01|

|1 0 |

Nunca alcanza un estado sustentable.

Adoptando el enfoque algebraico anteriormente para el ejemplo del cereal K


tenemos las tres ecuaciones siguientes:

x1 = 0.88x1 + 0.15x2

x2 = 0.12x1 + 0.85x2

x1 + x2 = 1

0.12x1 - 0.15x2 = 0

0.12x1 - 0.15x2 = 0
x1 + x2 = 1

Note que la ecuación x1 + x2 = 1 es esencial. Sin élla no podríamos obtener una


única solución para x1 y x2. Resolviendo conseguimos x1 = 0.5556 y x2 = 0.4444

Por lo tanto, en la largo plazo, K comercializa una porción del mercado del 55.56%.

Un chequeo numérico útil (particularmente para problemas más grandes) es sustituir


el examen final calculando los valores en las ecuaciones originales para verificar
que ellos son consistentes con esas ecuaciones.

Paquete de Computo para la solución

El problema anterior se resolvió usando un paquete, la entrada se muestra abajo.

Datos de entrada del Problema del cereal de K (Iniciales Probabilidades de Estado)

1: 0.2500 2: 0.7500

Datos de entrada del Problema del cereal de K (Matriz de Probabilidades de


Transición) Pg 1

.......De ...........A

1 1: 0.8800 2: 0.1200

2 1: 0.1500 2: 0.8500

El rendimiento se muestra debajo. Aunque el paquete puede usarse para calcular y


desplegar st (para cualquier valor de t) no hemos querido mostrar esto.

En el rendimiento mostrado abajo de la nota:

Las probabilidades de estado sustentables (se necesitaron 38 iteraciones antes de


que st-1 y st fueran aproximadamente el mismo). Estas figuras son como se
calcularon antes.
Periodo recurrente para cada estado - éstos son el número esperado de periodos
que pasarán para que una persona en un estado esté de nuevo en ese estado (esto
es, esperaríamos que hubieran 1.80 periodos (en promedio) entre que una persona
que compra el cereal de K y su próxima compra de cereal de K).

Iteración final--las Iteraciones Totales = 38

1: 0.5556 2: 0.4444

Periodo recurrente para Cada Estado

1: 1.80 2: 2.25

Datos

Note aquí que los datos que pueden necesitarse para deducir las probabilidades de
transicióna, pueden a menudo fácilmente encontrarse, hoy en día . Por ejemplo se
colectar tales datos por marca del consumidor que cambia, inspeccionando a los
clientes individualmente. Sin embargo hoy día, muchos supermercados tienen sus
propias "tarjetas de lealtad" qué son registradas a través de inspecciones al mismo
tiempo que un cliente hace sus compras en la caja. Éstos proporcionan una masa
de información detallada sobre el cambio de marca, así como también otra
información - por ejemplo el efecto de campañas promocionales.

Debe estar claro que las probabilidades de transición no necesitan se consideradas


como números fijos - más bien ellas son a menudo números que podemos
influenciar/cambiar.

También note que la disponibilidad de tales datos permite modelos más detallados,
al ser construidos. Por ejemplo en el caso del cereal, la competencia fue
representada por sólo un estado. Con datos más detallados ese estado pudiera ser
desagregado en varios estados diferentes - quizá uno para cada marca competidora
del cereal. También podríamos tener modelos diferentes para segmentos diferentes
del mercado - quizá el cambio de marca es diferente en áreas rurales del cambio de
marca en áreas urbanas, por ejemplo. Las familias con niños constituirían otro
segmento importante del mercado obviamente.
4.7 Probabilidad de transición estacionaria.

Las ecuaciones de Chapman-Kolmogorov proporcionan un método para calcular


estas probabilidades de transición de n pasos

Estas ecuaciones simplemente señalan que al ir de un estado i al estado j en n


pasos, el proceso estará en algún estado k después de exactamente m ( menor que
n) pasos. Así,

Es solo las probabilidad condicional de que, si se comienza en el estado i, el


proceso vaya al estado k despues de m pasos y después al estado j en n- m pasos.

Los casos especiales de m=1 y m=n-1 conducen a las expresiones

Para toda i, j, y n de lo cual resulta que las probabilidades de transición de n


pasos se pueden obtener a partir de las probabilidades de transición de un paso de
manera recursiva. Para n=2, estas expresiones se vuelven

Note que las son los elementos de la matriz P(2) , pero también debe de

observarse que estos elementos, se obtienen multiplicando la matriz de


transición de un paso por sí misma; esto es , P(2) = P * P = P2 .
En términos más generales, se concluye que la matriz de probabilidades de
transición de n pasos se puede obtener de la expresión : P(n) = P * P .... P = Pn =
PPn-1 = Pn-1 P.

Entonces, la matriz de probabilidades de transición de n pasos se puede obtener


calculando la n-ésima potencia de la matriz de transición de un paso. Para valores
no muy grandes de n, la matriz de transición de n pasos se puede calcular en la
forma que se acaba de describir, pero cuando n es grande, tales cálculos resultan
tediosos y, más aún, los errores de redondeo pueden causar inexactitudes.

Estado estacionario

Se dice que un sistema o proceso está en estado estacionario si las variables que
definen su comportamiento (las llamadas variables de estado), respecto del tiempo,
permanecen invariantes. La expresión matemática expresaría que para aquellas
propiedades p del sistema, la derivada parcial de p respecto del tiempo es nula:

El concepto de estado estacionario cobra relevancia en campos como


la termodinámica y la ingeniería.
En particular, un sistema físico está en estado estacionario cuando sus
características no varían con el tiempo. En este fundamento se basan las teorías de
la electrostática y la magneto estática, entre otras. Suele ser la situación a
considerar en gran parte de los supuestos de la termodinámica. El estado
estacionario también se conoce como el estado en el que está la naturaleza (estado
en el que se encuentra).

En cinética química el estado estacionario también se puede emplear para


determinar la constante de velocidad de una reacción a través de varias
experiencias en las cuales se puede suponer que una concentración de algún
producto o reactivo no varia.
También se dice que un sistema está en estado estacionario si las variaciones con
el tiempo de las cantidades físicas son periódicas y se repiten de manera idéntica a
cada periodo. Es el caso, por ejemplo:

de sistemas en los cuales hay ondas cuya amplitud y frecuencia no varía, como en
un interferómetro.

de circuitos eléctricos alimentados con generadores alternativos, una vez que los
fenómenos transitorios han desaparecido.

Es el estado de referencia en termodinámica de procesos irreversibles. El estado


estacionario de un sistema abierto que está en equilibrio se define como aquél en
el que no varían las variables de estado (temperatura, volumen, presión, etc.) y, por
tanto, tampoco se modifican, con el tiempo, las funciones de estado
(entropía, entalpía, etc.). El estado estacionario es un estado de mínima producción
de entropía(principio de energía mínima).
ESTADO ESTABLE.

Para en grande, tiende a una matriz con renglones idénticos. Esto significa que
después de un largo tiempo, la cadena de markov se estabiliza, e
(independientemente del estado inicial i) hay una probabilidad de que se está en el
estado.

El vector se llama distribución de estado estable o distribución de equilibrio, para la


cadena de markov. Para una cadena determinada con matriz de transición P, ¿cómo
se puede hallar la distribución de probabilidad de estado estable? A partir del
teorema 1, se observa que para n grande y toda i,

(6)

Puesto que (renglón i de ) (columna j de P), se podría escribir

(7)

Si n es grande, sustituyendo la ecuación (6) en la (7), se obtiene

(8)

En forma de matriz, (8) se podría escribir como

(8¬¬`)

Infortunadamente, el sistema de ecuaciones especificado en (8) tiene un número


infinito de soluciones, debido a que el rango de la matriz P siempre resulta ser
(véase capitulo 2, problema de repaso 21). Para obtener los valores únicos de la
probabilidad de estado estable, observe que para cualquier n y cualquier i,

También podría gustarte