Está en la página 1de 11

INTRODUCCION

Los modelos markovianos ocultos (HMM) asumen que el sistema estudiado sigue
un proceso de markov con parmetros desconocidos.
La tarea fundamental consiste en determinar los parmetros ocultos a partir de
parmetros observados. La diferencia fundamental respecto a un modelos de
markov habitual consiste en que los estados no son directamente visibles para el
observador, pero si lo son las variables influenciadas por el estado. Cada estado
tiene una distribucin de probabilidad asociada sobre el conjunto de posibles
valores de salida. La secuencia de valores de salida generados a partir de un
HMM son darn cierta informacin sobre la secuencia de estados.

MODELOS OCULTOS DE MARKOV


Un Modelo Oculto de Markov (Hidden Markov Model HMM) es un proceso
estocstico que consta de un proceso de Markov no observado (oculto) q =
{qt}t y un proceso observado O = {ot}t cuyos estados son dependientes
estocsticamente de los estados ocultos, es decir, es un proceso bivariado (q,O).
Los HMMs se pueden considerar tambin como sistemas generativos
estocsticos, los cuales se emplean en la modelacin de series de tiempo.
DEFINICION DE MODELOS OCULTOS DE MARKOV
Un modelo oculto de Markov es una cadena de q junto con un proceso estocstico
que toma valores en un alfabeto y el cual depende de q.
Estos sistemas evolucionan en el tiempo pasando aleatoriamente de estado a
estado y emitiendo en cada momento al azar algn smbolo del alfabeto .
Cuando se encuentra en el estado qt-1 = i, tiene la probabilidad aij de moverse al
estado qt = j en el siguiente instante y la probabilidad bj(k) de emitir el smbolo ot =
vk en el tiempo t.
Solamente los smbolos emitidos por el proceso q son observables, pero no la ruta
o secuencia de estados q, de ah el calificativo de "oculto" de Markov, ya que el
proceso de Markov q es no observado.

ARQUITECTURA DE UN MODELOS OCULTO DE MARKOV

El diagrama muestra la arquitectura general de un HMM. Cada ovalo representa


una variable aleatoria que puede tomar determinados valores. La variable aleatoria
x(t) es el valor de la variable oculta en el instante de tiempo t. La variable aleatoria
y(t) es el valor de la variable observada en el mismo instante de tiempo t, las
flechas indican dependencias condicionales.
TIPOS DE PROBLEMAS RELACIONADOS CON HMM

Dado el HMM Cul es la probabilidad de una secuencia de observables?


Dado el HMM y una secuencia observable Cul es la secuencia de
estados mas probables que ha generado la secuencia observable?
Dado un conjunto de estados y una coleccin de secuencias observables.
cul es el HMM ms probable que ha generado la secuencia

ALGORITMO DE FORWARD
Consideremos la funcin

at

(i):

at (i)=p ( o1 , o2 o p . q t=si
Esta ecuacin puede calcularse de forma recursiva

ALGORITMO DE VITERBI
El objetivo es saber cul es la secuencia de estados que maximiza P(O l Q , ):

Que puede calcularse recursivamente como:

La probabilidad de la secuencia ptima ser:

ALGORITMO BAUM WELCH


Nmero de veces promedio que se pasa por un estado:

Nmero de veces que se usa un arco:

El nuevo HMM ser:

Ejemplo:
El siguiente ejemplo ilustra un proceso q independiente del tiempo. Supngase
que en un saln se encuentra un nmero N muy grande de urnas de vidrio. Dentro
de cada urna se tiene una cantidad M de bolas de colores. Un mago est en el
saln y de acuerdo con algn procedimiento aleatorio elige una urna inicial. De
sta saca al azar una bola y registra su color como una observacin. La bola es
retornada a la urna de la cual fue seleccionada. A continuacin selecciona una
nueva urna de acuerdo con un procedimiento aleatorio que depende de la urna
actual y la eleccin de alguna bola es repetida. Este proceso completo se realiza
en un tiempo T y genera una secuencia de observacin finita de colores O de
longitud T, la cual puede modelarse como la salida observable de un HMM. Se
asume que las urnas son seleccionadas independientemente.

Los siguientes son ejemplos de posibles secuencias de observacin del modelo de


las
Urnas y las bolas:
O1
= (amarillo, verde, azul, verde, rojo, amarillo, naranja, rojo, verde, azul, amarillo),

O2
= (amarillo, rojo, verde, rojo, azul, naranja, verde, rojo, azul, amarillo, rojo, verde),
O3
= (rojo, azul, amarillo, rojo, azul, vede, rojo, amarillo, naranja, naranja, verde,
rojo),
O4
= (rojo, verde, naranja, rojo, rojo, azul, verde, amarillo, azul, rojo, verde, rojo).
El alfabeto es:
= verde, azul, rojo, amarillo, naranja
Los estados ocultos son:
Q = {1,2,...,N}
Las probabilidades de obtener un color en cada urna son:

El primer problema consiste en decidir cual proceso es representado por los


estados y despus decidir cuantos estados pueden estar en el modelo. Como se
ilustr antes, el HMM ms simple que corresponda al comportamiento de este
proceso es aquel en el cual cada estado representa una urna especfica y cada
color representa un posible smbolo de observacin. Por cada estado se define
una probabilidad de extraer una bola (color) y una probabilidad de pasar a la
siguiente urna. Los colores de las bolas dentro de cada urna pueden o no ser los
mismos y pueden existir nmeros diferentes de bolas de cada color en cada urna.
Por lo tanto, una observacin aislada de un color en particular no dice
inmediatamente de cul urna procede.

APLICACIONES DE LOS HMM


Varios son los usos y aplicaciones de los HMM, en la era moderna; en distintas
aplicaciones, ya que son de un gran inters para la realizacin de procesos
complejos involucrados a problemas de gran envergadura, por tal razn como el
rea de aplicacin es inmensa solo describiremos unos pocos usos con la
finalidad de tener una visin clara del futuro de los HMM.
Reconocimiento Automtico de la Voz.
La tarea que debe realizar un sistema automtico de reconocimiento de voz es
encontrar la cadena de palabras que satisfaga:
W=arg max P(A W)P(W)
Donde A son los datos acsticos y W= w1, w1,, wn, con wiV, denota la
cadena de n palabras de entre un vocabulario de tamao fijo V.
En este caso una palabra queda definida por su pronunciacin.
Si una palabra tiene varias pronunciaciones se considerar que son
dos entidades diferentes.
Los vocablos homfonos se considerarn una nica palabra.

Imaginmonos que tenemos un amigo que vive lejos y con quien habla a diario por
telfono acerca de lo que hizo durante el da. A su amigo le interesan tres
actividades: caminar por la plaza, salir de compras y limpiar su departamento. Lo
que su amigo hace depende exclusivamente del estado del tiempo en ese da.
Usted no tiene informacin clara acerca del estado del tiempo donde su amigo
vive, pero conoce tendencias generales. Basndose en lo que su amigo le dice
que hizo en el da, usted intenta adivinar el estado del tiempo.
Supngase que el estado del tiempo se comporta como una cadena de Markov
discreta. Existen dos estados, Lluvioso y Soleado, pero usted no los puede
observar directamente, es decir, estn ocultos. Existe tambin una cierta
posibilidad de que su amigo haga una de sus actividades cada da, dependiendo
del estado del tiempo: caminar, comprar o limpiar. Dado que su amigo le
cuenta sus actividades del da, esas son las observaciones. El sistema completo
es un modelo oculto de Markov.
Usted conoce las tendencias generales del tiempo en el rea y lo que a su amigo
le gusta hacer. En otras palabras, los parmetros del HMM son conocidos.
Estados = (Lluvioso, Soleado)
Observaciones = (caminar, comprar, limpiar)
Probabilidad inicial = {Lluvioso': 0.6, Soleado': 0.4}

probabilidad transicin = {Lluvioso: {Lluvioso': 0.7, Soleado': 0.3}, Soleado:


{Lluvioso': 0.4, Soleado': 0.6},}
probabilidad emisin = {Lluvioso: {caminar': 0.1, comprar': 0.4, limpiar': 0.5},
Soleado: {caminar': 0.6, comprar': 0.3, limpiar': 0.1}, }
En esta porcin de cdigo, probabilidad inicial representa el estado en el que
usted cree que se encuentra el HMM la primera vez que su amigo lo llama (es
decir, sabe que es un poco ms probable que est lluvioso). La distribucin de
probabilidades que se us aqu no es la de equilibrio, que es (dadas las
probabilidades de transicin) aproximadamente {Lluvioso': 0.571, Soleado':
0.429}.
La probabilidad transicin representa el cambio del tiempo en la cadena de
Markov por detrs del modelo. En este ejemplo, hay un 30% de probabilidad de
que maana est soleado si hoy llovi. La probabilidad emisin representa con
cuanta probabilidad su amigo realiza una actividad determinada cada da. Si
llueve, hay un 50% de probabilidad de que est limpiando su departamento; si
hay sol, hay un 60% de probabilidades de que haya salido a caminar.

MODELIZACIN DE TRANSECTOS DE VEGETACIN MEDIANTE HMM


Veamos con un ejemplo cmo se aplican los conceptos anteriores; se tratar de
modelizar transeptos de vegetacin con datos de presencia-ausencia. Los datos
consisten en transeptos realizados en una zona semirida (Benidorm, Alicante, SE
Espaa), cada uno de 25 m de longitud con 250 puntos igualmente espaciados, en
dos reas contiguas (cuatro transeptos en cada una), una quemada y otra no
quemada (vase Bautista, 1999; Bellot et al., 2000, para ms detalles y discusin
sobre los datos).
Resultaba evidente, a partir de la simple observacin de campo, que, a la escala
considerada, la vegetacin defina manchas, o zonas ms vegetadas, y claros, o
zonas con escasa vegetacin, con un cierto patrn de distribucin, con diferencias
entre la zona quemada y no quemada (tres aos despus del incendio). De hecho,
un anlisis descriptivo clsico de patrones en transectos de vegetacin, de la
familia del anlisis de la varianza en bloques (Greig-Smith, 1952; Greig-Smith,
1979; Hill, 1973), mostraba un patrn complejo, con similitudes globales y
diferencias en tamao de grano e intensidad entre las dos zonas (Bautista y
Vallejo, 2002).
Un primer tipo de HMM que podemos considerar constara de dos estados ocultos,
correspondientes a las manchas y claros, que son los elementos del sistema en
los que estamos interesados y que deseamos describir de la forma ms precisa

posible. Estos elementos no son directamente observables, pues, aunque la


probabilidad de encontrar vegetacin en un punto del transecto correspondiente a
una mancha es mayor que si estamos en un claro, es posible registrar ausencia de
vegetacin en el primer caso y presencia en el segundo. Los smbolos del modelo
seran dos, correspondientes a presencia y ausencia de vegetacin. El modelo
tendra, por tanto, cuatro parmetros bsicos independientes, dos probabilidades
de transicin y dos de emisin (el resto queda determinado por la condicin de
que la suma de las probabilidades de transicin, y tambin de emisin, desde un
cierto estado debe ser la unidad). Si para los estados escribimos 1 para mancha y
2 para claro, y para los smbolos 1 para presencia y 2 para ausencia de
vegetacin, podemos considerar como parmetros independientes las dos
probabilidades de transicin entre diferentes estados (T12 y T21) y las dos
probabilidades de observar presencia de vegetacin en manchas (E11) y en claros
(E21), tenindose que T11=1-T12, T22=1-T21, E12=1-E11 y E22=1-E21
Este modelo puede ayudar a entender el sentido de considerar estados ocultos, que es la
idea fundamental de los HMM. Sin embargo, conociendo el sistema que se trata de
modelizar, no es esperable que este modelo sea muy apropiado, pues sera ms
adecuado en situaciones con patrones simples, con manchas y claros relativamente
homogneos, como podra esperarse, por ejemplo, en algunas comunidades herbceas
de pastizales, en donde HMM de este tipo han sido utilizados para detectar bordes de
manchas (Ver Hoef & Cressie, 1997).

En el caso que estamos considerando, se tendran plantas arbustivas agrupadas


en ciertas zonas con reas de escasa vegetacin entre ellas, existiendo, por tanto,
dos niveles de manchas, el de la agrupacin y el de los propios arbustos,
resultando en el patrn complejo exhibido por los anlisis descriptivos clsicos.
Una de las ventajas de los HMM es que esta informacin a priori sobre el sistema
se puede introducir en el proceso de modelizacin, mediante la eleccin de la
topologa del modelo. As, podemos considerar tres estados ocultos; un primer
estado, correspondiente a los arbustos, que denominamos manchas (1), pequeos
claros entre manchas (2) y claros (3), de modo que una sucesin de los dos
primeros estados constituiran agrupaciones de manchas, separadas entre s por
los claros. En este modelo, las transiciones entre los estados 2 y 3 no tendran
sentido; por tanto, el modelo queda determinado por siete parmetros bsicos
independientes, cuatro probabilidades de transicin (T12, T13, T21 y T31) y las
tres probabilidades de observar presencia de vegetacin en cada uno de los tres
estados (E11, E21 y E31). En la Figura 2B se muestra un esquema de la topologa
del modelo.

La Tabla 1 muestra los valores de los parmetros, estimados mediante el algoritmo


de Baum-Welch, aplicando los dos modelos descritos a los transectos en las
zonas quemada y no quemada. Sin entrar en un anlisis detallado, los parmetros
muestran una estructura similar en las dos zonas, con valores algo mayores de las
probabilidades de transicin entre estados en la zona quemada, lo que implica un
menor tamao de las manchas y claros.

Una vez estimados los parmetros, la aplicacin del algoritmo de Viterbi


proporciona la sucesin de estados ocultos y, con ello, una descripcin detallada
de los tamaos de manchas y claros. En los transectos originales es difcil
encontrar una sucesin de puntos con presencia o ausencia continua de
vegetacin; en la sucesin de estados ocultos estimada, sin embargo, se detectan
series continuas de manchas y claros de mayor longitud, especialmente en el caso
del modelo con tres estados.

Bibliografa
file:///C:/Users/kathe%20andrea/Downloads/dcart.pdf
http://es.slideshare.net/efcuencaq/modelos-ocultos-de-markov
http://www.virtual.unal.edu.co/cursos/ingenieria/2001832/lecturas/hmm.pdf

También podría gustarte