Está en la página 1de 4

UNIVERSIDAD NACIONAL DE COLOMBIA 1

Ruina del jugador y colección de fichas del mundial


Dicken Santiago Barrera Cuellar, Daniel Eduardo Meza Rodrı́guez

Abstract I-D. Cadena de Markov

En el presente artı́culo se desarrollan dos problemas Es un proceso estocástico a tiempo discreto {Xn : n =
relacionados con los procesos estocásticos, mediante el uso 0, 1, ...}, con espacio de estados discreto, y que satisface la
del lenguaje de programación Python, para finalmente propiedad de Markov, esto es, para cualquier entero n ≥ 0, y
identificar comportamientos repetitivos e interesantes para cualesquiera estados x0 , ..., xn+1 , se cumple:
que podrı́an llegar a ser aplicados en la vida real.
p(xn+1 | x0 , ..., xn ) = p(xn+1 | xn ) (1)
Palabras clave: Estado, Cadenas, Probabilidad, Simula- Estos tipos de procesos son importantes y son modelos en
ción. donde, suponiendo conocido el estado presente del sistema, los
estados anteriores no tienen influencia en los estados futuros
del sistema.
I. I NTRODUCCI ÓN
II. M ETODOLOG ÍA
Problema 1 (ruina del jugador): se plantea que un jugador
debe lanzar una moneda para avanzar o retroceder a través II-A. Ruina Del Jugador
de los número del 0 al 10; si sale cara avanza, y si sale sello En este problema se realizó el código en el lenguaje de
retrocede. El jugador empieza desde el número 5, si llega al 10 programación python, donde el lanzamiento de la moneda se
gana el juego, pero si llega al cero pierde. Se busca responder realiza con una variable aleatoria que toma valores entre 0 y
a las siguientes preguntas: ¿cuál es la probabilidad de ganar o 1; 0 significa sello y 1 significa cara, por lo que si la variable
perder? ¿cuántos lanzamientos requiere para ganar o perder? toma el valor de 1, el jugador avanza una posición, pero si
toma el valor de 0, el jugador retrocede una posición. En
Problema 2 (monas del álbum Panini): el álbum Panini tiene
el programa se cuentan los intentos realizados para ganar o
cierta cantidad de monas. ¿Cuántas monas debe comprar una
perder en cada juego o partida, se realizaron 50000 partidas,
persona para poder llenar el álbum en su totalidad, es decir,
obteniendo finalmente un valor promedio para los intentos
para obtenerlas todas?
requeridos para ganar y perder el juego. Posteriormente, se
calcula un intervalo de confianza al 0.95 para los intentos
necesarios para ganar y perder a partir de la muestra obtenida,
I-A. Marco Conceptual
también se construyó un plot para cada caso (perder o ganar)
Para desarrollar correctamente los problemas, es necesario donde se muestra en eje de las abscisas las iteraciones de cada
clarificar algunos conceptos. ciclo y en las ordenas el número de intentos.

II-B. Monas Del Mundial


I-B. Proceso Estocástico
En este problema se realizó el código en el lenguaje de
Es una colección de variables aleatorias {Xt : t ∈ T } programación python. Se debe tener en cuenta que cada una de
parametrizada por un conjunto T , llamado espacio parametral, las monas del álbum tienen la misma probabilidad de aparecer
y con valores en un conjunto S llamado espacio de estados, es al momento de comprar una nueva. El parámetro principal del
decir, es un modelo de probabilidad que describe la evolución programa es el número de monas que componen al álbum,
de un sistema que evoluciona aleatoriamente en el tiempo1 . valor que se cambia varias veces, lo que trae consigo resul-
tados distintos en la cantidad promedio de monas compradas
para llenar el álbum. Se incluye también un contador para
I-C. Estado poder apreciar la cantidad de monas repetidas al momento de
Es la información compactada de la actividad pasada que se completar el álbum. Posteriormente, se calcula un intervalo de
ha tenido en el sistema, de forma que con esta, se puede confianza para el valor promedio de monas compradas para
predecir el comportamiento futuro del sistema ante una entrada completar el álbum a partir de la muestra obtenida.
cualquiera2 .
III. R ESULTADOS
1 Rincon,L. Introduccion a los Procesos Estocasticos
2 Valera Fernandez,A.Modelado y Control en el Espacio de Estados Diagrama de transición de ruina del jugador:
UNIVERSIDAD NACIONAL DE COLOMBIA 2

La probabilidad de ganar y perder concuerdan con lo


esperado, ya que coinciden con la probabilidad de sacar cara
o sello en una moneda. Cabe destacar que estos resultados
son casi iguales al realizar solamente 1000 juegos, ya que
en ambos casos es una muestra muy grande, por lo que es
suficiente para modelar lo que pasa en la realidad; también,
hay que tener en cuenta que el promedio muestral es un
estimador eficiente de µ que es la tendencia de los datos en
la población.

Al calcular un intervalo de confianza para el número de


La matriz de transición muestra la probabilidad de pasar de
intentos para ganar y perder, se obtuvo lo siguiente: Intervalo
una posición a otra, siendo siempre igual a 0.5 ya que se trata
de confianza al 0.95 para el número de intentos necesarios
de la probabilidad cara o sello de una moneda. En caso de
para ganar=(24.744361044230327 - 25.097403520622226).
encontrarse en la posición 0 o 10, la probabilidad de pasar
nuevamente a ese mismo estado es de 1, ya que el juego se
ha acabado en estas dos situaciones, por lo que no se puede Intervalo de confianza al 0.95 para el número de
cambiar de posición. Al realizar la suma de las filas, se puede intentos necesarios para perder=(24.900858799751003 -
evidenciar que en todos los casos el resultado es igual a 1, por 25.256905274886623)
lo que se trata de un modelo estocástico.
La precisión de los intervalos se debe al gran tamaño de
muestra (50000). Podemos observar que ambos intervalos (pa-
Al realizar el juego 50000 veces,
ra ganar y para perder), ası́ como ambos promedios arrojados
se obtuvieron los siguientes resultados:
al realizar 50000 juegos son muy parecidos; casi iguales. Esto
nuevamente es de esperarse, ya que la probabilidad de ganar
o perder es la misma (0.5 cada una).

En el gráfico de Ruina del jugador-ganar podemos observar


la ocurrencia de picos o puntas, que son datos entre 100 y
200, pero son pocos en comparación con la base del gráfico,
allı́ observamos una densidad de datos que están entre 0 y 50,
a lo cual, podemos afirmar que el promedio de intentos para
ganar esta entre este par de valores; los valores como 205,
150 no afectan mucho al resultado dado que la muestra es
demasiado grande. Para el gráfico Ruina del jugador-perder se
puede hacer la misma interpretación, puesto que, la mayorı́a
de los datos se encuentran entre 0 y 50.

Diagrama de transición de monas del álbum Panini:


UNIVERSIDAD NACIONAL DE COLOMBIA 3

Intervalo de confianza al 0.95 para el número de


En cuanto al problema de las monas del álbum Panini, la
intentos requeridos para llenar el álbum de 100 mo-
matriz de transición muestra la probabilidad de pasar de tener
nas=(512.9785841599514 - 519.8818158400486)
i monas en el álbum a tener i+1 monas, siendo esta cada vez
Resultados con un álbum de 200 monas:
más pequeña, ya que se aumenta la probabilidad de que salga
alguna repetida. En caso de encontrarse en la posición 0, la
probabilidad de pasar nuevamente a ese mismo estado es de
0, ya que no ha comprado ninguna ficha, la probabilidad de
sacar 1 ficha repetida es de 1/N-monas y de obtener 2 monas
repetidas es de 2/N-monas, ası́ hasta llegar a N-monas, cuando
este en ese estado hemos completado el álbum y si queremos
comprar otra ficha la probabilidad de salir repetida es de 1. Al
realizar la suma de las filas, se puede evidenciar que en todos
los casos el resultado es igual a 1, por lo que se trata de un
modelo estocástico.
Resultados con un álbum de 30 monas: Intervalo de confianza al 0.95 para el número de
intentos requeridos para llenar el álbum de 200 mo-
nas=(1170.8023331850497 - 1184.6908668149501)
Resultados con un álbum de 500 monas:

Intervalo de confianza al 0.95 para el número de


intentos requeridos para llenar el álbum de 30 mo-
nas=(119.4298571617865 - 121.5265428382135) Intervalo de confianza al 0.95 para el número de
intentos requeridos para llenar el álbum de 500 mo-
Resultados con un álbum de 60 monas: nas=(3381.798786522386 - 3416.814813477614)

IV. C ONCLUSIONES
Con los dos problemas propuestos, se entendió el concepto
de cadenas de Markov, dado que se utilizó el principio de
Markov, que involucra solamente el estado actual, para saber
el estado futuro. Del primer ejercicio se puede concluir que
si estamos con un dinero inicial de 5 pesos la probabilidad
de ganar o perder son parecidos y tienden a un valor de 0.5,
esto es correcto, dado que, se lanza una moneda para jugar
y solo existen dos posibilidades que justamente valen 0.5, es
decir, ganar un peso más tiene una probabilidad de 0.5 como
Intervalo de confianza al 0.95 para el número de
también de perderlo; si se cambian el dinero inicial a un valor
intentos requeridos para llenar el álbum de 60 mo-
de 8 pesos la probabilidad de ganar va ser más alta, puesto
nas=(278.290206131923 - 282.463793868077)
que esta más cerca de 10 pesos y tiende a un valor de 0.8, esto
Resultados con un álbum de 100 monas: quiere decir que dependiendo del dinero inicial (estado actual)
se puede decir cuál será la probabilidad de ganar o perder
UNIVERSIDAD NACIONAL DE COLOMBIA 4

(estado futuro) y esto es lo que se enuncia en el principio


de Markov; el promedio de lanzamientos para ganar o perder
son muy parecidos cuando el dinero inicial es de 5 pesos, se
puede decir que las variables se encuentran en equilibrio en un
estado inicial de 5 pesos. Finalmente para el segundo ejercicio
se puede concluir que el número de monas que tiene el álbum
Panini es proporcional al número que tiene que comprar o
coleccionar, puesto que, para un tamaño de 30 monas que tiene
el álbum tiene que comprar o coleccionar en promedio 120
monas, mientras que para un álbum de 500 monas es necesario
comprar 3400 aproximadamente; también podemos observar
que los intervalos de confianza son más grandes dependiendo
del número de monas del álbum. Se puede concluir también,
gracias a la matriz de transición y al diagrama de transición,
que al comienzo es muy fácil conseguir monas y que no
estén repetidas, tanto para un álbum grande como pequeño,
posteriormente se dificulta la colección de monas dado que al
tener unas coleccionadas, la probabilidad de repetir fichas es
alta, como se muestra en la matriz; si al final se logró llenar
el álbum y se decide comprar otra mona, la probabilidad de
que esté repetida es de 1.

R EFERENCIAS
[1] Rincón, L. (2011). INTRODUCCIÓN A LOS PROCESOS
ESTOCÁSTICOS. México DF: UNAM. Obtenido de:
http://lya.fciencias.unam.mx/lars/libros/procesos.pdf
[2] Fernández, Á. V. (2016). MODELADO Y CONTROL EN EL
ESPACIO DE ESTADOS.
Valencia: UNIVERSITAT POLITÈCNICA DE VALÈNCIA. Obtenido de:
https://gdocu.upv.es/alfresco/service/api/node/content/workspace/SpacesStore/edea5442-
cf02 4018-95e9-78a7ed411af9/TOC0 5030 60 1.pdf ?guest = true

También podría gustarte