Métodos para Generar Variables aleatorias Hay cuatro métodos generales de generación de variables aleatorias y una serie de métodos

Particulares de las distintas distribuciones. La facilidad de aplicación de dichos métodos, así como el coste computacional asociado a los Mismos, varía mucho según la familia de variables aleatorias a las que se apliquen. Normalmente existen varios algoritmos que se pueden utilizar para generar valores de una Determinada distribución, y diferentes factores que se pueden considerar para determinar qué algoritmo utilizar en un caso particular. Desafortunadamente dichos factores suelen entrar en conflicto unos con otros y a veces se ha de llegar a una solución de compromiso. Algunos de estos factores son los siguientes: Exactitud: se han de obtener valores de una variable con una precisión dada. A veces se tiene suficiente con obtener una aproximación y otras no. Eficiencia: el algoritmo que implementa el método de generación tiene asociado un tiempo de ejecución y un gasto de memoria. Elegiremos un método que sea eficiente en cuando al tiempo y a la cantidad de memoria requeridos. Complejidad: Buscamos métodos que tengan complejidad mínima, siempre y cuando se garantice cierta exactitud. Robusted: el método tiene que ser eficiente para cualquier valor que tomen los parámetros de la distribución que siga la variable aleatoria. Facilidad de implementación.

Métodos generales

Los métodos generales para la generación de variables aleatorias son: Método de Inversión, de Aceptación-Rechazo, de Composición y de Convolución. A continuación pasamos a estudiarlos. Método De Los Cuadrados Consiste en que cada número de una sucesión es producido tomando los dígitos medios de un número obtenido mediante la elevación al cuadrado. P1: Obtener semilla (valores iniciales 445) P2: Aplicación de Algoritmos recursivos (elevar al cuadrado) P3: Validación del conjunto de datos generados Ejemplo: Consideremos la semilla 445 X X2 N° Aleatorio 445 1| 9802 | 5 0,9802 9802 96| 0792 | 04 0,0792 792 6 | 2726 | 4 0,2726 2726 …………… ……………

Métodos para Generar Variables aleatorias

 Método de Inversión La función de distribución (también llamada función de distribución acumulativa), F(x), de una variable aleatoria X es definida para cada número real x como sigue:
F(x)=P(X≤x) para -∞<x<∞ Donde P(X≤x) es la probabilidad asociada con el suceso {X≤x}. Así F(x) es la probabilidad, cuando se ha realizado el experimento, de que la variable X tome un valor menor o igual que x. Una función de distribución F(x) tiene las siguientes propiedades:

Una variable aleatoria X se dice que es discreta si puede tomar unos valores determinados, no pudiendo tomar ningún valor comprendido entre dos consecutivos. Así la variable sólo puede tomar un conjunto finito de valores x1, x2,...,xn. La probabilidad de que la variable aleatoria X tome el valor xi es dado por:

Donde la sumatoria significa la suma de todas las probabilidades p(x1), p(x2),... Todas las probabilidades acerca de X se pueden calcular desde p(x), a la cual se le llama función de probabilidad para la variable discreta X. Si I=[a,b], donde a y b son números reales tales que a≤b, entonces

El método de inversión va a aprovechar las propiedades de la función de distribución para obtener un valor de la variable aleatoria a partir de un número aleatorio uniformemente distribuido en el intervalo (0,1).

 Caso continuo En este caso la función de distribución es continua. Los métodos de inversión.  Método de Aceptación Rechazo Este método es más probabilístico que el anterior. uniformemente distribuido en (0.  Caso discreto Al ser discreta no hay fórmula de su inversa y puede ocurrir que dado un u no se encuentre imagen x de la función. Vamos a utilizar un número aleatorio u.1) y vamos a suponer que es el valor que toma la función de distribución en un punto x.Vamos a ver en qué consiste dicho método tanto para el caso en el que la variable aleatoria sea continua como para cuando es discreta. El método de aceptaciónrechazo es menos directo en su aproximación Es a X una variable aleatoria con función de densidad Supóngase que f(x)=Cg(x)h(x) con C una constante. vamos a encontrar un valor de x para cualquier u. Tal punto va a ser el valor de la variable que queremos generar. Si densidad h) son independientes. Al ser la función de distribución continua. y e Y (con función de Demostración: . en el sentido en que tratan directamente con la función de distribución. h(x) una función de densidad en I. entonces . sino que este valor esté entre dos valores posibles. composición y convolución son métodos de generación directos. . En este caso la función de distribución es discontinua y tiene una forma escalonada.

Si u>g(y). se va al paso 1. Se . 2. Algoritmo de aceptación y rechazo: 1. entonces si queremos optimizar el método habrá que intentaar que C sea próxima a uno y que h sea sencilla de generar.E.Q. 3. Ahora interesa conocer cuál es la probabilidad de que en una iteración concreta se rechace el valor generado: y un valor y de la variable Y (de forma Como el número de iteraciones del método hasta aceptar un valor sigue una distribución geométrica de parámetro (cuya esperanza es C).D. entonces buscamos que sea . Si hacemos tendrá . Se genera independiente). Si . entonces se hace x=y.

f como . etc. Se elige la i-ésima función con probabilidad pi y se genera un valor para la función de densidad fi.  Método de composición El método consiste en generar dos números aleatorios.Como coincide con h salvo la constante y h es una función de sea densidad en I.  Método de convolución Muchas variables aleatorias incluyendo la normal. descompone . se pueden expresar de forma exacta o aproximada mediante la suma lineal de otras variables aleatorias. poisson. El valor de la variable obtenida es el valor buscado. uno sirve para seleccionar un trozo y el otro se utiliza para generar un valor de una variable que sigue la distribución de dicho trozo. binomial. El método de composición consiste en lo siguiente: 1.  Procedimientos especiales Existen algunas distribuciones estadísticas de probabilidad en las cuales es posible emplear sus propiedades para obtener expresiones matemáticas para la generación de variables aleatorias en forma eficiente.. El método de convolución se puede usar siempre y cuando la variable aleatoria x se pueda expresar como una combinación lineal de k variables aleatorias Permite generar una distribución a partir de la suma de distribuciones más elementales o mediante la transformada z. . Sea f(x) la función de densidad de una variable aleatoria X. entonces también se tiene que cumplir que finita. Se 2. En varios casos se aplica el Teorema Central del Límite y en otros se utiliza el método directo para encontrar las variables aleatorias. gamma. erlang. con fi función de densidad. . .

}.Transformada inversa. que es continua en [0. tal que satisface F (s) = L{f} (s). la transformada inversa de La place de una función F (s) es una función f (t) cuya TL sea F (s). convolución. El método de la transformada inversa: Suponga que queremos generar el valor de una variable aleatorio discreta X con función de masa de probabilidad (Transformada Inversa de La place) La Transformada Inversa de La place de una función F (s) es una función única L−1 {F } (t) = f (t). . En las siguientes propiedades se asume que las funciones f(t) y g(t) con funciones que poseen transformada de La place. directos. ∞). aceptación-rechazo. En otras palabras. A la transformada inversa de una función se le denota con la letra minúscula correspondiente a la de su transformada o utilizando el operador transformada inversa L−1 {.

Observaciones: 1.Podemos escribir lo anterior en forma algorítmica. como Generar un número aleatorio U Si U<p0 hacer X = x0 y terminar Si U<p0+ p1 hacer X = x1 y terminar Si U<p0+ p1 + p2 hacer X = x2 y terminar ..

Sean y=1+[ku]. Método del alias (Este método sólo es válido para variables cuya probabilidad está concentrada en un número finito de puntos) Sea X tal que P(X=xi)=pi. Se hace s=p1. se tiene el siguiente algoritmo: 1. Se toma x=xk. entonces k=y. Se genera 2. s=s+pi y se repite el paso 2. 2. Tras una fase de preprocesamiento que se detalla más adelante. Si .Generación de variables aleatorias discretas: distribuciones poisson. entonces x=xi es el valor que se genera y finaliza el algoritmo. Método de la transformación inversa Sea X una variable aleatoria discreta con función de distribución F y probabilidades puntuales Considerando la función F. entonces k=A(y). Falta determinar los valores Q(i) y los alias A(i) de modo que se tenga . Si . entonces se hace i=i+1. y geométrica. Se genera . z=frac(ku). . . que es escalonada.Binomial. Si u>s. Si z>Q(y). i=1. se tiene el siguiente algoritmo: 1.

Para cada se define 2. Si esto no es posible. Q(i)=kai. A(4)=1. A(3)=2. i=3. Se repiten las siguientes operaciones (a lo sumo) k-1 veces:  Selecciónese i tal que . . Ij=true. I(3)=False. Ejemplo: Sea vector de probabilidades es ( ) con x=0. . j=1. A(i)=j. . j=2.2. Ii=true. Selecciónese j tal que .1. I(4)=False.Fase de preprocesamiento: 1.   Hágase Ii=false. .3. finaliza el preprocesamiento. El i=4.

. . Distribuciones concretas Distribución geométrica Representa el número de fracasos hasta que se produce el primer éxito en un experimento de Bernouilli de parámetro p. A(1)=2. el 3 al 2 y el 4 al 3. .i=1. el 2 al 1. j=2. con lo cual cuando apliquemos la segunda parte del algoritmo del alias nos dará los valores que buscamos. La variable geométrica se puede relacionar fácilmente con la variable exponencial: Sea Sea x>0. Ahora asignamos el 1 al valor 0.

por lo que se concluye que Distribución binomial negativa Representa el número de fracasos antes del r-ésimo éxito en un experimento de Bernouilli de parámetro p. Veamos también un algoritmo directo basado en el método de composición. tomemos tal que para conseguir la expresión de probabilidad puntual de una distribución G(p). Otro modo consiste en observar que una variable BN(p. Basta tomar una hacer . Tras esto se toma un valor y generado según y se toma x=[y].r) es suma de r variables geométricas G(p) independientes.Como . Ya se vio que para ello hay que . Sean (Poisson) y . por lo que basta simular r veces una geométrica con parámetro p y sumar los valores obtenidos. . con . Existen varias formas de simular variables con distribución binomial negativa: la más inmediata es ir simulando experimentos de Bernouilli de parámetro p y contabilizar los fracasos hasta que se obtiene el éxito résimo.

Este valor x está distribuido según una distribución binomial negativa BN(p. Como nosotros queremos simular . Ese valor x corresponderá a una variable Como los valores Tj son exponenciales de parámetro tiene que .r). con . entonces se . En unidad de tiempo sigue una distribución de Poisson de parámetro consecuencia. para generar una variable siguiente modo: se generan valores . podemos proceder del tales que .Luego esta composición es . . Distribución de Poisson En la primera parte de la asignatura se vio que si los tiempos entre sucesos consecutivos son . . Se genera 2. entonces debemos tomar siguiente algoritmo: 1. entonces el número de sucesos por . por lo que . Se genera .r). resultando el una BN(p. .

En resumen. x=1. 2. En caso contrario se hace x=x+1 y se va al paso 2. Se genera 3. . entonces x-1 es el valor buscado. y se hace k=kui. Si . el algoritmo es el siguiente: 1. Sean k=1.

Beta. Exponencial. y Triangular Distribución exponencial Un método que ya se usado varias veces consiste en tomar con . normal. . Gamma. Ahora se hace y Estos valores corresponden a una variable Exp(1) y son independientes.Generación de variables aleatorias continuas: distribuciones Uniforme. Erlang. u(n)=1. es el siguiente: se generan Ordenando obtenemos definimos u(0)=0. Otro método. basado en los estadísticos ordenados y que permite generar n valores a la vez.

del segundo parámetro y una variable es una consideramos la siguiente descomposición: Es por esto por lo que basta limitarse a simular variables con .Distribución gamma Sea y . El siguiente teorema nos da un método directo para y son simular estas variables. Si independientes. entonces . Como esta distribución es reproductiva respecto .

0<w<1.Demostración: Sean v>0. Por la independencia de W y V: Se considera el cambio Así El recinto transformado es La distribución marginal de X es .

Si son independientes.D. En los dos siguientes teoremas veremos dos métodos para simular variables beta de modo eficiente.Luego Q. entonces f está acotada y se puede aplicar aceptación y para una cota de rechazo. . Distribución beta Si . el método sólo es eficiente si tanto como están próximos a uno.E. El valor máximo de f se alcanza en Sin embargo. . entonces e Demostración: .

Se considera el cambio de variable La densidad conjunta es El recinto transformado es La distribución marginal de X1 es .

Distribución de (Y1.D.Y2): Como Y1 e Y2 son independientes. . entonces e independientes. Distribución de Y1 (la de Y2 se obtiene de forma análoga pero considerando en lugar de ): El recinto transformado es 0<y1<1. entonces Distribución de Se considera el cambio de variable : .E.Luego Q. Demostración: Como U1 y U2 son independientes. Sean U1. Si . entonces Y1 e Y2 también lo son.

El recinto transformado es Ahora. . si . entonces: En consecuencia.

1).D.Luego Además.y2) en una iteración concreta es Q.1) e .1) se considera el cambio de coordenadas siguiente (cambio polar): con independientes.E. Con el fin de generar una variable N(0. Demostración: e independientes. Las variables Z1. la probabilidad de que se acepte el par (y1. basta generar una variable N(0. Distribución normal Para generar una variable pues . Z2 son N(0.

La idea es la siguiente. se simularía la distribución empírica. Definición 2. Distribuciones Empíricas de probabilidad La distribución empírica asociada a una muestra es la ley de probabilidad sobre el conjunto de las modalidades. Así Luego y son independientes. tal que: probabilidad .El recinto transformado es . En otras palabras. . Supongamos que queremos aumentar artificialmente la cantidad de datos. que afecta a cada observación con el peso .1 Sean diferentes valores que toman los una muestra. La forma más simple sería sacar aleatoriamente nuevos valores a partir de los valores ya observados. La distribución empírica de la muestra es la ley de sobre el conjunto . respetando sus frecuencias. Para los denotamos: el número de veces que el valor valor aparece o sea el efectivo del .

Para estudiar una distribución empírica. Para un carácter continuo agrupado en clases de amplitudes iguales. Para un carácter discreto. Una distribución empírica se llama unimodal si la frecuencia maximal es significativamente mayor que las otras. es decir escribir sus estadígrafos de orden. a los valores iguales a los puestos en orden creciente: Aquí tenemos como ejemplo a una muestra de tamaño estadígrafos de orden. la varianza y la desviación estándar pueden ser vistas como carácterísticas probabilistas de la distribución empírica.2 Sea una muestra numérica. La media de la muestra es la esperanza de su distribución empírica. y sus La función de distribución empírica es la función de distribución de la distribución empírica. . hablamos de clase modal. Puede ser bimodal o multimodal en otros casos. Llamamos estadígrafos de orden de la muestra. la primera etapa consiste en ordenar los datos en orden creciente. la moda de la distribución empírica es el valor que tiene la frecuencia más alta. Definición 2.La media.

3 La función de distribución empírica es la función de en . . es la proporción de los elementos de la muestra que son menores o iguales a .Definición 2. que denotamos por y que toma los valores: En otras palabras.

Sign up to vote on this title
UsefulNot useful