Números aleatorios

Introducción Definiciones Características de un generador Métodos de generación Pruebas de aleatoriedad Referencias

Lenguajes de simulación

2004-2005

Números aleatorios. Introducción
La gran disponibilidad de generadores de números aleatorios en muchos entornos y en prácticamente casi todos los compiladores puede llevarnos a pensar que para un usuario de la simulación no sería necesario estudiar estas cuestiones. Una lección del pasado reciente nos obliga a sacar conclusiones y actuar con mucho cuidado con dichos generadores (RANDU - IBM). El uso progresivo de modelos de simulación cada vez más detallados exige una mayor calidad de los generadores de números aleatorios. Ripley indica que la generación de números aleatorios parece uno de los temas peor comprendidos de la ciencia de computadoras. Knuth, por su parte indica que “Los números aleatorios no deben ser obtenidos con un método elegido aleatoriamente”

Lenguajes de simulación

2004-2005

DEF 2: L’Ecuyer (1990) [Impredicibilidad] Una sucesión de números es aleatoria si nadie que utilice recursos computacionales razonables puede distinguir entre la serie y una sucesión de números verdaderamente aleatoria de una forma mejor que tirando una moneda legal para decidir cuál es cuál. 3. u2. 2004-2005 .-La varianza de los números generados puede ser demasiado alta o demasiado baja. Obs: Una particular ley de Probabilidad base para la generación de números pseudoaleatorios u1.1).Números aleatorios.Los números generados pueden no estar distribuidos uniformemente.Autocorrelación entre números.1)... Algunas características Cuando se generan números seudo aleatorios se pueden producir ciertos errores o problemas.. Definiciones (I) DEF 1: Kolmogorov (1987) [Complejidad Algorítmica] Una sucesión de números es aleatoria si no puede producirse eficientemente de una manera más corta que la propia serie. como por ejemplo: 1. 1) ui ~ U(0. 5.Varios números por encima de la media seguidos de otros por debajo de la misma..Los números generados pueden corresponder a una distribución discreta en lugar de a una continua... 2. un} es una sucesión de números U(0. Lenguajes de simulación 2004-2005 Números aleatorios.. DEF 3: Un Número aleatorio es una realización de una variable aleatoria que tiene asociada una ley de probabilidades F... Lenguajes de simulación DEF 4: Una sucesión de números aleatorios generados {u1. . Por ejemplo . 4.La media de los números generados puede ser demasiado alta o demasiado baja. Obs: Esta definición conduce a los denominados generadores PT-perfectos usados en Criptografía..Puede existir una clara dependencia entre ellos. un : es la uniforme (0 ... si tiene las mismas propiedades estadísticas relevantes que dicha sucesión de números aleatorios reales. u2.Números correlativamente más bajos o más altos que los adyacentes. .

.. Existe una gran número de métodos para generar {ui} ≈ U(0. – – Lenguajes de simulación 2004-2005 . Las secuencias de números aleatorios deben ser replicables. La ocurrencia de repeticiones en los números obtenidos puede propiciar la no aceptación del generador. i=1. con h=1.n . Partiendo del mismo número se debe poder obtener la misma secuencia Los números obtenidos deben aproximarse a las propiedades estadísticas ideales de uniformidad e independencia. hay también unas ciertas consideraciones importantes para la elección de un método u otro. Obs: h=2 tenemos (ui.ui+1) .2.E[U]= ½ . La rutina debe tener un ciclo suficientemente largo. Definiciones (II) DEF 5: Una sucesión de números aleatorios {ui} es aleatorio si h-tuplas de números sucesivos no superpuestos se distribuyen aproximadamente como una [0. idealmente. Un ciclo representa la longitud de una secuencia antes que comiencen a repetirse los números en el orden anterior. V[U]= 1/12 .n..Números aleatorios.Período largo Lenguajes de simulación 2004-2005 Consideraciones para la elección de generadores Aunque existe un gran número de métodos posibles para la generación de números aleatorios en una computadora.1]2... La rutina debe ser transportable entre diferentes ordenadores e. se distribuye como una ley uniforme en [0. para n suficientemente grande. – – – La rutina debe ser rápida.2. a diferentes lenguajes de programación.1]h.Independientes .1) : -Uniformente distribuidos .

.....Validación] P1 : Obtener semilla (valores iniciales) P2 : Aplicación de algún algoritmo de generación recursivo P3 : Validación del conjunto de números generados (Pruebas de Aleatoriedad) Lenguajes de simulación 2004-2005 Métodos de los cuadrados medios Consiste en que cada número de una sucesión es producido tomando los dígitos medios de un número obtenido mediante la elevación al cuadrado.9802 0...Métodos de Congruencias Todo proceso de generación consta de tres fases: [Semilla .... 2004-2005 .Algoritmo ...Métodos de generación Existen varios métodos para la generación de números aleatorios como: 1..........Método de los cuadrados medios 2..0792 0. P1 : Obtener semilla (por ejemplo 445) P2 : Aplicación del algoritmo (elevar al cuadrado y truncar) P3 : Validación del conjunto de los números generados Ejemplo: Consideremos la semilla 445 X 445 9802 792 2726 Lenguajes de simulación X2 1| 9802 | 5 96| 0792 | 04 6 | 2726 | 4 .... N° Aleatorio 0.....2726 ..

4 (1962). T. siendo todos ellos enteros. Zi=aZi-1-mKi donde Ki= ⎣aZi-1/m⎦ donde Z0 es la semilla. Si 4 divide a m. Lenguajes de simulación 2004-2005 . Se debe cumplir que m>0. entonces 4 divide a (a-1). Este tipo de generadores producen una secuencia de enteros entre 0 y m-1 de acuerdo con: Zn=(a Zn-1+c) mod m donde a es el multiplicador. c<m y Z0<m. (1) Planteado por HULL. entonces q divide a (a-1). DOBELL.c y m son determinantes para la longitud de la secuencia y la calidad del generador. La mayoría de los generadores que se utilizan actualmente son generadores de congruencias lineales. a<m. R. Para obtener el número aleatorio se utiliza: Un=Zn/m La elección de los valores de a.2. ⎡ c(a i − 1) ⎤ Z i = ⎢a i Z 0 + ⎥ mod m − a 1 ⎣ ⎦ Teorema1: Un generador de congruencias lineales mixto tiene periodo total si y solo si se cumplen las condiciones siguientes: El único entero positivo que divide exactamente a m y a c es 1 (m y c son primos entre si)... Cuando c>0 los generadores se llaman mixtos y cuando c=0 se llaman multiplicativos. c es el incremento o desplazamiento y m el módulo. Random number generators. Si q es un número primo que divide a m. E.. Lenguajes de simulación 2004-2005 Generadores de congruencias lineales mixtos Su forma general es: Zi=(aZi-1+c) mod m Por inducción matemática se puede ver que para i = 1. SIAM Rev.Generadores de congruencias lineales. A.

3 Ejemplo: sea m = 102 = 100. c = 0 y X0 = 63 la secuencia obtenida de acuerdo con dicha fórmula es: X0 = 63 X1 = (19)(63) mod 100 = 1197 mod 100 = 97 X2 = (19)(97) mod 100 = 1843 mod 100 = 43 X3 = (19)(43) mod 100 = 817 mod 100 = 17 X4 = (19)(17) mod 100 = 323 mod 100 = 23 . por lo que este tipo de operación será muy eficiente en las computadoras. para i= >1. a = 19.Generadores de congruencias lineales. Los números generado por 2 y 6 son iguales pero en sentido contrario. la operación módulo se realiza guardando los b dígitos decimales de la derecha.. Lo mismo ocurre con los generados por 7 y 8. Este tipo de relaciones se producen generalmente en generadores multiplicativos. Ejemplo (II) Sea la secuencia: Xi+1 = a Xi mod 11. Z0 = 1 i/a 0 1 2 3 4 5 6 7 8 9 1 1 1 2 1 2 4 8 5 10 9 7 3 6 3 1 3 9 5 4 1 4 1 4 5 9 3 1 5 1 5 3 4 9 1 6 1 6 3 7 9 10 5 8 4 2 7 1 7 5 2 3 10 4 6 9 8 8 1 8 9 6 4 10 3 2 5 7 9 1 9 4 3 5 1 10 1 10 1 Las raíces primitivas son 2. como 10b. 2. 7 y 8.. Ejemplo (I) La fórmula general es: Xi+1 = (a Xi + c) mod m. Lenguajes de simulación 2004-2005 .1. i=0. Lenguajes de simulación 2004-2005 Generadores de congruencias lineales. 6. Cuando m es una potencia de 10.

Lenguajes de simulación 2004-2005 Generadores de congruencias lineales. Ejemplo (IV) Parámetros b m 0 13 0 13 0 13 0 11 0 11 Caso 1 2 3 4 5 a 6 7 5 7 6 xo 1 10 5 5 3 Caso 1 2 3 4 5 6 5 12 2 7 10 9 8 3 9 8 11 1 10 10 9 12 5 4 5 2 6 12 6 8 Salidas 12 7 3 8 8 1 9 8 4 2 3 4 5 1 1 5 2 12 7 6 4 1 8 5 3 11 7 1 2 7 1 10 5 3 9 6 5 12 10 10 10 9 8 4 5 Lenguajes de simulación 2004-2005 . 3 y 4 i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Xi 1 13 41 21 17 29 57 37 33 45 9 53 49 61 25 5 1 Xi' 2 26 18 42 34 58 50 10 2 Xi'' 3 39 59 63 51 23 43 47 35 7 27 31 19 55 11 15 3 Xi''' 4 52 36 20 4 Para una potencia de 2. a = 13.Generadores de congruencias lineales. Ejemplo (III) La fórmula general es: Xi+1 = (a Xi + c) mod m Ejemplo: sea m = 26 = 64. 2. m = 2l y c = 0 el periodo posible más grande es P = m/4 = 2l-2 que se consigue en el caso en que la semilla es impar y el multiplicador a está dado por ±3 + 8k donde k es un entero. c = 0 y X0 = 1.

iv) La representación de pares (Xi. Lenguajes de simulación 2004-2005 . b = 0 Xn = 65539 Xn-1 mod (231) un = Xn/m ¡Este generador proporciona tripletas consecutivas de números que caen en 15 planos! Lo que sugiere cierta que los resultados a obtener son previsibles (Mal Generador) Lenguajes de simulación 2004-2005 Generadores de congruencias lineales.Generadores de congruencias lineales. algunas salidas parecen más aleatorias que otras. Ejemplos (V) Un algoritmo de muy fácil implementación de generadores de congruencias es m = 231-1 a = 75 (raíz primitiva de m) Xn = 75 Xn-1 mod (231-1) un = Dicho generador se encuentra en las bibliotecas IMSL y NAG La rutina RANDU. a = 65539 . Propiedades Algunas observaciones de las salidas de los generadores de congruencias: i) Los generadores de congruencias tienen ciclos iI) La longitud del ciclo depende de la selección de los parámetros iii) Dentro de selecciones de parámetros que conducen a la misma longitud. que IBM proporcionaba para sus equipos consideraba un modelo congruencial multiplicativo con m = 231 . Xi+1) sugiere que éstos se disponen en un número finito de hiperplanos.

b42 = (b39 + b37) mod 2 = 2 mod 2 = 0 Se puede repetir la secuencia pero dependiendo de la elección de la longitud no coincidir en dicha repetición. Una de las cuestiones de más importancia en este aspecto es el de la autocorrelación más baja entre número sucesivos. Lenguajes de simulación 2004-2005 . Xn= [(234 +1)Xn-1+1] mod 235 Xn= [(218 +1)Xn-1+1] mod 235 No obstante. mientras el segundo tiene una correlación despreciable menor que 2-18. el periodo no debe ser el único criterio de decisión a la hora de elegir un generador. Ambos generadores tienen el mismo periodo total pero el primero tiene una correlación de 0.Consideraciones respecto a la elección Un generador que tiene el periodo máximo posible se dice que es de periodo total.25 entre Xn y Xn-1. Lenguajes de simulación 2004-2005 Generadores de Tausworthe En este caso se deben proporcionar los primeros q bits. lo que es análogo a la semilla de los generadores de congruencias lineales.. Este tipo de generador depende del largo de la palabra Ejemplo: r=3 q = 5 con b1 = b2 = b3 = b4 = b5 = 1 para i ≥ 6 bi = (bi-3 + bi-5) módulo 2 b6 = (b3 + b1) mod 2 = 2 mod 2 = 0 b7 = (b4 + b2) mod 2 = 2 mod 2 = 0 b8 = (b5 + b3) mod 2 = 2 mod 2 = 0 b9 = (b6 + b4) mod 2 = 1 mod 2 = 1 b10 = (b7 + b5) mod 2 = 1 mod 2 = 1 ..

. Lenguajes de simulación 2004-2005 .... Aunque la correlación de primer orden (un número con el siguiente) es casi cero se sospecha que algunos generadores pueden proporcionar valores elevados de correlaciones de orden elevado. Se elige l = 4 y1 = b123 + b222 + b321 + b420 = 8 + 4 + 2 + 1 = 15 y2 = b523 + b622 + b721 + b820 = 8 + 0 + 0 + 0 = 8 y3 = b923 + b1022 + b1121 + b1220 = 8 + 4 + 0 + 1 = 13 y4 = b1323 + b1422 + b1521 + b1620 = 8 + 4 + 0 + 1 = 13 .... . pero no es el periodo de la secuencia de números. . Consideremos {bi} b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13.1)?.Generadores de Tausworthe ¿Cómo se transforma la sucesión {bi} en números aleatorios U(0. No todos los polinomios primitivos tiene las mismas cualidades.. ..⎬ ⎩16 16 16 16 16 16 16 16 16 ⎭ Comienza la repetición u1 = u2 = y1 2 y2 2l y3 l = u3 = 2l 15 16 8 = 16 13 = 16 El periodo de los bits es 31 (2q – 1). . b41 b42 1 1 1 1 1 0 0 0 1 1 0 1 1 .. i =1 = ⎨ 8 13 13 4 2 5 9 1 ⎫ ....... pero pueden tener un comportamiento local poco satisfactorio. Inconvenientes: La secuencia obtenida puede tener buenos resultados en las pruebas sobre el ciclo completo.. como 2251-1 > 10156 e incluso mayores en micros de 16 bits. .. Se pueden obtener secuencias de longitud considerable. En general proporcionan malos resultados en las pruebas de rachas hacia arriba y hacia abajo. y así sucesivamente ⎧15 {u i }10 .... Las primeras versiones de GPSS/H utilizaban un generador de Tausworthe. 1 0 1111 1000 1101 1101 0100 0010 01 01 1001 1111 0001 …. . Lenguajes de simulación 2004-2005 Generadores de Tausworthe Ventajas: Son independientes del ordenador y del tamaño de la palabra que utilice. ..

Utilizar series no solapadas (cada serie precisa una semilla separada). Reutilizar las semillas para sucesivas réplicas de la misma simulación. No subdividir una serie.1] H1: Ri ≠ U[0. Lenguajes de simulación 2004-2005 Cuando se prueba la uniformidad las hipótesis son: . H0: Ri ∼ U[0. Pruebas de series. – – – – – Prueba de frecuencia. Prueba de poker. Se supone que la selección de la misma no debe afectar a los resultados de la simulación. los generadores suministrados comercialmente ya han pasado por algunas de estas pruebas. Prueba de saltos. Prueba de autocorrelación. Producen problemas como: • la simulación no se puede reproducir • no es posible garantizar que seres vivos no se solapen Lenguajes de simulación 2004-2005 Pruebas de aleatoriedad Para comprobar si los número aleatorios obtenidos cumplen las propiedades deseadas de uniformidad e independencia se deben realizar una serie de pruebas. No utilizar semillas aleatorias. – – – – – – No utilizar el cero.1] La hipótesis nula supone que la secuencia de números obtenidos está distribuida uniformemente en el intervalo [0.1]. Dependiendo de las características del generador (si es de periodo total o no) se han establecido una serie de normas a la hora de seleccionar la semilla. Prohibir los valores pares.Selección de la semilla En casi todos los generadores es necesario disponer de una semilla. En general.

26.21 Por tanto D = 0.80 0..= max1 ≤ i ≤ N {R(N) . SN(x). 0.. Lenguajes de simulación 2004-2005 ..= max1 ≤ i ≤ N {R(N) .14 0..81 0..05 y N = 5 el valor de la tabla es 0. Para α = 0. .565 por tanto no se puede rechazar la hipótesis nula.R(i) R(i) .26 0. Existen dos métodos para realizar esta prueba: – – Prueba de Kolmogorv-Smirnov. 0.81.60 0.15 0.D-) Se compara con el valor de la tabla para un α dado. Lenguajes de simulación 2004-2005 Prueba de Kolmogorov-Smirnov Ejemplo de prueba de Kolmogorov-Smirnov: Sean 5 números 0. Por definición: F(x) = x para 0 ≤ x ≤ 1 Para una muestra de R1.(i-1)/N } D = max(D+.05 0.R(N) } = 0.44 0..07 0.(i-1)/N }= 0.20 0. 0.00 0.04 0. ≤ R(N) Se calcula: Se obtiene D+ = max1 ≤ i ≤ N {i/N . 0.21 0. de la muestra de N observaciones.R(N) } D. R2.16 0..(i-1)/N 0. R2.RN que son ≤ 1)/N D = max |F(x) .SN(x)| Forma de obtenerlo: Se ordenan los datos de menor a mayor R(1) ≤ R(2) ≤ .05.93 generados por algún método. está definida por: SN(x) = (número de R1.13 D+ = max1 ≤ i ≤ N {i/N .40 0. SN(x).Pruebas de frecuencia La prueba básica a la que se debiera someter cualquier nuevo generador de números aleatorios es la de uniformidad.26 D.44.05 0.93 1. . Prueba de chi-cuadrado.14.RN la función de distribución acumulada. Kolmogorov-Smirnov compara la función de distribución acumulada F(x) de la distribución uniforme con la empírica.. R(i) I/N I/N .

npj es el número esperado de n Xi’s que caen en el intervalo jésimo. Ejemplo: Sea el generador de congruencias multiplicativo Zn=AZn-1 mod M con A=630360016.Prueba de Chi-cuadrado (I) Sean X1. Prueba de chi-cuadrado para variables aleatorias U(0. X2.ak) Sea Nj = número de Xi’s en [aj-1. Lenguajes de simulación 2004-2005 Prueba de Chi-cuadrado (II) Si H0 es verdadera. entonces χ 2 = 4141 como χ 4095 . Lenguajes de simulación 2004-2005 ... Se divide el rango de F en k intervalos adyacentes [a0.9 = 4211.aj) y sea pj la probabilidad de que un resultado esté en [aj-1. Por tanto. M=231-1 y semilla Z0=1973272912. U2.….. se rechaza H0 si χ 2 > χ k2−1.[a1. 0. y se divide (0.[ak-1.1−α donde χ k2−1.1) en k subintervalos de igual longitud y se generan U1. 2 k Una forma más simple de la expresión es: χ2 = ∑ j =1 (O j − E j ) Ej donde Oj es el número observado en el intervalo j y Ej es el número esperado.1. pj = F(aj)-F(aj-1)) 2 Se construye el test estadístico como χ2 = ∑ j =1 k ( N j − np j ) np j Si H0 es verdadera.. Entonces: es el cuantil 1-α de la k k ⎛ n⎞ χ = ∑⎜ N j − ⎟ n j =1 ⎝ k⎠ 2 2 Se recomienda elegir k≥100 y n/k ≥5. Sea Nj el número de variables aleatorias Ui en le intervalo j-ésimo.1) en k=212=4096 2 subintervalos.Un. entonces la distribución converge a una distribución de chicuadrado con k-1 grados de libertad cuando n →∞. Si se generan n=215=32768 números aleatorios (Ui).1−α distribución de chi-cuadrado con k-1 grados de libertad. Se define la hipótesis nula como H0: La Xi’s son variables aleatorias idénticamnete distribuidas con una función de distribución F.a2).aj) (es decir.…Xn n observaciones.4 No se rechaza la hipótesis H0 al nivel α=0.a1).1): Se divide (0.

Pruebas de secuencias (I) Una secuencia (o serie) es un conjunto de eventos semejantes.1) / 3 σa 2= (16N . Si N es el número de números aleatorios (en este caso 15) y a es el número total de secuencias.99 0.+ Hay 8 secuencias de + o ..42 0.+ .12 0.98 0.+ + .1) / 3])/ SQR((16N .28 0.74 0.+ + + .30 +0.16 0. Ejemplo: Sean los 15 números siguientes: -0.. precedidos o seguidos por otro de distinto tipo. cada una puede ser de una longitud cualquiera.29) / 90 Para N > 20 la distribución de a se aproxima razonablemente a una distribución normal.29) / 90) Lenguajes de simulación 2004-2005 Pruebas de secuencias (II) Sea la siguiente secuencia de 20 números aleatorios 0.45 -0.+ a=14 µa = 13 σa =3.23 Z = (14 -13) / 3.67 0. σa 2).65 +0. N(µa .31 0.32 -0.+ + + .93 +0.79 0.15 +0.32 0.+ .82 -0. la media y la varianza de a vienen dadas por: µa = (2N .23 Z = 0.es: .seguidos.µa )/ σa = (a – [(2N .3.27 0.58 .55 comparado con el valor crítico N ( 13 .69 -0.23) El supuesto de independencia no puede ser rechazado Lenguajes de simulación 2004-2005 .55 0.45 0.24 +0..01 0.43 0.19 -0.81 La secuencia de 14 + o . En el caso de números aleatorios puede ser que el número sea superior o inferior al anterior.+ + + .33 0.23 +0.+ . El valor estadístico a comprobar es: Z0 = (a .87 +0.18 +0.+ -+ + .20 0.22 0.12 0.

36 0.45 0.16 0.31 0.57 0.94 0..+ + -2n n ⎞ b−⎛ ⎜ 1 2 N ⎟ − 12 ⎝ ⎠ 2n1 n 2 (2n1 n 2 − N ) 2n1 n 2 1 2 Z0 = 1 σb = µb = + Los valores que se obtienen son: 2 ⎡ 2n1 n 2 (2n1 n 2 − N ) ⎤ 2 N (N − 1) N 2 ⎢ ⎥ N 2 (N − 1) ⎢ ⎥ ⎣ ⎦ N = n1 + n2 = 40 b = 17 n1 = 18 n2 = 22 µb = 2(18)(22)(2(18)(22) − 40) 2(18)(22) 1 2 = 20.025 = 1.') Representación gráfica de una matriz de 10.91 0..74 0.01 0..19 0.13 0.96 Lenguajes de simulación 2004-2005 Ejemplo.47 0.3 + = 20..1.68 0. Matlab x=unifrnd(0.+ + .89 0.04 0.Pruebas de secuencias (III) Sea la siguiente secuencia de 40 números aleatorios 0.01 0.69 0..23 0.10000.42 0.+ .82 0.54 = −1.18 0.41 0.+ .+ + .+ + .29 Aplicando la prueba de rachas por encima y por debajo de la media se obtiene: ..72 0.02 0.18 0.62 0.83 0.54 0.63 0.28 0.1.1) y=unifrnd(0.3 9.1) plot(x.08 0...75 0..55 0.10000.000 de números aleatorios generados por Matlab Lenguajes de simulación 2004-2005 .95 0.3 σ b = (40) 2 (40 − 1) 40 2 Z0 = 17 − 20.32 0.+ .000x10.y...+ + + + + + + .07 Z 0.27 0..36 0.'.53 0.73 0.

nist.ac.mhhe. El capítulo 7 trata sobre generación de números aleatorios.ac.mat. http://www. Simulation Modeling and Analysis (third edition).gov/rng/rng6_4.net Law and Kelton.umontreal.keio. Discrete event system simulation (third edition).math. Nelson.html Documentación y distintos tipos de pruebas para números aleatorios.html Página del algoritmo Mersene Twister de Matsumoto Lenguajes de simulación 2004-2005 .com/lawkelton http://random. Nicol. El capítulo 7 está dedicado al tema.bcnn.ca/~lecuyer/ Página personal de Pierre L’Ecuyer http://www.at/generators/ http://csrc. http://www. Carson. http://www.jp/~matumoto/MT2002/emt19937ar.sbg.iro.Referencias Libros: Banks.