Números aleatorios

Introducción Definiciones Características de un generador Métodos de generación Pruebas de aleatoriedad Referencias

Lenguajes de simulación

2004-2005

Números aleatorios. Introducción
La gran disponibilidad de generadores de números aleatorios en muchos entornos y en prácticamente casi todos los compiladores puede llevarnos a pensar que para un usuario de la simulación no sería necesario estudiar estas cuestiones. Una lección del pasado reciente nos obliga a sacar conclusiones y actuar con mucho cuidado con dichos generadores (RANDU - IBM). El uso progresivo de modelos de simulación cada vez más detallados exige una mayor calidad de los generadores de números aleatorios. Ripley indica que la generación de números aleatorios parece uno de los temas peor comprendidos de la ciencia de computadoras. Knuth, por su parte indica que “Los números aleatorios no deben ser obtenidos con un método elegido aleatoriamente”

Lenguajes de simulación

2004-2005

. u2.. un} es una sucesión de números U(0. u2. .. Obs: Esta definición conduce a los denominados generadores PT-perfectos usados en Criptografía... 3. Obs: Una particular ley de Probabilidad base para la generación de números pseudoaleatorios u1. Por ejemplo .. si tiene las mismas propiedades estadísticas relevantes que dicha sucesión de números aleatorios reales.Puede existir una clara dependencia entre ellos. 4. 2...-La varianza de los números generados puede ser demasiado alta o demasiado baja.1). un : es la uniforme (0 . . Definiciones (I) DEF 1: Kolmogorov (1987) [Complejidad Algorítmica] Una sucesión de números es aleatoria si no puede producirse eficientemente de una manera más corta que la propia serie.1). DEF 2: L’Ecuyer (1990) [Impredicibilidad] Una sucesión de números es aleatoria si nadie que utilice recursos computacionales razonables puede distinguir entre la serie y una sucesión de números verdaderamente aleatoria de una forma mejor que tirando una moneda legal para decidir cuál es cuál.Varios números por encima de la media seguidos de otros por debajo de la misma...La media de los números generados puede ser demasiado alta o demasiado baja. 5. 1) ui ~ U(0.Números aleatorios.Autocorrelación entre números. DEF 3: Un Número aleatorio es una realización de una variable aleatoria que tiene asociada una ley de probabilidades F.. como por ejemplo: 1. Algunas características Cuando se generan números seudo aleatorios se pueden producir ciertos errores o problemas.Los números generados pueden no estar distribuidos uniformemente. Lenguajes de simulación 2004-2005 Números aleatorios..Números correlativamente más bajos o más altos que los adyacentes. Lenguajes de simulación DEF 4: Una sucesión de números aleatorios generados {u1. 2004-2005 .Los números generados pueden corresponder a una distribución discreta en lugar de a una continua.

E[U]= ½ . se distribuye como una ley uniforme en [0. a diferentes lenguajes de programación..2. – – Lenguajes de simulación 2004-2005 .n .1) : -Uniformente distribuidos . con h=1.ui+1) . idealmente. Un ciclo representa la longitud de una secuencia antes que comiencen a repetirse los números en el orden anterior... Obs: h=2 tenemos (ui.Independientes . Definiciones (II) DEF 5: Una sucesión de números aleatorios {ui} es aleatorio si h-tuplas de números sucesivos no superpuestos se distribuyen aproximadamente como una [0.. Las secuencias de números aleatorios deben ser replicables. V[U]= 1/12 . Partiendo del mismo número se debe poder obtener la misma secuencia Los números obtenidos deben aproximarse a las propiedades estadísticas ideales de uniformidad e independencia. hay también unas ciertas consideraciones importantes para la elección de un método u otro.2. para n suficientemente grande.Números aleatorios.. La rutina debe tener un ciclo suficientemente largo. – – – La rutina debe ser rápida. La rutina debe ser transportable entre diferentes ordenadores e. La ocurrencia de repeticiones en los números obtenidos puede propiciar la no aceptación del generador. Existe una gran número de métodos para generar {ui} ≈ U(0.Período largo Lenguajes de simulación 2004-2005 Consideraciones para la elección de generadores Aunque existe un gran número de métodos posibles para la generación de números aleatorios en una computadora.1]h. i=1.n.1]2.

Validación] P1 : Obtener semilla (valores iniciales) P2 : Aplicación de algún algoritmo de generación recursivo P3 : Validación del conjunto de números generados (Pruebas de Aleatoriedad) Lenguajes de simulación 2004-2005 Métodos de los cuadrados medios Consiste en que cada número de una sucesión es producido tomando los dígitos medios de un número obtenido mediante la elevación al cuadrado..... P1 : Obtener semilla (por ejemplo 445) P2 : Aplicación del algoritmo (elevar al cuadrado y truncar) P3 : Validación del conjunto de los números generados Ejemplo: Consideremos la semilla 445 X 445 9802 792 2726 Lenguajes de simulación X2 1| 9802 | 5 96| 0792 | 04 6 | 2726 | 4 .........Métodos de generación Existen varios métodos para la generación de números aleatorios como: 1.....0792 0..9802 0.Método de los cuadrados medios 2. 2004-2005 ......2726 ... N° Aleatorio 0..Algoritmo ......Métodos de Congruencias Todo proceso de generación consta de tres fases: [Semilla .

Lenguajes de simulación 2004-2005 . Zi=aZi-1-mKi donde Ki= ⎣aZi-1/m⎦ donde Z0 es la semilla.c y m son determinantes para la longitud de la secuencia y la calidad del generador. Para obtener el número aleatorio se utiliza: Un=Zn/m La elección de los valores de a. entonces q divide a (a-1). La mayoría de los generadores que se utilizan actualmente son generadores de congruencias lineales.2. c es el incremento o desplazamiento y m el módulo. Este tipo de generadores producen una secuencia de enteros entre 0 y m-1 de acuerdo con: Zn=(a Zn-1+c) mod m donde a es el multiplicador. (1) Planteado por HULL. E. Si 4 divide a m. Cuando c>0 los generadores se llaman mixtos y cuando c=0 se llaman multiplicativos.. T. ⎡ c(a i − 1) ⎤ Z i = ⎢a i Z 0 + ⎥ mod m − a 1 ⎣ ⎦ Teorema1: Un generador de congruencias lineales mixto tiene periodo total si y solo si se cumplen las condiciones siguientes: El único entero positivo que divide exactamente a m y a c es 1 (m y c son primos entre si). Si q es un número primo que divide a m.. 4 (1962). R. a<m. DOBELL. Random number generators. Se debe cumplir que m>0.Generadores de congruencias lineales. A.. c<m y Z0<m. entonces 4 divide a (a-1). Lenguajes de simulación 2004-2005 Generadores de congruencias lineales mixtos Su forma general es: Zi=(aZi-1+c) mod m Por inducción matemática se puede ver que para i = 1. siendo todos ellos enteros. SIAM Rev.

Ejemplo (I) La fórmula general es: Xi+1 = (a Xi + c) mod m.. i=0.. c = 0 y X0 = 63 la secuencia obtenida de acuerdo con dicha fórmula es: X0 = 63 X1 = (19)(63) mod 100 = 1197 mod 100 = 97 X2 = (19)(97) mod 100 = 1843 mod 100 = 43 X3 = (19)(43) mod 100 = 817 mod 100 = 17 X4 = (19)(17) mod 100 = 323 mod 100 = 23 . Este tipo de relaciones se producen generalmente en generadores multiplicativos. para i= >1.1. la operación módulo se realiza guardando los b dígitos decimales de la derecha. Z0 = 1 i/a 0 1 2 3 4 5 6 7 8 9 1 1 1 2 1 2 4 8 5 10 9 7 3 6 3 1 3 9 5 4 1 4 1 4 5 9 3 1 5 1 5 3 4 9 1 6 1 6 3 7 9 10 5 8 4 2 7 1 7 5 2 3 10 4 6 9 8 8 1 8 9 6 4 10 3 2 5 7 9 1 9 4 3 5 1 10 1 10 1 Las raíces primitivas son 2. Lo mismo ocurre con los generados por 7 y 8. a = 19. Lenguajes de simulación 2004-2005 Generadores de congruencias lineales. por lo que este tipo de operación será muy eficiente en las computadoras.Generadores de congruencias lineales. Lenguajes de simulación 2004-2005 . Los números generado por 2 y 6 son iguales pero en sentido contrario. 7 y 8. 3 Ejemplo: sea m = 102 = 100. 2. 6. como 10b. Ejemplo (II) Sea la secuencia: Xi+1 = a Xi mod 11. Cuando m es una potencia de 10.

c = 0 y X0 = 1. m = 2l y c = 0 el periodo posible más grande es P = m/4 = 2l-2 que se consigue en el caso en que la semilla es impar y el multiplicador a está dado por ±3 + 8k donde k es un entero. a = 13. 3 y 4 i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Xi 1 13 41 21 17 29 57 37 33 45 9 53 49 61 25 5 1 Xi' 2 26 18 42 34 58 50 10 2 Xi'' 3 39 59 63 51 23 43 47 35 7 27 31 19 55 11 15 3 Xi''' 4 52 36 20 4 Para una potencia de 2. Ejemplo (III) La fórmula general es: Xi+1 = (a Xi + c) mod m Ejemplo: sea m = 26 = 64. Ejemplo (IV) Parámetros b m 0 13 0 13 0 13 0 11 0 11 Caso 1 2 3 4 5 a 6 7 5 7 6 xo 1 10 5 5 3 Caso 1 2 3 4 5 6 5 12 2 7 10 9 8 3 9 8 11 1 10 10 9 12 5 4 5 2 6 12 6 8 Salidas 12 7 3 8 8 1 9 8 4 2 3 4 5 1 1 5 2 12 7 6 4 1 8 5 3 11 7 1 2 7 1 10 5 3 9 6 5 12 10 10 10 9 8 4 5 Lenguajes de simulación 2004-2005 . 2.Generadores de congruencias lineales. Lenguajes de simulación 2004-2005 Generadores de congruencias lineales.

algunas salidas parecen más aleatorias que otras. b = 0 Xn = 65539 Xn-1 mod (231) un = Xn/m ¡Este generador proporciona tripletas consecutivas de números que caen en 15 planos! Lo que sugiere cierta que los resultados a obtener son previsibles (Mal Generador) Lenguajes de simulación 2004-2005 Generadores de congruencias lineales. Xi+1) sugiere que éstos se disponen en un número finito de hiperplanos. Lenguajes de simulación 2004-2005 . a = 65539 . iv) La representación de pares (Xi. Ejemplos (V) Un algoritmo de muy fácil implementación de generadores de congruencias es m = 231-1 a = 75 (raíz primitiva de m) Xn = 75 Xn-1 mod (231-1) un = Dicho generador se encuentra en las bibliotecas IMSL y NAG La rutina RANDU.Generadores de congruencias lineales. Propiedades Algunas observaciones de las salidas de los generadores de congruencias: i) Los generadores de congruencias tienen ciclos iI) La longitud del ciclo depende de la selección de los parámetros iii) Dentro de selecciones de parámetros que conducen a la misma longitud. que IBM proporcionaba para sus equipos consideraba un modelo congruencial multiplicativo con m = 231 .

. b42 = (b39 + b37) mod 2 = 2 mod 2 = 0 Se puede repetir la secuencia pero dependiendo de la elección de la longitud no coincidir en dicha repetición. Este tipo de generador depende del largo de la palabra Ejemplo: r=3 q = 5 con b1 = b2 = b3 = b4 = b5 = 1 para i ≥ 6 bi = (bi-3 + bi-5) módulo 2 b6 = (b3 + b1) mod 2 = 2 mod 2 = 0 b7 = (b4 + b2) mod 2 = 2 mod 2 = 0 b8 = (b5 + b3) mod 2 = 2 mod 2 = 0 b9 = (b6 + b4) mod 2 = 1 mod 2 = 1 b10 = (b7 + b5) mod 2 = 1 mod 2 = 1 . el periodo no debe ser el único criterio de decisión a la hora de elegir un generador.. Xn= [(234 +1)Xn-1+1] mod 235 Xn= [(218 +1)Xn-1+1] mod 235 No obstante. Lenguajes de simulación 2004-2005 Generadores de Tausworthe En este caso se deben proporcionar los primeros q bits.Consideraciones respecto a la elección Un generador que tiene el periodo máximo posible se dice que es de periodo total. Ambos generadores tienen el mismo periodo total pero el primero tiene una correlación de 0. Lenguajes de simulación 2004-2005 . lo que es análogo a la semilla de los generadores de congruencias lineales.25 entre Xn y Xn-1. Una de las cuestiones de más importancia en este aspecto es el de la autocorrelación más baja entre número sucesivos. mientras el segundo tiene una correlación despreciable menor que 2-18.

.. como 2251-1 > 10156 e incluso mayores en micros de 16 bits.. i =1 = ⎨ 8 13 13 4 2 5 9 1 ⎫ . . Se elige l = 4 y1 = b123 + b222 + b321 + b420 = 8 + 4 + 2 + 1 = 15 y2 = b523 + b622 + b721 + b820 = 8 + 0 + 0 + 0 = 8 y3 = b923 + b1022 + b1121 + b1220 = 8 + 4 + 0 + 1 = 13 y4 = b1323 + b1422 + b1521 + b1620 = 8 + 4 + 0 + 1 = 13 .. Se pueden obtener secuencias de longitud considerable. . .. pero no es el periodo de la secuencia de números.. No todos los polinomios primitivos tiene las mismas cualidades. . Las primeras versiones de GPSS/H utilizaban un generador de Tausworthe......⎬ ⎩16 16 16 16 16 16 16 16 16 ⎭ Comienza la repetición u1 = u2 = y1 2 y2 2l y3 l = u3 = 2l 15 16 8 = 16 13 = 16 El periodo de los bits es 31 (2q – 1). Inconvenientes: La secuencia obtenida puede tener buenos resultados en las pruebas sobre el ciclo completo.. .. En general proporcionan malos resultados en las pruebas de rachas hacia arriba y hacia abajo. Aunque la correlación de primer orden (un número con el siguiente) es casi cero se sospecha que algunos generadores pueden proporcionar valores elevados de correlaciones de orden elevado.. b41 b42 1 1 1 1 1 0 0 0 1 1 0 1 1 .. Lenguajes de simulación 2004-2005 Generadores de Tausworthe Ventajas: Son independientes del ordenador y del tamaño de la palabra que utilice.. 1 0 1111 1000 1101 1101 0100 0010 01 01 1001 1111 0001 ….. . y así sucesivamente ⎧15 {u i }10 ...... Lenguajes de simulación 2004-2005 ..1)?.Generadores de Tausworthe ¿Cómo se transforma la sucesión {bi} en números aleatorios U(0. pero pueden tener un comportamiento local poco satisfactorio. Consideremos {bi} b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13.

Se supone que la selección de la misma no debe afectar a los resultados de la simulación. Prueba de saltos. los generadores suministrados comercialmente ya han pasado por algunas de estas pruebas.1]. Producen problemas como: • la simulación no se puede reproducir • no es posible garantizar que seres vivos no se solapen Lenguajes de simulación 2004-2005 Pruebas de aleatoriedad Para comprobar si los número aleatorios obtenidos cumplen las propiedades deseadas de uniformidad e independencia se deben realizar una serie de pruebas.1] H1: Ri ≠ U[0. Prueba de poker. – – – – – – No utilizar el cero. Lenguajes de simulación 2004-2005 Cuando se prueba la uniformidad las hipótesis son: . Prueba de autocorrelación. Dependiendo de las características del generador (si es de periodo total o no) se han establecido una serie de normas a la hora de seleccionar la semilla. Reutilizar las semillas para sucesivas réplicas de la misma simulación. Utilizar series no solapadas (cada serie precisa una semilla separada). H0: Ri ∼ U[0.1] La hipótesis nula supone que la secuencia de números obtenidos está distribuida uniformemente en el intervalo [0. – – – – – Prueba de frecuencia. Prohibir los valores pares. En general. No utilizar semillas aleatorias.Selección de la semilla En casi todos los generadores es necesario disponer de una semilla. Pruebas de series. No subdividir una serie.

40 0..05 0..16 0. Prueba de chi-cuadrado. de la muestra de N observaciones. SN(x).26. SN(x). Por definición: F(x) = x para 0 ≤ x ≤ 1 Para una muestra de R1. R2.RN la función de distribución acumulada. Lenguajes de simulación 2004-2005 .05.20 0. 0.RN que son ≤ 1)/N D = max |F(x) .15 0.14. .= max1 ≤ i ≤ N {R(N) .= max1 ≤ i ≤ N {R(N) .05 y N = 5 el valor de la tabla es 0. 0.(i-1)/N }= 0.SN(x)| Forma de obtenerlo: Se ordenan los datos de menor a mayor R(1) ≤ R(2) ≤ .Pruebas de frecuencia La prueba básica a la que se debiera someter cualquier nuevo generador de números aleatorios es la de uniformidad.(i-1)/N } D = max(D+.60 0.(i-1)/N 0. Kolmogorov-Smirnov compara la función de distribución acumulada F(x) de la distribución uniforme con la empírica.R(N) } = 0.81 0.81.04 0..44 0.26 D.R(N) } D. está definida por: SN(x) = (número de R1. Lenguajes de simulación 2004-2005 Prueba de Kolmogorov-Smirnov Ejemplo de prueba de Kolmogorov-Smirnov: Sean 5 números 0..21 0. R(i) I/N I/N .R(i) R(i) .26 0.D-) Se compara con el valor de la tabla para un α dado.93 1.05 0.565 por tanto no se puede rechazar la hipótesis nula. 0.00 0..93 generados por algún método.14 0. Para α = 0. ≤ R(N) Se calcula: Se obtiene D+ = max1 ≤ i ≤ N {i/N .13 D+ = max1 ≤ i ≤ N {i/N .80 0.07 0... R2.21 Por tanto D = 0..44. Existen dos métodos para realizar esta prueba: – – Prueba de Kolmogorv-Smirnov. . 0.

. Se define la hipótesis nula como H0: La Xi’s son variables aleatorias idénticamnete distribuidas con una función de distribución F. se rechaza H0 si χ 2 > χ k2−1.a1).aj) y sea pj la probabilidad de que un resultado esté en [aj-1..9 = 4211.a2). Lenguajes de simulación 2004-2005 .1−α donde χ k2−1. pj = F(aj)-F(aj-1)) 2 Se construye el test estadístico como χ2 = ∑ j =1 k ( N j − np j ) np j Si H0 es verdadera.1): Se divide (0. Si se generan n=215=32768 números aleatorios (Ui). y se divide (0.1. Sea Nj el número de variables aleatorias Ui en le intervalo j-ésimo. Prueba de chi-cuadrado para variables aleatorias U(0.Un. Entonces: es el cuantil 1-α de la k k ⎛ n⎞ χ = ∑⎜ N j − ⎟ n j =1 ⎝ k⎠ 2 2 Se recomienda elegir k≥100 y n/k ≥5.1) en k=212=4096 2 subintervalos.ak) Sea Nj = número de Xi’s en [aj-1.Prueba de Chi-cuadrado (I) Sean X1. entonces la distribución converge a una distribución de chicuadrado con k-1 grados de libertad cuando n →∞.[ak-1. 2 k Una forma más simple de la expresión es: χ2 = ∑ j =1 (O j − E j ) Ej donde Oj es el número observado en el intervalo j y Ej es el número esperado... Lenguajes de simulación 2004-2005 Prueba de Chi-cuadrado (II) Si H0 es verdadera. npj es el número esperado de n Xi’s que caen en el intervalo jésimo.[a1.…Xn n observaciones.aj) (es decir. Se divide el rango de F en k intervalos adyacentes [a0. Por tanto. X2.1) en k subintervalos de igual longitud y se generan U1.…. entonces χ 2 = 4141 como χ 4095 . 0.4 No se rechaza la hipótesis H0 al nivel α=0.1−α distribución de chi-cuadrado con k-1 grados de libertad. M=231-1 y semilla Z0=1973272912. U2. Ejemplo: Sea el generador de congruencias multiplicativo Zn=AZn-1 mod M con A=630360016.

79 0.69 -0.55 0. precedidos o seguidos por otro de distinto tipo.23) El supuesto de independencia no puede ser rechazado Lenguajes de simulación 2004-2005 .19 -0.43 0..+ . cada una puede ser de una longitud cualquiera.23 Z = (14 -13) / 3.28 0.+ + + .42 0. N(µa .20 0.+ + + ..55 comparado con el valor crítico N ( 13 .99 0.es: .+ a=14 µa = 13 σa =3.+ .12 0. En el caso de números aleatorios puede ser que el número sea superior o inferior al anterior. Si N es el número de números aleatorios (en este caso 15) y a es el número total de secuencias.45 0.seguidos.74 0..23 Z = 0.27 0.+ .33 0.29) / 90) Lenguajes de simulación 2004-2005 Pruebas de secuencias (II) Sea la siguiente secuencia de 20 números aleatorios 0.32 -0.58 .1) / 3 σa 2= (16N .+ Hay 8 secuencias de + o .18 +0.1) / 3])/ SQR((16N . El valor estadístico a comprobar es: Z0 = (a .65 +0.93 +0.31 0.µa )/ σa = (a – [(2N . Ejemplo: Sean los 15 números siguientes: -0.22 0. la media y la varianza de a vienen dadas por: µa = (2N .81 La secuencia de 14 + o .15 +0. σa 2).23 +0.Pruebas de secuencias (I) Una secuencia (o serie) es un conjunto de eventos semejantes.3.82 -0.01 0.16 0.29) / 90 Para N > 20 la distribución de a se aproxima razonablemente a una distribución normal.12 0.45 -0.24 +0.30 +0.+ -+ + .98 0.32 0.67 0.+ + .+ + + .87 +0.

.91 0.+ + + + + + + .08 0.57 0.31 0.28 0.19 0.10000.82 0.63 0.53 0.94 0.54 0...55 0...01 0.3 9...23 0.+ + .y.95 0.025 = 1.+ .32 0.1.'.47 0.1.') Representación gráfica de una matriz de 10.69 0.62 0.36 0.73 0.68 0...75 0.+ .18 0.45 0.27 0.07 Z 0. Matlab x=unifrnd(0.000x10.3 σ b = (40) 2 (40 − 1) 40 2 Z0 = 17 − 20.54 = −1.36 0.+ + -2n n ⎞ b−⎛ ⎜ 1 2 N ⎟ − 12 ⎝ ⎠ 2n1 n 2 (2n1 n 2 − N ) 2n1 n 2 1 2 Z0 = 1 σb = µb = + Los valores que se obtienen son: 2 ⎡ 2n1 n 2 (2n1 n 2 − N ) ⎤ 2 N (N − 1) N 2 ⎢ ⎥ N 2 (N − 1) ⎢ ⎥ ⎣ ⎦ N = n1 + n2 = 40 b = 17 n1 = 18 n2 = 22 µb = 2(18)(22)(2(18)(22) − 40) 2(18)(22) 1 2 = 20.72 0.83 0.01 0.1) plot(x.1) y=unifrnd(0.13 0.3 + = 20.41 0.10000.74 0.000 de números aleatorios generados por Matlab Lenguajes de simulación 2004-2005 .18 0.16 0.+ + ..+ ..42 0.02 0.04 0.29 Aplicando la prueba de rachas por encima y por debajo de la media se obtiene: .89 0.Pruebas de secuencias (III) Sea la siguiente secuencia de 40 números aleatorios 0..+ + .96 Lenguajes de simulación 2004-2005 Ejemplo.

Nelson. El capítulo 7 trata sobre generación de números aleatorios.html Página del algoritmo Mersene Twister de Matsumoto Lenguajes de simulación 2004-2005 .com/lawkelton http://random.at/generators/ http://csrc.keio. http://www. Simulation Modeling and Analysis (third edition). El capítulo 7 está dedicado al tema. Discrete event system simulation (third edition). Carson.mhhe.jp/~matumoto/MT2002/emt19937ar. http://www.mat.iro.gov/rng/rng6_4.ca/~lecuyer/ Página personal de Pierre L’Ecuyer http://www.Referencias Libros: Banks.umontreal. Nicol. http://www.ac.bcnn.html Documentación y distintos tipos de pruebas para números aleatorios.net Law and Kelton.nist.ac.sbg.math.

Sign up to vote on this title
UsefulNot useful