Está en la página 1de 15

PRUEBAS PARA

GENERADORES DE NUMEROS
PSEUDO-ALEATORIOS

Aldo Valenzuela
Diciembre 2016

Asegurarse que el generador de nmeros pseudoaleatorios produzca una secuencia suficientemente


aleatoria
Debe someter al generador a un conjunto de
pruebas estadsticas
Si no pasa una prueba podemos asumir que el
generador no es bueno
Pasar una prueba es una condicin necesaria, pero
no suficiente
Un generador puede pasar una prueba y luego no
pasarla si se usa otra semilla

Las dos propiedades mas importantes esperadas


en los nmeros aleatorios son uniformidad e
independencia.
La prueba de uniformidad puede ser realizada
usando las pruebas de bondad disponibles
Un nmero estadstico suficiente de nmeros
aleatorios pueden ser usados para verificar la
distribucin de los nmeros contra la distribucin
uniforme terica usando ya sea el mtodo Chi
Cuadrado (CC) o el mtodo Kolmogorof-Smirnov
(KS)
Esta prueba se denomina prueba de frecuencia

Prueba de frecuencia
Comprueba la uniformidad de una sucesin de N nmeros p-aleatorios
Para cada conjunto de N nmeros p-aleatorios r1, r2, r3rn. se divide el intervalo
unitario(0,1) en x subintervalos iguales
El nmero esperado de nmeros p-aleatorios que se encontrarn en cada
subintervalo es N/x.
Si fj(j=1, 2...x) denota el nmero que realmente se tiene de nmeros p-aleatorios
ri (i=1,2,...N) en el subintervalo (j-1)/ x ri < j/x entonces el estadstico:

Tiene aproximadamente una distribucin x2 con x-1 grados de libertad


La hiptesis de que los nmeros p-aleatorios en el de conjunto de N nmeros paleatorios, son verdaderos nmeros p-aleatorios, debe rechazarse si xi2 con x-1
grados de libertad excede su valor crtico fijado por el nivel de significancia
deseado.

Prueba de medios
Verifica que los nmeros generados tengan una media estadsticamente igual a ,
de este modo la hiptesis planteada es:
H0= Hiptesis nula:
H1 = Hiptesis alternativa:

=
Diferente de .

1. Calcular la media de los n nmeros generados

2. Calcular los lmites superior e inferior de aceptacin:

Si el valor de la media se encuentra entre el lmite inferior y el lmite superior se


acepta entonces que los nmeros aleatorios tienen una media estadsticamente
igual a con un nivel de aceptacin de 1- . Para el clculo de los lmites de
aceptacin se usa el estadstico Z/2, el cual se determina con la tabla de
distribucin normal estndar.

Prueba de varianza
Verifica si los nmeros aleatorios generados tienen una varianza de 0.083, de tal
forma que la hiptesis queda expresada como:

El procedimiento a seguir es el siguiente:


1. Calcular la variancia de los n nmeros generados V(x).

2. Calcular los lmites superior e inferior de aceptacin:

Si V(x) se encuentra entre los valores de los lmites anteriores, entonces se acepta
la hiptesis nula y los nmeros aleatorios tienen una variancia estadsticamente
igual a 1/12.

Prueba de Chi-Cuadrado
Esta prueba busca determinar si los nmeros del conjunto Ri se distribuyen
uniformemente en el conjunto (0,1).
Se requiere dividir el intervalo (0,1) en m subintervalos, en donde se recomienda
m=n1/2.
Luego se clasifica cada nmero p-aleatorio de Ri en los m subintervalos A la
cantidad de nmeros Ri que clasifica en cada subintervalo se le denomina
frecuencia observada Oi.
Se busca la cantidad de nmeros Ri que se espera encontrar en cada intervalo,
es decir, la frecuencia esperada Ei, tericamente n/m.
A partir de los valores Ei y Oi se calcula el valor estadstico.
Calcular el Chi-Cuadrado con las diferencia entre el valor esperado y el
observado en cada uno de los intervalos.
Comparar el estadstico calculado con el mximo permitido que se obtuvo de las
tablas. Si es menor se concluye que no hay evidencia para indicar que el
conjunto dado no tiene una distribucin uniforme.

Prueba de KOLMOGOROV-SMIRNOV
Verifica o niega la hiptesis que un conjunto de observaciones provienen de una
distribucin. Es una medida de la diferencia mxima observada entre la
distribucin emprica y la terica supuesta. Verifica o niega que un conjunto de
nmeros p-aleatorios tienen una distribucin uniforme en el intervalo cerrado
[0,1].
1. Se formula la hiptesis nula, Ho, de que los nmeros provienen de una
distribucin uniforme en el intervalo cerrado [0,1].
2. Se selecciona una muestra de tamao n de nmeros p-aleatorios generados. Sea
Fn(x), de la siguiente manera:
Fn(x) = i/n
3. Calcular la funcin de distribucin acumulada emprica fn(x) de la siguiente
manera. Ordene los valores de la secuencia de menor a mayor, tal que para toda
i haga Fn(Xi) Xi
4. Evaluar la estadstica de Kolmogorov-Smirnov. A partir de:
Dn = Mx. [Fn (Xi) Xi] para toda Xi.
5. Consultar la tabla de lmites de aceptacin para la prueba KS, para un tamao de
muestra n y un determinado nivel de riesgo alfa, si D es menor o igual a este
nmero se acepta Ho, de otra manera se rechaza.

0.15

0.31

0.81

0.48

0.01

0.60

0.33

0.49

0.77

0.04

0.26

0.34

0.70

0.31

0.07

0.06

0.25

0.83

0.68

0.97

0.18

0.11

0.03

0.59

0.25

0.55

0.43

0.92

0.11

0.00

Ri

Fn(i)

Fn(i)-Ri

Ri

Fn(i)

Fn(i)-Ri

0.00

0.03

0.03

16

0.34

0.53

0.19

0.01

0.07

0.06

17

0.34

0.57

0.23

0.03

0.10

0.07

18

0.43

0.60

0.17

0.04

0.13

0.09

19

0.48

0.63

0.15

0.06

0.17

0.11

20

0.49

0.67

0.18

0.07

0.20

0.13

21

0.55

0.70

0.15

0.11

0.23

0.12

22

0.59

0.73

0.14

0.11

0.27

0.16

23

0.60

0.77

0.17

0.15

0.30

0.15

24

0.68

0.80

0.12

10

0.18

0.33

0.15

25

0.70

0.83

0.13

11

0.25

0.36

0.11

26

0.77

0.87

0.10

12

0.25

0.40

0.15

27

0.81

0.90

0.09

13

0.26

0.43

0.17

28

0.83

0.93

0.10

14

0.31

0.47

0.16

29

0.92

0.97

0.05

15

0.33

0.50

0.17

30

0.97

1.00

0.03

Dn = Mx. [Fn (Xi) Xi] = 0.23 y de la tabla para n=30 y alfa=0.05 D=0.242

Prueba de las corridas


Existen dos versiones de la prueba de las corridas: la prueba de corridas arriba y
abajo del promedio y la prueba de corridas arriba y abajo.
Prueba de corridas arriba y abajo del promedio:
Es un caso ligeramente modificado de la prueba de la distancia en la cual =0
y =0.5. Se genera una secuencia de nmeros p-aleatorios U1,Un. Luego se
obtiene una secuencia binaria, en la cual el ith trmino es 0 si UI < 0.5 y 1 si
UI>0.5. El siguiente paso es determinar la cantidad de veces que una misma
longitud de corrida se repite (frecuencia observada de la corrida de longitud i). Una
sucesin de i ceros (unos), enmarcada por unos (ceros) en los extremos
representa una corrida de longitud i. El nmero total esperado de corridas y el
nmero esperado para cada tamao de corrida, se obtienen las siguientes
expresiones:
E (total de corridas) = N+1/2
FEi = (N-i+3)/2i+1
Estas frecuencias esperadas son comparadas con las observadas a travs de una
distribucin chi-cuadrada y se toma una decisin sobre la aleatoriedad de los
nmeros p-aleatorios generados.

Pruebas de corridas de arriba y abajo


En esta prueba, se genera una secuencia de nmeros p-aleatorios U1.Un , y al
igual que la prueba anterior, se obtiene una secuencia binaria, en la cual el
ith trmino es cero si Ui < Ui+1 y 1 si Ui>Ui+1. Una vez obtenida la secuencia
binaria, se sigue el mismo procedimiento descrito anteriormente y se obtiene la
frecuencia observada para cada tamao de corrida. El nmero total esperado de
corridas y el nmero esperado para cada tamao de corrida, se obtienen con las
siguientes expresiones:
E (total de corridas) = 2N-1/3
FEi = 2 [[(i2+3i+1) N (i3+3i2-i-4)] / (i+3)!] Para i < N-1
FEN-1 = 2/N! Para I = N-1
Finalmente, el estadstico X0 se determina de acuerdo a:
Donde n es el nmero de trminos de la ecuacin anterior. La frecuencia esperada
para cada tamao de corrida debe ser mayor o igual a cinco. Si las frecuencias
esperadas para corridas de tamao grande son menores que 5, estas se deben
agrupar con las adyacentes de manera que la frecuencias esperada de los
tamaos de corrida sea de al menos 5.

También podría gustarte