Está en la página 1de 47

"Año de la Lucha contra la Corrupción y la

Impunidad"

UNAMAD
UNIVERSIDAD NACIONAL AMAZONICA DE MADRE DE
DIOS

FACULTAD DE
INGENIERIA
ESCUELA PROFESIONAL DE INGENIERIA
DE SISTEMAS E INFORMATICA
Tema 5
Integrantes:
• Burgos Ramirez, Maria Atenea.
• Quispe Choquehuanca, Estefany.
• Sucso Avendaño, Rebeca.

2
Temas a tratar:

 Método de los cuadrados medios
 Variables aleatorias.
 Generadores congruenciales lineales.

3
👦
Método de los
cuadrados medios
4
¿Que es un numero pseudoaleatorio y un numero genuinamente
aleatorio?

Se produce a
través de un Surge de manera
algoritmo impredecible
matemático.

5
METODO DEL CUADRADO MEDIO
+ Método propuesto por los
matemáticos John von
Neumann y Nicholas
Metropolis, en los años
cuarenta, que básicamente
consiste en la producción de
números pseudoaleatorios.

6
+ Aplicación del método.

7
Paso 1
Se elige un numero al azar que sea mayor o igual a
dos dígitos al que denominaremos “numero
semilla”.

141

8
Paso 2
El numero semilla se eleva al cuadrado.

2
141=19,881

9
Paso 3
Se denominará X1 al número resultante de separar las
cifras centrales o medias del resultado del número
elevado al cuadrado.

19,881=>X1=988

10
Paso 4
+ Posteriormente se origina un numero
pseudoaleatorio al cual se denominará U1, que
será ubicado con una coma decimal delante de la
primera cifra.

X1=988 => U1=0.988


11
Paso 5
+ Se toma el valor de X1 y se realizan el mismo
procedimiento desde el paso 2.
2
X1=988
976,144=>X2=7614
U2=0.7614
12
+ Generar modelos según una
distribución.
+ La sucesión producida debe ser

REQUISITOS
generada desde la semilla.
+ Poseer una longitud de ciclo tan
vasto como se desee.

DESEABLES
+ Originar valores de alta velocidad.
+ Ocupar una mínima cantidad de
memoria.

13
+ Tienden a declinar rápidamente a
cero.
+ Los números producidos pueden
repetirse cíclicamente después de
una secuencia corta.
+ La utilización de números primos
puede generar ciclos mas largos en
la generación de números
pseudoaleatorios.

14
15
2
1000=1,000,000
👦
Variables aleatorias

17
Definición de variable aleatoria
Podemos decir que las variables
aleatorias son aquellas que tienen un
comportamiento probabilístico en la
realidad.
Por ejemplo, el número de clientes que llegan cada hora aun
banco depende del momento del día, del día de la semana y de
otros factores: por lo general, la afluencia de clientes será mayor
al mediodía que muy temprano por la mañana; la demanda será
más alta el viernes que el miércoles; habrá más clientes un día
de pago que un día normal, etcétera.

18
Debido a estas características, las variables aleatorias
deben cumplir reglas de distribución de probabilidad como
éstas:

 La suma de las probabilidades asociadas a todos los valores


posibles de la variable aleatoria x es uno.
 La probabilidad de que un posible valor de la variables x se
presente siempre es mayor que o igual a cero.
 El valor esperado de la distribución de la variable aleatoria es la
media de la misma, la cual a su vez estima la verdadera media
de la población.

19
Tipos de variables aleatorias
Podemos diferenciar las variables aleatorias de acuerdo con el
tipo de valores aleatorios que representan.
si habláramos del número de si habláramos del tiempo
clientes que solicitan cierto que tarda en ser atendida
servicio en un periodo de una persona, nuestra
tiempo determinado, investigación tal vez arrojaría
podríamos encontrar valores resultados como 1.54
tales como 0, 1, 2, ..., n, es minutos, 0.028 horas o 1.37
decir, un comportamiento días, es decir, un
como el que presentan las comportamiento similar al
distribuciones de de las distribuciones de
probabilidad discretas. probabilidad continuas.

20
Variables aleatorias discretas.
Este tipo de variables deben
cumplir con estos
parámetros:

Algunas distribuciones discretas


de probabilidad son la uniforme
discreta, la de Bernoulli, la
hipergeométrica, la de Poisson y
la binomial.

21
Podemos asociar a estas u otras distribuciones de probabilidad el comportamiento de
una variable aleatoria.

si nuestro propósito al analizar un muestreo si lo que queremos es modelar el


de calidad consiste en decidir si la pieza bajo número de usuarios que llamarán a
inspección es buena o no, estamos un teléfono de atención a clientes, el
realizando un experimento con 2 posibles tipo de comportamiento puede
resultados: la pieza es buena o la pieza es llegar a parecerse a una distribución
mala. Este tipo de comportamiento está de Poisson.
asociado a una distribución de Bernoulli.

Incluso podría ocurrir que el comportamiento de la variable no se pareciera a


otras distribuciones de probabilidad conocidas. Si éste fuera el caso, es
perfectamente válido usar una distribución empírica que se ajuste a las
condiciones reales de probabilidad.

22
Variables aleatorias continuas.
Este tipo de variables se representan mediante una ecuación
que se conoce como función de densidad de probabilidad. Dada
esta condición, cambiamos el uso de la sumatoria por la de una
integral para conocer la función acumulada de la variable
aleatoria. Por lo tanto, las variables aleatorias continuas deben
cumplir los siguientes parámetros.

23
Entre las distribuciones de probabilidad tenemos la uniforme
continua, la exponencial, la normal, la de Weibull, la Chi-cuadrada y la
de Erlang. De la misma forma que en las distribuciones discretas,
algunos procesos pueden ser asociados a ciertas distribuciones.

24
Determinación del tipo de distribución de un conjunto de datos
La distribución de probabilidad de los datos históricos puede
determinarse mediante las pruebas Chi-cuadrada, de Kolmogorov-
Smirnov y de Anderson-Darling. la forma de realizarlas a través de
Stat::Fit, una herramienta complementaria de ProModel.
 Prueba Chi-cuadrada

Se trata de una prueba de hipótesis a partir de datos, basada en


el cálculo de un valor llamado estadístico de prueba, al cual suele
comparársele con un valor conocido como valor crítico, mismo
que se obtiene, generalmente, de tablas estadísticas.

25
 Prueba de Kolmogorov-Smirnov

Desarrollada en la década de los treinta del siglo XX, esta prueba


permite —al igual que la prueba Chi-cuadrada— determinar la
distribución de probabilidad de una serie de datos. Una limitante de
la prueba de Kolmogorov-Smirnov estriba en que solamente se
puede aplicar al análisis de variables continuas.

 Prueba de Anderson-Darling
Se dio a conocer en 1954. Esta prueba tiene como propósito
corroborar si una muestra de variables aleatorias proviene de una
población con una distribución de probabilidad específica. En
realidad se trata de una modificación de la prueba de Kolmogorov-
Smirnov, aunque tiene la virtud de detectar las discrepancias en los
extremos de las distribuciones.

26
La principal desventaja de la prueba de Anderson-Darling estriba en que
es necesario calcular los valores críticos para cada distribución. La
prueba es muy sensible en los extremos de la distribución, por lo que
debe usarse con mucho cuidado en distribuciones con límite inferior
acotado, y no es confiable para distribuciones de tipo discreto.

 Ajuste de datos con Stat::Fit

La herramienta Stat::Fit de ProModel se utiliza para analizar y


determinar el tipo de distribución de probabilidad de un
conjunto de datos.

27
Esta utilería permite comparar los resultados entre
varias distribuciones analizadas mediante una
calificación. Entre sus procedimientos emplea las
pruebas Chi-cuadrada, de Kolmogorov-Smirnov y
de Anderson-Darling.

Además calcula los parámetros apropiados


para cada tipo de distribución, e incluye
información estadística adicional como
media, moda, valor mínimo, valor máximo y
varianza, entre otros datos.

28
Stat::Fit se puede ejecutar desde la pantalla de inicio de ProModel, o
bien desde el comando Stat::Fitdel menú Tools.

29
Una vez que comience a ejecutarse el comando Stat::Fit, haga clic en el icono de la hoja
en blanco de la barra de herramientas Estándar para abrir un nuevo documento
(también puede abrir el menú File y hacer clic en New). Enseguida se desplegará una
ventana con el nombre Data Table, en la que deberá introducir los datos de la variable
que se analizará, ya sea con el teclado o mediante los comandos Copiar y Pegar (Copy /
Paste) para llevar dichos datos desde otra aplicación, como puede ser Excel o el Bloc de
notas de Windows.

30
Ejemplo Los datos del número de automóviles que
entran a una gasolinera por hora son:

Determine la
distribución de
probabilidad con un
nivel de significancia
a de 5 %.

Después de introducir estos datos en Stat::Fit, despliegue el


menú Statistics y seleccione el comando Descriptive.
Enseguida aparecerá una nueva ventana con el nombre de
Descriptive Statistics, en donde se muestra el resumen
estadístico de la variable

31
32
Para determinar el tipo de distribución de probabilidad de los datos,
seleccione el comando AutoFít del menú Fit en la pantalla principal de
Stat::Fit. A continuación se desplegará un cuadro diálogo similar al que se
ilustra, en el cual se tiene que seleccionar el tipo de distribución que se
desea probar. Se debe seleccionar si dicha distribución es no acotada en
ambos extremos (unbounded), o si el límite inferior está acotado —en este
último caso se puede aceptar la propuesta de que la cota del límite
inferior sea el dato más pequeño de la muestra (lower bound)—, o
seleccionar explícitamente otro valor como límite inferior (assigned
bound).

33
Para este ejemplo seleccionamos una distribución de
tipo discreto: discrete distributions, ya que los datos de
la variable aleatoria [automóviles/hora] tienen esa
característica.

34
Para que el proceso de ajuste se lleve a cabo, haga clic en el botón OK. El resultado
se desplegará en la ventana Automatic Fitting, donde se describen las
distribuciones de probabilidad analizadas, su posición de acuerdo con el ajuste, y si
los datos siguen o no alguna de las distribuciones.

se observa el resultado del


análisis de ajuste, el cual nos
indica que no se puede rechazar
la hipótesis de que los datos
provengan de cualquiera de las
siguientes dos distribuciones;
Binomial, con N = 104 y p = 0.145, o
de Poisson, con media 15.0.

35
Haga clic en cualquiera de las dos distribuciones; enseguida se desplegará
el histograma que se ilustra, las barras representan la frecuencia
observada de los datos; la línea indica la frecuencia esperada de la
distribución teórica.

36
El formato del histograma puede
ser modificado mediante el
comando Graphics style del menú
Graphics (esta opción solamente
está disponible cuando se tiene
activa la ventana Comparison
Graph.

37
Generación de variables aleatorias
La variabilidad de eventos y actividades se representa a través de funciones de densidad
para fenómenos continuos, y mediante distribuciones de probabilidad para fenómenos de
tipo discreto.
La simulación de estos eventos o actividades se realiza con la ayuda de la generación de
variables aleatorias.
Los principales métodos para generar las variables
aleatorias son:
 Método de la transformada inversa
 Método de convolución
 Método de composición
 Método de transformación directa
 Método de aceptación y rechazo

38
👦
Generador lineal
congruencial
39
Generador lineal congruencial

+ El algoritmo congruencial
propuesto por Derrick Henry
Lehmer en 1951.

40
Generador lineal congruencial
+ El algoritmo congruencial lineal genera una
secuencia de números enteros por medio de la
siguiente ecuación recursiva
Donde:
• X0 es la semilla
• a es el multiplicador
• c la constante aditiva
• m el modulo

41
Condiciones
+ Para que el algoritmo sea capaz de lograr el
máximo periodo de vida N.
Bajo estas condiciones se
obtiene un periodo de vida
máximo N = m = 2^g
De no cumplirse el periodo
de vida N=m no se garantiza

42
Ejemplo

X0 = 6 K = número entero c = número impar g = número entero

a = 1 + 4k c=5 m = 2^g

k=8 g=2

a = 1 + 4(8) = 33 m = 2^2 = 4

43
X0 = 6 k=8 c=5 g=2

a = 1 + 4(8) = 33 m = 2^2 = 4

X0 = 6 203/4 = 50,75 -> 0.75 * 4 = 3


X1 = (33 * 6 + 5) mod(4) = 203 mod (4) = 3 r1 = 3/(4-1) = 1.00
X2 = (33 * 3 + 5) mod(4) = 203 mod (4) = 0 r2 = 0/(4-1) = 0.00
X3 = (33 * 0 + 5) mod(4) = 203 mod (4) = 1 r3= 1/(4-1) = 0.33
X4 = (33 * 1 + 5) mod(4) = 203 mod (4) = 2 r4 = 2/(4-1) = 0.66
X5 = (33 * 2 + 5) mod(4) = 203 mod (4) = 3 r5 = 3/(4-1) = 1.00

44
Ejemplo en Excel

45
+ Son rapidos, requieren poca
memoria (32 0 64 bits).
+ No deberían ser usados en

Ventajas y
aplicaciones para las que se
requiera aleatoriedad de alta
calidad.
+
Desventajas
Se repite con un periodo m

46
47

También podría gustarte