Está en la página 1de 48

Aleatoriedad y conceptos

estadísticos
Monica Castañeda Riascos
Sebastián Zapata Ramírez

2019-2S
Contenido
1. ALEATORIEDAD
1.1 Números aleatorios, importancia, generación de números
aleatorios, variables aleatorias, concepto de probabilidad,
concepto de frecuencia
2. DISTRIBUCIÓN DE PROBABILIDAD
2.1 Uniforme (Discreta, Continua)
2.2 Normal
2.3 Exponencial
3. TRANSFORMADA INVERSA
3.1 Formulas de Excel para generar aleatorios
1. ALEATORIEDAD
1.1 ¿Qué es un número aleatorio?
• ¿Es 7 un número aleatorio?
• Un número no puede ser aleatorio, una secuencia de
números si
• Los números aleatorios son aquellos que pueden ser
generados a partir de fuentes de aleatoriedad
• Los números aleatorios son ingredientes necesarios en la
simulación de casi todos los sistemas

Variables aleatorias
Números aleatorios Generar conducta
Confianza
1.2 Importancia números aleatorios
• Para la seguridad informática (tarjetas de crédito generan un
número en cada transacción).
• Estudiar comportamientos de animales que no tienen un
patrón definido.
• Estudiar el comportamiento de una cola en un banco.
• Exploración de petróleo usando Montecarlo.
1.3 Generación de números aleatorios

Los métodos
Manuales
tradicionales son
limitados!!
Se recurre a métodos
digitales, basados en
Balotas formulas recursivas,
determinísticas que
generan números
pseudoaleatorios
Mecánicos

Ruletas
1.4 Variables aleatorias y tipos
Una variable aleatoria, usualmente se representa con la letra X, es
una variable cuyos posibles valores son resultados numéricos de un
fenómeno aleatorio

Variable aleatoria discreta:


toma valores numéricos
enteros en un intervalo
La
variable
aleatoria Variable aleatoria
puede continua: toma valores
ser. numéricos reales en un
intervalo
1.5 Concepto de probabilidad
𝑁ù𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =
𝑁ù𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Ejemplo
El tema de un examen es un proceso selectivo que
contiene 50 temas, de los cuales se elegirá uno por
sorteo. Si una persona no ha estudiado los últimos 15
temas ¿Cuál es la probabilidad de que salga un tema
que haya estudiado?
1.6 Concepto de frecuencia

Frecuencia absoluta: el número de veces que


aparece un valor.
Frecuencia relativa: Si en un experimento que se ha
repetido n veces un determinado suceso A se ha
observado en k de estas repeticiones, la frecuencia
relativa fr del suceso A es:

𝑘
𝑓𝑟 =
𝑛
1.6 Concepto de frecuencia: ejemplos
Las notas de 20 estudiantes de modelado y simulación en el
primer quiz con la profesora Mónica fueron:
2. DISTRIBUCION DE PROBABILIDAD

Una distribución de probabilidad es un conjunto de


todos los posibles valores de una variable aleatoria,
junto con sus respectivas probabilidades. En otras
palabras, una distribución de probabilidad de una
variable aleatoria es una función que asigna a cada
suceso definido sobre la variable aleatoria una
probabilidad de ocurrencia. A continuación veremos
tres tipos de distribución de probabilidad: Uniforme
(Discreta, Continua), Normal y Exponencial
2. DISTRIBUCION DE PROBABILIDAD
2.1 Distribución uniforme discreta
La distribución uniforme discreta describe el
comportamiento de una variable discreta que
puede tomar n valores distintos con la misma
probabilidad cada uno de ellos.

Esta es la distribución
de probabilidad
uniforme o histograma
de frecuencias
relativas
Actividad 1
Experimento aleatorio: lanzamiento de un dado de
10 caras
1. ¿Cual es la función de probabilidad para el
lanzamiento de un dado de 10 caras?
2. Si usted lanza 100 veces un dado de 10 caras,
¿cuántas veces espera que aparezca cada número?
3. ¿Cual es la probabilidad de cada uno de los
resultados posibles?
4. Conduzca este experimento. (!!!)
Actividad 1
Frecuencias Absoluta
1 2 3 4 5 6 7 8 9 10
6 11 9 12 13 8 12 5 11 13
Frecuencias Relativas
1 2 3 4 5 6 7 8 9 10
0.06 0.11 0.09 0.12 0.13 0.08 0.12 0.05 0.11 0.13
Simulación de Ud usando R
Recurso. Código en R para efectuar la simulación de la Actividad 1.

# SIMULANDO EL LANZAMIENTO DE UN DADO


xn <- 10 #número de caras del dado
k <- 100 #número de lanzamientos
dado <- sample(1:xn ,k, replace=T)
(fa <- table(dado))
(fr <- prop.table(fa))

par(mfrow=c(2,1))
barplot(fa, main="Histograma de Frecuencias Absolutas");abline(h=k/xn,col=2)
barplot(fr, main="Histograma de Frecuencias Relativas");abline(h=1/xn,col=3)
Actividad 2
Simulación usando R.
1. Use el código para una segunda simulación de 500
lanzamientos de un dado de 10 caras. ¿Obtiene los mismos
resultados? (Ayuda:Piense en la noción de experimento
aleatorio)
2. Lleve a cabo la simulación del experimento, pero ahora
considere que se lanza 1000 veces el dado.
3. Lleve a cabo la simulación del experimento, pero ahora
considere que se lanza 10000 veces el dado.
4. Compare las frecuencias (absolutas y relativas) de la simulación
cuando se lanza el dado 100, 500, 1000 y 10000 veces. ¿Qué
puede deducir?
Solución Actividad 2

1. Simulación inicial (k=100) Segunda


simulación (k=100)
Solución Actividad 2
2. Resultados Simulación con k=500 3. Resultados
con k=1000
Solución Actividad 2

4. Simulacion k=100 k=500


k=1000
Actividad 3
Considere una variable aleatoria X∼Ud (7 ; 12). Teniendo presente
este contexto resuelva las siguientes preguntas.
1. Se llevó a cabo una simulación de valores de X. A partir de las
frecuencias absolutas que se proveen en la tabla, indique cuántos
valores se han simulado de esta distribución (k=?) y luego halle la
frecuencia relativa para el valor 10. ¿Coinciden la frecuencia
relativa con el valor teórico? Explique.

Resultados
7 8 9 10 11 12
16 12 10 14 15 13
2. A partir del código del recuadro, conduzca una segunda
simulación de 80 valores y recalcule la frecuencia relativa para el
valor 10. ¿Cual es la diferencia respecto del valor teórico?

# SIMULANDO DISTRIBUCIÓN UNIFORME X~U(a,b)


a <- 7 #primer valor de X
b <- 12 #último valor de X
k <- 80 #cantidad de simulaciones
Resultados <- sample(a:b ,k, replace=T)
(fa <- table(Resultados))
(fr <- prop.table(fa))
par(mfrow=c(2,1))
plot(fa, main="Frecuencias Absolutas");abline(h=k/6,col=2)
plot(fr, main="Frecuencias Relativas");abline(h=1/6,col=3)
3. Modifique el código anterior y conduzca simulaciones de 400,
1000, 10000, 1000000 de valores. A partir de los gráficos, analice la
tendencia que muestran las frecuencias relativas hacia el valor
teórico que se planteó en modelo matemático para esta
distribución.
2.2 Distribución Uniforme Continua

Dados un par de valores reales a ∧ b con a < b, se dice que una


variable aleatoria X tiene distribución uniforme en el intervalo [a ,
b] si y sólo si la función de densidad es

Notación: X∼Uc (a ; b)
Caracterización. (Discusion en grupo)
Cual es el área bajo la curva f(x)?
¿Como se calcula?
Qué implicación tienen el resultado?

Área bajo la curva es uno. ⇒ Probabilidades


son áreas bajo la curva.

Sea x un valor entre a ∧ b,


entonces

F(x) es la función acumulativa.


Actividad 4.
Supónga que la concentración de cierto contaminante, en
muestras tomadas aleatoriamente, se encuentra distribuida de
manera uniforme en el intervalo de 0 a 20 ppm.
A. Especifique la variable aleatoria y el modelo de probabilidad
subyacente. f(x)
B. Que tan probable es que en una muestra se encuentre una
concentración de 5 ppm o menos?
C. Si se considera tóxica una concentración superior a 8 ppm.
¿Cuál es la probabilidad de que al tomarse una muestra se
encuentre que la concentración sea tóxica?
D. Lleve a cabo una simulación de 100 valores de X∼Uc (0 ; 20) y
determine la probabilidad anterior. Compare los resultados.
¿Que concluye? (Use el siguiente código en R)
x <- runif(100, 0 , 20)
hist(x, breaks = seq(0,20,4), labels=T)
Actividad 5
El tiempo que tarda un ave en ir y volver al nido con alimento para
sus polluelos varía de una excursión de caza a otra, pero puede
modelarse mediante una distribución uniforme en el intervalo de
30 a 50 minutos.
a) Cuál es la probabilidad de que el tiempo en ir y volver con
alimento supere los 45 minutos.
b) Indague cómo hallar el promedio y la desviación estándar de
esta distribución.
c) Calcule e interprete la probabilidad siguiente, P ( μ - σ ≤ X ≤ μ +
σ)
d) Lleve a cabo una simulación de 100 vuelos del ave y aproxime
la probabilidad anterior.
e) Con una simulación de 500 vuelos cual es el valor de la
probabilidad solicitada. ¿Qué puede concluir?
2.2 Distribucion Normal
Modelo para estudiar y predecir el comportamiento de
variables cuyas observaciones tienden a estar concentradas
alrededor del promedio.
Ejemplo arroz:
arroz callendo.mp4
Ejemplos: estatura o peso.

https://sp.depositphotos.com/137208576/stock-video-rice-
falls-on-a-solid.html
2.2 Distribucion Normal

Modelo para estudiar y predecir el comportamiento de variables


cuyas observaciones tienden a estar concentradas alrededor del
promedio.

Función de probabilidad: Notacion: X∼N (μ ; σ ), Grafica X∼N(8 ; 2)

𝑥
𝑃 𝑋 ≤ 𝑥 = 𝐹 𝑥 = න 𝑓 𝑡 𝑑𝑡
−∞
Regla Empirica

Para X∼N (25 ; 5) se tienen las siguientes


probabilidades para los intervalos a una, dos y tres
desviaciones estándar del promedio:
P(20 ≤ X ≤ 30) ≅0.6827
P(15 ≤ X ≤ 35) ≅0.9545
P(10 ≤ X ≤ 40) ≅0.9973
Actividad 1
Se llevó a cabo una simulación de 100 valores
provenientes de X∼N (25 ; 5). Se dispone del siguiente
gráfico de frecuencias.
A. Halle las proporciones de valores
en los intervalos a una, dos y tres
desviaciones estándar del promedio.
Compare los resultados con los que
reporta la regla empírica.
Se llevó a cabo una simulación de 100 valores
provenientes de X∼N (25 ; 5). Se dispone del siguiente
gráfico de frecuencias.
B. Halle P( X > μ + 3σ ) mediante
regla empírica y con los
resultados de la simulación.
Coinciden los resultados?
C. Halle P(20 < X < 30) mediante
regla empírica y con los
resultados de la simulación.
Coinciden los resultados?
Actividad 2

Use las siguientes instrucciones para llevar a cabo una segunda


simulación de 100 valores provenientes de X∼N (25 ; 5). Obtiene
los mismos resultados?

x <- rnorm(100,25,5)
hist(x, main="Histograma. Datos simulados de Normal", labels=T)

Lleve a cabo una simulación pero ahora para 500 y 1000 valores.
Qué puede deducir?
Solución Actividad 2
Resultados para la simulación de 100 valores de X∼N (25 ; 5)
Solución Actividad 2

Tendencia de los datos


simulados de X∼N (25 ;
5) hacia el modelo
matemático, a medida
que se incrementa la
cantidad de datos
disponibles.
Actividad 3
La vida útil de cierto dispositivo electrodoméstico sigue una
distribución normal con promedio 4 años y desviación estándar de
1 año. El fabricante repone sin costo aquellos dispositivos con más
baja duración, para lo cual otorga una garantía que se extiende por
máximo dos años. El fabricante recibe un pedido por 500
dispositivos.
A. Use un histograma para hallar la cantidad de dispositivos que
pueden fallar durante el periodo de garantía.
B. Conduzca una simulación para este caso y determine cuántos
dispositivos tendrán que ser cubiertos por la garantía. ¿En
proporción a cuanto equivalen al total del pedido?
C. Son consistentes los resultados de la simulación y la regla
empírica.
D. Si el fabricante quiere reponer solo un 0.135% de los
dispositivos con más baja duración, ¿qué tan larga debe ser la
garantía que debe otorgar?
2.3 Distribución exponencial (λ)
Esta distribución describe procesos en los que interesa saber el
tiempo hasta que ocurre determinado evento; en particular, se
utiliza para modelar tiempos de supervivencia. Un ejemplo es el
tiempo que tarda una partícula radiactiva en desintegrarse.

0 𝑠𝑖 𝑥 ≤ 0
𝐹 𝑥 = 𝑃(𝑋 ≤ 𝑥) = ቊ
1 − 𝑒 −λ𝑥 𝑠𝑖 𝑥 ≥ 0
2.3 Distribución exponencial (λ)
Una característica importante de esta distribución es la
propiedad conocida como “falta de memoria”. Esto significa,
por ejemplo, que la probabilidad de que un individuo de edad t
sobreviva x años más, hasta la edad x+t, es la misma que tiene
un recién nacido de sobrevivir hasta la edad x. Dicho de manera
más general, el tiempo transcurrido desde cualquier instante
dado 𝑡0 hasta que ocurre el evento, no depende de lo que haya
ocurrido antes del instante 𝑡0 .
Actividad 1
Se ha comprobado que el tiempo de vida de cierto tipo de
marcapasos sigue una distribución exponencial con media de
14 años. ¿Cuál es la probabilidad de que a una persona a la
que se le ha implantado este marcapasos se le deba
reimplantar otro antes de 20 años?

La variable aleatoria “tiempo de vida del marcapasos” sigue


una distribución exponencial de parámetro λ = 1/14; λ= 0,07
pexp(20, rate = 0.07)
Actividad 2
La magnitud de los terremotos registrados en una región de
Estados Unidos puede representarse mediante una función
exponencial con media 2.4, de acuerdo con la escala de Richter,
calcule la probabilidad de:

a) Rebase los 3.0 grados en la escala Richter.


b) Sea inferior a los 2.0 grados en la escala de Richter.
c) P(X < x) = 1/5.
d) P(X > x) = 2/5.
3. Método de la transformada inversa

Sean:
𝑋: una variable aleatoria (Discreta o Continua)
𝑓𝑥 (): función de densidad de probabilidad (fdp), para el caso
continuo, o función de cuantía para el caso discreto
𝐹𝑥 (): función acumulativa o función de distribución
𝐹𝑥−1 ():función inversa de la función acumulativa
𝑛: número de observaciones a generar
𝑟𝑖 : números aleatorios
3. Método de la transformada inversa

Entonces, las muestras de la variable aleatoria X se pueden obtener de la


siguiente manera

𝑋𝑖 = 𝐹𝑥−1 (𝑟𝑖 ) i=1,2,…, n

El proceso de muestreo tiene dos etapas:


● Generar uno o más números aleatorios
● Convertir estos números aleatorios en muestras de la distribución
requerida.
3. Método de la transformada inversa

En el caso de la figura, se
convierte el histograma de
frecuencias en la forma
acumulada. Las muestras se
toman usando un número
aleatorio (distribuido entre 0 y 1)
que representa un punto sobre el
eje vertical de la distribución
acumulada y leyendo el valor
correspondiente a la variable en
el eje horizontal. Para r=0.55, el
valor de x es 4.
Formulas de Excel para generar variables aleatorias que
distribuyan uniforme, normal y exponencial usando el
método de transformada inversa.
Actividad 1

● Crear un número aleatorio en la celda a2 con


+aleatorio()
● Luego en la celda b2 =DISTR.NORM.INV(a2;5;2).
● Si creamos muchas datos, crearemos una serie de
datos, con una distribución normal con media cercana
5 y desviación estándar muy cercana a 2.
Actividad 2
● Crear una serie de 500 datos en Excel usando el
método de la transformada inversada, con distribución
normal X∼N (25 ; 5).
● Encontrar la media y la desviación estándar de los
datos
● ¿Qué puede concluir de la esta generación de datos?
● ¿Para qué pueden ser útiles?
Actividad 3
● Llenar la siguiente hoja de Excel con su estatura y peso.
Ingrese la altura en metros, y separada con coma.
Ejemplo: 1,58m. Ingrese el peso en kilogramos.
https://docs.google.com/spreadsheets/d/1xUHftmc-
12cy_uPoUx8nF65JzFQwOHK_GxgTlyS6uLc/edit#gi
d=1517807841
Graficar estos datos usando grafica de barras en Excel,
encontrar la media y la desviación estándar, y generar una
serie de datos con distribución normal usando el método
de la transformada inversa.
Actividad 4

● Crear un número aleatorio en la celda a2 con


+aleatorio()
● Luego en la celda b2 =-LN(1-B2)*0,3. Si creamos
muchas datos, crearemos una serie de datos, con una
distribución exponencial con promedio cercano a 0.3.

También podría gustarte