Está en la página 1de 30

Generación de

datos aleatorios
de diferentes
4 TH C O F F E E

distribuciones
4 TH C O F F E E

Jovany Cely Ospina


Angélica María Guarín
Luis Martín Ramírez
Kevin Segura Vargas
¿QUÉ ES UN NÚMERO
ALEATORIO?
4 TH C O F F E E

Obtenido al azar
Todo número tiene la misma
probabilidad de ser elegido
La elección de un número no depende
de la elección del otro.
¿Para qué sirven los números aleatorios?
• Muestreos
4 TH C O F F E E

• Seguridad informática
• Simulación
• Sistemas criptográficos
• Juegos de video
• Sorteos y juegos de azar
Independencia
Sin repetición dentro de la sucesión
Portabilidad
Reproducibles y mutables
4 TH C O F F E E

: 0, 5
U:[0, 1]
Valores y secuencias impredecibles
Independiente

Uniformemente distribuidos U:[0, 1]


μ= 0.5
P=0≤X≤1

Propiedades de los números aleatorios


Métodos de generación de números aleatorios

✓ Métodos Manuales
4 TH C O F F E E

✓ Tablas de números
aleatorios
✓ Métodos de computación
analógica
✓ Métodos de computación
digital
4 TH C O F F E E

Generador de números (pseudo)aleatorios

G = (X, x0, T, U, g)

Número Pseudoaleatorio: generado en un proceso de


algoritmos determinísticos
4 TH C O F F E E

Tipos de
distribuciones
Distribuciones Nombre en R Distribuciones Nombre en R
Discretas Continuas

binom Uniforme Unif


Binomial
4 TH C O F F E E

nbinom Normal Norm


Binominal
negativa
T-Student T
Poisson pois
F-fisher F
Geométrica geom
Chi-Cuadrado Chiq
Hipergeométrica hyper

http://idaejin.github.io/courses/R/2019/euskaltel/distribuciones-de-probabilidad-en-r.html
DISTRIBUCIÓN UNIFORME

Es una distribución continua, cuyos valores


tienen la misma probabilidad.
4 TH C O F F E E

Se utiliza mucho en problemas de simulación


estadística y en fenómenos que presentan
regularidad de aparecimiento.

Fórmula
El coordinador del programa de estadística sabe que la llegada a la clase de cada uno de los estudiantes,
de acuerdo a la distribución uniforme en el intervalo es de 6:00 a 6:15 pm.

1. Calcule la probabilidad de que un estudiante ingrese a clase después de las 6:10 pm.

1 ; X = tiempo de ingreso de los


4 TH C O F F E E

_____ 0 ≤ x ≤ 15
𝑥~ ∪ 𝑎 = 0; 𝑏 = 15
f(𝑥) 15 estudiantes (minutos).
=
0 < otros valores
Distribución uniforme

𝑘
P (𝑥 ≤ 𝑘) =
𝑘−𝑎
; a≤k≤b P(𝑥 ≤ 𝑘) = 15 ; 0 ≤ k ≤ 15
𝑏−𝑎

10
P(𝑥 > 10) = 1 –p (x ≤ 10) P 𝑥 > 10 = 1 − 15

= 1 – 0.6666 = 0.33
Distribución de Enteros
1. La probabilidad para Cada valor entre a y b es
Suposiciones claves de la distribución enetra la misma
2. En caso de que los valores no sean enteros la
4 TH C O F F E E

probabilidad es 0
La distribución de entero es la versión discreta de la distribucción uniforme que ya observamos anteriormente, solo
que como lo mencionamos solo puede tomar valores discretos, esta distribucción de probabilidad al igual es donde
todos los valores del intervalo tienen la misma probabilidad.

Áreas de aplicación
Modelación de eventos
aleatorios.
Juegos de azar:
- Lanzamiento de un Dado
- Sacar una balota
- Lazar la pirinola
Ejercicio enVARAQUÍ 05
EL TÍTULO
En un juego de pririnola, se quiere observar cual es la
probabilidad de que al girar la pririnola caiga en alguna de
las seis caras que esta tiene, comprurbe las probibilidades
de cada una de las caras que se encuentran enumeradas de
4 TH C O F F E E

la siguiente manera:
1 = Toma todo La anterior es la fórmula de
2 = Toma dos distribución del entero donde:
3 = Toma 1
4 = Pon 1 a es el valor mínimo del intervalo.
5 = Pon 2 b es el valor máximo del intervalo
6 = Todos Ponen
Tanto a como b al igual que todos
x = round(runif(n,min = 1, max = 6)) los valores del intervalo tienen la
y = dunif(x,min = 1, max = 6) misma probabilidad.
plot(x = x, y = y, xlim = c(0,6), main = "Distribución Entera",
xlab = "Caras de la Pirinola", ylab = "Probabilidad", type = Solo toma valores enteros, o si no
"p", toma el valor de 0.
pch = 21, bg = "blue", col = "red", cex = 3)
DISTRIBUCIÓN NORMAL
Es la distribución mas importantes en probabilidad y
estadística. Una característica es que es simétrica • Estatura, peso
50% • Errores de medición en
experimentos científicos
4 TH C O F F E E

• Medición de inteligencia y aptitud


Parámetros Media, desviación estándar

El valor de la media es el mas


probable

Es simétrica respecto a la
Condicionales media

Hay más probabilidad de que se


aproxime a la media de que se aleje.
DISTRIBUCIÓN NORMAL
Supongamos que los estudiantes de estadística tienen una distribución normal de estatura media de 1.65 cm y
desviación típica igual a 12 cm.

¿Cual es la probabilidad que un estudiante mida menos de 1.70 cm? 𝜇 Media


4 TH C O F F E E

2
𝜎 Sigma
1
____ 𝑥 − 165 (Desviación
Fórmula 1
f(𝑥) ______ e 2 12 típica)
= 12 2𝜋

Hallar Z

170 − 165
𝑋−𝜇 𝑍= = 0,41
𝑍= 12
𝜎

P z < 0,41 = 0.6591 = 65,91%


• Tiempo de espera para que los pacientes
Distribución Exponencial sean atendidos en una clínica.
• Duración de un electrodoméstico, para
Distribución continua que se usa para modelar establecer tiempos de garantía.
tiempos de espera para la ocurrencia de un
evento
4 TH C O F F E E

Función de Distribución
F(t0) = P(t ≤ t0) = P(t > t0) = 1 – e-  t0
 Es el número de eventos

Función de Densidad
𝑑𝐹(𝑡)
f(t) = = e-  t con  > 0 y t > 0
𝑑𝑡

Esperanza Varianza
1 1
µ(t) =
 2(t) =
2
Ejercicio enVARAQUÍ 05
EL TÍTULO
Para generar n valores aleatorios de una distribución exponencial # valores del eje X
usamos la función rexp(). x <- seq(0, 12, length = 200)

En este ejercicio vamos a comprobar que aumenta el número de # Fijamos semilla


4 TH C O F F E E

observaciones, el histograma de los datos generados set.seed(1)


aleatoriamente se aproxima a la función de densidad exponencial.
# n = 10
Para que la salida sea reproducible, vamos a establecer una hist(rexp(10), main = "n = 10",
semilla para el generador de numero pseudoaleatorios en R, con: xlab = "", prob = TRUE)
lines(x, dexp(x), col = "red", lwd = 2)
Set.seed()
# n = 100
hist(rexp(100), main = "n = 100",
xlab = "", prob = TRUE)
lines(x, dexp(x), col = "red", lwd = 2)

# n = 1000
hist(rexp(1000), main = "n = 1000",
xlab = "", prob = TRUE)
lines(x, dexp(x), col = "red", lwd = 2)
DISTRIBUCIÓN POISSON

Es una distribución discreta que modela la


probabilidad de la cantidad de eventos
4 TH C O F F E E

que ocurren en un período de tiempo fijo, a


partir de un valor medio conocido.

Fórmula
DISTRIBUCIÓN POISSON

En un Banco un asesor comercial atiende en promedio a 3 personas por hora. ¿ Cual es la probabilidad
que en la siguiente hora atiende solamente a 2 personas?
4 TH C O F F E E

• Media o promedio de éxitos por 𝜇 =3 𝑒 −3 ∗ 32 2.7182 −3 ∗ 9


unidad de tiempo.(Lambda) 𝑃 𝑥=2 = =
2! 2!

=2 0.0498 ∗ 9 0.4482
• Números de éxitos que suceden. 𝑥 =
= 2
2

• Euler 𝑒 = 2.7182
𝑃 𝑥 = 2 = 0.2241 = 22,41%
Distribución Gamma

Distribución continua que se usa


4 TH C O F F E E

para modelar variables con una


mayor densidad de sucesos a la
izquierda de la media.
Se define por sus parámetros de
forma y escala.
Tiempo que transcurre para que falle un
tipo de componente eléctrico.
La mayoría fallará casi en el mismo
momento, pero unos pocos tardarán más.
Distribución binomial
1. La probabilidad de éxito p permanece constante
Suposiciones claves de la distribución binomial para cada ensayo.
2. Los n ensayos son independientes entre sí.
4 TH C O F F E E

La distribución binomial modela la cantidad de ocurrencias de un evento al observar una secuencia de


productores potenciales del evento, más no la magnitud del evento. Por ejemplo, puede modelar cuántos
participantes terminaron una carrera y la velocidad de los participantes.

Áreas de aplicación
Inspección de calidad
Ventas
Mercadotecnia
Medicina
Investigación de opiniones
R: Distribución Binomial.
4 TH C O F F E E

dbinom(x, size, prob, log = F) Devuelve resultados de la función de


densidad.

pbinom(q, size, prob, lower.tail = T, log.p = Devuelve resultados de la función de


F) distribución acumulada.
qbinom(p, size, prob, lower.tail = T, log.p = Devuelve resultados de los cuantiles de la
F) binomial.
rbinom(n, size, prob) Devuelve un vector de valores binomiales
aleatorios.
Distribución binomial
Ejemplo
4 TH C O F F E E

La probabilidad de que el próximo nacimiento en un hospital sea de un niño es


0.52. En los próximos mil nacimientos que se produzcan en dicho hospital,
vamos a calcular la probabilidad de que haya más de 540 niños.

Respuesta. Opción 01

Por un lado podríamos usar la distribución binomial, con n=1000,p=0.52 para calcular ese valor.
Pero lo que vamos a hacer aquí es simular esos 1000 nacimientos en un hospital y ver cuantos
niños obtenemos.

rbinom(n = 1, size = 1000, prob = 0.52)

## [1] 525
Distribución Geométrica
Distribución discreta que se usa para modelar procesos en los que se repiten pruebas
hasta conseguir el resultado deseado
4 TH C O F F E E

Número de veces que se debe


lanzar al aire una moneda para
obtener el primer resultado de
"cara“

Número de unidades producidas


antes de que se produzca la
primera unidad defectuosa
Ejercicio enVARAQUÍ 05
EL TÍTULO
# La probabilidad de encontrar a una persona
Un especialista en marketing deportivo selecciona al que asistio a un juego en la temparada pasada
azar a personas en la calle hasta que se encuentra es del 20% (p = 0.20)
con alguien que asistió a un juego de futbol en la p = 0.20
temporada pasada.
4 TH C O F F E E

n=3
# Fijamos semilla
¿Cuál es la probabilidad de que el especialista set.seed(2)
encuentre 3 personas que no asistieron a un juego # Primero realizamos el cálculo de esta
antes del primer éxito, cuando 20% de la población probabilidad mediante una simulación de datos
aleatorios.
asistió a un juego?
mean(rgeom(n = 10000, prob = p) == 3)
Solución:
# Despues realizamos la comprobación con el n
Teniendo en cuenta lo anterior vamos a generar una objetivo con la función de densisdad dgeom()
simulación con 10.000 caso aletorios con la función
rgeom y comprobar con la función de densidad. dgeom(x = n, prob = p)
Distribución binomial negativa
Está basada en ensayos de Bernoulli. Los ensayos de Bernoulli
modelan eventos en los cuales los ensayos tienen uno o dos
4 TH C O F F E E

resultados (éxito y error); tienen una probabilidad de éxito, p (p


Para tener en cuenta:
es la misma para cada ensayo); y son independientes entre sí.
la distribución binomial negativa modela la
cantidad de errores antes de un éxito
Gráfica
Distribución binomial negativa
Propiedades básicas de la distribución binomial negativa
𝑘+𝑥−1 𝑘
𝑝 𝑥: 𝑘, 𝑝 = 𝑝 (1 − 𝑝)𝑥
4 TH C O F F E E

𝑘−1
Función de probabilidad Donde:
k es el número de éxitos a conseguir
p es la probabilidad de éxito
x la cantidad de pruebas para k éxitos
𝑘(1 − 𝑝)
Media:
𝑝
𝑘(1 − 𝑝)
Varianza:
𝑝2
Coeficiente de asimetría: 2−𝑝
[𝑘 1 − 𝑝 ]1/2
(𝑝2 −6𝑝 + 6)
Curtosis relativa: 3+
𝑘(1 − 𝑝)
R: Distribución Binomial Negativa.
4 TH C O F F E E

dnbinom(x, size, prob, mu, log = F) Devuelve resultados de la función de


densidad.
pnbinom(q, size, prob, mu, lower.tail Devuelve resultados de la función de
= T, log.p = F) distribución acumulada.
qnbinom(p, size, prob, mu, lower.tail Devuelve resultados de los cuantiles
= T, log.p = F) de la Binomial Negativa.
rnbinom(n, size, prob, mu) Devuelve un vector de valores de la
Binomial Negativa aleatorios.
Distribución binomial negativa en R
Ejemplo

Una empresa petrolera tiene una probabilidad p = 0,20 de encontrar petróleo al perforar un pozo. ¿Cuál
es la probabilidad de que la compañía perfore 7 pozos para encontrar petróleo 3 veces?
4 TH C O F F E E

Solución opción 01 Solución opción 02

r=3 # simulated
p = 0.20 mean(rnbinom(n = 10000, size
n=7-r = r, prob = p) == n)
# exact
dnbinom(x = n, size = r, prob = ## [1] 0.0463
p)

## [1] 0.049152
4 TH C O F F E E

Gracias

También podría gustarte