Está en la página 1de 14

Punto 4.

Suponga que X es una variable aleatoria con función de probabilidad:

λx e−λ
P (x) =
para x = 0, 1, 2, ...
x!
La media esperada y la varianza de X son E[X]=Var[X]=λ
Por lo tanto, X ∼ P oisson(λ)
1. Graficar la función de probabilidad de X para distintos valores del paráme-
tro, es decir λ = 5, 10, 20 y 30. Describir los gráficos y compararlos.

Lambda 5 Lambda 10

0.12
0.15 0.10
Density

Density
0.08
0.10
0.06
0.05 0.04
0.02
0.00 0.00

0 5 10 15 0 5 10 15 20

x x

Lambda 20 Lambda 30

0.10 0.08
0.08
0.06
Density

Density

0.06
0.04
0.04
0.02 0.02

0.00 0.00

10 15 20 25 30 35 10 20 30 40 50

x x

Los gráficos se construyeron tomando 1000 datos aleatorios para cada valor de lambda,
como era de esperarse los gráficos muestran un comportamiento similar, ya que sus curvas
de densidades parecen estar centradas en sus respectivas medias(lambdas). Podríamos decir
a primera vista que se evidencia un comportamiento simétrico alrededor de la media para
todos los valores de lambda observados.

1
2. Calcular la probabilidad de que la variable aleatoria X tome valores a lo
sumo de: 5 (para lambda 5), 10 (para lambda 10), 20 (para lambda 20) y 30
(para lambda 30). Interpretar resultados y compararlos.
2.1. λ = 5
5
X 5x e−5
P (x ≤ 5) = = 0.6159607
x=0 x!
Cuando lambda toma el valor de 5, la probabilidad de que a lo sumo X sea 5 es de 0.616
2.2. λ = 10
10
X 10x e−10
P (x ≤ 10) = = 0.5830398
x=0 x!
Cuando lambda toma el valor de 10, la probabilidad de que a lo sumo X sea 10 es de 0.583
2.3. λ = 20
20
X 20x e−20
P (x ≤ 20) = = 0.5590926
x=0 x!
Cuando lambda toma el valor de 20, la probabilidad de que a lo sumo X sea 20 es de 0.5591
2.4. λ = 30
30
X 30x e−30
P (x ≤ 30) = = 0.5483515
x=0 x!
Cuando lambda toma el valor de 30, la probabilidad de que a lo sumo X sea 30 es de 0.5484
Se puede observar, como era de esperarse, que a medida que aumenta el valor de λ la
probabilidad disminuye, al parecer hacia una probabilidad de 0.5 dado que los valores que
estamos considerando son iguales a su media y varianza, y como se vió en los gráficos
anteriores la variable X presenta una distribución simétrica respecto a su media.

3. Calcular la esperanza matemática y la varianza de X cuando lambda toma


valores de 5, 10, 20 y 30. Interpretar resultados.
3.1. λ = 5
Cuando lambda toma el valor de 5, se tiene que la esperanza está dada por:


X 5x e−5
E[X] = x =5
x=0 x!
Y con varianza:

∞ ∞
!2
x −5
2 2
X
25 e
X 5x e−5
V ar[X] = E[X ] − E [X] = x − x = 30 − 25 = 5
x=0 x! x=0 x!

2
3.2. λ = 10
Cuando lambda toma el valor de 10, se tiene que la esperanza está dada por:


X 10x e−10
E[X] = x = 10
x=0 x!
Y con varianza:

∞ ∞
!2
10x e−10 10x e−10
V ar[X] = E[X 2 ] − E 2 [X] = x2
X X
− x = 110 − 100 = 10
x=0 x! x=0 x!

3.3. λ = 20
Cuando lambda toma el valor de 20, se tiene que la esperanza está dada por:


X 20x e−20
E[X] = x = 20
x=0 x!
Y con varianza:

∞ ∞
!2
x −20
2 2
X
2 20 e
X 20x e−20
V ar[X] = E[X ] − E [X] = x − x = 420 − 400 = 20
x=0 x! x=0 x!

3.4. λ = 30
Cuando lambda toma el valor de 30, se tiene que la esperanza está dada por:


X 30x e−30
E[X] = x = 30
x=0 x!
Y con varianza:

∞ ∞
!2
x −30
2 2
X
2 30 e
X 30x e−30
V ar[X] = E[X ] − E [X] = x − x = 930 − 900 = 30
x=0 x! x=0 x!

Podemos observar que para los distintos valores de lambda observados se cumple
E[X]=Var[X]= λ . Por lo tanto, para todo valor de lambda, el valor esperado de X es λ
con una varianza de λ.

3
4. Para una variable aleatoria X que se modela con una función de proba-
bilidad con parámetro lambda=20, generar 100 muestras aleatorias de tama-
ño n=1000. Por cada muestra aleatoria, calcular la media muestral, varianza
muestral y porcentaje de valores en la muestra menores o iguales 20.
Después de la simulación de las 100 muestras aleatorias podemos observar una sección de la
base de datos:
Cuadro 1: Muestra de la base de datos

Muestra Media Varianza Porcentaje


1 19.689 20.865 58.4
2 20.075 20.62 56.9
3 20.215 18.113 55.1
4 20.147 19.651 54.7
. . . .
. . . .
. . . .
97 19.821 18.489 56
98 20.029 20.681 54.8
99 19.766 20.672 56.3
100 20.093 22.483 55.1

4.a Construir un gráfico de dispersión donde en el eje y ubiques los resultados de las medias
muestrales y en el eje x los valores de 1 a 100 (indexación por muestra). Además, trazar una
línea paralela al eje x que corte en el eje y en el valor teórico de la esperanza matemática de
la variable X. Interpretar el grafico y la relación de los resultados muestrales y teóricos.

20.4

20.2
Media Muestral

20.0

19.8

19.6
0 25 50 75 100
Muestra

4
Se puede observar una dispersión notable entre los valores muestrales y el teórico, los datos
de la media a nivel muestral oscilan entre 19.624 y 20.37, pero en general se mueven muy
cerca de la media teórica que es 20. Esto debido a que el parámetro con el que se simularon
las muestras corresponde al valor teórico.
4.b Construir un gráfico de dispersión donde en el eje y ubiques los resultados de las varianzas
muestrales y en el eje x los valores de 1 a 100 (indexación por muestra). Además, trazar una
línea paralela al eje x que corte en el eje y en el valor teórico de la varianza de la variable
X. Interpretar el gráfico y la relación de los resultados muestrales y teóricos.

22

21
Varianza Muestral

20

19

18
0 25 50 75 100
Muestra

Se puede observar una dispersión considerable entre los valores muestrales y el teórico, los
datos de la varianza a nivel muestral oscilan entre 18.113 y 22.483, pero en general se mueven
muy cerca de la varianza teórica que es 20. Esto debido a que el parámetro con el que se
simularon las muestras corresponde al valor teórico.
4.c Construir un gráfico de dispersión donde en el eje y ubiques los resultados de los por-
centajes y en el eje x los valores de 1 a 100 (indexación por muestra). Además, trazar una
línea paralela al eje x que corte en el eje y en el valor de la probabilidad de que X toma
valores menores o iguales 20. Interpretar el gráfico y la relación de los resultados muestrales
y teóricos.

5
60.0

57.5
Porcentaje (<20)

55.0

52.5

0 25 50 75 100
Muestra

Si X ∼ P oisson(20) entonces P (x ≤ 20) = 55.91%, es notable que todos los porcentajes de


las muestras aleatorias oscilan entre 50.9% y 60.3% que son muy cercanos a la probabilidad
inicial.
4.d Construir 10 gráficos de barras para los resultados de 10 muestras aleatorias y compa-
rarlos con el gráfico de la función de probabilidad de X para λ=20 del ejercicio 1.

Muestra 1 Muestra 2 Muestra 3 Muestra 4


100 150 200
100 200 300 400

150
150
Frecuencia

Frecuencia

Frecuencia

Frecuencia

100
100

50
50

50
0

5 15 25 35 5 15 25 35 5 10 20 30 5 15 25 35

x x x x

Muestra 5 Muestra 6 Muestra 7 Muestra 8


400

100 200 300 400


150

300
300
Frecuencia

Frecuencia

Frecuencia

Frecuencia
100

200
200

100
100
50
0

5 15 25 35 5 15 25 35 5 15 25 35 5 15 25 35

x x x x

6
Muestra 9 Muestra 10 Ejercicio 1.

100 200 300 400


150

0.08
Frecuencia

Frecuencia

Density
100

0.04
50

0.00
0

0
5 15 25 35 5 15 25 35 5 10 20 30

x x x

Como era de esperarse, los datos de las 10 muestras aleatorias tienen comportamientos
similares, ya que provienen de la misma distribución con parámetro λ = 20. Podemos resaltar
de los gráficos la simetría respecto al parámetro lambda y la similitud en su distribución. La
diferencia más notable se observa en la amplitud de las barras, lo que se debe a la cantidad
de valores distintos y únicos para cada muestra.
5. Para una variable aleatoria X que se modela con una función de probabilidad
con parámetro lambda=20 seleccionar 12 muestras aleatorias de tamaños n=2,
5, 10, 20, 30, 50, 100, 200, 300, 400, 500, 1000. Por cada muestra calcular el
porcentaje de valores en la muestra menores o iguales 20. Construir un gráfico
de dispersión donde en el eje y ubiques los resultados de los porcentajes y en
el eje x los valores de 1 a 12 (indexación por muestra). Además, trazar una
línea paralela al eje x que corte en el eje y en el valor de la probabilidad de que
X tome valores menores o iguales 20. Analizar estos resultados y compararlos
con los encontrados en el ejercicio 4 c) del punto 4
Los datos obtenidos después de la simulación de las muestras son:

Muestra n Media Porcentaje


1 2 21.50 50.00
2 5 21.20 20.00
3 10 20.00 50.00
4 20 20.10 50.00
5 30 20.30 53.33
6 50 20.08 58.00
7 100 18.83 69.00
8 200 19.84 55.50
9 300 19.87 55.33
10 400 19.59 61.75
11 500 20.20 55.00
12 1000 20.18 55.30

7
Así, el gráfico de dispersión de los porcentajes, donde la línea roja representa la P (x ≤ 20) =
55.909% es:

70

60
Porcentaje (<20)

50

40

30

20

1 2 3 4 5 6 7 8 9 10 11 12
Muestra

Es notable que la mayoría de los porcentajes de las muestras aleatorias oscilan entre 50% y
61.75% que son muy cercanos a la probabilidad inicial (55.909%). Sin embargo, a diferencia
del ejercicio 4.c se notan dos valores alejados de la recta (20% y 69%) Esto debido a los
pocos datos de las muestras, pero si observamos su media muestral está muy cerca a la
teórica ya que provienen de la misma distribución.

Punto 5. Suponga que la variable aleatoria X se modela con una distribución Gamma. Se
utiliza en este caso la parametrización que se usa en el software R. La función de densidad
está dada por:
Z ∞
1 α−1 −x/σ
f (x) = α x e ; Γ(α) = tx−1 e−t dt
σ Γ(α) 0

Para x ≥ 0, α > 0 y σ > 0.


La media y la varianza son E(X) = ασ y Var(X) = ασ 2 K.

8
1. Graficar la función de densidad de X para distintos valores de los paráme-
tros. Alpha=2 y Sigma=1/3, 1/5, 1/10, 1/15 y 1/20. (todas estas curvas en
un mismo gráfico). Además, Alpha=1 y Sigma =1/3, 1/5, 1/10, 1/15 y 1/20
(todas estas curvas en un mismo gráfico). Describir y comparar las curvas de
densidad.

Alpha = 2

scale
1/10
Densidad

4
1/15
1/20
1/3
1/5
2

0 1 2 3
X

Alpha = 1

10
scale
1/10
Densidad

1/15
1/20
1/3
5
1/5

0 1 2
X

9
Se pueden observar claras diferencias entre ambos gráficos, el primero (α = 2) tiene colas
más pesadas que el segundo (α = 1) y los valores máximos son más altos en el segundo
a comparación del primero para los distintos valores de σ observados, sin embargo, para
ambos gráficos se puede observar que la altura de cada curva aumenta cuando se disminuye
el valor de sigma y la mayoría de los datos están entre 0 y 1.

2. Calcular la probabilidad de que la variable aleatoria X tome valores mayores


a 0.2. Suponer que la variable se modela con una función de densidad Gamma
con parámetros Alpha=2 y Sigma=1/10. Interpretar el resultado.
De esta forma si X ∼ gamma(2, 1/10) entonces:

Z 0.2
1
P (x > 0.2) = 1 − p(x ≤ 0.2) = 1 −  2 x2−1 e−10x dx = 1 − 0.5939942 = 0.4060058
0 1
10
Γ(2)

3.5

3.0

2.5
Densidad

2.0

1.5

1.0

0.5

0.0

0.0 0.2 0.4 0.6 0.8 1.0

La probabilidad de que x sea mayor a 0.2 es del 40.6% aproximadamente.

3. Calcular la esperanza matemática y la varianza de la variable aleatoria X


cuando esta se modela con una función de densidad Gamma con parámetros
Alpha=2 y Sigma=1/10. Interpretar resultados
Z ∞
1 1
E(X) = x ·  2 x2−1 e−10x = = 0.2
0 1
Γ(2) 5
10

Si X ∼ gamma(2, 1/10) entonces su valor esperado E(X) = ασ = 0.2 y su varianza está


dada por:

10
Z ∞
1
2 2
V ar(X) = E(X ) − E (X) = x2 ·  2 x2−1 e−10x − (0.2)2 = 0.06 − 0.04 = 0.02
0 1
10
Γ(2)

Así, el valor esperado de la variable X es de 0.2 con una varianza de 0.02

4. Para una variable aleatoria X que se modela con función de densidad de la


Gamma con parámetros Alpha=2 y Sigma=1/10, generar 100 muestras aleato-
rias de tamaño n=1000. Por cada muestra aleatoria, calcular media muestral,
varianza muestral y el porcentaje de valores en la muestra mayores a 0.2
Después de la simulación de las 100 muestras aleatorias podemos observar una sección de la
base de datos:
Cuadro 3: Muestra de la base de datos

Muestra Media Varianza Porcentaje


1 0.199 0.021 40.2
2 0.211 0.019 44.7
3 0.198 0.019 39.6
4 0.2 0.019 40.3
5 0.2 0.02 40.6
. . . .
. . . .
. . . .
96 0.201 0.021 41.9
97 0.195 0.019 39.1
98 0.207 0.024 41.4
99 0.199 0.019 41
100 0.194 0.018 38

4.a Construir un gráfico de dispersión donde en el eje y ubiques los resultados de las medias
muestrales y en el eje x los valores de 1 a 100 (indexación por muestra). Además, trazar una
línea paralela al eje x que corte en el eje y en el valor teórico de la esperanza matemática de
la variable X. Interpretar el gráfico y la relación de los resultados muestrales y teóricos.

11
0.210

0.205

Media Muestral
0.200

0.195

0.190

0 25 50 75 100
Muestra

Se puede observar una dispersión notable entre los valores muestrales y el teórico, los datos
de la media a nivel muestral oscilan entre 0.189 y 0.211, pero en general se mueven muy
cerca de la media teórica que es 0.2. Esto debido a que el parámetro con el que se simularon
las muestras corresponde al valor teórico.
4.b Construir un gráfico de dispersión donde en el eje y ubiques los resultados de las varianzas
muestrales y en el eje x los valores de 1 a 100 (indexación por muestra). Además, trazar una
línea paralela al eje x que corte en el eje y en el valor teórico de la varianza de la variable
X. Interpretar el gráfico y la relación de los resultados muestrales y teóricos.

0.024

0.022
Varianza Muestral

0.020

0.018

0 25 50 75 100
Muestra

Se puede observar una dispersión considerable entre los valores muestrales y el teórico, los
datos de la varianza a nivel muestral oscilan entre 0.017 y 0.024, pero en general se mueven
muy cerca de la varianza teórica que es 0.02. Esto debido a que el parámetro con el que se
simularon las muestras corresponde al valor teórico.
4.c Construir un gráfico de dispersión donde en el eje y ubiques los resultados de los porcen-
tajes calculados y en el eje x los valores de 1 a 100 (indexación por muestra). Además, trazar
una línea paralela al eje x que corte en el eje y en el valor de la probabilidad de que X toma
valores mayores a 0.2. Interpretar el gráfico y comparar resultados muestrales y teóricos.

12
45

43

Porcentaje (>0.2)
41

39

37

0 25 50 75 100
Muestra

Si X ∼ gamma(2, 1/10) entonces P (x > 0.2) = 40.6%, es notable que todos los porcentajes
de las muestras aleatorias oscilan entre 36.9% y 44.7% que son muy cercanos a la probabili-
dad dada inicialmente.

5. Para una variable aleatoria X que se modela con función de densidad de la


Gamma con parámetros Alpha=2 y Sigma=1/10, generar 12 muestras aleato-
rias de tamaños n=2, 5, 10, 20, 30, 50, 100, 200, 300, 400, 500, 1000. Por
cada muestra aleatoria, calcular la media muestral. Analizar estos resultados
y compararlos con los resultados encontrados en el ejercicio 4 a) del punto 5.
Los datos obtenidos después de la simulación de las muestras son:

Muestra n Media
1 2 0.2286
2 5 0.2283
3 10 0.1631
4 20 0.1661
5 30 0.1779
6 50 0.1790
7 100 0.2026
8 200 0.2006
9 300 0.1966
10 400 0.2107
11 500 0.2082
12 1000 0.2046

13
Así, el gráfico de dispersión de las medias, donde la línea roja representa la media teórica,
es:

0.22
Media Muestral

0.20

0.18

0.16
1 2 3 4 5 6 7 8 9 10 11 12
Muestra

Se puede observar una dispersión notable entre los valores muestrales y el teórico, los datos
de la media a nivel muestral oscilan entre 0.1631 y 0.2286. Debido a la escala de los datos no
es una diferencia tan considerable comparado con el ejercicio 4.a donde también se observó
una gran dispersión, esto debido a los tamaños de las muestras y a que los pámetros de las
simulaciones fueron iguales.

14

También podría gustarte