Está en la página 1de 6

Departamento de Ingenierı́a Civil Industrial

Estadı́stica - IN3242 INGENIERIA INDUSTRIAL


Prof: Raimundo Undurraga UNIVERSIDAD DE CHILE
Aux’s: Nicolás Acevedo - Fernando Miranda - Guillermo Morales
Rubén Ortega - Carla Peñafiel - Camila Pulgar - Carolina Salgado - Evelyn Silva

Auxiliar #1
Repaso Probabilidades

Resumen
- Variable Aleatoria (va): es una variable que toma valores numéricos y, su resultado esta
determinado por un proceso aleatorio de generación de datos. Ejemplo: Lanzar un dado de 6
caras y registrar su valor.
Existen dos tipos de variables aleatorias:

1. Discretas: la va X toma valores contables tal que la probabilidad de que X tome un


valor x es distinta a cero. Ahora, se puede definir la Distribución de probabilidades
de X, sea x que puede tomar k valores posibles {x1 , ..., xk }, entonces la probabilidad de
que la va X tome un valor x, es tal que f (xj ) = P(X = xj ) = pj para j = 1, ..., k.

2. Continuas: se asignan probabilidades para intervalos de valores, no para valores es-


pecı́ficos. La distribución de probabilidad de una va continua se denomina
R b Función de
densidad de probabilidad (pdf) de X, tal que pdf= P(a ≤ x ≤ b) = a f (x)dx.

- Función de distribución acumulada(cdf): Sea X va, la probabilidad de que X tome un


valor menor o igual a x, se denota como F (x). Estudiemos los casos de variables aleatorias:
P
1. Discretas: F (x) = X≤x f (x) = P(X ≤ x)
R
2. Continuas: F (x) = X≤x f (x) = P(X ≤ x)
dF (x)
Propiedades importantes: f (x) = dx , P(a ≤ x ≤ b) = F (b) − F (a), P(X ≥ x) =
1 − F (x).
- Esperanza: El valor esperado de X, que se denota como E[X] o µx , es un promedio
ponderado de los valores que pueden tomar x, y los ponderadores son las probabilidades
respectivas asociadas a cada valor.
P
1. Discretas: E[X] = µx = x xf (x).
R
2. Continuas: E[X] = µx = x xf (x)dx.

Propiedades:

1. ∀c ∈ R, E[c] = c

2. P
Sea g(X) una función de X, si X es una va discreta, entonces se cumple R E[X] =
x g(x)f (x). En cambio, si X es una va continua, entonces se cumple E[X] = x g(x)f (x)dx.

3. Si g(x) = a + bX, con a, b ∈ R, entonces E[g(X)] = E[a] + bE[X] = a + bE[X].

Generalización del punto 3: Si {a1 , ..., an } ∈ R y {x1 , ..., xn } son va, entonces E[ ni=1 ai Xi ] =
P
4. P
n
i=1 ai E[Xi ]

Auxiliar #1 - 15/03/2019 1
- Varianza: es una medida de dispersión que muestra la variabilidad de una serie de datos
respecto a su media. Su definición más formal esta dado por V ar[X] = σ 2 = E[(x − µ)2 ], es
decir, es la distancia promedio entre x y µ.

1. Discreta: V ar[X] = σ 2 = x (x − µ)2 f (x), con µ = x xf (x).


P P

2. Continua: V ar[X] = σ 2 = x (x − µ)2 f (x)dx, con µ = x xf (x)dx.


R R

Propiedades:

1. La varianza es siempre no negativa.

2. ∀c ∈ R, V ar[c] = 0.

3. ∀a, b ∈ R, V ar[aX + b] = a2 V ar[X].

4. ∀X va, se cumple que: V ar[X] = E[X 2 ] − E[X]2 .

- Desviación estándar: Se necesita tener una medida de la forma de distribución que sea
común a X y µ, es decir, que cuando µ aumente en un factor
p a, la dispersión de la distribución
lo haga a esa misma escala. Definimos SD[X] = σ = V ar[X]. Importante: ∀a, b ∈ R, se
cumple que SD[a + bX] = |a|SD[X].
- Estandarización de una variable aleatoria: Dada una va X, definimos una nueva va:
Z = X−µ
σ . La va Z tiene una media 0 y una varianza igual a 1, lo que normalmente se dice
que Z esta estandarizada.
- Distribuciones conocidas:

1. Variables aleatorias discretas:

(a) Bernoulli: Sea X ∈ {0, 1}, P(X = 1) = p, P(X = 0) = 1 − p. E[X] = p y


V ar[X] = p(1 − p)
(b) Binomial: Sea X ∼ bin(n, p), P(X = k) = nk pk (1 − p)n−k . E[X] = np, V ar[X] =


np(1 − p).
1−p
(c) Geométrica: X ∼ geo(p), P(X = k) = (1 − p)k−1 p. E[X] = p1 , V ar[X] = p2
.
exp−λ λk
(d) Poisson: X ∼ poisson(λ, k), P(X = k) = k! . E[X] = λ, V ar[X] = λ.

2. Variables aleatorias continuas:


1 a+b
(a) Uniforme: X ∼ U (a, b), P(X) = b−a (para a ≤ x ≤ b). E[X] = 2 , V ar[X] =
(b−a)2
12 .
(b) Exponencial: X ∼ exp(λ), P(X = k) = λ exp−λk . E[X] = λ1 , V ar[X] = 1
λ2
.
−(k−µ)2
(c) Normal: X ∼ N (µ, σ), P(X = k) = √ 1 2 exp 2σ2 . E[X] = µ, V ar[X] = σ 2 .
2πσ
Teorema: Si X ∼ N (µ, σ 2 ), entonces aX + b ∼ N (aµ + b, a2 σ 2 ).
Pregunta 1
1. Sea Y una variable aleatoria que sigue una distribución uniforme de parámetros a y b.
(b−a)2
Demuestre que E(Y ) = a+b
2 y V ar(Y ) = 12

Solución

1. Se debe recordar que:


(
1
f (y) = b−a si y[a, b]
f (y) = 0 ∼

Recordando además la fórmula de la esperanza para una variable aleatoria continua,


tenemos que:

∞ b b
1 y 2 b
Z Z Z
1 1
E(Y ) = yf (y)dy = y dy = ydy =
−∞ a b−a b−a a b−a 2 a

b2 − a2 (a + b)(b − a) a+b
E(Y ) = = =
2(b − a) 2(b − a) 2

Para la varianza, se debe recordar que

V ar(Y ) = E(Y 2 ) − E2 (Y )

Por lo que solo basta calcular la esperanza de Y al cuadrado.

∞ b b
1 y 3 b
Z Z Z
2 2 2 1 1
E(Y ) = y f (y)dy = y dy = y 2 dy =
−∞ a b−a b−a a b−a 3 a

b3 − a3 (b − a)(b2 + ab + a2 ) a2 + ab + b2
E(Y 2 ) = = =
3(b − a) 3(b − a) 3

Luego, la varianza de Y está dada por:

a2 + ab + b2 a2 + 2ab + b2 a2 − 2ab + b2 (b − a)2


V ar(Y ) = − = =
3 4 12 12
Pregunta 2
1. Sean X e Y variables i.i.d tal que X ∈ {0, 1, 2, 3}, Y ∈ {0, 1, 2, 3}. Calcule P(X +Y > 1).

2. (Propuesto) Suponga que X1 , ..., Xn son variables aleatorias i.i.d. que distribuyen uni-
forme en (0, 4). Cúal es la probabilidad que ninguna de ellas tome un valor en el intervalo
(2, 3).

Solución

1. Tenemos que calcular la probabilidad de que la suma de X e Y sea mayor estricto a 1,


es decir, valores tales que la suma sea 6, 5, 4, 3, 2. Esto a lenguaje probabilı́stico se
traduce en:

P(X + Y > 1) = P(X + Y = 6) + P(X + Y = 5) + ... + P(X + Y = 2) (1)

Pero, ¿Será muy engorroso realizar ese cálculo?, ¿Existirá otra forma mas eficiente de
abordar el problema?. En estos momentos es cuando nos acordamos de la siguiente
propiedad. Sea W una variable aleatoria con c ∈ R, entonces se cumple que:

P(X > c) = 1 − P(X ≤ c) (2)

Si se adapta al problema, tenemos que:

P(X + Y > 1) = P(X + Y = 6) + P(X + Y = 5) + ... + P(X + Y = 2) (3)

= 1 − [P(X + Y = 1) + P(X + Y = 0)] (4)


Ahora, nos ponemos en los casos en que la suma de X e Y es 0 y 1.

= 1 − [P(X = 1, Y = 0) + P(X = 0, Y = 1) + P(X = 0, Y = 0)] (5)

Por último, como X e Y son i.i.d., se cumple que las variables son independientes entre
sı́ y tienen la misma distribución de probabilidad. Por lo que se cumple que:

P(X = 1, Y = 0) = P(X = 1)P(Y = 0) (6)

Aplicados al ejercicio, tendremos que:

= 1 − [P(X = 1)P(Y = 0) + P(X = 0)P(Y = 1) + P(X = 0)P(Y = 0)] (7)

Reemplazamos las probabilidades de cada distribución para encontrar P(X + Y > 1).
11 11 11
=1−[ + + ] (8)
44 44 44
3 13
=1−[ ]= (9)
16 16
2. Para que ninguna de las variables aleatorias tome un valor entre (2, 3), se debe cumplir
que:
{X1 , ..., Xn } ∈
/ (2, 3) (10)
Calculemos la probabilidad de que lo anterior se cumpla, se tiene que cumplir por
separado, para todos los {X1 , ..., Xn } que no pertenecen al conjunto (2, 3). Esto se
puede expresar como:

P(X1 ∈
/ (2, 3), X2 ∈
/ (2, 3), ..., Xn ∈
/ (2, 3)) (11)
n
Y
= P(Xi ∈ / (2, 3))n
/ (2, 3)) = P(X ∈ (12)
i=1

Luego, la pitatoria sale de que al ser todas variables aleatorias independientes e idénticamente
distribuidas, se cumple la misma propiedad de la ecuación 9, por eso se cumple la igual-
dad número (15). Luego, la probabilidad que X ∈ / (2, 3) es de 43 , por lo que se puede
concluir que:
3
P(X ∈/ (2, 3))n = ( )n (13)
4

Pregunta 3: Ejercicio Computacional


Las salas de operaciones son uno de los recursos más caros de un hospital. Por esta razón
es importante mantener los pabellones con altas tasas de utilización, resultando en horarios
ajustados para las cirugı́as. Cuando se construye el horario de un pabellón, se solicita que los
cirujanos proporcionen una ventana de tiempo para realizar una cirugı́a (estas cirugı́as son
catalogadas como ”electivas” en contraste con las cirugı́as de emergencia donde el paciente es
directamente admitido en la sala que este disponible).
Para agendar una cirugı́a electiva, el hospital realiza una predicción sobre la duración de la
cirugı́a de manera de reservar el tiempo preciso en la sala de operaciones. Predecir el tiempo
de una cirugı́a es difı́cil. Usted cuenta con el dataset de cirugı́as cardiacas de un hospital en
California. Usando las primeras 35 filas de los datos responda lo siguiente:

1. Cargue la Base de Datos del archivo adjunto: cirugias.csv

2. Usando las primeras 35 filas, estime la duración promedio de una cirugı́a cardiaca.
Calcule el error estándar de su estimación.

Solución
Código adjunto.
6

También podría gustarte