Inferencia Causal en Estadística 2
Inferencia Causal en Estadística 2
Solemne
Daniela Jensen -
Clases PasaInvicto
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 1 / 103
Agenda
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 2 / 103
Tópico 1
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 3 / 103
Causalidad
Conceptos básicos:
Unidad: Un objeto fı́sico en un momento particular en el tiempo.
Tratamiento: Una intervención activa aplicada en un momento particular en el tiempo,
cuyos efectos deseamos evaluar en relación con ninguna intervención (el control).
Resultados potenciales: Resultados que se observarı́an si se aplicara un tratamiento activo
y que se observarı́an si se aplicara un tratamiento de control.
Efecto Causal: Comparación de los resultados potenciales bajo el tratamiento activo y el
tratamiento de control, para cada unidad.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 4 / 103
Causalidad como un problema de datos faltantes
El problema fundamental que enfrenta la inferencia causal es que podemos observar como
máximo un resultado potencial para cada unidad. Es decir, determinar causalidad es un
problema de datos faltantes (missing data en inglés):
Para cada unidad, el dato faltante es el resultado potencial que no observamos.
Si la unidad es tratada, observamos su resultado potencial bajo tratamiento, pero no
observamos su resultado potencial bajo control.
Si la unidad es control, observamos su resultado potencial bajo control, pero no
observamos su resultado potencial bajo tratamiento.
De este modo, el problema de inferencia causal radica en cómo nos enteramos de (aprendemos
sobre) los resultados potenciales que faltan y, por tanto, de los efectos causales.
Un elemento básico para esta tarea es que necesitamos múltiples unidades: al menos una unidad
recibe tratamiento activo y al menos una unidad recibe el tratamiento de control.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 5 / 103
Experimentos aleatorizados controlados
Los experimentos aleatorizados son los estudios que permiten dar la mayor confiabilidad y
validez cuando se busca determinar si una variable (el tratamiento) produce un efecto en otra
variable (el resultado).
De esta forma, se garantiza que las variables pretratamiento (observada o no observada) y los
resultados potenciales no estén asociadas con la asignación al tratamiento.
Por tanto, cualquier diferencia en la variable de resultado entre los grupos de tratamiento y
control puede ser atribuida al efecto del tratamiento.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 6 / 103
Test exacto de Fisher aplicado a causalidad
Podemos analizar los datos observados de experimentos aleatorizados para aprender sobre los
resultados potenciales que no observamos, utilizando el mecanismo de asignación del
tratamiento como base para la inferencia estadı́stica.
La hipótesis nula es que el tratamiento no tiene efecto alguno, para lo cual debemos especificar
qué significa que el tratamiento no tiene efecto.
La Nula dura
Formalizamos esta hipótesis como sigue:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 7 / 103
Ejercicio 1
Solución:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 8 / 103
Ejercicio 1
Solución:
Las unidades son los individuos del grupo de infractores primerizos que cumplı́a condena
que participan en el estudio. Supongamos n infractores primerizos que cumplı́a condena
que participan en el estudio, que los indexaremos por i = 1, 2, 3, ..., n.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 9 / 103
Ejercicio 1
Solución:
Las unidades son los individuos del grupo de infractores primerizos que cumplı́a condena
que participan en el estudio. Supongamos n infractores primerizos que cumplı́a condena
que participan en el estudio, que los indexaremos por i = 1, 2, 3, ..., n.
Tratamiento activo: asistir a curso de rehabilitación.
Tratamiento de control: no asistir a curso de rehabilitación.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 10 / 103
Ejercicio 1
Solución:
Las unidades son los individuos del grupo de infractores primerizos que cumplı́a condena
que participan en el estudio. Supongamos n infractores primerizos que cumplı́a condena
que participan en el estudio, que los indexaremos por i = 1, 2, 3, ..., n.
Tratamiento activo: asistir a curso de rehabilitación.
Tratamiento de control: no asistir a curso de rehabilitación.
Resultados potenciales:
Yi (1): indicador de si el infractor primerizo i reincide o no en crimen dentro de 10 años
después de cumplir su condena si asiste al curso de rehabilitación.
Yi (0): indicador de si el infractor primerizo i reincide o no en crimen dentro de 10 años
después de cumplir su condena si no asiste al curso de rehabilitación.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 11 / 103
Ejercicio 2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 12 / 103
Ejercicio 2
La tabla que sigue presenta la información que observamos del experimento.
Estamos interesados en estimar el efecto causal del programa de becas en la deserción durante
el primer año de universidad.
Especifique la hipótesis nula dura de Fisher y calcule el valor-p exacto de Fisher usando el
estadı́stico de prueba dado por la diferencia de medias:
T = Ȳtobs − Ȳcobs
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 13 / 103
Ejercicio 2
Solución:
A partir de los datos observados del experimento aleatorizado, tenemos que:
1+0+0+0
Ȳtobs = = 0, 25
4
1+1+0+0
Ȳcobs = = 0, 5
4
Además, recordemos que la nula dura de Fisher tiene la siguiente forma:
H0 : Yi (1) = Yi (0), i = 1, 2, 3, 4, 5, 6, 7, 8
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 14 / 103
Ejercicio 2
Solución:
A partir de los datos observados del experimento aleatorizado, tenemos que:
1+0+0+0
Ȳtobs = = 0, 25
4
1+1+0+0
Ȳcobs = = 0, 5
4
Además, recordemos que la nula dura de Fisher tiene la siguiente forma:
H0 : Yi (1) = Yi (0), i = 1, 2, 3, 4, 5, 6, 7, 8
Por ende, si rellenamos según la hipótesis anterior la tabla, quedarı́a:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 15 / 103
Ejercicio 2
Solución:
Luego, tal como indica el enunciado, utilizamos el siguiente estadı́stico para calcular el valor-p:
T = Ȳtobs − Ȳcobs
Tenemos 8 unidades en total, con un diseño de 4 tratados y 4 controles. Luego, tenemos que
tobs = 0, 25 − 0, 5 = −0, 25
−1, 96 ≤ tobs ≤ 1, 96
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 16 / 103
Tópico 2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 17 / 103
Distribución Conjunta
fX ,Y = Pr (X = x, Y = y )
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 18 / 103
Independencia
FX ,Y (x, y ) = FX (x)FY (y )
Pr (X = x, Y = y ) = Pr (X = x)Pr (Y = y )
Pr (Y = y |X = x) = Pr (Y = y )
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 19 / 103
Covarianza
Lo que es equivalente a,
Cov (X , Y ) = E [XY ] − E [X ]E [Y ]
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 20 / 103
Covarianza e Independencia
Si bien cuando dos variables son independientes su covarianza es igual a cero, no se cumple que
cuando la covarianza es cero son independientes.
La covarianza mide una relación lineal, y la dependencia estadı́stica puede darse de forma no
lineal.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 21 / 103
Correlación
Dado que el valor de la covarianza depende de las unidades en que se miden las variables
aleatorias, es conveniente definir una medida de relación entre variables que no dependa de las
unidades en que se miden las variables.
Cov (X , Y )
Corr (X , Y ) = p
Var (X )Var (Y )
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 22 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 23 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
Solución:
Recordemos que:
Z
fX (x) = fX ,Y (x, y )dy
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 24 / 103
Ejercicio 3
Sean X e Y variables aleatorias continuas con densidad conjunta:
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
Solución:
Z 2
1
fX (x) = (x + y )dy
0 3
y2 2
1
= xy + |0
3 2
1
= (2x + 2)
3
2
= (x + 1)
3
Luego,
2
fX (x) = (x + 1), 0<x <1
3
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 25 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
b) Calcule E (X ), E (X 2 ), Var (X )
Solución:
Usando la definición de esperanza:
Z
E (X ) = x · fX (x)dx
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 26 / 103
Ejercicio 3
Sean X e Y variables aleatorias continuas con densidad conjunta:
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
b) Calcule E (X ), E (X 2 ), Var (X )
Solución:
Usando la definición de esperanza:
Z
E (X ) = x · fX (x)dx
Luego, desarrollando:
Z 1 2
E (X ) = x·
(x + 1)dx
0 3
3
x2 1
2 x
= + |0
3 3 2
5
=
9
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 27 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
b) Calcule E (X ), E (X 2 ), Var (X )
Solución:
Usando LEI: Z
E (X 2 ) = x 2 · fX (x)dx
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 28 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
b) Calcule E (X ), E (X 2 ), Var (X )
Solución:
Usando LEI: E (X 2 ) = x 2 · fX (x)dx.
R
Z
2 1
E (X 2 ) = x2 ·
(x + 1)dx
0 3
4
x3 1
2 x
= + |0
3 4 3
7
=
18
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 29 / 103
Ejercicio 3
Sean X e Y variables aleatorias continuas con densidad conjunta:
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
b) Calcule E (X ), E (X 2 ), Var (X )
Solución:
Usando LEI: E (X 2 ) = x 2 · fX (x)dx.
R
Z
2 1
E (X 2 ) = x2 ·
(x + 1)dx
0 3
2 x4 x3 1
= + |0
3 4 3
7
=
18
Finalmente, 2
7 5 13
Var (X ) = E (X 2 ) − E (X )2 = − =
18 9 162
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 30 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
Solución:
Usando las propiedades de la varianza y la covarianza, junto a los datos del enunciado y la
varianza calculada en b) tenemos que:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 31 / 103
Ejercicio 3
1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3
Solución:
Usando las propiedades de la varianza y la covarianza, junto a los datos del enunciado y la
varianza calculada en b) tenemos que:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 32 / 103
Tópico 3
Distribuciones condicionales
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 33 / 103
Variables aleatorias condicionadas
Pr (X = x|Y = y )Pr (Y = y )
Pr (Y = y |X = x) =
Pr (X = x)
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 34 / 103
Esperanza Condicional a un evento
Recordar que E (Y ), para una variable aleatoria discreta, es un promedio ponderado de los
posibles valores que puede tomar Y , donde cada ponderación es la Pr (Y = y ).
Ahora, vamos a calcular una esperanza condicional, es decir, calcularemos la esperanza de Y
dado que ocurre un evento A, E (Y |A). Las ponderaciones ahora serán Pr (Y |A).
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 35 / 103
Esperanza Condicional en una v.a.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 36 / 103
Varianza Condicional en una v.a.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 37 / 103
Tips importantes
E (Y ) = E [E (Y |X )] = E (c) = c
E (XY ) = E [E (XY |X )] = E [XE (Y |X )] = cE (X )
Entonces, Cov (X , Y ) = cE (X ) − E (X )c = 0
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 38 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
a) Suponga que llegan 212 niñas a probarse. ¿Cuál es la distribución del número de niñas
que queda seleccionada, dada la información anterior? ¿Cuál es la esperanza y varianza de
esta distribución?
b) Suponga ahora que llegan n niñas a las pruebas (con n ≥ 0). Vuelva a responder la parte
anterior.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 39 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
a) Suponga que llegan 212 niñas a probarse. ¿Cuál es la distribución del número de niñas
que queda seleccionada, dada la información anterior? ¿Cuál es la esperanza y varianza de
esta distribución?
Solución:
La probabilidad de que cada niña quede seleccionada sigue una distribución Bernoulli con
p = 0, 25. Pero sabemos que son muchas niñas las que van a probarse, especı́ficamente
212.
Por eso podemos decir que seguirá una distribución Binomial con n = 212 repeticiones y
probabilidad de éxito p = 0, 25.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 40 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
b) Suponga ahora que llegan n niñas a las pruebas (con n ≥ 0). Vuelva a responder la parte
anterior.
En caso de que lleguen n niñas, entonces Y va a seguir una distribución binomial donde
n = n y p = 0, 25. Por lo tanto ahora debemos calcular:
E (Y |N = n), Var (Y |N = n)
Al igual que en a), sabemos que si Y sigue una distribución binomial su esperanza será np
y su varianza np(1 − p). En este caso la esperanza y varianza serán 0, 25n y 0, 1875n.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 41 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.
Solución:
Ahora nos están pidiendo la esperanza y varianza incondicional, es decir, sin condicionar a
un valor determinado de N. Además, consideremos que N ∼ Normal(µ = 200, σ 2 = 16).
Para calcular la esperanza incondicional usamos la Ley de Adán:
E (Y ) = E (E (Y |N))
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 42 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.
Solución:
Ahora nos están pidiendo la esperanza y varianza incondicional, es decir, sin condicionar a
un valor determinado de N. Además, consideremos que N ∼ Normal(µ = 200, σ 2 = 16).
Para calcular la esperanza incondicional usamos la Ley de Adán:
E (Y ) = E (E (Y |N))
E (0, 25N) = 0, 25 · E (N)
= 0, 25 · 200
= 50
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 43 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.
Solución:
Para calcular la varianza incondicional usamos la Ley de Eva:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 44 / 103
Ejercicio 4
Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.
Solución:
Para calcular la varianza incondicional usamos la Ley de Eva:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 45 / 103
Tópico 4
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 46 / 103
Distribución normal bivariada
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 47 / 103
Distribución normal bivariada
Nótese que:
Sean (X , Y ) v.a. independientes que siguen una distribución normal estandarizada,
entonces la distribución de (X + Y , X − Y ) es una Normal Bivariada ya que X + Y es
independiente de X − Y .
Sean (X , Y ) v.a. que siguen una distribución Normal Bivariada, con X e Y siguiendo una
normal estandarizada, con correlación ρ entre X e Y , entonces (X + Y , X − Y ) también
siguen una Normal Bivariada.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 48 / 103
Distribución normal bivariada
Suponga que tenemos dos v.a. independientes X , Y ∼ N(0, 1) y queremos generar variables
aleatorias (Z , W ) que tengan una distribución Normal Bivariada, con Corr (Z , W ) = ρ y con
Z , W siguiendo distribuciones marginales N(0, 1). Por definición, todo (Z , W ) que sea de la
forma
Z = aX + bY
W = cX + dY
Z = X
p
W = ρX + 1 − ρ2 Y
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 49 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 50 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
E (V ) = E (X ) = 0
E (W ) = E (ρX + aY ) = 0
Var (V ) = Var (X ) = 1
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 51 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
E (V ) = 0, E (W ) = 0, Var (V ) = 1
Luego,
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 52 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
Finalmente,
Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY )) − 0
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 53 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
Finalmente,
Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY ))
= E (ρX 2 + aYX )
= ρE (X 2 ) + aE (XY )
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 54 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
Finalmente,
Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY ))
= E (ρX 2 + aYX )
= ρE (X 2 ) + aE (XY )
= ρVar (X ) + aCov (X , Y )
= ρ + ρa
= ρ(1 + a)
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 55 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
Finalmente,
Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY ))
= E (ρX 2 + aYX )
= ρE (X 2 ) + aE (XY )
= ρVar (X ) + aCov (X , Y )
= ρ + ρa
= ρ(1 + a)
Con lo que,
Cov (V , W ) ρ(1 + a)
Corr (V , W ) = p = p
Var (V )Var (W ) ρ2 + a2 + 2ρ2 a
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 56 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
(V , W ) van a seguir una distribución normal bivariada si todas las combinaciones lineales
de V y W siguen una distribución normal. Sabemos que X e Y siguen una distribución
normal bivariada, por lo que las combinaciones de X e Y siguen una distribución normal.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 57 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
(V , W ) van a seguir una distribución normal bivariada si todas las combinaciones lineales
de V y W siguen una distribución normal. Sabemos que X e Y siguen una distribución
normal bivariada, por lo que las combinaciones de X e Y siguen una distribución normal.
Luego, como las combinaciones lineales de V y W son a su vez combinaciones lineales de
X e Y entonces V y W siguen también una normal bivariada.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 58 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
Como V y W siguen una normal bivariada, serán independientes si y solo si su correlación
es igual cero. Es decir, queremos que:
ρ(1 + a)
Corr (V , W ) = p =0
ρ2 + a2 + 2ρ2 a
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 59 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.
Solución:
Como V y W siguen una normal bivariada, serán independientes si y solo si su correlación
es igual cero. Es decir, queremos que:
ρ(1 + a)
Corr (V , W ) = p =0
ρ2 + a2 + 2ρ2 a
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 60 / 103
Tópico 5
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 61 / 103
Estadı́sticas descriptivas
Media:
n
x1 + x2 + ... + xn 1X
x̄ = = xi
n n i=1
Varianza:
n
(x1 − x̄)2 + x2 − x̄)2 + ... + xn − x̄)2 1X
σ̂x2 = = (xi − x̄)2
n n i=1
n
(x1 − x̄)(y1 − ȳ ) + ... + (xn − x̄)(yn − ȳ ) 1X
σ̂x,y = = (xi − x̄)(yi − ȳ )
n n i=1
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 62 / 103
Correlación de Pearson
Se dispone de pares ordenados (x1 , y1 ), ..., (xm , ym ) donde los yi son lineales en los xi ,
yi = a + bxi , i = 1, ..., m
σ̂x,y
rx,y =
σ̂x σ̂y
donde
1 Pm
σ̂x,y = m i=1 (xi − x̄)(yi − ȳ )
1 Pm
σ̂x = m i=1 (xi − x̄)2
1 Pm
σ̂y = m i=1 (yi − ȳ )2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 63 / 103
Tópico 6
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 64 / 103
Estimación de modelos estadı́sticos
A partir de ahora veremos cómo estimar los parámetros de un modelo estadı́stico. Esto
complementa los dos métodos que ya vimos: test de hipótesis simple e intervalos de confianza.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 65 / 103
El problema de estimación: Caso univariado
Datos: x1 , ..., xn
Modelo estadı́stico: Las xi son realizaciones de Xi que son i.i.d. con f.d.p f (x) que depende de
θ, donde θ son los parámetros del modelo y Θ es el conjunto de valores que puede tomar θ.
Definición: Estimador
Sea Xi i.i.d. con distribución común descrita por θ ∈ Θ. Un estimador de θ es una función de
las v.a. del modelo que se usa para estimar θ:
θ̂ = θ̂(X1 , X2 , ..., Xn )
θ̂ = θ̂(x1 , x2 , ..., xn )
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 66 / 103
Sesgo de un estimador y estimadores insesgados
Sesgo de un estimador
El sesgo de un estimador θ̂ de θ se define como:
b(θ) = E (θ̂) − θ
Mide la diferencia promedio entre el estimador y el parámetro que se desea estimar. En general,
toma valores distintos a medida que varı́a θ. Es positivo cuando, en promedio, θ̂ > θ y negativo
cuando, en promedio, θ̂ < θ.
Estimador insesgado
Diremos que θ̂ es un estimador insesgado de θ si b(θ) = 0 para todo θ ∈ Θ.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 67 / 103
Método de Momentos (MdM)
µk = E [X k ], k = 1, 2, 3, ...
n
1X k
Mk = X
n i=1 i
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 68 / 103
Problema de los estimadores MdM
Es habitual que haya más de un estimador MdM para un modelo estadı́stico. Esto es
problemático porque:
Obliga a elegir entre los posibles estimadores, lo cual se puede hacer, pero puede ser bien
trabajoso.
Mucho mejor serı́a que hubiera un solo estimador MdM y que, en algún sentido, este
siempre fuera un buen estimador.
Veremos que, a diferencia de los MdM, los estimadores máximo verosı́miles y bayesianos tienen
la propiedad anterior.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 69 / 103
Comparando estimadores
Sea X1 , ..., Xn i.i.d. con una distribución común que depende de un parámetro θ ∈ Θ. Se desea
comparar dos estimadores de θ, θ1 y θ2 . La intuición es que θ1 es un mejor estimador que θ2 si,
en promedio, está más cerca de θ.
ECM(θ) mide el promedio del cuadrado del error que se comete estimando θ como θ̂.
Considere que:
Siempre ECM(θ) ≥ 0.
Mientra más pequeño es el ECM(θ), más preciso es el estimador.
ECM(θ) se calcula usando la distribución de θ̂ cuando el parámetro verdadero es θ.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 70 / 103
Teorema: ECM, varianza y sesgo
b(θ) = E (θ̂) − θ
Entonces,
ECM(θ) = Var (θ̂) + [b(θ)]2
En palabras, el error cuadrático medio es igual a la suma de la varianza y el sesgo al cuadrado.
Comentarios:
Un pequeño sesgo reduce el ECM porque el sesgo viene acompañado de una reducción de
la varianza que más que compensa el sesgo.
Tradeoff sesgo-varianza: Contraer un estimador insesgado multiplicándolo por una
constante un poco menor que uno puede reducir el ECM. Los estimadores que se obtienen
de esta forma se conocen como estimadores de contracción.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 71 / 103
Propiedades de los estimadores
Estimador consistente:
Diremos que θ̂n es un estimador consistente de θ si:
Aplicando la noción de convergencia que usamos en la LGN, tenemos que la siguiente definición
es equivalente:
(∀θ ∈ Θ) lim E (θ̂n − θ)2 = 0
n→∞
El resultado anterior signica que el sesgo de un estimador consistente tiende a cero cuando el
tamaño de la muestra aleatoria tiende a infinito. Esto es muy distinto a exigir que el sesgo sea
igual a cero para todo n, como sucede cuando un estimador es insesgado.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 72 / 103
Propiedades de los estimadores
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 73 / 103
Ejercicio 6
a) Derive el estimador MdM de θ que depende solo del primer momento muestral.
b) Calcule el ECM del estimador. ¿Es insesgado?¿Es consistente?
c) Compare el ECM del estimador de este ejercicio con aquel del máximo de los Xi . Uno de
los dos es muchı́simo mejor que el otro. ¿Cuál?
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 74 / 103
Ejercicio 6
a) Derive el estimador MdM de θ que depende solo del primer momento muestral.
Solución:
RECORDATORIO: El primer momento de Xi será: µ1 = E (Xi ).
Tenemos que
θ
E (Xi ) = µ1 =
2
Luego, θ = 2µ1 .
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 75 / 103
Ejercicio 6
a) Derive el estimador MdM de θ que depende solo del primer momento muestral.
Solución:
RECORDATORIO: El primer momento de Xi será: µ1 = E (Xi ).
Tenemos que
θ
E (Xi ) = µ1 =
2
Luego, θ = 2µ1 .
θ̂ = 2M1 = 2X̄
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 76 / 103
Ejercicio 6
Solución:
θ θ2
RECORDATORIO: E (Xi ) = 2
, Var (Xi ) = 12
.
1 2θ
E (θ̂) = E (2X̄ ) = 2E (X̄ ) = 2 · · nE (Xi ) = =θ
n 2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 77 / 103
Ejercicio 6
Solución:
θ θ2
RECORDATORIO: E (Xi ) = 2
, Var (Xi ) = 12
.
1 2θ
E (θ̂) = E (2X̄ ) = 2E (X̄ ) = 2 · · nE (Xi ) = =θ
n 2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 78 / 103
Ejercicio 6
Solución:
θ θ2
RECORDATORIO: E (Xi ) = 2
, Var (Xi ) = 12
.
Finalmente,
θ2
ECM(θ) = Var (θ̂) =
3n
Es un estimador consistente, ya que ECM(θ) tiende a 0 cuando n tiende a infinito.
θ2
lim =0
n→∞ 3n
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 79 / 103
Ejercicio 6
c) Compare el ECM del estimador de este ejercicio con aquel del máximo de los Xi . Uno de
los dos es muchı́simo mejor que el otro. ¿Cuál?
Solución:
HINT: El ECM del máximo de los Xi (θ = max{Xi }) es igual a
2
ECM(θ) = θ2
(n + 2)(n + 1)
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 80 / 103
Ejercicio 6
X1 , .., Xn son i.i.d. U(0, θ).
c) Compare el ECM del estimador de este ejercicio con aquel del máximo de los Xi . Uno de
los dos es muchı́simo mejor que el otro. ¿Cuál?
Solución:
HINT: El ECM del máximo de los Xi (θ = max{Xi }) es igual a
2
ECM(θ) = θ2
(n + 2)(n + 1)
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 81 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:
2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)
n
X 1
k = n(n + 1)
k=1
2
n
X 1
k2 = n(n + 1)(2n + 1)
k=1
6
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 82 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:
2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)
Solución:
Denotamos la media y varianza de la normal en cuestión por µ y σ 2 . Entonces,
2
E (rn ) = [E (X1 ) + 2E (X2 ) + ... + nE (Xn )]
n(n + 1)
n
2 X
= kµ
n(n + 1) k=1
2µ 1
E (rn ) = · n(n + 1) = µ
n(n + 1) 2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 83 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:
2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)
b) Calcule la varianza de rn .
Solución:
2
2
Var (rn ) = [Var (X1 ) + 4Var (X2 ) + ... + n2 Var (Xn )]
n(n + 1)
n
2 !
2 X
= k2 σ2
n(n + 1) k=1
donde en el último paso se ocupó que Var (Xi ) = σ 2 . El desarrollo sigue utilizando la
segunda propiedad del HINT:
2
2 1
Var (rn ) = · n(n + 1)(2n + 1)
n(n + 1) 6
2 (2n + 1) 2
= · σ
3 n(n + 1)
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 84 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:
2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)
Solución:
Se debe demostrar que:
lim E (rn − µ)2 = 0
n→∞
La manera más directa para realizar esto es a partir de la descomposición del ECM.
2
lim E (rn − µ)2 = lim (X1 + 2X+ 3X3 + ... + nXn ) = 0
n→∞ n→∞ n(n + 1)
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 86 / 103
Función de Verosimilitud
Datos: x1 , ..., xn
Modelo: X1 , ..., Xn i.i.d. La f.d.p común de los Xi es f (x1 |θ), donde el parámetro θ ∈ Θ describe
los valores posibles del parámetro que caracteriza la f.d.p.
La f.d.p. conjunta de X1 , ..., Xn se denota por fn (x1 , ..., xn |θ). Como los Xi son independientes,
entonces la f.d.p conjunta será igual al producto de las marginales:
fn (x1 , ..., xn |θ) = f (x1 |θ) · f (x2 |θ) · ...f (xn |θ) = Πni=1 f (xi |θ)
Dados los datos, la función de verosimilitud L(θ; x1 , ..., xn ) como aquella que asigna a cada
θ ∈ Θ:
L(θ; x1 , ..., xn ) = fn (x1 , ..., xn |θ)
Dicho en palabras, la función de verosimilitud asocia a cada valor que puede tomar el parámetro
θ la probabilidad de haber observado los datos (x1 , ..., xn ) si θ fuera el parámetro verdadero.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 87 / 103
Estimadores de Máxima Verosimilitud
El valor estimado de máxima verosimilitud será el valor de θ ∈ Θ que maximiza L(θ; x1 , ..., xn ).
Es decir,
θ̂(x1 , ..., xn ) = argmaxθ∈Θ L(θ; x1 , ..., xn )
El estimador correspondiente será el estimador de máxima verosimilitud (e.m.v.)
θ̂ = θ̂(X1 , ..., Xn )
Caracterı́sticas:
Tienen buenas propiedades teóricas, al menos para n grande.
Funcionan bien en la práctica, incluso para valores más pequeños de n.
En general, los e.m.v. son mejores que los estimadores MdM
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 88 / 103
Propiedades
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 89 / 103
Ejercicio 8
Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.
Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .
HINT: Si en una o más de las siguientes preguntas, una vez planteado el modelo estadı́stico
sabe cuál es el e.m.v., no es necesario que lo derive.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 90 / 103
Ejercicio 8
Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.
Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .
Solución:
De acuerdo a lo visto en clases, sabemos que el e.m.v. en el modelo Bernoulli es la media
muestral (no es necesario demostrarlo). Luego,
5
p̂t =
610
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 91 / 103
Ejercicio 8
Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.
Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .
Solución:
De manera análoga, los controles también siguen un modelo Bernoulli donde el e.m.v. es
la media muestral. Luego, tendremos que:
43
p̂c =
610
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 92 / 103
Ejercicio 8
Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.
Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .
Solución:
Como los e.m.v. son invariantes, entonces,
p̂c − p̂t 43 − 5
ê = = ∗ 100 = 88, 4%
p̂c 43
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 93 / 103
Ejercicio 9
a) Determine el e.m.v. de p.
b) Muestre que el e.m.v. es consistente.
c) Encuentre el e.m.v. de la varianza de la geométrica.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 94 / 103
Ejercicio 9
a) Determine el e.m.v. de p.
Solución:
Recordemos que la función de probabilidad de la distribución geométrica es:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 95 / 103
Ejercicio 9
a) Determine el e.m.v. de p.
Solución:
Recordemos que la función de probabilidad de la distribución geométrica es:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 96 / 103
Ejercicio 9
Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de
éxito desconocida p ∈ [0, 1].
a) Determine el e.m.v. de p.
Solución:
Recordemos que la función de probabilidad de la distribución geométrica es:
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 97 / 103
Ejercicio 9
a) Determine el e.m.v. de p.
Solución:
n
!
X
logL(p|x1 , ..., xn ) = nlog (p) + xi log (1 − p)
i=1
La CPO es: Pn
n i=1 xi
− =0
p 1−p
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 98 / 103
Ejercicio 9
a) Determine el e.m.v. de p.
Solución:
n
!
X
logL(p|x1 , ..., xn ) = nlog (p) + xi log (1 − p)
i=1
La CPO es: Pn
n i=1 xi
− =0
p 1−p
Por lo cual, despejando p tenemos el e.m.v.
n 1
p= Pn =
n+ i=1 xi 1 + x̄n
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 99 / 103
Ejercicio 9
Solución:
Tenemos que el e.m.v., θ̂n viene dado por:
1
θ̂n =
1 + X̄n
Recordemos que, por la LGN, X̄n converge a la media de los Xi , es decir, a µ = (1 − p)/p.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 100 / 103
Ejercicio 9
Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de
éxito desconocida p ∈ [0, 1].
Solución:
Tenemos que el e.m.v., θ̂n viene dado por:
1
θ̂n =
1 + X̄n
Recordemos que, por la LGN, X̄n converge a la media de los Xi , es decir, a µ = (1 − p)/p.
Luego,
1
lim θ̂n =
n→∞ 1 + (1 − p)/p
p
=
p + (1 − p)
= p
Es consistente.
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 101 / 103
Ejercicio 9
Solución:
1−p
Se tiene que para una variable aleatoria geométrica Var (X ) = .
p2
Por invarianza, el e.m.v. de la varianza será:
1
1 − θ̂n 1− 1+X̄n
= 2
θ̂n2
1
1+X̄n
= X̄n (1 + X̄n )
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 102 / 103
Intensivo Estadı́stica 2
Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 103 / 103