0% encontró este documento útil (0 votos)
25 vistas103 páginas

Inferencia Causal en Estadística 2

El documento aborda temas de inferencia causal en estadística, incluyendo la comparación de resultados potenciales y la importancia de los experimentos aleatorizados controlados para determinar efectos causales. Se discuten conceptos clave como el tratamiento, el control y el problema de datos faltantes en la causalidad, así como la aplicación del test exacto de Fisher para evaluar la efectividad de un tratamiento. Además, se presentan ejercicios prácticos para ilustrar la aplicación de estos conceptos en estudios reales.

Cargado por

raliendre
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
25 vistas103 páginas

Inferencia Causal en Estadística 2

El documento aborda temas de inferencia causal en estadística, incluyendo la comparación de resultados potenciales y la importancia de los experimentos aleatorizados controlados para determinar efectos causales. Se discuten conceptos clave como el tratamiento, el control y el problema de datos faltantes en la causalidad, así como la aplicación del test exacto de Fisher para evaluar la efectividad de un tratamiento. Además, se presentan ejercicios prácticos para ilustrar la aplicación de estos conceptos en estudios reales.

Cargado por

raliendre
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Clase MES205 - Estadı́stica 2

Solemne

Daniela Jensen -
Clases PasaInvicto

September 24, 2022

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 1 / 103
Agenda

Tópico 1: Inferencia causal: Resultados potenciales. Test exacto de Fisher


Tópico 2: Variables aleatorias multivariadas.
Tópico 3: Distribuciones condicionales.
Tópico 4: Distribución normal bivariada
Tópico 5: Estadı́sticas descriptivas bivariadas.
Tópico 6: Estimación: Conceptos. Error cuadrático medio. Método de momentos
Tópico 7: Estimación máximo verosı́mil

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 2 / 103
Tópico 1

Inferencia causal: Resultados potenciales. Test exacto de Fisher

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 3 / 103
Causalidad

Conceptos básicos:
Unidad: Un objeto fı́sico en un momento particular en el tiempo.
Tratamiento: Una intervención activa aplicada en un momento particular en el tiempo,
cuyos efectos deseamos evaluar en relación con ninguna intervención (el control).
Resultados potenciales: Resultados que se observarı́an si se aplicara un tratamiento activo
y que se observarı́an si se aplicara un tratamiento de control.
Efecto Causal: Comparación de los resultados potenciales bajo el tratamiento activo y el
tratamiento de control, para cada unidad.

¿Cuál es el problema en causalidad? No podemos observar efectos causales porque no podemos


volver a un punto anterior en el tiempo para administrar el otro tratamiento.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 4 / 103
Causalidad como un problema de datos faltantes

El problema fundamental que enfrenta la inferencia causal es que podemos observar como
máximo un resultado potencial para cada unidad. Es decir, determinar causalidad es un
problema de datos faltantes (missing data en inglés):
Para cada unidad, el dato faltante es el resultado potencial que no observamos.
Si la unidad es tratada, observamos su resultado potencial bajo tratamiento, pero no
observamos su resultado potencial bajo control.
Si la unidad es control, observamos su resultado potencial bajo control, pero no
observamos su resultado potencial bajo tratamiento.

De este modo, el problema de inferencia causal radica en cómo nos enteramos de (aprendemos
sobre) los resultados potenciales que faltan y, por tanto, de los efectos causales.

Un elemento básico para esta tarea es que necesitamos múltiples unidades: al menos una unidad
recibe tratamiento activo y al menos una unidad recibe el tratamiento de control.

Mecanismo de asignación al tratamiento


El mecanismo de asignación al tratamiento se define como el proceso que rige qué unidades
reciben tratamiento y cuáles reciben control.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 5 / 103
Experimentos aleatorizados controlados

Los experimentos aleatorizados son los estudios que permiten dar la mayor confiabilidad y
validez cuando se busca determinar si una variable (el tratamiento) produce un efecto en otra
variable (el resultado).

Un experimento aleatorizado bien diseñado tiene tres elemento esenciales:


Grupos de control / tratamiento.
Asignación aleatoria del tratamiento, el que está controlado por investigador a cargo del
estudio.
Replicación.

De esta forma, se garantiza que las variables pretratamiento (observada o no observada) y los
resultados potenciales no estén asociadas con la asignación al tratamiento.

Por tanto, cualquier diferencia en la variable de resultado entre los grupos de tratamiento y
control puede ser atribuida al efecto del tratamiento.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 6 / 103
Test exacto de Fisher aplicado a causalidad
Podemos analizar los datos observados de experimentos aleatorizados para aprender sobre los
resultados potenciales que no observamos, utilizando el mecanismo de asignación del
tratamiento como base para la inferencia estadı́stica.

Especı́ficamente, el plan es implementar un test de hipótesis para evaluar si un tratamiento es


efectivo sobre la base de los datos observados de un experimento aleatorizado.
La idea es aplicar el marco de valores-p exactos de Fisher a causalidad.

La hipótesis nula es que el tratamiento no tiene efecto alguno, para lo cual debemos especificar
qué significa que el tratamiento no tiene efecto.

Hay dos posibilidades:


1 El tratamiento no tuvo efecto para ninguno de las unidades.
2 El tratamiento tuvo efecto, pero fue positivo para algunos y negativo para otros y, en
promedio, es cero.
La primera posibilidad es más exigente, es decir, si se cumple la primera se cumple la segunda
pero no viceversa. En general, vamos a analizar la primera posibilidad.

La Nula dura
Formalizamos esta hipótesis como sigue:

H0 : Yi (1) = Yi (0), i = 1, 2, ..., n

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 7 / 103
Ejercicio 1

La Defensorı́a Penal Pública desea determinar si la asistencia a un curso de rehabilitación en


prisión disminuye la reincidencia criminal. Para esto, un grupo de infractores primerizos que
cumplı́a condena se asigna al azar al grupo de tratamiento y de control, donde el grupo de
tratados consiste en quienes reciben el curso de rehabilitación, y el grupo de control, en quienes
no reciben el curso. Para cada participante en el estudio se registra si reincidió en activiades
criminales o no en un perı́odo de 10 años después de cumplir su condena. Identifique a las
unidades del estudio, el tratamiento y escriba los resultados potenciales que existen en este
estudio para cada unidad.

Solución:

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 8 / 103
Ejercicio 1

La Defensorı́a Penal Pública desea determinar si la asistencia a un curso de rehabilitación en


prisión disminuye la reincidencia criminal. Para esto, un grupo de infractores primerizos que
cumplı́a condena se asigna al azar al grupo de tratamiento y de control, donde el grupo de
tratados consiste en quienes reciben el curso de rehabilitación, y el grupo de control, en quienes
no reciben el curso. Para cada participante en el estudio se registra si reincidió en activiades
criminales o no en un perı́odo de 10 años después de cumplir su condena. Identifique a las
unidades del estudio, el tratamiento y escriba los resultados potenciales que existen en este
estudio para cada unidad.

Solución:
Las unidades son los individuos del grupo de infractores primerizos que cumplı́a condena
que participan en el estudio. Supongamos n infractores primerizos que cumplı́a condena
que participan en el estudio, que los indexaremos por i = 1, 2, 3, ..., n.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 9 / 103
Ejercicio 1

La Defensorı́a Penal Pública desea determinar si la asistencia a un curso de rehabilitación en


prisión disminuye la reincidencia criminal. Para esto, un grupo de infractores primerizos que
cumplı́a condena se asigna al azar al grupo de tratamiento y de control, donde el grupo de
tratados consiste en quienes reciben el curso de rehabilitación, y el grupo de control, en quienes
no reciben el curso. Para cada participante en el estudio se registra si reincidió en activiades
criminales o no en un perı́odo de 10 años después de cumplir su condena. Identifique a las
unidades del estudio, el tratamiento y escriba los resultados potenciales que existen en este
estudio para cada unidad.

Solución:
Las unidades son los individuos del grupo de infractores primerizos que cumplı́a condena
que participan en el estudio. Supongamos n infractores primerizos que cumplı́a condena
que participan en el estudio, que los indexaremos por i = 1, 2, 3, ..., n.
Tratamiento activo: asistir a curso de rehabilitación.
Tratamiento de control: no asistir a curso de rehabilitación.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 10 / 103
Ejercicio 1

La Defensorı́a Penal Pública desea determinar si la asistencia a un curso de rehabilitación en


prisión disminuye la reincidencia criminal. Para esto, un grupo de infractores primerizos que
cumplı́a condena se asigna al azar al grupo de tratamiento y de control, donde el grupo de
tratados consiste en quienes reciben el curso de rehabilitación, y el grupo de control, en quienes
no reciben el curso. Para cada participante en el estudio se registra si reincidió en activiades
criminales o no en un perı́odo de 10 años después de cumplir su condena. Identifique a las
unidades del estudio, el tratamiento y escriba los resultados potenciales que existen en este
estudio para cada unidad.

Solución:
Las unidades son los individuos del grupo de infractores primerizos que cumplı́a condena
que participan en el estudio. Supongamos n infractores primerizos que cumplı́a condena
que participan en el estudio, que los indexaremos por i = 1, 2, 3, ..., n.
Tratamiento activo: asistir a curso de rehabilitación.
Tratamiento de control: no asistir a curso de rehabilitación.
Resultados potenciales:
Yi (1): indicador de si el infractor primerizo i reincide o no en crimen dentro de 10 años
después de cumplir su condena si asiste al curso de rehabilitación.
Yi (0): indicador de si el infractor primerizo i reincide o no en crimen dentro de 10 años
después de cumplir su condena si no asiste al curso de rehabilitación.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 11 / 103
Ejercicio 2

Se llevó a cabo un experimento completamente aleatorizado para determinar el efecto de un


programa de becas de arancel y de manutención sobre la deserción estudiantil durante el primer
año de educación superior. Para este experimento, consideramos ocho estudiantes de escasos
recursos recién matriculados en la universidad, con cuatro asignados a tratamiento activo (con
beca) y cuatro asignados a control (sin beca). Al final del primer año, para cada participante en
el experimento, se registra si abandonó lo estudios (Y obs = 1) o no los abandonó (Y obs = 0).
La tabla que sigue presenta la información que observamos del experimento.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 12 / 103
Ejercicio 2
La tabla que sigue presenta la información que observamos del experimento.

Estamos interesados en estimar el efecto causal del programa de becas en la deserción durante
el primer año de universidad.
Especifique la hipótesis nula dura de Fisher y calcule el valor-p exacto de Fisher usando el
estadı́stico de prueba dado por la diferencia de medias:

T = Ȳtobs − Ȳcobs

donde t hace referencia a los tratados, mientras que c a los controles.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 13 / 103
Ejercicio 2

Solución:
A partir de los datos observados del experimento aleatorizado, tenemos que:

1+0+0+0
Ȳtobs = = 0, 25
4
1+1+0+0
Ȳcobs = = 0, 5
4
Además, recordemos que la nula dura de Fisher tiene la siguiente forma:

H0 : Yi (1) = Yi (0), i = 1, 2, 3, 4, 5, 6, 7, 8

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 14 / 103
Ejercicio 2
Solución:
A partir de los datos observados del experimento aleatorizado, tenemos que:
1+0+0+0
Ȳtobs = = 0, 25
4
1+1+0+0
Ȳcobs = = 0, 5
4
Además, recordemos que la nula dura de Fisher tiene la siguiente forma:
H0 : Yi (1) = Yi (0), i = 1, 2, 3, 4, 5, 6, 7, 8
Por ende, si rellenamos según la hipótesis anterior la tabla, quedarı́a:

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 15 / 103
Ejercicio 2

Solución:
Luego, tal como indica el enunciado, utilizamos el siguiente estadı́stico para calcular el valor-p:

T = Ȳtobs − Ȳcobs

Tenemos 8 unidades en total, con un diseño de 4 tratados y 4 controles. Luego, tenemos que

tobs = 0, 25 − 0, 5 = −0, 25

Recordemos de Estadı́stica 1 que rechazabamos H0 si:

−1, 96 ≤ tobs ≤ 1, 96

Por lo tanto, no existe evidencia para rechazar la nula.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 16 / 103
Tópico 2

Variables aleatorias multivariadas

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 17 / 103
Distribución Conjunta

Definición: La Función de Probabilidad Conjunta (f.p. Conjunta) de las variables aleatorias Y y


X es la función pX ,Y dada por:

fX ,Y = Pr (X = x, Y = y )

Definición: La Función de Distribución Acumulada Conjunta de las variables aleatorias Y y X es


la función FX ,Y dada por:
FX ,Y = Pr (X ≤ x, Y ≤ y )

Definición: Para las variables aleatorias discretas X e Y la función de probabilidad marginal de


X es X
Pr (X = x) = Pr (X = x, Y = y )
y

Definición: Sean X e Y variables aleatorias continuas con distribución conjunta fX ,Y , la


marginal de X es: Z ∞
fX (x) = fX ,Y (x, y )dy
−∞

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 18 / 103
Independencia

Diremos que si X e Y son independientes si para todo x e y ,

FX ,Y (x, y ) = FX (x)FY (y )

Si X e Y son varias aletorias discretas, la condición es:

Pr (X = x, Y = y ) = Pr (X = x)Pr (Y = y )

Cuando las variables aleatorias son independientes, se cumple además

Pr (Y = y |X = x) = Pr (Y = y )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 19 / 103
Covarianza

Definición: La covarianza entre dos variables aleatorias X e Y se define como

Cov (X , Y ) = E [(X − E (X ))(Y − E (Y ))]

Lo que es equivalente a,
Cov (X , Y ) = E [XY ] − E [X ]E [Y ]

Teorema: Si X e Y son variables aleatorias independientes, entonces no están correlacionadas


(Cov (X , Y ) = 0)

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 20 / 103
Covarianza e Independencia

Si bien cuando dos variables son independientes su covarianza es igual a cero, no se cumple que
cuando la covarianza es cero son independientes.

La covarianza mide una relación lineal, y la dependencia estadı́stica puede darse de forma no
lineal.

Propiedades importantes de las covarianzas:


Cov (X , X ) = Var (X )
Cov (X , Y ) = Cov (Y , X )
Cov (X , c) = 0 si c es una constante
Cov (X + Y , Z ) = Cov (X , Z ) + Cov (Y , Z )
Cov (X + Y , Z + W ) = Cov (X , Z ) + Cov (Y , Z ) + Cov (X , W ) + Cov (Y , W )
Var (X + Y ) = Var (X ) + Var (Y ) + 2Cov (X + Y )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 21 / 103
Correlación

Dado que el valor de la covarianza depende de las unidades en que se miden las variables
aleatorias, es conveniente definir una medida de relación entre variables que no dependa de las
unidades en que se miden las variables.

Definición: La correlación entre dos variables aleatorias, X e Y se define como

Cov (X , Y )
Corr (X , Y ) = p
Var (X )Var (Y )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 22 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

a) Determine la densidad marginal de X . Denótela por fX (x).


b) Calcule E (X ), E (X 2 ), Var (X )

Si se calcula la densidad marginal de Y , fY (y ) se puede obtener que


E (Y ) = 11/9, Var (Y ) = 23/81. Además, se puede obtener que Cov (X , Y ) = −1/81 (tome
todo esto como un dato, no es necesario que lo demuestre).

c) Determine Var (2X − 3Y + 8)

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 23 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

a) Determine la densidad marginal de X . Denótela por fX (x).

Solución:

Recordemos que:
Z
fX (x) = fX ,Y (x, y )dy

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 24 / 103
Ejercicio 3
Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

a) Determine la densidad marginal de X . Denótela por fX (x).

Solución:
Z 2
1
fX (x) = (x + y )dy
0 3
y2 2
 
1
= xy + |0
3 2
1
= (2x + 2)
3
2
= (x + 1)
3

Luego,
2
fX (x) = (x + 1), 0<x <1
3

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 25 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

b) Calcule E (X ), E (X 2 ), Var (X )

Solución:
Usando la definición de esperanza:
Z
E (X ) = x · fX (x)dx

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 26 / 103
Ejercicio 3
Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

b) Calcule E (X ), E (X 2 ), Var (X )

Solución:
Usando la definición de esperanza:
Z
E (X ) = x · fX (x)dx

Luego, desarrollando:
Z 1 2
E (X ) = x·
(x + 1)dx
0 3
 3
x2 1

2 x
= + |0
3 3 2
5
=
9

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 27 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

b) Calcule E (X ), E (X 2 ), Var (X )

Solución:
Usando LEI: Z
E (X 2 ) = x 2 · fX (x)dx

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 28 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

b) Calcule E (X ), E (X 2 ), Var (X )

Solución:
Usando LEI: E (X 2 ) = x 2 · fX (x)dx.
R

Z
2 1
E (X 2 ) = x2 ·
(x + 1)dx
0 3
 4
x3 1

2 x
= + |0
3 4 3
7
=
18

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 29 / 103
Ejercicio 3
Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

b) Calcule E (X ), E (X 2 ), Var (X )

Solución:
Usando LEI: E (X 2 ) = x 2 · fX (x)dx.
R

Z
2 1
E (X 2 ) = x2 ·
(x + 1)dx
0 3
2 x4 x3 1
 
= + |0
3 4 3
7
=
18

Finalmente,  2
7 5 13
Var (X ) = E (X 2 ) − E (X )2 = − =
18 9 162

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 30 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

Si se calcula la densidad marginal de Y , fY (y ) se puede obtener que


E (Y ) = 11/9, Var (Y ) = 23/81. Además, se puede obtener que Cov (X , Y ) = −1/81 (tome
todo esto como un dato, no es necesario que lo demuestre).
c) Determine Var (2X − 3Y + 8)

Solución:
Usando las propiedades de la varianza y la covarianza, junto a los datos del enunciado y la
varianza calculada en b) tenemos que:

Var (2X − 3Y + 8) = 4Var (X ) + 9Var (Y ) − 2 · 2 · 3Cov (X , Y )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 31 / 103
Ejercicio 3

Sean X e Y variables aleatorias continuas con densidad conjunta:

1
fX ,Y (x, y ) = (x + y ), si 0 < x < 1, 0<y <2
3

Si se calcula la densidad marginal de Y , fY (y ) se puede obtener que


E (Y ) = 11/9, Var (Y ) = 23/81. Además, se puede obtener que Cov (X , Y ) = −1/81 (tome
todo esto como un dato, no es necesario que lo demuestre).
c) Determine Var (2X − 3Y + 8)

Solución:
Usando las propiedades de la varianza y la covarianza, junto a los datos del enunciado y la
varianza calculada en b) tenemos que:

Var (2X − 3Y + 8) = 4Var (X ) + 9Var (Y ) − 2 · 2 · 3Cov (X , Y )


13 23 1
= 4· +9· + 12 ·
162 81 81
245
=
81

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 32 / 103
Tópico 3

Distribuciones condicionales

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 33 / 103
Variables aleatorias condicionadas

Para las variables aleatorias discretas X e Y la función de probabilidad condicional de Y dado


X = x es:
Pr (X = x, Y = y )
Pr (Y = y |X = x) =
Pr (X = x)
con Pr (X = x) > 0.

Usando el Teorema de Bayes, podemos reescribir la distribución condicional como:

Pr (X = x|Y = y )Pr (Y = y )
Pr (Y = y |X = x) =
Pr (X = x)

Y por Teorema de Probabilidades Totales, podemos reescribir Pr (X = x) como:


X
Pr (X = x) = Pr (X = x|Y = y )Pr (Y = y )
y

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 34 / 103
Esperanza Condicional a un evento

Recordar que E (Y ), para una variable aleatoria discreta, es un promedio ponderado de los
posibles valores que puede tomar Y , donde cada ponderación es la Pr (Y = y ).
Ahora, vamos a calcular una esperanza condicional, es decir, calcularemos la esperanza de Y
dado que ocurre un evento A, E (Y |A). Las ponderaciones ahora serán Pr (Y |A).

Definición: Sea A un evento con probabilidad positiva.


P
Si Y es una v.a. discreta, entonces, E (Y |A) = y yPr (Y = y |A).
R∞
Si Y es una v.a. continua, entonces, E (Y |A) = −∞ yf (y |A)dy , donde f (y |A) es la
función de densidad de y condicional en A.

Ley de Esperanzas Total:


Sea A1 , ..., An una partición del espacio muestral S, con Pr (Ai ) > 0. Sea Y una v.a. en S,
entonces,
n
X
E (Y ) = E (Y |Ai )Pr (Ai )
i

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 35 / 103
Esperanza Condicional en una v.a.

Propiedad 1: Si X e Y son independientes, E (Y |X ) = E (Y ) (conocer X no agrega valor).

Propiedad 2: Para una función h, E (h(x)Y |X ) = h(X )E (Y |X )

Propiedad 3: Linealidad. E (Y1 + Y2 |X ) = E (Y1 |X ) + E (Y2 |X ) y E (cY |X ) = cE (Y |X )

Propiedad 4: Ley de ADAM. E (E (Y |X )) = E (Y )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 36 / 103
Varianza Condicional en una v.a.

La varianza condicional de Y dado X es:

Var (Y |X ) = E [(Y − E (Y |X ))2 |X ] = E (Y 2 |X ) − (E (Y |X ))2

Teorema: Sean X e Y variables aleatorias,

Var (Y ) = E [Var (Y |X )] + Var [E (Y |X )]

Conocida como la ley de Eva (Esperanza-Varianza-Varianza-Esperanza (EVVE)).

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 37 / 103
Tips importantes

Sea E (Y |X ) = c, con c constante, entonces E (Y ) = c.


Demostración: Por Ley de Esperanzas Iteradas (LEI), E (E (Y |X )) = E (c) = c

Sea E (Y |X ) = c, con c constante, entonces E (XY ) = cE (X ).


Demostración: Por Ley de Esperanzas Iteradas,
E (XY ) = E (E (XY |X )) = E (XE (Y |X )) = cE (X )

Sea E (Y |X ) = c, con c constante, entonces Cov (X , Y ) = 0.


Demostración: Cov (X , Y ) = E (XY ) − E (X )E (Y ), pero

E (Y ) = E [E (Y |X )] = E (c) = c
E (XY ) = E [E (XY |X )] = E [XE (Y |X )] = cE (X )

Entonces, Cov (X , Y ) = cE (X ) − E (X )c = 0

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 38 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
a) Suponga que llegan 212 niñas a probarse. ¿Cuál es la distribución del número de niñas
que queda seleccionada, dada la información anterior? ¿Cuál es la esperanza y varianza de
esta distribución?
b) Suponga ahora que llegan n niñas a las pruebas (con n ≥ 0). Vuelva a responder la parte
anterior.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 39 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
a) Suponga que llegan 212 niñas a probarse. ¿Cuál es la distribución del número de niñas
que queda seleccionada, dada la información anterior? ¿Cuál es la esperanza y varianza de
esta distribución?

Solución:
La probabilidad de que cada niña quede seleccionada sigue una distribución Bernoulli con
p = 0, 25. Pero sabemos que son muchas niñas las que van a probarse, especı́ficamente
212.

Por eso podemos decir que seguirá una distribución Binomial con n = 212 repeticiones y
probabilidad de éxito p = 0, 25.

Como sigue una distribución binomial su esperanza será np = 212 · 0, 25 = 53 y su


varianza np(1 − p) = 212 · 0, 25(1 − 0, 25) = 39, 75.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 40 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
b) Suponga ahora que llegan n niñas a las pruebas (con n ≥ 0). Vuelva a responder la parte
anterior.

En caso de que lleguen n niñas, entonces Y va a seguir una distribución binomial donde
n = n y p = 0, 25. Por lo tanto ahora debemos calcular:

E (Y |N = n), Var (Y |N = n)

Al igual que en a), sabemos que si Y sigue una distribución binomial su esperanza será np
y su varianza np(1 − p). En este caso la esperanza y varianza serán 0, 25n y 0, 1875n.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 41 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.

Solución:
Ahora nos están pidiendo la esperanza y varianza incondicional, es decir, sin condicionar a
un valor determinado de N. Además, consideremos que N ∼ Normal(µ = 200, σ 2 = 16).
Para calcular la esperanza incondicional usamos la Ley de Adán:

E (Y ) = E (E (Y |N))

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 42 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.

Solución:
Ahora nos están pidiendo la esperanza y varianza incondicional, es decir, sin condicionar a
un valor determinado de N. Además, consideremos que N ∼ Normal(µ = 200, σ 2 = 16).
Para calcular la esperanza incondicional usamos la Ley de Adán:

E (Y ) = E (E (Y |N))
E (0, 25N) = 0, 25 · E (N)
= 0, 25 · 200
= 50

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 43 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.

Solución:
Para calcular la varianza incondicional usamos la Ley de Eva:

Var (Y ) = E (Var (Y |N)) + Var (E (Y |N))

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 44 / 103
Ejercicio 4

Suponga que en un equipo de fútbol se hacen pruebas masivas para contratar nuevas jugadoras
para las divisiones inferiores. El número de niñas que llega a probarse cada domingo sigue una
distribución Normal con media 200 y varianza 16. A su vez, la probabilidad de que una jugadora
quede seleccionada es 0.25, y es independiente de la probabilidad que seleccionen a otra.
c) ¿Cuál es la varianza y la esperanza del número de niñas que quedan seleccionadas? Hint:
Utilice la Ley de Adán y la Ley de Eva.

Solución:
Para calcular la varianza incondicional usamos la Ley de Eva:

Var (Y ) = E (Var (Y |N)) + Var (E (Y |N))


= E (0, 1875N) + Var (0, 25N)
= 0, 1875 · E (N) + 0, 0625 · Var (N)
= 0, 1875 · 200 + 0, 0625 · 16
= 38, 5

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 45 / 103
Tópico 4

Distribución normal bivariada

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 46 / 103
Distribución normal bivariada

La función de densidad de una Normal Bivariada para (X , Y ) con distribuciones marginales


N(0, 1) y correlación ρ es:
 
1 1
fX ,Y (x, y ) = exp − 2 (x 2 + y 2 − 2ρxy )
2πτ 2τ
p
donde τ = 1 − ρ2 .

Si (X , Y ) es una normal bivariada donde la distribución de X e Y es una normal estándar y la


correlación de X e Y es ρ, entonces podemos escribir:
p
Y = ρX + 1 − ρ2 V

donde V es una normal estándar independiente de X .

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 47 / 103
Distribución normal bivariada

Nótese que:
Sean (X , Y ) v.a. independientes que siguen una distribución normal estandarizada,
entonces la distribución de (X + Y , X − Y ) es una Normal Bivariada ya que X + Y es
independiente de X − Y .
Sean (X , Y ) v.a. que siguen una distribución Normal Bivariada, con X e Y siguiendo una
normal estandarizada, con correlación ρ entre X e Y , entonces (X + Y , X − Y ) también
siguen una Normal Bivariada.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 48 / 103
Distribución normal bivariada

Suponga que tenemos dos v.a. independientes X , Y ∼ N(0, 1) y queremos generar variables
aleatorias (Z , W ) que tengan una distribución Normal Bivariada, con Corr (Z , W ) = ρ y con
Z , W siguiendo distribuciones marginales N(0, 1). Por definición, todo (Z , W ) que sea de la
forma

Z = aX + bY
W = cX + dY

seguirá una distribución Normal Bivariada.

¿Qué valores deben tomar a, b, c, d para lograr lo que queremos?


Primero, las varianzas tienen que ser iguales a 1, por lo tanto, a2 + b 2 = 1, c 2 + d 2 = 1.
La covarianza entre Z y W tiene que ser igual a ρ, entonces, ac + bd = ρ.

Finalmente, tendremos que:

Z = X
p
W = ρX + 1 − ρ2 Y

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 49 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).
b) ¿Siguen (V , W ) una distribución normal bivariada?
c) ¿Para qué valor de a las variables V y W son independientes?

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 50 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).

Solución:

E (V ) = E (X ) = 0
E (W ) = E (ρX + aY ) = 0
Var (V ) = Var (X ) = 1

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 51 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).

Solución:
E (V ) = 0, E (W ) = 0, Var (V ) = 1

Luego,

Var (W ) = Var (ρX + aY )


= ρ2 Var (X ) + a2 Var (Y ) + 2ρaCov (X , Y )
= ρ2 + a2 + 2ρ2 a

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 52 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).

Solución:
Finalmente,

Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY )) − 0

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 53 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).

Solución:
Finalmente,

Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY ))
= E (ρX 2 + aYX )
= ρE (X 2 ) + aE (XY )

Recordemos que: Var (X ) = E (X 2 ) − E (X )2 y que Cov (X , Y ) = E (XY ) − E (X )E (Y )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 54 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).

Solución:
Finalmente,

Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY ))
= E (ρX 2 + aYX )
= ρE (X 2 ) + aE (XY )
= ρVar (X ) + aCov (X , Y )
= ρ + ρa
= ρ(1 + a)

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 55 / 103
Ejercicio 5
Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

a) Defina V = X y W = ρX + aY con a ∈ R. Calcule


E (V ), E (W ), Var (V ), Var (W ), Corr (V , W ).

Solución:
Finalmente,

Cov (V , W ) = E (VW ) − E (V )E (W )
= E (X (ρX + aY ))
= E (ρX 2 + aYX )
= ρE (X 2 ) + aE (XY )
= ρVar (X ) + aCov (X , Y )
= ρ + ρa
= ρ(1 + a)

Con lo que,
Cov (V , W ) ρ(1 + a)
Corr (V , W ) = p = p
Var (V )Var (W ) ρ2 + a2 + 2ρ2 a

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 56 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

b) Sean V = X y W = ρX + aY con a ∈ R. ¿Siguen (V , W ) una distribución normal


bivariada?

Solución:
(V , W ) van a seguir una distribución normal bivariada si todas las combinaciones lineales
de V y W siguen una distribución normal. Sabemos que X e Y siguen una distribución
normal bivariada, por lo que las combinaciones de X e Y siguen una distribución normal.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 57 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

b) Sean V = X y W = ρX + aY con a ∈ R. ¿Siguen (V , W ) una distribución normal


bivariada?

Solución:
(V , W ) van a seguir una distribución normal bivariada si todas las combinaciones lineales
de V y W siguen una distribución normal. Sabemos que X e Y siguen una distribución
normal bivariada, por lo que las combinaciones de X e Y siguen una distribución normal.
Luego, como las combinaciones lineales de V y W son a su vez combinaciones lineales de
X e Y entonces V y W siguen también una normal bivariada.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 58 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

c) ¿Para qué valor de a las variables V y W son independientes?

Solución:
Como V y W siguen una normal bivariada, serán independientes si y solo si su correlación
es igual cero. Es decir, queremos que:

ρ(1 + a)
Corr (V , W ) = p =0
ρ2 + a2 + 2ρ2 a

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 59 / 103
Ejercicio 5

Suponga que (X , Y ) siguen una distribución normal bivariada con los siguientes parámetros:
E (X ) = E (Y ) = 0, Var (X ) = Var (Y ) = 1 y Corr (X , Y ) = ρ con −1 < ρ < 1.

c) ¿Para qué valor de a las variables V y W son independientes?

Solución:
Como V y W siguen una normal bivariada, serán independientes si y solo si su correlación
es igual cero. Es decir, queremos que:

ρ(1 + a)
Corr (V , W ) = p =0
ρ2 + a2 + 2ρ2 a

Luego, para que V y W son independientes se requiere que a = −1.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 60 / 103
Tópico 5

Estadı́sticas descriptivas bivariadas

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 61 / 103
Estadı́sticas descriptivas
Media:
n
x1 + x2 + ... + xn 1X
x̄ = = xi
n n i=1

Varianza:
n
(x1 − x̄)2 + x2 − x̄)2 + ... + xn − x̄)2 1X
σ̂x2 = = (xi − x̄)2
n n i=1

Covarianza: Mide la asociación lineal entre las observaciones de las variables.

n
(x1 − x̄)(y1 − ȳ ) + ... + (xn − x̄)(yn − ȳ ) 1X
σ̂x,y = = (xi − x̄)(yi − ȳ )
n n i=1

Sean X e Y v.a. independientes con distribución conjunta común, la covarianza será:

σX ,Y = E [(Xi − µX )(Yi − µY )], i = 1, 2, ..., n

Correlación entre las v.a. X e Y :


σX ,Y
ρXY =
σX σY

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 62 / 103
Correlación de Pearson

Se dispone de pares ordenados (x1 , y1 ), ..., (xm , ym ) donde los yi son lineales en los xi ,

yi = a + bxi , i = 1, ..., m

La correlación de Pearson se define como:

σ̂x,y
rx,y =
σ̂x σ̂y

donde
1 Pm
σ̂x,y = m i=1 (xi − x̄)(yi − ȳ )
1 Pm
σ̂x = m i=1 (xi − x̄)2
1 Pm
σ̂y = m i=1 (yi − ȳ )2

Notar también que −1 ≤ rx,y ≤ 1.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 63 / 103
Tópico 6

Estimación: Conceptos. Error cuadrático medio. Método de


momentos

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 64 / 103
Estimación de modelos estadı́sticos

A partir de ahora veremos cómo estimar los parámetros de un modelo estadı́stico. Esto
complementa los dos métodos que ya vimos: test de hipótesis simple e intervalos de confianza.

Tres métodos de estimación:


Método de momentos
Estimación máximo verosı́mil
Estimación bayesiana

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 65 / 103
El problema de estimación: Caso univariado

Datos: x1 , ..., xn

Modelo estadı́stico: Las xi son realizaciones de Xi que son i.i.d. con f.d.p f (x) que depende de
θ, donde θ son los parámetros del modelo y Θ es el conjunto de valores que puede tomar θ.

Parámetro de interés: Lo que se desea estimar, será una función de θ.

Definición: Estimador
Sea Xi i.i.d. con distribución común descrita por θ ∈ Θ. Un estimador de θ es una función de
las v.a. del modelo que se usa para estimar θ:

θ̂ = θ̂(X1 , X2 , ..., Xn )

El valor estimado de θ viene dado por:

θ̂ = θ̂(x1 , x2 , ..., xn )

La diferencia entre el estimador y el valor estimado de θ es importante:


El estimador es una variable aleatoria.
El valor estimado es un número.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 66 / 103
Sesgo de un estimador y estimadores insesgados

Sesgo de un estimador
El sesgo de un estimador θ̂ de θ se define como:

b(θ) = E (θ̂) − θ

Mide la diferencia promedio entre el estimador y el parámetro que se desea estimar. En general,
toma valores distintos a medida que varı́a θ. Es positivo cuando, en promedio, θ̂ > θ y negativo
cuando, en promedio, θ̂ < θ.

Estimador insesgado
Diremos que θ̂ es un estimador insesgado de θ si b(θ) = 0 para todo θ ∈ Θ.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 67 / 103
Método de Momentos (MdM)

La idea procede en dos pasos:


1 Exprese el parámetro de interés en función de los momentos del modelo.
2 El estimador MdM se obtiene reemplazando los momentos de la expresión anterior por los
momentos muestrales.

Dos conceptos claves:


Momento de una variable aleatoria:
Definimos el k-ésimo momento de una variable aleatoria X mediante:

µk = E [X k ], k = 1, 2, 3, ...

Momento muestral de una muestra aleatoria:


Considere una muestra aleatoria X1 , ..., Xn . El k-ésimo momento muestral se define como:

n
1X k
Mk = X
n i=1 i

El estimador MdM de un momento de una v.a. es el momento muestral correspondiente.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 68 / 103
Problema de los estimadores MdM

Es habitual que haya más de un estimador MdM para un modelo estadı́stico. Esto es
problemático porque:
Obliga a elegir entre los posibles estimadores, lo cual se puede hacer, pero puede ser bien
trabajoso.
Mucho mejor serı́a que hubiera un solo estimador MdM y que, en algún sentido, este
siempre fuera un buen estimador.
Veremos que, a diferencia de los MdM, los estimadores máximo verosı́miles y bayesianos tienen
la propiedad anterior.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 69 / 103
Comparando estimadores

Sea X1 , ..., Xn i.i.d. con una distribución común que depende de un parámetro θ ∈ Θ. Se desea
comparar dos estimadores de θ, θ1 y θ2 . La intuición es que θ1 es un mejor estimador que θ2 si,
en promedio, está más cerca de θ.

Error Cuadrático Medio de un estimador


Dado un estimador θ̂ de θ y un valor θ ∈ Θ, definimos el error cuadrático como:

ECM(θ) = E [(θ̂ − θ)2 ]

ECM(θ) mide el promedio del cuadrado del error que se comete estimando θ como θ̂.

Considere que:
Siempre ECM(θ) ≥ 0.
Mientra más pequeño es el ECM(θ), más preciso es el estimador.
ECM(θ) se calcula usando la distribución de θ̂ cuando el parámetro verdadero es θ.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 70 / 103
Teorema: ECM, varianza y sesgo

Recordar que el sesgo de un estimador es:

b(θ) = E (θ̂) − θ

Entonces,
ECM(θ) = Var (θ̂) + [b(θ)]2
En palabras, el error cuadrático medio es igual a la suma de la varianza y el sesgo al cuadrado.

Consecuencia: Si θ̂ es un estimador insesgado de θ, entonces,

ECM(θ) = Var (θ̂)

Comentarios:
Un pequeño sesgo reduce el ECM porque el sesgo viene acompañado de una reducción de
la varianza que más que compensa el sesgo.
Tradeoff sesgo-varianza: Contraer un estimador insesgado multiplicándolo por una
constante un poco menor que uno puede reducir el ECM. Los estimadores que se obtienen
de esta forma se conocen como estimadores de contracción.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 71 / 103
Propiedades de los estimadores

Estimador consistente:
Diremos que θ̂n es un estimador consistente de θ si:

(∀θ ∈ Θ) lim θ̂n = θ


n→∞

Aplicando la noción de convergencia que usamos en la LGN, tenemos que la siguiente definición
es equivalente:
(∀θ ∈ Θ) lim E (θ̂n − θ)2 = 0
n→∞

Es decir, θ̂n es un estimador consistente si ∀θ ∈ Θ, el ECM tiende a 0 cuando n tiende a infinito.

Como otro resultado equivalente, diremos que θ̂n es un estimador consistente si

(∀θ ∈ Θ) lim Var (θ̂n ) = 0 y lim bn (θ) = 0


n→∞ n→∞

El resultado anterior signica que el sesgo de un estimador consistente tiende a cero cuando el
tamaño de la muestra aleatoria tiende a infinito. Esto es muy distinto a exigir que el sesgo sea
igual a cero para todo n, como sucede cuando un estimador es insesgado.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 72 / 103
Propiedades de los estimadores

Los estimadores MdM tienen las siguientes propiedades:


Son consistentes
No necesariamente son insesgados
Son invariantes
Dado un modelo estadı́stico, en general existen muchos estimadores MdM.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 73 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

a) Derive el estimador MdM de θ que depende solo del primer momento muestral.
b) Calcule el ECM del estimador. ¿Es insesgado?¿Es consistente?
c) Compare el ECM del estimador de este ejercicio con aquel del máximo de los Xi . Uno de
los dos es muchı́simo mejor que el otro. ¿Cuál?

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 74 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

a) Derive el estimador MdM de θ que depende solo del primer momento muestral.

Solución:
RECORDATORIO: El primer momento de Xi será: µ1 = E (Xi ).

Tenemos que
θ
E (Xi ) = µ1 =
2
Luego, θ = 2µ1 .

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 75 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

a) Derive el estimador MdM de θ que depende solo del primer momento muestral.

Solución:
RECORDATORIO: El primer momento de Xi será: µ1 = E (Xi ).

Tenemos que
θ
E (Xi ) = µ1 =
2
Luego, θ = 2µ1 .

RECORDATORIO: El estimador MdM P de un momento será el momento muestral


correspondiente, es decir, M1 = n1 ni=1 Xi = X̄

Luego, un estimador MdM de θ serı́a:

θ̂ = 2M1 = 2X̄

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 76 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

b) Calcule el ECM del estimador. ¿Es insesgado?¿Es consistente?

Solución:
θ θ2
RECORDATORIO: E (Xi ) = 2
, Var (Xi ) = 12
.

Sabemos que ECM(θ) = Var (θ̂) + b(θ)2 . Veremos primero el sesgo:

1 2θ
E (θ̂) = E (2X̄ ) = 2E (X̄ ) = 2 · · nE (Xi ) = =θ
n 2

por lo que el sesgo del estimador es cero.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 77 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

b) Calcule el ECM del estimador. ¿Es insesgado?¿Es consistente?

Solución:
θ θ2
RECORDATORIO: E (Xi ) = 2
, Var (Xi ) = 12
.

Sabemos que ECM(θ) = Var (θ̂) + b(θ)2 . Veremos primero el sesgo:

1 2θ
E (θ̂) = E (2X̄ ) = 2E (X̄ ) = 2 · · nE (Xi ) = =θ
n 2

por lo que el sesgo del estimador es cero.

Como el sesgo es cero, su ECM serı́a igual que su varianza. Luego,

1 4Var (Xi ) 4θ2 θ2


Var (θ̂) = Var (2X̄ ) = 4Var (X̄ ) = 4 · 2
· nVar (Xi ) = = =
n n 12n 3n

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 78 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

b) Calcule el ECM del estimador. ¿Es insesgado?¿Es consistente?

Solución:
θ θ2
RECORDATORIO: E (Xi ) = 2
, Var (Xi ) = 12
.

Finalmente,
θ2
ECM(θ) = Var (θ̂) =
3n
Es un estimador consistente, ya que ECM(θ) tiende a 0 cuando n tiende a infinito.

θ2
lim =0
n→∞ 3n

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 79 / 103
Ejercicio 6

X1 , .., Xn son i.i.d. U(0, θ).

c) Compare el ECM del estimador de este ejercicio con aquel del máximo de los Xi . Uno de
los dos es muchı́simo mejor que el otro. ¿Cuál?

Solución:
HINT: El ECM del máximo de los Xi (θ = max{Xi }) es igual a

2
ECM(θ) = θ2
(n + 2)(n + 1)

Y el ECM de este ejercicio es:


θ2
ECM(θ) =
3n

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 80 / 103
Ejercicio 6
X1 , .., Xn son i.i.d. U(0, θ).

c) Compare el ECM del estimador de este ejercicio con aquel del máximo de los Xi . Uno de
los dos es muchı́simo mejor que el otro. ¿Cuál?

Solución:
HINT: El ECM del máximo de los Xi (θ = max{Xi }) es igual a

2
ECM(θ) = θ2
(n + 2)(n + 1)

Y el ECM de este ejercicio es:


θ2
ECM(θ) =
3n

Para n = 1 y n = 2 los ECM de ambos estimadores son iguales.


Para n ≥ 3, el ECM del máximo es menor que el ECM del estimador de MdM y, de
hecho, la diferencia es cada vez mayor: el cuociente del ECM de MdM vs el ECM
del máximo tiende a infinito cuando n tiende a infinito.
Por lo tanto, el máximo es un mejor estimador de θ que el de esta pregunta.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 81 / 103
Ejercicio 7 - Propuesto

Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:

2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)

a) Calcule el valor esperado de rn .


b) Calcule la varianza de rn .
c) ¿Es rn un estimador consistente de µ?

HINT: Recuerde que:

n
X 1
k = n(n + 1)
k=1
2
n
X 1
k2 = n(n + 1)(2n + 1)
k=1
6

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 82 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:

2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)

a) Calcule el valor esperado de rn .

Solución:
Denotamos la media y varianza de la normal en cuestión por µ y σ 2 . Entonces,

2
E (rn ) = [E (X1 ) + 2E (X2 ) + ... + nE (Xn )]
n(n + 1)
n
2 X
= kµ
n(n + 1) k=1

Se extrae µ de la sumatoria y se utiliza la primera propiedad del HINT:

2µ 1
E (rn ) = · n(n + 1) = µ
n(n + 1) 2

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 83 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:
2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)

b) Calcule la varianza de rn .

Solución:
 2
2
Var (rn ) = [Var (X1 ) + 4Var (X2 ) + ... + n2 Var (Xn )]
n(n + 1)
n
 2 !
2 X
= k2 σ2
n(n + 1) k=1

donde en el último paso se ocupó que Var (Xi ) = σ 2 . El desarrollo sigue utilizando la
segunda propiedad del HINT:
 2
2 1
Var (rn ) = · n(n + 1)(2n + 1)
n(n + 1) 6
2 (2n + 1) 2
= · σ
3 n(n + 1)

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 84 / 103
Ejercicio 7 - Propuesto
Suponga que los Xi son i.i.d. normales con media desconocida µ y varianza 1. Antiprom define
el siguiente estimador para la media µ:

2
rn = (X1 + 2X2 + 3X3 + ... + nXn )
n(n + 1)

c) ¿Es rn un estimador consistente de µ?

Solución:
Se debe demostrar que:
lim E (rn − µ)2 = 0
n→∞

La manera más directa para realizar esto es a partir de la descomposición del ECM.

E (rn − µ)2 = Var (rn ) + [Sesgo(rn )]2

Por la parte a), sabemos que rn es un estimador insesgado de µ y la varianza ya fue


determinada en b). Luego,

2
lim E (rn − µ)2 = lim (X1 + 2X+ 3X3 + ... + nXn ) = 0
n→∞ n→∞ n(n + 1)

Por lo tanto, podemos afirmar que rn es un estimador consistente de µ.


Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 85 / 103
Tópico 7

Estimación máximo verosı́mil

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 86 / 103
Función de Verosimilitud

Datos: x1 , ..., xn

Modelo: X1 , ..., Xn i.i.d. La f.d.p común de los Xi es f (x1 |θ), donde el parámetro θ ∈ Θ describe
los valores posibles del parámetro que caracteriza la f.d.p.

La f.d.p. conjunta de X1 , ..., Xn se denota por fn (x1 , ..., xn |θ). Como los Xi son independientes,
entonces la f.d.p conjunta será igual al producto de las marginales:

fn (x1 , ..., xn |θ) = f (x1 |θ) · f (x2 |θ) · ...f (xn |θ) = Πni=1 f (xi |θ)

Dados los datos, la función de verosimilitud L(θ; x1 , ..., xn ) como aquella que asigna a cada
θ ∈ Θ:
L(θ; x1 , ..., xn ) = fn (x1 , ..., xn |θ)
Dicho en palabras, la función de verosimilitud asocia a cada valor que puede tomar el parámetro
θ la probabilidad de haber observado los datos (x1 , ..., xn ) si θ fuera el parámetro verdadero.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 87 / 103
Estimadores de Máxima Verosimilitud

El valor estimado de máxima verosimilitud será el valor de θ ∈ Θ que maximiza L(θ; x1 , ..., xn ).
Es decir,
θ̂(x1 , ..., xn ) = argmaxθ∈Θ L(θ; x1 , ..., xn )
El estimador correspondiente será el estimador de máxima verosimilitud (e.m.v.)

θ̂ = θ̂(X1 , ..., Xn )

Caracterı́sticas:
Tienen buenas propiedades teóricas, al menos para n grande.
Funcionan bien en la práctica, incluso para valores más pequeños de n.
En general, los e.m.v. son mejores que los estimadores MdM

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 88 / 103
Propiedades

1 Los e.m.v. son consistentes


2 Los e.m.v. son asintóticamente insesgados.
3 En general, los e.m.v. son únicos cuando n es suficientemente grande.
4 Los e.m.v. son invariantes.
5 Los e.m.v. son asintóticamente eficientes.
Es decir, para n grande, ningún estimador consistente tendrá un ECM signicativamente
menor que el e.m.v.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 89 / 103
Ejercicio 8

Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.

En un experimento completamente aleatorizado con personas a las cuáles se les acababa de


diagnosticar Covid-19, se administró la droga a 610 personas y el placebo a 610 personas. Tres
dı́as después hubo 5 hospitalizaciones entre los tratados y 43 entre los controles.

Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .

HINT: Si en una o más de las siguientes preguntas, una vez planteado el modelo estadı́stico
sabe cuál es el e.m.v., no es necesario que lo derive.

a) Obtenga el valor que toma el e.m.v. de pt .


b) Obtenga el valor que toma el e.m.v. de pc .
c) Obtenga el valor que toma el e.m.v. de e.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 90 / 103
Ejercicio 8

Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.

En un experimento completamente aleatorizado con personas a las cuáles se les acababa de


diagnosticar Covid-19, se administró la droga a 610 personas y el placebo a 610 personas. Tres
dı́as después hubo 5 hospitalizaciones entre los tratados y 43 entre los controles.

Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .

a) Obtenga el valor que toma el e.m.v. de pt .

Solución:
De acuerdo a lo visto en clases, sabemos que el e.m.v. en el modelo Bernoulli es la media
muestral (no es necesario demostrarlo). Luego,

5
p̂t =
610

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 91 / 103
Ejercicio 8

Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.

En un experimento completamente aleatorizado con personas a las cuáles se les acababa de


diagnosticar Covid-19, se administró la droga a 610 personas y el placebo a 610 personas. Tres
dı́as después hubo 5 hospitalizaciones entre los tratados y 43 entre los controles.

Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .

b) Obtenga el valor que toma el e.m.v. de pc .

Solución:
De manera análoga, los controles también siguen un modelo Bernoulli donde el e.m.v. es
la media muestral. Luego, tendremos que:

43
p̂c =
610

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 92 / 103
Ejercicio 8

Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.

En un experimento completamente aleatorizado con personas a las cuáles se les acababa de


diagnosticar Covid-19, se administró la droga a 610 personas y el placebo a 610 personas. Tres
dı́as después hubo 5 hospitalizaciones entre los tratados y 43 entre los controles.

Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables i.i.d.
Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0 si no) se
modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco se define
como e = (pc − pt )/pc .

c) Obtenga el valor que toma el e.m.v. de e.

Solución:
Como los e.m.v. son invariantes, entonces,

p̂c − p̂t 43 − 5
ê = = ∗ 100 = 88, 4%
p̂c 43

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 93 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

a) Determine el e.m.v. de p.
b) Muestre que el e.m.v. es consistente.
c) Encuentre el e.m.v. de la varianza de la geométrica.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 94 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

a) Determine el e.m.v. de p.

Solución:
Recordemos que la función de probabilidad de la distribución geométrica es:

f (x|p) = p(1 − p)x

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 95 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

a) Determine el e.m.v. de p.

Solución:
Recordemos que la función de probabilidad de la distribución geométrica es:

f (x|p) = p(1 − p)x

La densidad conjunta de x1 , ..., xn será:


Pn
fn (x1 , ..., xn |p) = p n (1 − p) i=1 xi

de modo que la función de verosimilitud viene dada por:


Pn
L(p|x1 , ..., xn ) = p n (1 − p) i=1 xi

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 96 / 103
Ejercicio 9
Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de
éxito desconocida p ∈ [0, 1].

a) Determine el e.m.v. de p.

Solución:
Recordemos que la función de probabilidad de la distribución geométrica es:

f (x|p) = p(1 − p)x

La densidad conjunta de x1 , ..., xn será:


Pn
fn (x1 , ..., xn |p) = p n (1 − p) i=1 xi

de modo que la función de verosimilitud viene dada por:


Pn
L(p|x1 , ..., xn ) = p n (1 − p) i=1 xi

Luego, tomamos el logaritmo natural:


n
!
X
logL(p|x1 , ..., xn ) = nlog (p) + xi log (1 − p)
i=1

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 97 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

a) Determine el e.m.v. de p.

Solución:
n
!
X
logL(p|x1 , ..., xn ) = nlog (p) + xi log (1 − p)
i=1

La CPO es: Pn
n i=1 xi
− =0
p 1−p

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 98 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

a) Determine el e.m.v. de p.

Solución:
n
!
X
logL(p|x1 , ..., xn ) = nlog (p) + xi log (1 − p)
i=1

La CPO es: Pn
n i=1 xi
− =0
p 1−p
Por lo cual, despejando p tenemos el e.m.v.

n 1
p= Pn =
n+ i=1 xi 1 + x̄n

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 99 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

b) Muestre que el e.m.v. es consistente.

Solución:
Tenemos que el e.m.v., θ̂n viene dado por:

1
θ̂n =
1 + X̄n

Recordemos que, por la LGN, X̄n converge a la media de los Xi , es decir, a µ = (1 − p)/p.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 100 / 103
Ejercicio 9
Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de
éxito desconocida p ∈ [0, 1].

b) Muestre que el e.m.v. es consistente.

Solución:
Tenemos que el e.m.v., θ̂n viene dado por:

1
θ̂n =
1 + X̄n

Recordemos que, por la LGN, X̄n converge a la media de los Xi , es decir, a µ = (1 − p)/p.
Luego,

1
lim θ̂n =
n→∞ 1 + (1 − p)/p
p
=
p + (1 − p)
= p

Es consistente.

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 101 / 103
Ejercicio 9

Se dispone de una muestra de tamaño n de una distribución geométrica con probabilidad de


éxito desconocida p ∈ [0, 1].

c) Encuentre el e.m.v. de la varianza de la geométrica.

Solución:
1−p
Se tiene que para una variable aleatoria geométrica Var (X ) = .
p2
Por invarianza, el e.m.v. de la varianza será:

1
1 − θ̂n 1− 1+X̄n
= 2
θ̂n2

1
1+X̄n

= X̄n (1 + X̄n )

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 102 / 103
Intensivo Estadı́stica 2

Mucho éxito en la Solemne !!!

Daniela Jensen - Clases PasaInvicto Clase MES205 - Estadı́stica 2 Solemne September 24, 2022 103 / 103

También podría gustarte