Está en la página 1de 3

Inferencia Estadística - 2023

Guía de ejercicios prácticos 1


J.T.P.: Matías Hisgen

1. Ejercicios con R

1.1. (Ejercicio tomado del apéndice B de Wooldridge J. (2010). Se ha hablado mucho acerca de
que hay algunos fondos mutualistas que superan el mercado año tras año (es decir, el
rendimiento de las acciones de los fondos mutualistas es más alto que el de un portafolio como
el S&P 500). En concreto, considere un periodo de 10 años y la población formada por los
4,170 fondos mutualistas publicados en The Wall Street Journal el 1 de enero de 1995. Decir
que el desempeño en relación al mercado es aleatorio significa que cada año, cada fondo tiene
50 por ciento de posibilidades de superar el mercado y que su desempeño es independiente de
un año a otro.
i) Si el desempeño en relación al mercado es realmente aleatorio, ¿cuál es la probabilidad
de que un determinado fondo supere el mercado todos estos 10 años?
ii) Calcule la probabilidad de que en estos 10 años por lo menos uno de los 4,170 fondos
supere el mercado?
iii) Determine la probabilidad de que, en estos 10 años, por lo menos cinco fondos superen el
mercado.

1.2. Antes de elegir el jurado para el juicio por homicidio contra O. J. Simpson en 1995, en una
encuesta se encontró que aproximadamente 20% de la población adulta creía que Simpson era
inocente (dado que gran parte de las evidencias físicas del caso habían sido reveladas al
público). Ignorando el hecho de que este 20% sea una estimación basada en una submuestra
tomada de la población; considérese como ilustración, como el verdadero porcentaje de
personas que, antes de la elección del jurado, pensaban que Simpson era inocente. Suponga que
los 12 miembros del jurado fueron elegidos de la población de forma aleatoria e independiente
(aunque esto resultó no ser cierto).
(i) Calcule la probabilidad de que entre los miembros del jurado haya habido por lo
menos uno que antes de la elección del mismo haya creído en la inocencia de
Simpson. [Sugerencia: defínase una variable aleatoria binomial (12, .20) X
correspondiente a la cantidad de miembros del jurado que creían en la inocencia
de Simpson.]
ii) Calcule la probabilidad de que entre los miembros del jurado haya habido al
menos dos que hayan creído la inocencia de Simpson.

1.3. Utilizando el lenguaje R, responda las siguientes consignas:


a) Genere 100.000 realizaciones de una variable “x” que siga una distribución de
probabilidad Normal con media y varianza iguales a 30 (guardarlas en objeto “Pob.x”).
b) Obtenga la probabilidad de que “x” tome un valor inferior a 25 y, por otro lado, tome
valores entre 35 y 45?
c) Suponiendo que “Pob.x” contiene a la población de “x”, extraiga 1.000 muestras
aleatorias (con reposición) de tamaño n=10 de la población de “x” y calcule sus medias
guardando éstas en un objeto. Compute el promedio y la varianza de las medias
muestrales obtenidas.
d) Cuál es la probabilidad de que la media de “x” sea inferior a 25 y, por otro lado, se
encuentre entre 35 y 45?
e) Repita lo realizado en c) con tamaños muestrales de n=100 y n=1000. Comente a qué
postulado teórico responde el resultado observado. Qué distribución siguen las medias
muestrales?
f) Repita lo realizado en el ítem e) pero estandarizando previamente las medias muestrales
utilizando la media y varianza de la población. Cómo se distribuyen las medias muestrales
para los diferentes tipos de tamaño muestral?

2. Ejercicios con Stata

2.1 Para este ejercicio utilice la base “Datos4.dta”, que contiene información sobre distritos
escolares. Se pide:
a) Qué porcentaje de Escuelas presentan valores de la variable “Aprueba_Exam” iguales o
inferiores a 72.
b) Qué porcentaje de Escuelas presentan valores de la variable “Asistencia” entre 95,3 y 99,8.
c) Realice un histograma para las variables “Aprueba_Exam” y “Asistencia”. Cuál de las
distribuciones se podría decir que presenta observaciones atípicas?
d) Describa las variables “Asistencia” en términos de su tendencia central. Que variable
presenta mayor dispersión, “Asistencia” o “Ayuda Social”?

2.2 Para esta aplicación utilice la base “Datos3”, que contiene datos sobre 48 revistas impresas
de circulación popular en EEUU.
a) Obtenga la media, la mediana, el desvío estándar y el rango intercuartílico de la variable
Circulación. Repita lo mismo la variable de “Ingreso Medio” de los lectores. ¿Cuál de las dos
variables presenta mayor asimetría en su distribución de frecuencias?
b) Analice si varían la tendencia central y la variabilidad del “Ingreso Medio” al separar las
revistas en dos grupos. Un grupo con revistas de circulación menor a la “circulación promedio”
y otro grupo con circulación superior a la “circulación promedio”.

2.3 Utilice los datos de la base “Individual_EAHU_12.dta” para construir la variable


“años_educ”. Luego:

a) Obtenga la media no condicional de la variable p47t (“Ingreso mensual total de los


individuos”) para individuos con años de educación entre 6 y 21 e ingresos positivos.
b) Para los mismos individuos del punto (a), compute la media de la variable p47t
condicionada a cada uno de los valores que toman los percentiles 10, 50 y 90 de la
variable “años_educ”. Comente si la media de p47t cambia o no al variar los años de
educación.
c) Para los mismos individuos del punto (a), evalúe gráficamente la distribución de
probabilidad de la variable p47t, comparándola con la distribución Normal. Proponga
una transformación no-lineal de p47t que ayude a “simetrizar” o “normalizar” dicha
distribución.

También podría gustarte