Está en la página 1de 11

UNIVERSIDAD AUTÓNOMA DE YUCATÁN

FACULTAD DE MATEMÁTICAS

Inferencia Estadística
Unidad 3. Estimación por intervalos
Tarea 1

Equipo

 Amaya Medina, Naomy Abigail  Pech May, Jorge Roberto


 Cuxim Tuz, Carlos Enrique  Ruiz Enríquez, Abigail

Instrucciones: Resuelve cada uno de los siguientes ejercicios.

1. Supongamos que Y ∼ N ( 0 , σ 2 ).

a) Demuestra que Y 2 /σ 2 es un pivotal. (6 puntos)

Solución.

b) Usa el pivotal del inciso anterior para construir un intervalo de 95% de confianza
para σ 2. (6 puntos)

Solución.

θ−1
2. Sea X una sola observación de la densidad f ( x ; θ )=θ x I (0,1 ) ( x), donde θ>0 .

a) Hallar un pivotal y usarlo para definir un intervalo de confianza para θ . (4 puntos)

Solución. Primero hallemos la función de distribución acumulada. Por definición


tenemos que si x ≤ 0 entonces F ( x ;θ )=0 y que si x ≥ 1 entonces F ( x ;θ )=1, de esta
forma consideremos el caso cuando x ∈(0,1). Por definición tenemos que
x 0 x
x
F ( x ;θ )= ∫ f ( t ; θ) dt= ∫ 0 dt +∫ θ t θ −1 dt=[ t θ ] 0=x θ .
−∞ −∞ 0

De esta forma tenemos que la función de distribución acumulada de X va a estar


dada por

1
1,∧x ≥ 1 ,

{
F ( x ;θ )= x ,∧0< x <1 ,
θ

0 ,∧x ≤ 0.

Notemos que F ( x ;θ ) es siempre continua sobre x , pero por teoremas ya vistos


tenemos que F ( X ; θ ) ∼U ( 0,1 ) de este modo X θ es un pivotal de θ . De esta forma
sabemos que existen q 1 y q 2 tales que

P ( q 1< X θ <q2 ) ∧¿ 1−α ,


P ( ln q 1<θ ln X <ln q 2) ∧¿ 1−α ,
ln q 2 ln q 2
P ( ln X
<θ<
ln X )
∧¿ 1−α .

De esta forma tenemos que ( ln q 2 /ln x , ln q 1 /ln x ) forma un intervalo del


100 ( 1−α ) % de confianza para θ .

b) Define Y =−1/ln X y demuestra que ( Y /2 ,Y ) es un intervalo de confianza para θ .


Hallar también el nivel de confianza. (4 puntos)

Solución. Por la parte anterior sabemos que X θ es in pivotal de θ y además que


X θ ∼U ( 0,1 ). De esta forma veamos que
−1

−1 e2
(
P e−1 < X θ< e 2 )∧¿ ∫ dx ,
e−1
−1
1
(
P −1<θ ln X ←
2)
∧¿ e −e , 2 −1

−1
−1 1
P(
ln X )
2 −1
<θ ← ∧¿ e −e ,
2 ln X
−1
Y
P ( < θ<Y )∧¿ e −e ≈ 0.2387 .
2 −1
2

De esta forma tenemos que (Y /2 , Y ) forma un intervalo de confianza de


aproximadamente 23.87%.

c) Hallar un mejor intervalo de confianza para θ . (4 puntos)


θ
Solución. Dado que X ∼U (0,1) entonces P ( 0.05< X θ<1 )=1−0.05=0.95 . Pero por
la parte a) sabemos que entonces

( lnln 1x , lnln0.05x )=(0 , lnln0.05x )


2
forma un intervalo de confianza del 95% para θ . En otras palabras, que el intervalo
(0 , ln 0.05 /ln x ) forma un mejor intervalo de confianza para θ .

3. Supóngase que la variable aleatoria Y es una observación de una distribución normal con
media μ desconocida y varianza 1. Encuentra lo siguiente

a) Un intervalo de 95% de confianza para μ. (6 puntos)

Solución.

b) El límite superior de 95% de confianza para μ. (5 puntos)

Solución.

c) El límite inferior de 95% de confianza para μ. (5 puntos)

Solución.

4. El síndrome del compartimiento anterior crónico es un mal que se manifiesta por un dolor
en el muslo debido al ejercicio. A la inflamación y el daño al nervio se suma el dolor, que
disminuye con reposo. Con el objeto de determinar si las mediciones de la presión sobre el
compartimiento del músculo anterior difieren en los corredores y en los ciclistas, un grupo
de investigadores en medicina deportiva realizó un experimento que incluía a 10
corredores y a 10 ciclistas saludables. En la siguiente tabla se resumen los datos (la presión
ejercida se mide en milímetros de mercurio)

Corredores Ciclistas
Estado
Media Desv. Estándar Media Desv. Estándar

Reposo 14.5 3.92 11.1 3.98

80% de consumo
12.2 3.49 11.5 4.95
de O2

Suponiendo que la muestra proviene de una población que se distribuye normal,


construye un intervalo de confianza de 95% para la diferencia en las presiones promedio
sobre el compartimiento entre los corredores y los ciclistas que están en reposo. ¿Cómo
interpretarías el resultado? (8 puntos)

3
Solución. Sea R y C las variables aleatorias que miden la presión de los corredores y
ciclistas en reposo. Primero encontremos un intervalo de confianza del 95% de σ R /σ C. Por
2 2
las instrucciones sabemos que S R=15.3664 , SC =15.8404 y n R=nC =10 de esta forma
tenemos que un intervalo de confianza del 95% de σ R /σ C va a estar dado por

S2R S2R 15.3664 15.3664


( S 2
C
−1
( F 0.025,9,9 ) ,
S2
C
)(
F 0.025,9,9 =
15.8404
( 4.026 )−1 ,
15.8404 )
( 4.026 ) =( 0.2409,3 .9055 ) .

Podemos notar que el 1 se encuentra en el intervalo de confianza entonces podemos


considerar que no hay una diferencia significativa entre las desviaciones, es decir podemos
2 2
considerar que σ R =σ C .

De esta forma, dado que ^μ R=14.5 y ^μC =11.1 y considerando los datos dados con
anterioridad, entonces veamos que

^μ R− μ^ C =3.4 ,

ν=n R +nC −2=10+10−2=18 ,

2 ( nR −1 ) S 2R + ( nC −1 ) S2C 9 ( 15.3664 ) +9 ( 15.8404 )


S= p = =15.6034 ,
n R +nC −2 18

1 1 2
Sp
√ + =√15.6034
n R nC 10
=1.7665 ,

t α / 2,18=t 0.025,18=2.101.

De esta forma tenemos que un intervalo de confianza para μ R−μC está dado por

( 3.4−2.101 ( 1.7665 ) ,3.4+ 2.101 ( 1.7665 ) ) =(−0.3114,7 .1114 ) .


Así tenemos que hay un 95% de probabilidad de que la diferencia entre la media real de la
presión de los corredores en reposo menos la media real de la presión de los ciclistas en
reposo esté en (−0.3114,7 .1114 ). Dado que el 0 forma parte del intervalo, entonces
podemos decir que no existe una diferencia significativa entre la diferencia de medias de
las presiones de los corredores y ciclistas en reposo.

5. ¿Está menguando el romance de los yucatecos con el cine? En una encuesta realizada por
alumnos de cuarto semestre de la Facultad de Matemáticas, con n=80 0 adultos
seleccionados aleatoriamente, 45 % indicaron que el cine estaba mejorando, mientras que
43 % dijeron que el cine estaba empeorando.

4
a) Encuentra un intervalo de 98 % de confianza para p, la proporción de adultos que
dicen que el cine está mejorando. (6 puntos)

Solución. Observemos que la proporción de adultos que dicen que el cine está
mejorando se puede modelar mediante una variable Bernoulli de parámetro p. Los
datos que tenemos son los siguientes:

 n=800
 1−α=0.98→ α =0.02
 ^p=0.45

De manera que, el intervalo de confianza pedido es

^p ( 1− ^p ) ^p (1− ^p )
( √ ^p −Z α
2
n √
, ^p +Z α
2
n )
Z α =Z 0.01=2.33. Es decir,
donde
2

0.45 ( 0.55 ) 0.45 ( 0.55 )


( 0.45−2.33
√ 800
,0.45+ 2.33
800 √ )≈ ( 0.409 ,0.490 )

∴ Con un 98% de confianza, la proporción de adultos que dicen que el cine está
mejorando está entre 0.409< p< 0.490.

b) ¿El intervalo incluye el valor p=0.50? ¿Piensas que una mayoría de adultos dice
que el cine está mejorando? ¿Por qué? (6 puntos)

Solución. El intervalo se acerca mucho, pero no incluye el valor p=0.5. A pesar de


que la cantidad de opiniones es muy similar, es mayor la cantidad de personas que
piensan que el cine está empeorando.

6. Los economistas desde hace mucho se dieron cuenta de que solamente el PNB no mide el
bienestar total de un país. Factores menos tangibles también son importantes, como el
tiempo libre y la impunidad contra la contaminación y el crimen. Para tener una idea de
cómo estos otros factores varían entre los países, en la década de 1970 se emprendió una
encuesta a nivel mundial. Para saber más sobre la cuestión del crimen, se planteó la
pregunta “¿Tiene usted miedo de caminar por su vecindario en la noche?”. Se obtuvieron
las siguientes respuestas:

5
Estados Unidos Japón América Latina
Opinión
A B C

Sí 40% 33% 57%

No 56% 63% 42%

× 4% 4% 1%

Dado por hecho que la encuesta de cada país fue equivalente en exactitud a una muestra
aleatoria simple de n=300 personas, encuentra un intervalo de confianza del 95% para la
diferencia en el porcentaje de personas que respondieron “sí”:

a) Entre Estados Unidos y Japón. (6 puntos)

Solución. Los datos que se tienen son

 n A =300  n B=n A

 x́ A=0.40  x́ B =0.33

0.40(1−0.40) 0.33(1−0.3)
 σ A=
√ 300
≈ 0.0 283  σ B=
√ 300
≈ 0.0271

Donde el nivel de confianza es 1−α=0.95, con α =0.05 . Como el tamaño de la


muestra de cada población es grande, los límites del intervalo para la diferencia de
medias están dados por:

σ 2A σ 2B 2 2

( x́ A −x́ B ) ± Z α
2 √ + → ( 0.40−0.33 ) ±1.96
nA nB
( 0.0283 ) ( 0.0271 )
√300
+
300

Por lo tanto, con una confianza de 95%, la diferencia en el porcentaje de personas


que respondieron “sí” entre Estados Unidos y Japón se encuentra entre el intervalo

0.0655< p A − pB < 0.0744

b) Entre Estados Unidos y América Latina. (6 puntos)

Solución. Los datos que se tienen son

 n A =300  nC =n A

6
 x́ A=0.40  x́ C =0. 57

0.40(1−0.40) 0. 57(1−0.57)
 σ A=
√ 300
≈ 0.0283  σC =
√ 300
≈ 0.02858

Donde el nivel de confianza es 1−α=0.95, con α =0.05 . Como el tamaño de la


muestra de cada población es grande, los límites del intervalo para la diferencia de
medias están dados por:

σ 2A σ 2C 2 2

( x́ A −x́C ) ± Z α
2 √ + → ( 0.40−0.57 ) ± 1.96
n A nC
( 0.0283 ) ( 0.02 858 )
√300
+
300

Por lo tanto, con una confianza de 95%, la diferencia en el porcentaje de personas


que respondieron “sí” entre Estados Unidos y América Latina se encuentra entre el
intervalo

−0.1745< p A − p B ←0.1654 →0.1654 < pB − p A <0.1745

7. Se seleccionó una muestra aleatoria de 21 ingenieros de un grupo mayor que labora para
un fabricante de equipo electrónico. La desviación estándar de la muestra de las horas de
trabajo por semana fue de 7 horas. Determinar un intervalo de confianza de 90% para la
varianza de la población de las horas de trabajo para todos los ingenieros que laboran
para el fabricante, al suponer que estas mediciones tienen una distribución normal. (8
puntos)

Solución. Los datos que tenemos son

 n=21
 S=7

 v=n−1=21−1=20 grados de libertad

 1−α=0.9→ α =0.1

Puesto que la población tiene una distribución normal, los límites del intervalo de
confianza para σ 2 están dados por

( n−1 ) S2 ( n−1 ) S2 ( 20 ) (7)2 ( 20 ) (7)2 980 980


( 2
χα
,
( 2 , n−1)
2
χ α
= 2
)( , 2
χ (0.05,20) χ ( 0.95,20)
(1− 2 ,n−1)
=
31.41)(
,
10.851 )

7
De manera que, la varianza poblacional está comprendida, con un 90% de confianza, entre
los valores

31.20<σ 2< 90.32

8. Los siguientes datos, registrados en días, representan el tiempo de recuperación para


pacientes que se tratan al azar con uno de dos medicamentos para curar infecciones
graves de la vejiga:

Medicamento 1 n1 =1 4 x́ 1=1 7 s21=1. 5

Medicamento 2 n2 =16 x́ 2=1 9 s22=1. 8

Encuentra un intervalo de confianza de 99% para la diferencia μ1−μ 2 en el tiempo


promedio de recuperación para los dos medicamentos, suponga poblaciones normales
con varianzas iguales. (8 puntos)

Solución.

9. Se lleva a cabo un estudio para comparar la longitud de tiempo entre hombres y mujeres
para ensamblar cierto producto. Experiencia pasada indica que la distribución de los
tiempos para hombres y mujeres es aproximadamente normal pero que la varianza de los
tiempos para las mujeres es menor que para los hombres. Una muestra aleatoria de
tiempos para 11 hombres y 14 mujeres produce los siguientes datos:

Hombres n1 =11 x́ 1=22.3 hrs s1=6.1 hrs

Mujeres n2 =14 x́ 2=20.1 hrs s2=5.3 hrs

2 2
a) Determinar un intervalo de 95% de confianza para el cociente σ 1 /σ 2. (6 puntos)

Solución.

b) Con base a los resultados anteriores, construye un intervalo de 95% de confianza


para la diferencia de medias μ1−μ 2. (6 puntos)

Solución.

8
Puntos extra: 10 puntos

10. En el archivo anexo (agricultura.xlsx) se proporcionan datos del censo de agricultura de


1992 en Estados Unidos. La descripción de las variables se encuentra en la segunda hoja
de cálculo del mismo archivo.

a) Usa el software R y elabora un histograma para la cantidad de acres dedicados a la


agricultura en 1992. (1 punto)

Solución. Usando el programa R y el archivo agricultura.xlsl tenemos que el


histograma para la cantidad de acres dedicados a la agricultura en 1992 es el
siguiente.

b) Calcula la media poblacional y la varianza poblacional de la cantidad de acres


dedicados a la agricultura en 1992. (2 puntos)

Solución. Haciendo uso de las funciones de Excel tenemos que la media y varianza
poblacional, están dadas por

μ=297897.05

σ 2=118320288153.14

c) Usa el software R para extraer una muestra aleatoria simple de tamaño 50 de la


base de datos. (2 puntos)

9
Solución. Usando el software R se extrajo una muestra de tamaño 50. Esta se puede
encontrar en el archivo muestra.csv.

d) Usa la muestra obtenida en el inciso (c) y elabora de nuevo un histograma para la


cantidad de acres dedicados a la agricultura en 1992. ¿Se parece al obtenido en el
inciso (a)? ¿Por qué sí? o ¿Por qué no? explica. (2 puntos)

Solución. Usando el programa R y la muestra calculada en (c) tenemos que el


histograma para la cantidad de acres dedicados a la agricultura en 1992 es el
siguiente.

Podemos observar que existe cierta similitud con respecto al histograma obtenido
en (a), sobre todo con respecto a los primeros intervalos. La mayor diferencia radica
que en los valores más altos y que no tenían alta frecuencia no aparecen o aparece
unos cuantos en el histograma de la muestra.

e) Usa la muestra obtenida en el inciso (c) y construye un intervalo de 95% de


confianza para la verdadera cantidad promedio de acres dedicados a la agricultura
en 1992. (2 puntos)

Solución. Por la parte (b) tenemos que ya sabemos la varianza poblacional y por
tanto desviación estándar poblacional estará dada por σ =343977.16, de igual
forma, por los datos del archivo tenemos que la población es de N p=300. Ahora,

10
usando las funciones de Excel (o el programa R) y el archivo extraído de la muestra,
tenemos entonces que su media y varianza muestral está dada por

x́=262109.3

De esta forma, dado que el tamaño de muestra n=50 es grande y teniendo en


cuenta que σ y N p son conocidos y considerando que z 0.025 =1.96 entonces veamos
que

σ N p −n 343977.16
z 0.025

√ n N p−1
=1.96( √50 ) √ 250
299
=87183.66 .

De esta forma tenemos que un intervalo de confianza del 95% de μ está dado por

( 262109.3−87183.66 ,262109.3+ 87183.66 )=( 174925.64,349292.96 ) .

f) El intervalo construido en el inciso (e) ¿contiene el promedio obtenido en (b)?


Explica tus conclusiones. (1 punto)

Solución. En el inciso (b) obtuvimos que μ=297897.05, podemos ver claramente


que

174925.64< μ< 349292.96 ,

De esta forma tenemos que el intervalo calculado en (e) sí contienen el promedio


calculado en (b).

11

También podría gustarte