Está en la página 1de 8

Gua Resuelta de Ejercicios Prueba 1

Estadstica II

Seccin A. Estadstica inferencial y diseo de muestras
1. Lee la siguiente descripcin de diseo muestral y responde las preguntas que aparecen a
continuacin.
1.200 personas fueron seleccionadas y entrevistadas en sus hogares en 120 comunas del pas. El
diseo muestral contempl una seleccin en cuatro etapas (comunas-manzanashogar-persona).
Primero, las comunas fueron clasificadas por nivel socio-econmico y se seleccionaron 40 comunas
de NSE bajo, 40 comunas de NSE medio y 40 comunas de NSE alto. Segundo, en cada comuna se
seleccionaron al azar 5 manzanas. Tercero, en cada manzana se seleccionaron al azar 5 hogares.
Cuarto, en cada hogar se seleccion al azar a una persona mayor de 18 aos de edad. En cada
etapa la seleccin de elementos de la muestra fue realizada de manera aleatoria.
a. A qu tipo de diseo muestral se refiere esta descripcin? Se refiere a un tipo de
muestreo probabilstico o no-probabilstico? Describe el tipo de diseo muestral de cada
etapa
Respuesta: El diseo muestral corresponde a un muestreo polietpico y probabilstico en todas sus etapas.
En la primera etapa se utiliz un muestreo estratificado por nivel socio-econmico (NSE). Las comunas
fueron clasificadas en estratos segn su NSE y se seleccionaron al azar unidades de cada estrato/NSE. En
la segunda etapa se utiliz un muestreo por conglomerados considerando cada manzana como un
conglomerado. Se seleccionaron 5 conglomerados/manzanas en cada comuna. En la tercera etapa se
utiliz un muestreo por conglomerados considerando cada hogar como un conglomerado. Se seleccionaron
5 hogares en cada manzana seleccionada. Por ltimo, en la cuarta etapa se utiliz un muestreo aleatorio
simple para seleccionar una persona en cada hogar.

b. Es posible realizar inferencias de la muestra a la poblacin? Por qu?
Respuesta: Es posible realizar inferencias de la muestra a la poblacin debido a que el diseo muestral es
probabilstico. En estos casos, podemos utilizar los conocimientos que tenemos acerca de la distribucin
muestral para estimar un error muestral asociado a la estimacin.








2. Una investigadora quiere estudiar la opinin que los propietarios de kioskos en Santiago Centro
tienen sobre las marchas estudiantiles. La investigadora te pide que la asesores en la decisin del
diseo de muestras. Con respecto a este estudio


a. Nombra un diseo muestral no-probabilstico que permitira estudiar a los propietarios de
kioskos. Describe brevemente cmo se llevara a cabo la seleccin de la muestra.
Una respuesta posible: podramos utilizar un muestreo accidental. En este caso, definimos un tamao de
muestra requerido y solicitamos a los encuestadores que vayan kiosko por kiosko preguntando a los
propietarios de kioskos si estn dispuestos a contestar una encuesta. Este procedimiento se realizar hasta
completar el tamao de la muestra especificado.

b. Nombra un diseo muestral probabilstico que permitira estudiar a los propietarios de kioskos.
Describe brevemente cmo se llevara a cabo la seleccin de la muestra.
Una respuesta posible: podramos utilizar un muestreo aleatorio simple. Para poder llevar a cabo este tipo
de muestreo debemos conseguir un listado de los kioskos y sus direcciones de la municipalidad (marco
muestral). Asumiendo que es posible obtener este listado, ordenamos los kioskos en una lista y les
asignamos un nmero a cada uno. Luego utilizamos un generador de nmeros aleatorios para seleccionar
los kioskos que sern considerados en la muestra. Por ltimo, contactamos a los propietarios de los kioskos
seleccionados para la muestra y les solicitamos que contesten una encuesta.

c. Nombra 2 aspectos a favor de utilizar el diseo muestral no-probabilstico y 2 aspectos a favor de
utilizar el diseo muestral probabilstico
Respuesta: Entre las ventajas de utilizar un muestreo no probabilstico se encuentran el no necesitar
contar con un marco muestral para realizar la seleccin de elementos de la muestra y la facilidad y rapidez
de realizar encuestas a personas que se encuentran convenientemente a disposicin. Entre las ventajas de
utilizar un muestreo probabilstico se encuentran la posibilidad de realizar inferencias a la poblacin
conociendo el error en la estimacin y la posibilidad de utilizar muestreos por etapas para asegurar la
representatividad y posibilidad de inferencia- de los elementos a distintos niveles (regiones, comunas,
entre otros).


Seccin B. Curva normal y puntajes estandarizados
1. En una muestra de estudiantes (n=120) la media de estatura es de 165 centmetros y la desviacin
estndar es de 7 centmetros. Responde las siguientes preguntas asumiendo que la estatura se
distribuye normalmente:

a. Qu porcentaje de estudiantes mide menos de 150 centmetros?
Respuesta: Calculamos un puntaje Z para los siguientes valores:
X

=165
X =150
s
x
=7

Z =
X X

s
x
=
150 165
7
=2,14
Luego, buscamos en la tabla de la distribucin normal la proporcin de casos que cae entre un Z=0 y un
Z=2,14 (en este caso, 0,484). Dado que estamos interesados en calcular la proporcin de estudiantes que
mide menos de 150 centmetros (o que obtiene un valor Z menor a -2,14), restamos este valor a 0,50 y
obtenemos 0,50-0,484=0,016.
Conclusin: El 1,6% de los estudiantes mide menos de 150 centmetros.

b. Un estudiante mide 185 centmetros. Qu porcentaje de sus compaeros miden menos
que l?

Respuesta: Calculamos un puntaje Z para los siguientes valores:
X

=165
X =185
s
x
=7

Z =
X X

s
x
=
185 165
7
=2,86
Luego, buscamos en la tabla de la distribucin normal la proporcin de casos que cae entre un Z=0 y un
Z=2,86 (en este caso, 0,498). Dado que estamos interesados en calcular la proporcin de estudiantes que
mide menos de 185 centmetros (o que obtiene un valor Z menor a 2,86), sumamos este valor a 0,50 y
obtenemos 0,50+0,498=0,998.
Conclusin: Un 99,8% de los estudiantes mide menos de 185 centmetros.

Seccin C. Intervalos de Confianza
1. En una encuesta CEP (2011; n=1559) el 47.9% de los encuestados respondi que consideraba que
las medidas policiales por la violencia en las marchas eran excesivas, mientras que el restante
52.1% consider que estas eran adecuadas o insuficientes. Calcula un intervalo de confianza de la
proporcin de personas que opinan que la violencia es excesiva. Utiliza un 95% de confianza.
Interpreta el intervalo.
Respuesta: Calculamos un intervalo de confianza para proporciones considerando los siguientes valores:
P
S
=0,479

S
=0,521
n = 1559
Z 2 =1,96

Partimos por calcular el error estndar:
s
Ps
=
_
P
s

s
n
=
_
0,479 0,521
1559
=0,013

Luego calculamos el intervalo de confianza:

P Z 2 s
Ps

0,479 1,96 0,013
0,479 0,025

Lmite inferior del intervalo: 0,479 u,u2S = u,4S4
Lmite superior del intervalo: 0,479 + 0,025 = 0,504

Conclusin: El porcentaje de chilenos que opina que las medidas policiales por la violencia en las marchas
son excesivas se encuentra entre el 45,4% y el 50,4%, a un 95% de confianza.


2. Segn datos de la encuesta CASEN (2009, n=175.221) el promedio de aos de escolaridad de
personas mayores de 18 aos es de 10,41 aos con una varianza de 19,52. Calcula un intervalo de
confianza en torno al promedio de aos de escolaridad. Utiliza un 99% de confianza. Interpreta el
intervalo.

Respuesta: Calculamos un intervalo de confianza para medias considerando los siguientes valores:
X

=10,41
s
2
=19,52
s
x
=19,52 =4,42
n = 175221
Z 2 =2,58
418,594

Partimos por calcular el error estndar:
s
x
=
s
x
n
=
4,42
175221
=0,011


Luego calculamos el intervalo de confianza:

X

Z 2 s
x

10,41 2,58 0,011
10,41 0,028

Lmite inferior del intervalo: 10,41 0,028 = 10,38
Lmite superior del intervalo: 10,41 + 0,028 = 10,44

Conclusin: El promedio de aos de escolaridad de los chilenos mayores de 18 aos se encuentra entre
los 10,38 y los 10,44 aos de estudios, a un 99% de confianza.


Seccin D. Clculo del tamao de la muestra
1. Un investigador desea realizar una encuesta para determinar el porcentaje de estudiantes de un
colegio (N=1000) que practica algn deporte al menos una vez a la semana. El investigador no tiene
informacin previa acerca de la dispersin de esta variable y decide asumir la mayor dispersin
posible (P=0.5). El investigador quisiera obtener una estimacin con un error muestral del +/- 4% a
un 95% de confianza. Cul es el tamao de muestra que debiera obtener el investigador?

Respuesta: Calculamos el tamao de la muestra mnimo necesario considerando los siguientes valores:
P
s
=0,50

s
=0,50
Z 2 =1,96
crror mucstrol =0,04


Luego calculamos el tamao de la muestra:

n =
(P
s

s
) (Z 2 )
2
(crror mucstrol)
2
=
(0,50 0,50) (1,96)
2
(0,04)
2
=
0,9604
0,0016
=600,25

Conclusin: el investigador requiere obtener una muestra de 601 casos para poder realizar una estimacin
con un error muestral del 4% y un nivel de confianza del 95%.
Seccin E. Pruebas de hiptesis para una muestra nica
1. Se llev a cabo una encuesta a una muestra probabilstica de trabajadores en una empresa (n=400)
y se les pregunt acerca de su nivel de satisfaccin en el trabajo. Se utiliz una escala de 1 a 10,
donde 1 significa muy baja satisfaccin y 10 significa muy alta satisfaccin. El promedio obtenido
fue de 5,5, con una desviacin estndar de 4. El ao pasado el promedio obtenido fue de 5,3
puntos. Lleva a cabo una prueba de hiptesis para determinar si el puntaje de este ao es
significativamente mayor al puntaje del ao pasado. Utiliza un nivel de confianza del 95%.

Respuesta: Llevamos a cabo una prueba de hiptesis de medias para muestra nica (muestra grande),
considerando los siguientes datos:
n = 400
X

=5,5
s = 4
p
0
=5,3
= u,uS

Luego desarrollamos la prueba de hiptesis paso a paso:
1. Considerar los datos y si se cumplen los supuestos
El nivel de medicin de la variable es de intervalo/razn, por lo que utilizamos una prueba para medias. La
muestra es probabilstica y el tamao de la muestra es grande (n>121). Por lo tanto, podemos utilizar una
prueba de hiptesis para muestras grandes.

2. Enunciar pregunta de investigacin
Tienen los trabajadores de la empresa un promedio de satisfaccin en el trabajo significativamente
superior al promedio del ao anterior, considerando un 95% de confianza?

3. Formular hiptesis nula e hiptesis alternativa. Definir la direccin de la prueba
E
0
: p
x
=5,3
E
1
: p
x
>5,3
Esta es una prueba de una cola con direccin positiva


4. Describir la distribucin muestral
Dado que la muestra fue seleccionada al azar y el tamao de la muestra es grande, la distribucin muestral
de medias ser normal. Esta distribucin est centrada en torno a un promedio de 5,3 (valor objetivo).

5. Definir el nivel de significacin y el valor crtico de la prueba
El nivel de significacin definido es =u,uS y el valor crtico para un nivel de confianza del 95% y una
prueba de una cola es Z
u
=1,64

6. Observar los resultados, calcular los efectos de la prueba y el estadstico de la prueba
Empezamos por calcular el error estndar:
s
x
=
s
x
n
=
4
400
=0,2

Luego calculamos el estadstico de la prueba:
Z
X

=
X

-
x
s
x
=
5,5 -5,3
0,2
=1

7. Tomar la decisin de rechazo
Dado que el valor Z calculado (1) es menor al valor Z crtico (1,64), fallamos en rechazar la hiptesis nula a
un 95% de confianza

8. Interpretar los resultados en lenguaje comn
Podemos concluir que los trabajadores de la empresa presentan un promedio de satisfaccin en el trabajo
(en una escala de 1 a 10) que no es significativamente superior al promedio obtenido el ao anterior,
considerando un 95% de confianza.