Está en la página 1de 16

3.2.

1 Estimacin por Intervalos de confianza para medias


poblacionales.

Al multiplicar cada termino en la desigualdad por
n
o
, y despus de restar
X de cada termino y multiplicar por -1 (para invertir el sentido de las
desigualdades), obtenemos
o
o

o
o o
=
|
|
.
|

\
|
+ < < 1
2 2
n
z X
n
z X P


Se selecciona una muestra aleatoria de tamao n de una poblacin cuya
varianza
2
o se conoce y se calcula la media x para obtener el siguiente
intervalo de confianza de ( ) % 100 1 o . Es importante enfatizar que
recurrimos al teorema del lmite central. Como resultado es importante
anotar las condiciones para las aplicaciones que siguen.



Intervalo de confianza de

; con
o
conocida.

Si x es la media de una muestra aleatoria de tamao n de una poblacin
con varianza
2
o , conocida, un intervalo de confianza ( ) % 100 1 o para
esta dado por
o
o

o
o o
=
|
|
.
|

\
|
+ < < 1
2 2
n
z X
n
z X P


Donde
2
o
z
es el valor z que deja un rea de
2
o
a la derecha.


Muestras grandes
( ) 30 > n


De manera general, los lmites de confianza estn dados por
x c
z X o
donde
c
z
depende del nivel particular deseado de confianza,
puede obtenerse de la tabla 2.2


En el caso de que la toma de muestras sea de
una poblacin infinita o si el muestreo se
lleva a cabo con reemplazo de una poblacin
finita.

n
z X
c
o


Si el muestreo es sin reemplazo de una
poblacin finita de tamao N.
1

N
n N
n
z X
c
o



3.2.2 Elementos que componen un intervalo de confianza
para medias

Las partes de la frmula del intervalo de confianza son:

1.
x
es la estimacin puntual y el punto central del intervalo de
confianza.
2.
2
o
z
es el coeficiente confianza. Es el nmero de mltiplos de error
estndar necesarios para formular una estimacin por intervalo del
ancho correcto para tener un nivel de confianza de ) 1 ( o

a) Nivel de confianza (la proporcin central de la distribucin).
b) El
2
o
, el rea usada para identificar el puntaje z (rea a la derecha
usada con la notacin de valor crtico).
c) El coeficiente de confianza
2
o
z
, cuyo valor se encuentra usando la
tabla 2.2
3.
n
o
es el error estndar de la media, la desviacin estndar de la
distribucin muestral de medias muestrales.
4.
n
z
o
o
2
es la mitad del ancho del intervalo de confianza (el producto
del coeficiente de confianza y el error estndar) y se denomina error
mximo de estimacin, E.
5.
|
|
.
|

\
|

n
z X
o
o
2
es el lmite de confianza inferior y
|
|
.
|

\
|
+
n
z X
o
o
2
es
el lmite superior del intervalo de confianza.


Ejemplo 3.2
El cuerpo estudiantil de muchas universidades comunitarias es considerado
como una poblacin que viaja a diario. La oficina de actividades
estudiantiles desea obtener una respuesta a la pregunta Qu tan lejos viaja
(en un solo sentido) el estudiante promedio de la universidad comunitaria
para ir a la escuela cada da. Se identific una muestra aleatoria de 100
estudiantes que viajan para ir a la universidad, y se obtuvo la distancia
recorrida en un solo sentido por cada estudiante. La distancia media
resultante de la muestra fue de 10.22 millas. Estima la distancia media
recorrida en un solo sentido por todos los estudiantes que viajan para ir a la
universidad usando:
a) Una estimacin puntual.
b) Un intervalo de confianza de 95% ( usar 6 = o millas)

Solucin
a) Estimacin puntual.
1. El parmetro de inters es la media de las distancias recorridas en un
solo sentido por todos los estudiantes de la universidad comunitaria
que viajan.

2. Los criterios del intervalo de confianza.

- Un tamao de muestra es igual a 100, debe ser lo suficientemente
grande como para se cumpla el Teorema le lmite central, el cual
sostiene que la distribucin muestra es normal.
- La estadstica de prueba empleada para calcular los lmites de
confianza, es la variable normal estndar z, usando 6 = o .
- El 95% de confianza ) 1 ( o
100% = 95%

3. La informacin muestral que se proporciona en el planteamiento del
problema
n = 100,
22 . 10 = x
, la estimacin puntual para la distancia media en un solo
sentido es de 10.22

b) Intervalo de confianza del 95%.
- El coeficiente de confianza se encuentra usando la tabla 2.2

Nivel de
Confianza 99.73% 99% 98% 96% 95.45% 95%

93% 90% 80%

75% 68.27% 50%
Valores crticos
c
z
3 2.58 2.33 2.05 2 1.96


1.81 1.645 1.28


1.15 1 0.6745
o 0.0027 0.01 0.02 0.04 0.0455 0.05
0.07
0.10 0.20
0.25
0.3173 0.5
Tabla 2.2 Algunos Niveles de confianza que se utilizan en la prctica.


- Encontrar el error mximo de estimacin.
( ) 176 . 1 6 . 0 96 . 1
100
6
96 . 1
2
= =
|
|
.
|

\
|
=
n
z
o
o


- Encontrar los lmites de confianza.

( )
( ) 95 . 0 396 . 11 044 . 9
% 95 176 . 1 22 . 10 176 . 1 22 . 10
% 95
2 2
= < <
= + < <
=
|
|
.
|

\
|
+ < <

o
o o
n
z X
n
z X


- En consecuencia , con el 95% de confianza es posible afirmar que
la distancia media en un solo sentido est entre 9.04 y 11.39, lo
que se abrevia como: 9.04 a 11.39, el intervalo de confianza del
95% para

3.2.3 Aplicacin e interpretacin de resultados.
Qu significa decir que tiene una confianza de 95% de que el valor
verdadero de la media poblacional est dentro de un cierto intervalo? Si
nuestro objetivo fuera construir 20 de estos intervalos, cada uno por medio
de informacin muestral diferente, los intervalos podran parecerse a los
que se muestran en la figura 2.7. De los 20 intervalos, se podra esperar que
95% de ellos, o 19 de 20 funcionen como se ha planeado y contengan a
dentro de sus lmites superior e inferior. Es importante recordar que no se
puede estar completamente seguro de que cualquier intervalo particular
contenga la media , y nunca se sabr si su intervalo particular es uno de
los 19 que funcionaron, o si ste es el nico intervalo que fallo. El intervalo
estimado se deduce del hecho de que cuando se calculan intervalos
repetidos, 95% de stos contendrn a .



Figura 2.7

Veinte intervalos
de confianza para la
media del ejemplo
2.4
Nmero
de intervalos

















Un buen intervalo de confianza debe tener las siguientes dos
caractersticas:
- Ser tan estrecho como sea posible. Cuanto ms estrecho sea el
intervalo, habr localizado el parmetro estimado con ms exactitud.
- Tener un coeficiente grande, cercano a 1. Cuanto ms grande sea el
coeficiente de confianza, hay ms probabilidades de que el intervalo
contenga al parmetro estimado.

Ejemplo 3.3
Un cientfico interesado en vigilar los contaminantes qumicos en los
alimentos y, por tanto, la acumulacin de contaminantes en las dietas
humanas, eligi una muestra aleatoria en n = 50 adultos de sexo masculino.
Se encontr que la ingestin diaria promedio de productos lcteos era
756 = x gramos al da con una desviacin estndar de 35 = s gramos diarios.
Con esta informacin de la muestra construir un intervalo de confianza de
a) 95% y b) 99% para la ingestin diaria de productos lcteos de los
hombres.

Solucin
a) o 1 = 95%.

( )
70 . 765 30 . 746
% 95 70 . 9 756 70 . 9 756
% 95
50
35
96 . 1 756
50
35
96 . 1 756
< <
= + < < =
=
|
|
.
|

\
|
|
|
.
|

\
|
+ < <
|
|
.
|

\
|
=

P
P

Por tanto, el intervalo de confianza de 95% para

es de 746.30 a 765.70
gramos al da.

b)
o 1
= 99%

( )
77 . 768 23 . 743
% 99 77 . 12 756 77 . 12 756
% 99
50
35
58 . 2 756
50
35
58 . 2 756
< <
= + < < =
=
|
|
.
|

\
|
|
|
.
|

\
|
+ < <
|
|
.
|

\
|
=

P
P




005 . 0
2
=
o




- 2.58 0 2.58
0
Figura 2.8 ( ) 99 . 0 77 . 768 23 . 734 = < < P




Por tanto, el intervalo de confianza de 99% para es de 743.23 a 768.77
gramos al da. Este intervalo de confianza es ms ancho que el intervalo de
95%.

005 . 0
2
=
o

0.99
Como podemos observar el intervalo de confianza del b) es ms amplio que
del a), pese a que en ambos casos el tamao de la muestra es el mismo.
Esto significa que al aumentar el nivel de confianza, el margen de error
|
.
|

\
|
=
n
Z e
o
o
2
aumenta, pero disminuye la precisin en la estimacin
del parmetro. Por esa razn, es recomendable que se especifique el valor
de o deseado y la precisin el margen de error- requeridos, antes de
iniciar un estudio. A partir de estos datos se podr determinar el tamao de
muestra.



Determinar el tamao de
muestra.
El tamao de muestra se determina
despejando n de la frmula del
margen de error, esto es:

2
2
|
|
.
|

\
|
=
e
Z
n
o
o


2
o
Z
Es el valor de la distribucin
normal que corresponde al
nivel de confianza deseado.
o
Desviacin estndar
e
Margen de error permisible.





Ejemplo 3.4
Un bilogo desea estimar media de fosfato contenida por unidad de
volumen en un lugar. En estudios realizados aos anteriores se sabe que la
desviacin estndar es 5 = o . Cuntas muestras de agua debe analizar el
bilogo para tener una certeza del 90% de que error de estimacin no
excede 1.2?
Solucin

Datos que proporciona el ejercicio
5 = o , ( ) 90 . 0 1 = o , 05 . 0 2 = o , 645 . 1
05 . 0
= Z y
2 . 1 = e


Con esta informacin se puede aplicar la frmula para calcular el tamao
de muestra n, as

( )( )
47 97 . 46
2 . 1
5 645 . 1
2
2
2
~ =
|
.
|

\
|
=
|
|
.
|

\
|
=
e
Z
n
o
o


Por tanto el tamao de muestra es n = 47.
Si se quisiera aumentar la confianza, la nica manera de aumentar la
confianza sin incrementar la amplitud del intervalo es aumentar el tamao
de la muestra, n.
A medida que n aumenta, se tiene ms informacin para estimar

. Por
tanto, las estimaciones deben estar ms cerca de la muestra. Las
distribuciones muestrales para
x

basadas en muestras aleatorias de n = 5, n = 20 y n = 80 de una distribucin
normal se muestran en la figura 2.8 observa cmo se centran estas
distribuciones respecto a

y cmo disminuye la dispersin de las


distribuciones cuando n aumenta.


Figura 2.8

Distribuciones mustrales
para x basadas en muestras
aleatorias de
una Distribucin normal,
n = 5, 20 y 80




















La mayora de los estimadores de intervalo utilizados en estadstica
proporcionan intervalos de confianza aproximados ya que las suposiciones
en las que se basan no se satisfacen de manera exacta.



3.2.1 y 3.2.2
Estimacin de los Intervalos y Elementos que componen un
intervalo de confianza para proporciones poblacionales
(muestras grandes)

Muchos experimentos de investigacin o las encuestas por muestreo tienen
como objetivo estimar la proporcin de personas u objetos en un grupo
grande que poseen una cierta caracterstica. A continuacin se dan algunos
ejemplos:

- La proporcin de ventas que se puede esperar en un gran nmero de
contactos con clientes.
- La proporcin de estudiantes que acreditan un ciclo escolar
4 . 1 = o
x

n = 80





n = 20


n = 5
- La proporcin de votantes probables que planean votar por un
candidato particular.
- La proporcin de semillas que germinan.

Cada uno es un ejemplo prctico de un experimento binomial, y el
parmetro por estimar es la proporcin binomial p.
Cuando el tamao de la muestra es grande, la proporcin muestral,

ensayos de total Nmero
exitos de total Nmero
n
x
p = =


Es el mejor estimador puntual para la proporcin poblacional p. Puesto que
su distribucin muestral es aproximadamente normal, con media p y error
estndar
n
pq
p
=

o
,
p

se puede usar para construir un intervalo de


confianza acorde con el mtodo general dado en esta seccin.

Intervalo de confianza de ( ) % 100 1 o para una proporcin poblacional
p en una muestra grande.

Si el muestreo se realiza en una poblacin
infinita y con reemplazo, los limites de
confianza son.
n
pq
z p
2



Si la toma de muestras se hace sin
reemplazo de una poblacin de tamao
finito.

1

N
n N
n
pq
z p
o


Donde
2
o
z es el valor de z que corresponde a un rea
2
o
en la cola
derecha de una distribucin normal estndar de z. Puesto que se
desconocen p y q, se estiman por medio de los mejores estimadores
puntuales: p y q . Se considera que el tamao de la muestra es grande
cuando la aproximacin normal a la distribucin binomial es adecuada; a
saber, cuando np > 5 y nq > 5.

3.2.3 Aplicacin e interpretacin de resultados.

Ejemplo 3.5
Una muestra aleatoria de 985 votantes probables los que tienen ms
probabilidades de votar en las prximas elecciones fueron encuestados por
telfono por el Partido Revolucionario. De los 985 encuestados, 529
indicaron que pensaban votar por el candidato revolucionario en las
prximas elecciones. Construye un intervalo de confianza de 90% para p, la
proporcin de votantes probables en la poblacin que piensa votar por el
candidato revolucionario. Con esta informacin, puedes concluir que el
candidato ganar la eleccin?

Solucin
La estimacin puntual de p es
601 . 0
985
592
= = =
n
x
p



El error estndar es
( )( )
01560 . 0
985
399 . 0 601 . 0
= = =
n
q p
n
pq


El valor z para un intervalo de confianza de 90% es el valor que tiene rea
05 . 0
2
=
o
en la cola superior de la distribucin de z, o bien
645 . 1
05 . 0
= z
de la tabla 2.2. El intervalo de confianza de 90% para p es

( )
( ) % 90 627 . 0 575 . 0
% 90 026 . 0 601 . 0 026 . 0 601 . 0
% 90

645 . 1

645 . 1
= < <
= + < <
=
|
|
.
|

\
|
+ < <
p
p
n
q p
p p
n
q p
p

Se estima que el porcentaje de votantes probables que piensan votar por el
candidato republicano est entre 57.5% y 62.7%. El candidato ganar la
eleccin? Si se supone que necesita ms de 50% de los votos para ganar, y
puesto que los lmites de confianza superior e inferior exceden este valor
mnimo, puede decir con 90% de confianza que ganar el candidato.

Sin embargo, hay algunos problemas con este tipo de encuesta por
muestreo.
Qu pasa si los votantes que se consideran votantes probables en
realidad no asisten a las elecciones?
Qu sucede si un votante cambia de opinin entre el da en que respondi
a la encuesta y el da de la eleccin?
Qu pasa si un votante encuestado no responde con veracidad cuando le
pregunta un trabajador de la campaa?

El intervalo de confianza de 90% que se ha construido le da 90% de
confianza slo si ha seleccionado una muestra aleatoria de poblacin de
inters. Nosotros ya no podramos estar seguros de tener una confianza
de 90% si la muestra es sesgada o si la poblacin de respuestas de votantes
cambian antes del momento de la eleccin!

Determinar el tamao de muestra.

Determinemos ahora qu tan grande se requiere que sea una muestra para
asegurar que el error al estimar p sea menor que una cantidad especfica e.




Determinar el tamao de muestra.
Si p se utiliza como estimacin de p, podemos tener
una confianza del ( ) % 100 1 o de que el error ser
menor que una cantidad especfica e cuando el
tamao de la muestra es aproximadamente.

|
|
|
.
|

\
|
=
2
2
2

e
q p Z
n
o



Ejemplo 3.6
Qu tan grande se requiere que sea una muestra si tenemos
96 . 1
2
=
o
Z
,
68 . 0 = p
,
32 . 0 = q
y
02 . 0 = e

Solucin
( ) ( )( )
( )
2090
02 . 0
32 . 0 68 . 0 96 . 1
2
2
= = n


Por tanto, s basamos nuestra estimacin de p sobre una muestra aleatoria
de tamao 2090, podemos tener una confianza de 95% de que nuestra
proporcin muestral no diferir de la proporcin real por ms de 0.02

La muestra permite calcular los errores estadsticos a que est sujeta la
investigacin. La seguridad de una muestra se refiere al error de muestreo.
Una seguridad de 95% quiere decir que, si tomamos cien muestras, habr
cinco donde los resultados se alejan de la realidad o, lo que es lo mismo,
que hay 95% de probabilidades de tener razn. La homogeneidad se refiere
al grado de conocimiento de una poblacin. Se indica, por lo general, en
trminos de una proporcin
( ) q p
y la proporcin que se expresa en
porcentajes
40 60 30 70 , 50 50 o
. Siempre la suma dar cien.
Cuando en una investigacin no se tienen antecedentes de ningn tipo,
la nica proporcin que podemos utilizar es
50 50
.

La frmula ms sencilla para calcular una muestra aleatoria, cuando la
seguridad es de 95% y la homogeneidad o proporcin es de
50 50
(en
estas condiciones se calculan prcticamente todas las muestras), es uno
entre el error aceptable al cuadrado
|
.
|

\
|
2
1
e


Por ejemplo si consideramos la seguridad de 95% y la proporcin es de
50 50
, % 2 = e
El tamao de la muestra ser
2500
) 02 . 0 (
1 1
2 2
= =
|
.
|

\
|
e
, el resultado es
vlido cuando la muestra no agot al universo. El universo debe ser mayor
o igual a siete veces la muestra. Por el contrario, cuando el universo es
exhaustivo, es decir, la muestra es mayor que el universo, entonces se
recurre a una frmula de correccin
( ) n N
Nn
n
+
= '
, donde N es el universo
y n la muestra o exhaustiva. Por ejemplo, si consideramos nuevamente la
seguridad de 95% y la proporcin es de
50 50
,
% 2 = e
, pero un
universo de 3000, la muestra sera de 2500, que agota al universo de 300
personas.
Por tanto, recurrimos a la frmula de correccin y nos queda:
( )
268
300 2500
300 2500
=
+

= ' n

En vista del resultado, en lugar de utilizar una muestra es preferible
levantar un censo, ya que se evitan los errores estadsticos y se cuenta con
la mayor precisin.