Está en la página 1de 10

Navarro

Estimación por intervalo de la proporción poblacional (p).


(muestra grande, aproximación normal)

Por las propiedades estudiadas de la proporción muestral p , sabemos que éste es un estadístico cuyo

valor medio es  p = p y su error estándar es σ  = pq . Además, para muestras grandes, tiene


p n
distribución aproximadamente normal. Por lo tanto p̂ es un buen estimador del parámetro p.

Si estandarizamos el estimador p , obtenemos

p −p
Z=
pq
n
la cual es una variable normal estándar

Para construir un intervalo de confianza para estimar el parámetro p utilizamos la normal estándar.
Determinamos un intervalo alrededor de la media de Z que tenga una probabilidad predeterminada 1-α:

α/2 1-α
α/2

-Z 2 Z 2
0

P(-Z 2  Z  Z 2 ) = 1− 


p− p
P( - Z 2   Z 2 ) = 1 − 
pq
n

haciendo un despeje algebraico en la desigualdad se obtiene

 pq  pq
P( p - Z 2  p  p + Z 2 ) =1 −
n n

de donde el intervalo queda como sigue:

29
Navarro

 pq
p: p  Z 2
n
Esta última expresión tiene el inconveniente de que se necesita conocer el valor de p, que es precisamente
el parámetro que estamos estimando. Para salvar esta dificultad sustituimos p por su estimador puntual

p , lo cual nos proporcionará un intervalo aproximado:

Intervalo de (1-α)100% de confianza para p


 
 pq
p: p  Z 2
n

Ejercicio 1: Se desea estimar el % de televidentes del sábado por la tarde que ven el programa “ABC”.
Una muestra aleatoria de 228 televidentes del sábado por la tarde mostró que 90 veían dicho programa.
Determinar un intervalo del 95% de confianza para hacer la estimación.

Solución:

p: Proporción poblacional de televidentes del sábado tarde que ven el programa “ABC”
(q=1-p: Proporción poblacional de televidentes del sábado tarde que no ven el programa “ABC”)
𝑋
Datos muestrales: n=228 y x=90; 𝑝̂ = = 0.395 𝑦 𝑞̂ = 0.605
𝑛
Nivel de confianza de la estimación: 1-=0.95  Z/2=1.96
Intervalo del 95% de confianza para p  p: 0.395  0.063; o en porcentaje: % : 39.5  6.3
También se puede expresar así: o.332 ≤ p ≤ 0.458

O en porcentajes: 33.2 ≤ % ≤ 45.8

Cuando trabajamos con una población que no es muy grande y conocemos el tamaño poblacional N, el
intervalo cambia ligeramente al tomar en cuenta el factor de corrección para población finita:

Intervalo de (1-α)100% de confianza para p


(población finita de tamaño N)
 
 pq N− n
p: p  Z2
n N −1

Ejercicio 2: En una comunidad de 1,620 familias se desea estimar el porcentaje de éstas que tienen un
ingreso anual de $3,000.00 o menos. Una muestra aleatoria de 440 familias mostró que 154 tenían un
ingreso tal. Hacer la estimación mediante un intervalo del 95% de confianza.
30
Navarro

Solución: p: Proporción de familias de la comunidad cuyo ingreso anual es $3,000.00 ó menos.


(q=1-p: Proporción de familias de la comunidad cuyo ingreso anual es mayor a $3,000.00) .

Tamaño de la población: N=1,620 familias


𝑋
Datos muestrales: n=440 y x=154; 𝑝̂ = = 0.350 𝑦 𝑞̂ = 0.650
𝑛
Nivel de confianza de la estimación: 1-=0.95  Z/2=1.96
Intervalo del 95% de confianza para p  p: 0.350  0.038; o en porcentaje: %: 35.0  3.8
También se puede expresar así: 0.312 ≤ p ≤ 0.388

O en porcentajes: 31.2 ≤ % ≤ 38.8

Determinación del tamaño de muestra necesario


Para estimar una proporción poblacional “p”
En una población grande o infinita

El error en valor absoluto, e, al estimar p por medio de p es la diferencia

e = │p - p │

Este error no se puede conocer exactamente, pero se puede encontrar una cota superior. Valiéndonos de
la normal estándar tenemos

α/2 α/2
1-α

0
-Z  2 Z 2

P(-Z 2  Z  Z 2 ) = 1− 


p− p
P(-Z 2   Z 2 ) = 1 − 
pq
n

pq  pq
P(− Z  2  p− p  Z 2 ) = 1−
n n

31
Navarro

 pq
P( ¦ p − p ¦  Z  2 ) =1−
n

Esta última ecuación probabilística nos dice que el error, en valor absoluto, al estimar p por medio de p
es, con probabilidad 1-α, menor o igual a

pq
Z 2
n
Esto significa que el error máximo, llamado margen de error, que puede haber con probabilidad 1-α, al
pq
estimar p por medio de

p es E = Z 2
n

Si despejamos n de la última ecuación obtenemos:

2
Z p q
n= 2

E2

Que es la expresión para determinar el tamaño de muestra necesario para estimar p con un error
máximo E y con probabilidad 1-α. La fórmula anterior tiene el inconveniente de que es necesario conocer
el valor de p, el parámetro que deseamos estimar y que no se conoce. Para solventar este inconveniente
se utiliza uno de los tres criterios siguientes:

1. Estudios anteriores de la misma población dan una idea aproximada del valor de p. Usar éste en
la fórmula (recuerde que q=1-p).

2. Mediante la información proporcionada por una muestra piloto, se calcula la proporción de esta
muestra y se usa en vez de p en la fórmula.

3. Se sustituye en la fórmula el valor para p que produce el más grande valor de n. Éste es p=½ y
q=(1-p)=½.

 12  Z 
2 1 2
Z
n= = 2 2 
2
2

E 2  4E 
 

El criterio último es el más utilizado y la fórmula del tamaño de muestra queda así:

2
Z
n= 2

4 E2

Ejercicio 3: Se desea estimar el porcentaje de trabajadores del país que estarían dispuestos a pagar más
por una mejora sustancial en los servicios de salud. ¿De qué tamaño debe ser la muestra si se desea que
el error en la estimación no sobrepase el 3.5%, con una confiabilidad (probabilidad) del 95%?. (no se tiene
idea de este porcentaje ni se dispone de la información de una muestra piloto).

32
Navarro

Solución:
p: Proporción de trabajadores del país que estarían dispuestos a pagar más por una mejora.
(q=1-p: Proporción de trabajadores del país que no estarían dispuestos a pagar más por una mejora.)

Nivel de confianza de la estimación: 95%  1-=0.95  /2=0.0250  Z/2=1.96

Margen de error del 3.5%  E=0.035

𝟏.𝟗𝟔𝟐
𝒏= = 𝟕𝟖𝟒
𝟒(𝟎.𝟎𝟑𝟓)𝟐

Para hacer la estimación debe tomarse una muestra aleatoria de n=784 trabajadores.

Tamaño de muestra necesario para estimar p en una población finita de tamaño N.


Si la población es de tamaño N, la fórmula del margen de error tiene la forma

pq N − n
E = Z2
n N −1

Manipulando algebraicamente la ecuación anterior se llega al siguiente resultado para el cálculo del tamaño
de muestra (n) en dos pasos:

1. Se calcula un n0 previo usando la fórmula para población grande (o infinita):

2 2
Z p q Z
n0 = 2
n0 = 2
2
4 E2
o según el caso.
E

2. Seguidamente se calcula el n definitivo mediante la siguiente fórmula:

n0
n=
1 + nN0

Ejercicio 4: En una comunidad donde habitan 2,500 familias, Se desea estimar el % de éstas que tienen
adultos analfabetos. ¿De qué tamaño debe ser la muestra aleatoria para que la estimación tenga un margen
de error del 3.5% y con un nivel de confianza del 95 %?.

Solución:
p: Proporción de familias de la comunidad que tienen adultos analfabetos.
(q=1-p: Proporción de familias de la comunidad que no tienen adultos analfabetos).

Nivel de confianza de la estimación: 95%  1-=0.95  /2=0.0250  Z/2=1.96

Margen de error del 3.5%  E=0.035

𝟏.𝟗𝟔𝟐 𝑛0 784
𝒏𝟎 = = 𝟕𝟖𝟒  𝒏= 𝑛 = 784 =597
𝟒(𝟎.𝟎𝟑𝟓)𝟐 1+ 0 1+
𝑁 2,500

Debe usarse una muestra aleatoria de n=597 familias.


33
Navarro

Ejercicio 5: Suponga que se realiza el muestreo (del ejercicio 4) y se encuentra que en 200 familias de las
muestreadas hay adultos analfabetos. Determina un intervalo del 95% de confianza para estimar dicho
porcentaje en toda la comunidad.

Solución: p: Proporción de familias que tienen adultos analfabetos.


(q=1-p: Proporción de familias que no tienen adultos analfabetos.

Tamaño de la población: N=2,500 familias


𝑋
Datos muestrales: n= y x= ; 𝑝̂ = =
𝑛

Nivel de confianza de la estimación: 1-=  Z/2=

Intervalo del 95% de confianza para p:

(Realiza los cálculos)

34
Navarro

Estimación por intervalo de la media poblacional (μ)


Cuando la característica de interés en la población estudiada es cuantitativa, generalmente deseamos
estimar la media poblacional μ. El estimador usual es la media muestral X , la cuál tiene distribución
 


n

normal (o aproximadamente normal) con media  x =  y error estándar x =


  N−n

 n N−1

x −
Al estandarizar el estimador, obtenemos Z = y podemos plantear las siguientes ecuaciones
x
probabilísticas:

α/2 1-α
α/2

-Z  2 0 Z 2

P(-Z 2  Z  Z 2 ) = 1− 

x −
P(-Z 2   Z 2 ) = 1− 
x

Haciendo el despeje algebraico obtenemos un intervalo del (1-)100% de confianza para la media
poblacional:

 : x  Z 2  x

la cual, para población grande es:


 : x  Z 2
n

y para población finita de tamaño N:

 N− n
 : x  Z 2 N−1
n

35
Navarro

(Nótese que es necesario conocer la desviación estándar poblacional σ para calcular el error estándar de
la media  x . Si no se conoce σ pero la muestra es grande (n30), se puede sustituir σ por su
estimador muestral S, σ  S).

Ejercicio 6: un analista financiero selecciona al azar el 10% de las 950 cuentas incobrables de un comercio,
con el objeto de estimar el monto medio por cuenta (). Después de analizar la muestra obtuvo una media
de 𝑋̅ =35.40($) y una desviación estándar de S=7.50$. Hacer la estimación mediante un intervalo del 90%
de confianza.

Solución:
µ = Monto medio de las 950 cuentas incobrables. (N=950 cuentas)
Datos muestrales: n= 95 cuentas, 𝑋̅ =35.40($), S=7.50($)

Para estimar µ mediante un intervalo del 90% de confianza usaremos la expresión:

 N− n
 : x  Z 2 N−1
n

Confiabilidad 1-= 0.90  /2= 0.05  Z/2 1.65


Como  no se conoce y la muestra es grande (n=95) puedo usar   S=7.50($)

7.50 950−95
µ: 35.40 ± 1.65 √ $  µ: 35.40  1.21 $. También se puede expresar
√95 949
así:
34.19 ≤  ≤ 36.61 ($).

Distribución t
Si no se conoce σ y la muestra no es suficientemente grande, se puede utilizar un estadístico exacto, como
lo es el estadístico t (ó t-student).

En nuestro caso el estadístico a utilizar es el siguiente:

x −
t = S
n

el cual tiene una distribución de probabilidades llamada distribución t. Ésta depende de un parámetro
=n-1 al que se le llama grados de libertad.

La distribución t tiende a la normal estándar a medida que los grados de libertad crecen. A continuación se
dan las gráficas de tres distribuciones t (=1, 2, 5) y la normal estándar

36
Navarro

0.45
0.40
0.35
distrib. normal std. Z
0.30
0.25 distrib. t con =5
0.20 distrib. t con =2

0.15 distrib. t con =1

0.10
0.05
0.00 0

Haciendo un trabajo similar al que se hizo con la distribución normal estándar, se puede deducir un intervalo
de confianza para μ cuando no se conoce σ. El intervalo de confianza que resulta cuando utilizamos el
estadístico t es el siguiente:
S
 : x  t 2
n

El valor del estadístico t se puede leer en tablas o utilizar excel. Este valor depende del nivel de confianza
(1-α) y de los grados de libertad (=n-1).

Si la población es finita de tamaño N, podemos usar el factor de corrección y el intervalo queda de la


siguiente manera:

S N−n
 : x  t 2 N−1
n

Ejercicio 7: Los datos que se dan corresponden a los tiempos, en minutos, que se tardaron 10 clientes en
recibir el servicio en una estación de gasolina: 5.5 10.0 7.5 12.0 9.5 14.5 10.0 9.5 8.5 y 14.0. Determina
un intervalo del 90% de confianza para estimar el tiempo medio de servicio.

S
Solución: Utilizaremos la expresión  : x  t 2
n
Datos muestrales: ingresamos los 10 datos en la calculadora con modo estadístico de una variable y
obtendremos n=10, 𝑋̅ =10.1 min. y S=2.78 min.

Valor t de tablas: confiabilidad de intervalo: 1-=0.90  /2=0.05  t/2=1.833


(para determinar el valor t/2 se busca la columna encabezada por la probabilidad cola 0.05 y luego la fila
que corresponde a los grados de libertad =n-1=10-1=9. En la intersección de columna y fila se encuentra
el valor t=1.833)
Efectuando las operaciones indicadas en la expresión del intervalo de confianza obtenemos
µ: 10.1  1.6 min. o también 8.5 ≤  ≤ 11.7 min.

37
Navarro

Determinación del tamaño de muestra necesario


para estimar una media poblacional μ

Utilizando las propiedades de normalidad que tiene X y con un trabajo algebraico similar al que se hizo
para establecer un intervalo de confianza, se pueden determinar los siguientes resultados:

• Máximo error, E, que se puede cometer con probabilidad 1-α, al estimar µ por medio de X

E = Z2 
n

• Tamaño de muestra necesario para estimar µ con un error no más grande que E y con probabilidad
1-α
2
Z  2
n= 2

E2

• Si la población es finita, el tamaño de muestra se puede calcular en dos etapas:

1. Se calcula un n0 previo, usando la fórmula anterior

2
Z  2
n0 = 2

E2

2. Se calcula el n definitivo

n0
n= n0
1+ N

nótese que es necesario conocer σ2 . Si ésta no se conoce hay que estimarla de alguna manera, con una
muestra piloto por ejemplo, y sustituir en la fórmula σ2 por su estimación S2.

Ejercicio 8: Relativo al ejercicio anterior, ¿de qué tamaño debería de tomarse una muestra para estimar
el tiempo medio de servicio
a) con un margen de error de 1.0 min y con probabilidad 0.90. (se sugiere tomar los 10 datos como
una muestra piloto).
b) con un margen de error de 0.5 min y con probabilidad 0.90. (se sugiere tomar los 10 datos como
una muestra piloto).

Solución: a) Margen de error= E= 1.0 min. confiabilidad=1-=0.90  /2 = 0.05  Z/2=1.65


  s= 2.78 min.
2
Z  2
(1.65)2 (2.78)2
n= 2
2  =21
E (1.0)2

b) Margen de error= E= 0.5 min. confiabilidad=1-=0.90  /2 = 0.05  Z/2=1.65


  s= 2.78 min.
n= . . . =84

38

También podría gustarte