Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes Sem 7 Interv Confianza - P
Apuntes Sem 7 Interv Confianza - P
La media
La media
Si por ejemplo decimos que el 42% de los escolares de la comunidad suelen perder
al menos un da de clase a causa de gripes y catarros, nos referimos a la poblacin
y la proporcin la designamos por p = 0.42. Sin embargo, si observamos
1000 escolares donde 540 han perdido clase nos referimos a la muestra y la
proporcin la designamos por
p=0.54 .
Podramos a
perdido clase
muestral (de
poblacional es
2. DISTRIBUCIONES MUESTRALES
2.1. Distribucin muestral de la proporcin
Si en una poblacin conocemos la proporcin p de los individuos que tienen
cierta caracterstica, podemos elegir aleatoriamente muestras de tamao n y
obtener la proporcin en cada muestra.
Muestra 1: p1 n1
Muestra 2: p2 n2
Poblacin
p
Muestra k : pk nk
x
xitos
p= =
n tamao de la muestra
Como sabes, el nmero de xitos x de una muestra de tamao n se
distribuye de forma binomial B(n; p), luego a partir de aqu vamos a determina
la distribucin de la variable p .
Si por ejemplo sabemos que el 40% de los escolares de nuestro instituto
tienen computadora en casa, podemos preguntar aleatoriamente a grupos
de tamao n=50 y obtener la proporcin de los que tienen ordenador en
cada muestra.
Muestr
a
Muestr
a1
Muestr
a
. . 2.
Muestr
ak
xit
21
22
...
p =
21/50=0.42
p =
22/50=0.44
18
p N p ,
p (1 p)
n
Ejemplo
En una localidad de 6000 habitantes, la proporcin de menores de 16
aos es p= 1/4.
a) Cul es la distribucin de la proporcin de menores de 16 aos
en muestras de 50 habitantes de dicha poblacin?
b) Halla la probabilidad de que, en una muestra de 50 habitantes, existan
entre 14 y 20 habitantes menores de 16 aos.
Solucin
a)
(
)
1
p= =0.25 ,
4
p N p ,
es decir,
0.25(10.25)
50
n=50, =np=500.25=12.5 , = npq= 500.250.75=3.06
p N 0.25,
b)
p (1 p)
n
x N ( 12.5,3.06 )
P [ 14 x 20 ] =P
=
13.512.5
20.512.5
x
=P [ 0.33 x 2.61 ]
3.06
3.06
Ejemplo
El 42% de los habitantes de un municipio es contrario a la gestin del
alcalde y el resto son partidarios de este. Si se toma una muestra de 64
individuos, cul es la probabilidad de que ganen los que se oponen al
alcalde?
Solucin
p=
x
>0.5
64
o equivalentemente, que el
x> 0.564=32.
P [ x 33 ] =1 P [ x 32 ] =1P z
3226.88
=1 ( 1.42 )=0.0788
3.95
Muestra 1: x 1 n1
Muestra 2: x 2 n2
Poblacin
N ( ; 2 )
Muestra k : x k n k
x =
x N (; )
Si suponemos que
x 1 + x 2+ + x n
n
x =
y varianza
2 x =
2
n
( )
x N ,
n
392 gr
50
2 x =
50
=
n 16
x =400 y varianza
x N 400, 50
16
Ejemplo
El peso de los libros de texto en el instituto se distribuye de forma normal
y su peso medio es de = 400 g y su desviacin tpica = 50 g, Si
tomamos una muestra aleatoria de tamao n = 16, hallar la
probabilidad de que el peso medio est entre 375 y 425 g.
Solucin
x N (400 ; 502)
. Entonces:
P [ 375 x 425 ] =P
x N 400, 50
16
375400
425400
x
=P [ 2 x 2 ]
50
50
16
16
( 2 ) (2 )=2 ( 2 )1=0.9545
3. INTERVALOS DE CONFIANZA
Los intervalos de confianza son intervalos aleatorios que se obtienen para estimar los parmetros desconocidos de la poblacin a partir de los estadsticos
de las muestras.
Aqu se estudian dos casos.
Poblacin
p desconocida
p=x /n
Muestra : p n
Poblacin
N ( ; 2 )
Muestra : x n
desconocida
El grfico muestra que la informacin se obtiene a partir de la muestra, y
con esa informacin estimaremos el valor desconocido del parmetro .
Es importante resaltar que estos problemas son de inferencia o estimacin.
Los parmetros son desconocidos y la informacin se obtiene a partir de las
muestras.
p N p ,
p(1 p)
n
P Z /2
Sustituyendo Z:
Despejando p, IC:
Z 1 /2
p p
Z 1 / 2 =1
p(1 p)
n
p Z /2
es el cuartil
p (1 p )
(1p )
p
p p + Z 1 /2
n
n
1 /2 de la distribucin normal.
Ejemplo
Si el porcentaje de individuos daltnicos en la muestra de tamao
36 es igual al 30%, Se desea estimar la proporcin p de individuos
daltnicos de una poblacin con un nivel de confianza de 1 = 0.95.
Solucin
p=0.3
n=36
1 =0.95 .
Z 1 /2=Z 0.975=1.96
El intervalo viene dado por
[
[
IC= p Z /2
p (1 p )
p (1 p )
p p + Z1 /2
x N ( 0,1 )
n
n
0.30.7
0.30.7
p 0.3+1.96
36
36
0.30.1497
0.3+0.1497
[
]
IC= 0.31.96
p (1 p )
n
Error=e=Z1 /2
p (1 p )
0.3 ( 0.7 )
=1.96
=0.1123
n
64
Ejemplo
Si en el ejemplo anterior queremos un error de 0.1, manteniendo el
mismo nivel de confianza del 0.95. Cul sera el tamao de la
muestra que debemos elegir?
Solucin:
Despejamos en la expresin del error el valor del tamao n de la muestra
y sustituimos por Z 1 /2=1.96 ,
=0.3 y e=0.1
p
2
2
Z 1 /2
1.96
n=
p( 1 p )=
( 0.3 )( 0.7 ) 81
e
0.1
( )
Ejemplo
En un instituto de Enseanza Secundaria hay matriculados 800
alumnos. Tomamos una muestra aleatoria de 120 alumnos. En ella, 24
alumnos afirmaron que utilizaban la cafetera del instituto.
Determinar, con un nivel de confianza del 99%, el error cometido al
estimar a partir de los datos, la proporcin de alumnos que utilizan la
cafetera.
Solucin:
Error=e=Z1 /2
24
24
( 1
)
p (1 p )
0.2 ( 0.8 )
120
120
=Z 0.995
=2.58
=0.094
n
120
120
10
( )
x N ,
n
, a partir de la
La media muestral
x 1 + x 2+ + x n
n
x
z=
N (0,1)
Tipificar/estandarizar:
n
Si fijamos una probabilidad 1 , se tiene:
x =
aleatoria de tamao n.
P [ Z / 2 z Z 1 /2 ]=1
1
: Nivel de confianza
: Nivel de significacin.
Z 1 /2
1 /2 de la distribucin
: Percentil
normal.
Sustituyendo Z:
P Z /2
x
Z 1 /2 =1
conocida es:
IC= x Z / 2
; x +Z 1 /2
n
n
La distribucin de
x para muestras pequeas no se ajusta a la
ecuacin anterior.
En caso de muestras grandes (n 30) la aproximacin es buena, y se
puede sustituir
Sx
por
con
IC= x Z / 2
desconocida
y n 30:
S
S
; x + Z 1 /2
n1
n1
Ejemplo
Se tom una muestra aleatoria de 16 individuos a los que se midi el nivel
de glucosa en sangre, obteniendo una media muestral de 110 mg/cc. Se
sabe que la desviacin tpica de la poblacin es de 20 mg/cc. Obtener un
intervalo de confianza, al 95%, para el nivel medio de glucosa en sangre
en la poblacin.
Solucin:
n=16
11
IC= x Z / 2
; x +Z 1 /2
n
n
] [
1101 .96
20
20
; 110 +1. 96
16
16
con
x Z /2
; x + Z 1 /2
n
n
un nivel de confianza de 1 , hay probabilidad 1
de que el
intervalo obtenido contenga al valor real y desconocido de .
Al calcular el I.C. para la media
Esto significa que, para el ejemplo anterior, tenemos una probabilidad del
95% de que el intervalo
[ 100.2; 119.8 ] contenga la media real y
desconocida de glucosa en sangre en la poblacin.
Estudio del error
Cuando calculamos el intervalo de confianza para la media
nivel de confianza de 1
tenemos:
al
Ejemplo
Si en el ejemplo anterior el tamao de la muestra fuese 64.
valdra el error o semi-amplitud del intervalo?
Cunto
Solucin:
El error o semi-amplitud del intervalo se aprecia en la expresin del
intervalo de confianza:
Error=e=Z1 /2
1.9620
=
= 4.9
n
64
Ejemplo
Si en el ejemplo anterior quisiramos un error de 1 mg/cc. Cul
sera el tamao de la muestra adecuado?
Solucin:
Despejamos en la expresin del error el valor del tamao n de la muestra
y sustituimos por Z 1 /2=1.96 ,
=20 y e=1
n=
Z 1 /2 2 201.96 2
=
1537 Individuos
e
1
) (
12
Ejercicio 1:
Cierto tipo de componentes elctricas tienen una resistencia media de 200, con
desviacin tpica = 10 .
Se utilizan 25 de ellas en un circuito:
a. Calcular la probabilidad de que la resistencia media de las 25 componentes est
entre 199 y 202 .
b. Calcular la probabilidad de que la resistencia total de las 25 componentes no
supere los 5100 .
Solucin
x N (200,100)
a.
P [ 199< x <202 ] =P
x N (200,
] [
100
)
25
199u
202u
199200
202200
< Z<
=P
<Z <
/ 25
/ 25
10/ 25
10/ 25
x < 204
204u
=P [ Z 2 ]
/ 25
( 2 ) =0 , 9772
Otro enfoque:
Resistencia total=
R=R 1+ R 2 + R n
( R )= 25102
Entonces,
(Desviacin de 25 resistencias)
R N (5000,50)
51005000
= ( 2 )=0 ,9772
50
Ejercicio 2:
Sea p la proporcin de fumadores en una poblacin.
Entre 1000 personas elegidas al azar, hay 600 fumadores.
Determinar un intervalo de confianza para p, con un nivel de confianza 0,95.
Solucin
n=1000 p =
600
=0.61 =0.95 z =z 0.975=1.96
1
1000
2
IC= p Z /2
p (1 p )
p (1 p )
p p + Z1 /2
n
n
13
IC= 0.61.96
0.6 ( 0.4 )
0.6 ( 0.4 )
p 0.6+1.96
1000
1000
n=100 p =
10
=0.11 =0.95 z =z 0.975=1.96
1
100
2
[
[
IC= p Z /2
IC= 0.11.96
p (1 p )
p (1 p )
p p + Z1 /2
n
n
0.1 ( 0.9 )
0.1(0.9)
p 0.1+1.96
100
100
Ejercicio 4:
Se quiere estimar la proporcin de zurdos en una poblacin con una confianza del
95% y una precisin de 0,01.
a. Cul debe ser el tamao de la muestra elegida?
b. Mediante un muestreo previo se estima que p0,1. Qu tamao debe tener la
muestra si para calcularlo se utiliza la estimacin de p dada?
Solucin
a. Determinar el tamao de una muestra
tamao :n 1=0.95 z
Error=Z 1 /2
Error=1.96
=z 0.975 =1.96
p (1 p )
=0.01
n
0.50.5
=0.01
n
n=
b. Si p0.1,
1.96
0.10.9=3458
0.01
( )
n=
14
1.96
0.25=9604 individuos .
0.01
( )
Ejercicio 5:
Se desea estimar la proporcin p de electores que votarn al candidato poltico
A, con un nivel de confianza 0,9 y una precisin de 0,05. Qu tamao debe
tener la muestra?
Solucin
Error=Z 1 /2
1.645
=z 0.95=1.645
p (1 p )
=0.05
n
(Tomo p=0.5)
0.50.5
1.645 2
=0.05 n=
0.50.5 271
n
0.05
Ejercicio 6:
En una poblacin muy grande, se extrae al azar una muestra de 100 votantes
para conocer sus opiniones respecto de dos candidatos. De los individuos de la
muestra, 55 apoyan al candidato A y 45 apoyan al candidato B.
Se pide:
a. Calcular un intervalo de confianza para la proporcin de votos a favor de cada
candidato.
b. Calcular cul debera ser el tamao de la muestra para que una fraccin 0,55
de partidarios de A nos d una confianza del 95% de que ste saldr elegido.
Solucin
IC= p Z /2
=z 0.975 =1.96
p (1 p )
p (1 p )
p p + Z1 /2
n
n
IC A= 0.551.96
0.55 ( 0.45 )
0.55(0.45)
p 0.55+1.96
100
100
IC B= q Z /2
q (1q )
q(1q )
q q +Z 1 / 2
n
n
15
IC B= 0.451.96
0.45 ( 0.55 )
0.45(0.55)
q 0.45+1.96
100
100
Estandarizando:
p N p ,
P [ p <0.5 ] =P Z <
p (1 p)
n
p N 0.55,
0.55(0.45)
n
0.55(0.45) = -1.645
n
es decir
0.50.55
=0.0 5=(1.6 4 5)
0.55( 0.45)
n
0.50.55
Luego,
1.65 2
n=
0.550.45=269 ms
0.05
( )
Por tanto, si la p real para A es de 0,55, una muestra de al menos 269 entrevistados
nos garantizara a un nivel de confianza del 0,95 que A sera el elegido.
16
17
1 y
2 desconocidas
x 1 y
IC= ( x 1 x 2 )Z 1 / 2
Es decir:
( x 1x 2 )Z1 /2
21 22
21 22
+ ; ( x x ) + Z 1 /2
+
n1 n2 1 2
n1 n 2
21 22
+
n1 n2
12 ( x 1x 2 ) +Z 1 /2
21 22
+
n1 n2
Ejemplo
Una muestra de 100 pacientes con la enfermedad A, internados en un
hospital de enfermedades crnicas, registr 35 das de permanencia
media en el hospital.
Otra muestra de 100 pacientes con la enfermedad B permaneci durante
un promedio de 28 das.
Si las varianzas de la poblacin son 100 y 255, respectivamente, calcular
el intervalo de confianza del 95% para A - B
Solucin:
Muestra A:
n A =100,
x A=35, 2A =100
Muestra B:
n B=100,
x b=28, 2B=255
x A - x B=3528=7 ,
A B=
Al nivel de 95%:
Z 1 /2=1.96
21 22
+ =1.88
n1 n2
18
[ 3.31; 10.68 ]
1 y
2 desconocidas
21
a) Varianzas Iguales
22
x 1 y
tamaos
IC= ( x 1 x 2 )t 1 /2
Es decir:
( x 1x 2 )t 1 / 2
(1 , n1+n22)
2
^S2c ^S2c
S^ 2c S^ 2c
+ ; ( x x ) +t
+
n1 n 2 1 2 1 /2 n1 n2
S^ 2c S^ 2c
+
n1 n2
12 ( x 1x 2 ) +t 1 /2
^S2c ^S2c
+
n1 n2
Ejemplo
El encargado de compras de una cadena de restaurantes tiene que
escoger entre dos variedades de arroz A y B. Selecciona dos muestras
aleatorias independientes de 10 bolsas de arroz de un kilo de cada tipo de
arroz y encuentra los siguientes porcentajes quebrados por kilo.
A:
B:
7
6
6
5
10
8
6
n A =10,
x A=7.3, S^ 2A =2.23
Muestra B:
n B=10,
92.23+91.822
2
S^ c =
=2.026
18
Al nivel de 95 :t
=t (0.975,18) =2.101
(1 , n1+n22)
2
S^ 2 S^ 2
x A - x B=7.35. 4=1.9 , S AB = c + c = 2.026 + 2.026 =0.636
n1 n2
10
10
19
20
[ 0.563; 3.24 ]
21
b) Varianzas distintas
22
x 1 y
IC= ( x 1 x 2 )t 1 /2
Es decir:
g=
( x 1x 2 )t 1 / 2
S^ 21
n1
n11
libertad.
S^ 21 S^ 22
+
n1 n2
12 ( x 1x 2 ) +t 1 /2
^S21 ^S22
+
n1 n2
[ ]
[] []
^S21 S^ 22
+
n 1 n2
2
2
2
2
S^ 1 S^ 2
s^ 1 S^ 2
+ ; ( x x ) +t
+
n1 n 2 1 2 1 /2 n1 n2
^S2
2
n2
Valor
(1 , g)
2
t-Student con g
grados de
n2 1
Ejemplo
Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y
mujeres para realizar determinada tarea. Las experiencias anteriores
indican que la distribucin de los tiempos tanto para hombres como para
mujeres es normal con varianzas diferentes. Una muestra de 9 hombres y
8 mujeres han dado los siguientes tiempos en minutos
Hombres:
12
28
10
25
24
19
22
33
Mujeres:
16
20
16
20
16
17
15
21
17
n A =9,
x A=21.111, S^ 2A=55.111
S^ 2A 55.111
=
=6.12
nA
9
Mujeres:
n B=8,
x B=17.625, S^ 2B =5.41
S^ 2B 5.41
=
=0.676
nB
8
^ 2 ^2
S A B= S A + S B = 6.12+ 0.676=2.626
n 1 n2
g=
( 6.12+0.676 )2
2
46.23
=9.7 .. g=10
4.75
21
x A - x B=21.11117.625=3.486 ,
Al nivel de 95 :t
22
(1 , g=10)
2
=2.228
[ 2.3625 ; 9.3345 ]
3.5
Intervalo de
poblacionales
Si
p1
confianza
p2
de
la
diferencia
de
dos
proporciones
independientes de tamaos
p1 -
IC= ( p1 p 2 )z 1/ 2
n1
n2 respectivamente, entonces, el
p2 es:
p1 (1 p 1) p2 (1 p 2)
p (1 p1 ) p2 (1 p2 )
+
; ( p1 p 2 )+ z1 /2 1
+
n1
n2
n1
n2
Es decir:
( p1 p2 ) + z 1 / 2
z 1 /2
p 1(1 p1) p2 (1 p 2)
p (1 p1 ) p2 (1 p2 )
+
p1 p2 ( p 1 p 2 ) + z 1 /2 1
+
n1
n2
n1
n2
( 1 )
Ejemplo
Una firma distribuye 2 marcas de cerveza. En una reciente encuesta se
encontr que 50 de 80 prefieren la marca A y 60 de 120 prefieren la
marca B. Use un intervalo de confianza del 95% para la diferencia de
proporciones con el fin de determinar si son diferentes las proporciones de
preferencias poblacionales.
Solucin:
Marca A:
Marca N:
A B=
p A =
50
=0.625,
80
pB =
60
=0.5,
120
p1 ( 1 p1 )
n1
Al nivel de 95 :Z
(1 )
2
p2 ( 1 p2 )
n2
=1.96
p A - pB =0.125
IC=[ 0.1251.96 ( 0.071 ) ; 0.125+1.96 ( 0.071 ) ]
23
[ 0.0146 ; 0.2641 ]