Documentos de Académico
Documentos de Profesional
Documentos de Cultura
hacer la tabla escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos
en un recipiente y los revolvemos, de ah, la primera tira seleccionada determina
el primer nmero de la tabla, se regresa al recipiente y despus de revolver otra
vez se selecciona la seguida tira que determina el segundo nmero de la tabla;
el proceso contina hasta obtener una tabla de dgitos aleatorios con tantos
nmeros como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco
prctico, imposible o no deseado; aunque sera deseable usar muestras
aleatorias simples para las encuestas nacionales de opinin sobre productos o
sobre elecciones presidenciales, sera muy costoso o tardado.
El muestreo estratificado requiere de separar a la poblacin segn grupos que
no se traslapen llamados estratos, y de elegir despus una muestra aleatoria
simple en cada estrato. La informacin de las muestras aleatorias simples de
cada estrato constituira entonces una muestra global.
Ejemplo 1.2
Suponga que nos interesa obtener una muestra de las opiniones de los
profesores de una gran universidad. Puede ser difcil obtener una muestra con
todos los profesores, as que supongamos que elegimos una muestra aleatoria
de cada colegio, o departamento acadmico; los estratos vendran a ser los
colegios, o departamentos acadmicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria
simple de unidades heterogneas entre s de la poblacin llamadas
conglomerados. Cada elemento de la poblacin pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado son usualmente
heterogneos o dismiles.
Ejemplo 1.3
Suponga que una compaa de servicio de televisin por cable est pensando
en abrir una sucursal en una ciudad grande; la compaa planea realizar un
estudio para determinar el porcentaje de familias que utilizaran sus servicios,
como no es prctico preguntar en cada casa, la empresa decide seleccionar una
parte de la ciudad al azar, la cual forma un conglomerado.
En el muestreo por conglomerados, stos se forman para representar, tan
fielmente como sea posible, a toda la poblacin; entonces se usa una muestra
aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones
sociales como iglesias, hospitales, escuelas y prisiones se realizan,
generalmente, con base en el muestreo por conglomerados.
x
2
3
4
3
4
5
4
5
6
Error muestral e = x -
2 4 = -2
3 4 = -1
44=0
3 4 = -1
44=0
54=1
44=0
54=1
64=2
X1
Muestra 1
X2
X2
Muestra 2
X3
X3
Muestra 3
Xk
Muestra K
Xk
POBLACION
Distribucin muestral de
medias (x)
Muestra 1
s2
Muestra 2
Muestra 3
s1
s2
s3
sk
s3
Muestra K
sk
POBLACION
Distribucin muestral de
desviaciones estndar (s)
Ejemplo 1.6
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de
valores 0, 2, 4 y 6. Encuentre:
, la media poblaciona.
, la desviacin estndar poblacional.
x, la media de la distribucin muestral de medias.
x , la desviacin estndar de la distribucin muestral de medias.
Adems, grafique las frecuencias para la poblacin y para la distribucin
muestral de medias.
7
Solucin:
a) La media poblacional es:
=
0+ 2+4+6
=3
4
f
1
x
0 2 4 6
Grfica de frecuencias para la poblacin
(0 3)2 + (2 3) 2 + (4 3)2 + (6 3) 2
4
= 2.236
0
1
2
3
1
2
3
4
2
3
4
5
3
4
5
6
Distribucin de frecuencias de x
x
f
0
1
1
2
2
3
3
4
4
3
5
2
6
1
4
3
2
1
0
2 3
4 5 6
( fx
f
48
3
= 3
x =
x =
2.236
=
= 1.58
2
n
Como para cualquier variable aleatoria, la dsitribucin muestral de medias tiene
una media o valor esperado, una varianza y una desviacin estndar, se puede
demostrar que la distribucin muestral de medias tiene una media igual a la
media poblacional. Esto es:
x = E (x) = = 3
Distribuciones muestrales
Despus de haber realizado el ejercicio anterior se puede ver que una
distribucin muestral se genera extrayendo todas las posibles muestras del
mismo tamao de la poblacin y calculndoles a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin
muestral de medias ser normal sin importar el tamao de la muestra.
De aqu que podamos deducir que: x =
Poblacin
Normal
Poblacin Exponencial
n=50
n=30
n=20
Ejemplo
Para la dsitribucin muestral de medias del ejercicio pasado, encuentre:
a) El error muestral de cada media
b) La media de los errores muestrales
c) La desviacin estndar de los errores muestrales.
Solucin:
a) En la tabla siguiente se ven las muestras, las medias de las muestras y los
errores muestrales:
Muestra x Error muestral, e=x-
(0,0)
0
0 - 3 = -3
(0,2)
1
1 - 3 = -2
(0,4)
2
2 - 3 = -1
(0,6)
3
33=0
(2,0)
1
1 3 = -2
(2,2)
2
2 3 = -1
(2,4)
3
33=0
(2,6)
4
43=1
(4,0)
2
2 3 = -1
(4,2)
3
33=0
(4,4)
4
43=1
(4,6)
5
53=2
(6,0)
3
33=0
(6,2)
4
43=1
(6,4)
5
53=2
(6,6)
6
63=3
10
( 3 ) + ( 2 ) + ( 1 ) +
0 + ... + 2 + 3
16
= 0
(e e )2 f
=
N
=1.58
N n
x =
n N 1
donde es la desviacin estndar de la poblacin de donde se toman las
muestras, n es el tamao de la muestra y N el de la poblacin.
Como rfegla de clculo, si el muestreo se hace sin reemplazo y el tamao de la
poblacin es al menos 20 veces el tamao de la muestra (N20), entonces se
puede usar la frmula.
N n
El factor
se denomina factor de correccin para una poblacin finita.
N 1
Ejemplo:
Suponga que la tabla siguiente muestra la antiguedad en aos en el trabajo de
tres maestros universitarios de matemticas:
Maestro de matemticas
Antiguedad
A
6
B
4
C
2
Suponga adems que se seleccionan muestras aleatorias de tamao 2 sin
reemplazo. Calcule la antigedad media para cada muestra, la media de la
distribucin muestral y el error estndar, o la desviacin estndar de la
distribucin muestral.
Solucin:
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras
posibles de tamao 2, con sus respectivas medias muestrales.
Muestras
A,B
Antigedad
(6,4)
Media Muestral
11
A,C
B,C
(6,2)
(4,2)
4
3
2+4+6
=4
3
La media de la distribucin muestral es:
5+ 4 +3
x =
=4
3
La desviacin estndar de la poblacin es:
(6 4 )2 + (4 4 ) 2 + (2 4 ) 2
=
=
= 1 . 63
1 . 63
=
= 1 . 152
n
2
N n
1 . 63
=
N 1
2
32
= 0 . 816
31
S
Es la poblacin
infinita?
No
Se muestrea
con sustitucin?
No
S
Es
N20n?
x =
Nn
N 1
12
n
y para poblaciones finitas y muestro con reemplazo:
x
z=
N n
n N 1
Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin
estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria
de 16 focos tenga una vida promedio de menos de 775 horas.
Solucin:
775 800
z=
= 2.5
40
0.0062
16
Este valor se busca en la tabla de z
P( x 775) = P (z 2.5) = 0.0062
775
800
N n 6.9
1000 25
=
= 1.36
25 1000 1
N 1
a)
z=
N n
N 1
172.5 174.5
= 1.47
1.36
175.8 174.5
z=
= 0.96
1.36
p (172.5 x 175.8) = 0.7607
0.7607
172.5
174.5
175.8
172 174.5
= 1.83
1.36
p ( x 172) = 0.00336
b) z =
0.0336
174.5
14
p1
Muestra 1
p1
p2
p3
.
.
pk
p
p2
Muestra 2
p3
Muestra 3
Muestra K
pk
POBLACION
Artculos Malos
1
2
3
4
5
4
3
2
1
0
Proporcin de
artculos
defectuoso
4/5=0.8
3/5=0.6
2/5=0.4
1/5=0.2
0/5=0
Total
Nmero de maneras
en las que se puede
obtener la muestra
8C1*4C4=8
8C2*4C3=112
8C3*4C2=336
8C4*4C1=280
8C5*4C0=56
792
15
(0.8 1/ 3)2 *8 +(0.6 1/ 3)2 *112+(0.4 1/ 3)2 *336+ (0.21/ 3)2 *280+(0 1/ 3)2 *56 = 0.1681
792
La varianza de la distribucin binomial es 2= npq, por lo que la varianza de la
distribucin muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores
en esta frmula tenemos que:
(1 / 3)(2 / 3)
p =
= 0.2108 , este valor no coincide con el de 0.1681, ya que nos
5
falta agregar el factor de correccin para una poblacin finita y un muestreo sin
reemplazo:
(1 / 3)(2 / 3) 12 5
p =
= 0.1681
5
12 1
p =
Pq N n
n N 1
300
200
100
0.2
z=
p P
Pq
n
16
N n
si se cumple con
N 1
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande
fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la
probabilidad de que la proporcin de la muestra de la gente que fuma cigarrillos
sea menor que 0.55.
Solucin:
Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el segundo utilizando la
frmula de la distribucin muestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x<440) = ?
Media= np= (800)(0.60)= 480
z=
0.0017
x np
439.5 480
=
= 2.92
npq
800(0.60)(0.40 )
440-0.5=439.5
440
480
p(x<440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de
que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
Distribucin Muestral de Proporciones
Datos:
n=800 estudiantes
P=0.60
p= 0.55
p(p<0.55) = ?
0.0017
0.55
0.60
0.55-(0.5/800)=0.549375
z=
p P
0.549375 0.60
x np
6.5 4.5
=
= 0.96
npq
150(0.03)(0.97 )
4.5
0.1685
6
6+0.5=6.5
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que
al extraer una muestra de 150 personas, mas de 6 presentarn una reaccin
adversa.
b) Distribucin Muestral de Proporciones
0.1685
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
0.03
0.04
0.04+(0.5/150)=0.0433
18
z=
p P
0.0433 0.03
0.2327
0.03
0.04
0.03-(0.5/60)= 0.0216
z=
p P
0.0216 0.04
b) Datos:
n= 60 artculos
P=0.04
p= 0.01 y 0.05
p(0.01<p<0.05) = ?
0.01
0.04
0.01+(0.5/60)= 0.0183
z=
p P
Pq
n
0.0183 0.04
(0.04 )(0.96 )
60
= 0.86
z=
p P
Pq
n
0.05
0.05-(0.5/60)= 0.0416
0.0416 0.04
(0.04 )(0.96)
= 0.06
60
19
X11
X11-X 21
Muestra 1
X12
Muestra 2
Muestra 2
X12-X 22
X13-X 23
Muestra 3
Muestra 1
X22
X23
Muestra 3
X13
Muestra K
X1k-X 2k
Muestra K
X2k
X1k
POBLACION 1
Distribucin muestral de
Diferencia de Medias
POBLACION 2
, por lo
+ 2 .
n1
n2
2
n
2
20
p ( x1 x 2 20 ) = ?
0.1056
1 -2 =15
z=
( x1 x2 ) ( 1 2 )
1
+ 2
n1
n2
2
x1 x 2 = 20
20 (100 85)
(14.142 )
20
(12.247 )
= 1.25
25
p ( x A x B 1) = ?
0.0023
A -B=0.5
z=
( x A x B ) ( A B )
A2 B2
+
nA
nB
x A xB = 1
1 (7.2 6.7 )
(0.8) 2 + (0.7 )2
34
= 2.84
40
21
Ejemplo:
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una
desviacin estndar de 1.23km/L para la primera gasolina y una desviacin
estndar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina
en 35 autos y la segunda en 42 autos.
a) Cul es la probabilidad de que la primera gasolina de un rendimiento
promedio mayor de 0.45km/L que la segunda gasolina?
b) Cul es la probabilidad de que la diferencia en rendimientos promedio se
encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.
Solucin:
En este ejercicio no se cuenta con los parmetros de las medias en ninguna de
las dos poblaciones, por lo que se supondrn que son iguales.
0.0642
Datos:
1 = 1.23 Km/Lto
2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
1 -2 =0
a) p ( x1 x 2 0.45 ) = ?
z=
x1 x2 = 0 .45
( x1 x2 ) (1 2 )
12 22
+
n1
n2
( x1 x2 ) (1 2 )
1
+ 2
n1
n2
2
0.83 0
(1.23)2 + (1.37 )2
35
(1.23)2 + (1.37 )2
35
b) p (0.65 x1 x2 0.83) = ?
( x x2 ) (1 2 )
0.65 0
z= 1
=
= 2.19
2
2
2
2
1
(1.23) + (1.37 )
+ 2
n1
n2
35
42
z=
0.45 0
= 1.52
42
= 2.80
42
0.0117
1 -2 =0
0.65
0.83
22
p 11
Muestra 1
p 12
Muestra 2
Muestra 3
p 13
Muestra K
p11-p21
p12-p22
p13-p23
.
.
.
p1k-p2k
Muestra 1
p 22
Muestra 2
p 23
Muestra 3
Muestra K
p 2k
p 1k
Distribucin muestral de
Diferencia de Proporciones
POBLACION 1
POBLACION 2
P1q1
Pq
+ 2 2 .
n1
n2
23
z=
( p1 p 2 ) ( P1 P2 )
P1 q1
Pq
+ 2 2
n1
n2
Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte
difieren en sus opiniones sobre la promulgacin de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos
estn a favor de la pena de muerte, mientras que slo 10% de las mujeres
adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y 100
mujeres su opinin sobre la promulgacin de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor
que el de las mujeres.
Solucin:
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-p M 0.03) = ?
0.4562
PH -PM=0.02 p H -p M=0.03
0.03-(0.5/100)=0.025
Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una
distribucin binomial y se est utilizando la distribucin normal.
z=
( pH
pM ) ( PH PM )
PH q H
P q
+ M M
nH
nM
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la
pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.
Ejemplo:
Una encuesta del Boston College const de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontr que 20% haban estado sin
trabajo durante por lo menos dos aos. Supngase que tuviera que seleccionar
otra muestra aleatoria de 320 trabajadores de entre todos los empleados
despedidos entre 1979 y 1984. Cul sera la probabilidad de que su porcentaje
muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del
porcentaje obtenido en la encuesta de Boston College, en 5% o ms?
Solucin:
En este ejercicio se cuenta nicamente con una poblacin, de la cual se estn
extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los
24
0.063
p 1 -p2 =-0.05
0.063
P1 -P2 =0
-0.05+(0.5/320)=-0.0484
z=
( p1 p 2 ) ( P1 P2 )
P1q1
Pq
+ 2 2
n1
n2
z=
( p1 p 2 ) ( P1 P2 )
P1q1
Pq
+ 2 2
n1
n2
p 1 -p2 =0.05
0.05-(0.5/320)=0.0484
0.0484 0
= 1.53
(0.20 )(0.80) + (0.20)(0.80 )
320
320
0.0484 0
= 1.53
(0.20 )(0.80) + (0.20)(0.80)
320
320
25
Ejemplo:
Se sabe que 3 de cada 6 productos fabricados por la mquina 1 son defectuosos
y que 2 de cada 5 objetos fabricados por la mquina 2 son defectuosos; se
toman muestras de 120 objetos de cada mquina:
a) cul es la probabilidad de que la proporcin de artculos defectuosos de la
mquina 2 rebase a la mquina 1 en por lo menos 0.10?
b) cul es la probabilidad de que la proporcin de artculos defectuosos de la
mquina 1 rebase a la mquina 2 en por lo menos 0.15?
Solucin:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
a) p(p2-p10.10) = ?
z=
( p 2 p1 ) ( P2 P1 )
0.0011
P2 -P1 =-0.10
p 2 -p1 =0.10
0.10-(0.5/120)=0.0958
0.0958 ( 0.10)
= 3.06
(0.50 )(0.50) + (0.40 )(0.60)
120
120
P1q1
Pq
+ 2 2
n1
n2
Otra manera de hacer este ejercicio es poner P 1-P 2:
0.0011
p 1 -p2 =-0.10
P1 -P2 =0.10
-0.10+(0.5/120)=-0.0958
z=
( p1 p 2 ) ( P1 P2 )
P1q1
Pq
+ 2 2
n1
n2
0.0958 0.10
= 3.06
(0.50 )(0.50) + (0.40)(0.60 )
120
120
0.2357
P1 -P2 = 0.10
p 1 -p2 =0.15
0.15-(0.5/120)=0.1458
26
z=
( p1 p 2 ) ( P1 P2 )
0.1458 0.10
= 0.72
(0.50 )(0.50) + (0.40 )(0.60)
120
120
P1q1
Pq
+ 2 2
n1
n2
La probabilidad de que exista una diferencia de proporciones de artculos
defectuosos de por lo menos 15% a favor de la mquina 1 es de 0.2357.
Distribucin Muestral de Nmero de Defectos
En el control de calidad y especficamente en los grficos de control c se aplica
esta distribucin, la cual consiste en que al extraer un artculo contabilicemos el
nmero de defectos que tiene ese artculo.
Esta distribucin muestral proviene de la distribucin de Poisson, en la cual le
media es y que en este caso es el nmero promedio de defectos por unidad.
Como ya es conocido la varianza de la distribucin de Poisson es igual a por lo
que se puede deducir la formula de la siguiente manera:
x
z=
a)
z=
c C 5.5 8
=
= 0.88
C
8
c=6
C=8
6-0.5 = 5.5
27
b) z =
c C 6.5 8
=
= 0.53
C
8
z=
7.5 8
0.17
8
0.1344
c=7
7-0.5=6.5
C=8
7+0.5=7.5
c C 9.5 8
=
= 0.53
C
8
0.7019
C=8
c=9
9+0.5 = 9.5
b) 6 o ms puntos.
c) Entre 2 y 5 puntos.
4. Un especialista en gentica ha detectado que el 26% de los hombres y el
24% de las mujeres de cierta regin del pas tiene un leve desorden
sanguneo; si se toman muestras de 150 hombres y 150 mujeres, determine
la probabilidad de que la diferencia muestral de proporciones que tienen ese
leve desorden sanguneo sea de:
a) Menos de 0.035 a favor de los hombres.
b) Entre 0.01 y 0.04 a favor de los hombres.
5. Una urna contiene 80 bolas de las que 60% son rojas y 40% blancas. De un
total de 50 muestras de 20 bolas cada una, sacadas de la urna con
remplazamiento, en cuntas cabe esperar
a) Igual nmero de bolas rojas y blancas?
b) 12 bolas rojas y 8 blancas?
c) 8 bolas rojas y 12 blancas?
d) 10 mas bolas blancas?
6. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media
de 2.40 onzas y desviacin estndar de 0.048 onzas. Si se extraen 300
muestras de tamao 36 de esta poblacin, determinar la media esperada y la
desviacin estndar de la distribucin muestral de medias si el muestreo se
hace:
a) Con remplazamiento
b) Sin remplazamiento
7. La vida media de una mquina para hacer pasta es de siete aos, con una
desviacin estndar de un ao. Suponga que las vidas de estas mquinas
siguen aproximadamente una distribucin normal, encuentre:
a) La probabilidad de que la vida media de una muestra aleatoria de 9 de
estas mquinas caiga entre 6.4 y 7.2 aos.
b) El valor de la x a la derecha del cual caera el 15% de las medias
calculadas de muestras aleatorias de tamao nueve.
8. Se llevan a cabo dos experimentos independientes en lo que se comparan
dos tipos diferentes de pintura. Se pintan 18 especmenes con el tipo A y en
cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el
tipo B. Se sabe que las desviaciones estndar de la poblacin son ambas
1.0. Suponga que el tiempo medio de secado es igual para los dos tipo de
pintura. Encuentre la probabilidad de que la diferencia de medias en el
tiempo de secado sea mayor a uno a favor de la pintura A.
29
30
ESTIMACION
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. Como vimos en la seccin anterior, los
estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de
otros sus valores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo.
Una estimacin puntual es un nico valor estadstico y se usa para estimar un
parmetro. El estadstico usado se denomina estimador.
Una estimacin por intervalo es un rango, generalmente de ancho finito, que
se espera que contenga el parmetro.
Estimacin Puntual
La inferencia estadstica est casi siempre concentrada en obtener algn tipo de
conclusin acerca de uno o ms parmetros (caractersticas poblacionales).
Para hacerlo, se requiere que un investigador obtenga datos muestrales de cada
una de las poblaciones en estudio. Entonces, las conclusiones pueden estar
basadas en los valores calculados de varias cantidades muestrales . Po ejemplo,
representamos con (parmetro) el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la
resistencia a la ruptura x se poda emplear para sacar una conclusin acerca del
valor de . De forma similar, si 2 es la varianza de la distribucin de resistencia
a la ruptura, el valor de la varianza muestral s2 se podra utilizar pra inferir algo
acerca de 2.
Cuando se analizan conceptos generales y mtodos de inferencia es
conveniente tener un smbolo genrico para el parmetro de inters. Se utilizar
la letra griega para este propsito. El objetivo de la estimacin puntual es
seleccionar slo un nmero, basados en datos de la muestra, que represente el
valor ms razonable de .
Una muestra aleatoria de 3 bateras para calculadora podra presentar
duraciones observadas en horas de x1=5.0, x2 =6.4 y x3=5.9. El valor calculado
de la duracin media muestral es x = 5.77, y es razonable considerar 5.77 como
el valor ms adecuado de .
Una estimacin puntual de un parmetro es un slo nmero que se puede
considerar como el valor ms razonable de . La estimacin puntual se obtiene
al seleccionar una estadstica apropiada y calcular su valor a partir de datos de
la muestra dada. La estadstica seleccionada se llama estimador puntual de .
31
()
32
Distribucin muestral de
medianas
33
34
Existen varias tablas en las cuales podemos encontrar el valor de z, segn sea
el rea proporcionada por la misma. En esta seccin se realizar un ejemplo
para encontrar el valor de z utilizando tres tablas diferentes.
Ejemplo:
Encuentre el valor de z para un nivel de confianza del 95%.
Solucin 1:
Se utilizar la tabla que tiene el rea bajo la curva de - hasta z. Si lo vemos
grficamente sera:
0.475
En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975,
ya que cada extremo o cola de la curva tiene un valor de 0.025.
0.975
z = 1.96
Solucin 2:
Si se utiliza una tabla en donde el rea bajo la curva es de 0 a z:
En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el
resultado del valor de z ser el mismo, para este ejemplo 1.96.
35
Solucin 3:
Para la tabla en donde el rea bajo la curva va desde z hasta :
0.025
n
el parmetro y lo queremos estimar por medio de la media de la muestra, slo se
despejar de la formula anterior, quedando lo siguiente:
z
= x
n
De esta formula se puede observar que tanto el tamao de la muestra como el
valor de z se conocern. Z se puede obtener de la tabla de la distribucin normal
a partir del nivel de confianza establecido. Pero en ocasiones se desconoce
por lo que en esos casos lo correcto es utilizar otra distribucin llamada t de
student si la poblacin de donde provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin
puntual de la desviacin estndar, es decir igualar la desviacin estndar de la
muestra a la de la poblacin (s=).
Ejemplos:
1. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99%
para la concentracin media de zinc en el ro. Suponga que la desviacin
estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de es x = 2.6. El valor de z para un nivel de confianza
del 95% es 1.96, por lo tanto:
36
= x
z
(1.96 )(0.3) = 2.50 y 2.70
= 2.6
n
36
0.95
min = 2.50
max = 2.70
min = 2.47
max = 2.73
37
Z=-1.645
z
(1.654 )(3.38) = 16.39
= 17.17
n
48
Esto quiere decir que con un nivel de confianza de 95%, el valor de la media
est en el intervalo (16.39, ).
Estimacin de una Proporcin
Un estimador puntual de la proporcin P en un experimento binomial est dado
por la estadstica P=X/N, donde x representa el nmero de xitos en n pruebas.
Por tanto, la proporcin de la muestra p =x/n se utiulizar como estimador
puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca de 0
de 1, se puede establecer un intervalo de confianza para P al considerar la
distribucin muestral de proporciones.
p P
z=
Pq
n
Al despejar P de esta ecuacin nos queda:
38
Pq
n
En este despeje podemos observar que se necesita el valor del parmetro P y
es precisamente lo que queremos estimar, por lo que lo sustituiremos por la
proporcin de la muestra p siempre y cuando el tamao de muestra no sea
pequeo.
pq
P= pz
n
Cuando n es pequea y la proporcin desconocida P se considera cercana a 0
a 1, el procedimiento del intervalo de confianza que se establece aqu no es
confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que
np nq sea mayor o igual a 5.
P= pz
pq
(0.03)(0.97 )
= 0.03 (1.645)
n
500
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos
defectuosos que no pasan la prueba en esa poblacin esta entre 0.0237 y
0.0376.
P= pz
39
Solucin:
p=x/n = 20/400=0.05
z(0.95)=1.96
pq
(0.05)(0.95 )
= 1.96
= 0.021
n
400
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P
dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para erstimar P,
el error mximo de estimacin ser aproximadamente 0.021 con un nivel de
confianza del 95%.
=z
P= pz
pq
(0.20 )(0.80)
= 0.20 (1.645)
= 0.20 0.038
n
300
0.162<P<0.238
40
z=
( x1 x 2 ) ( 1 2 )
12 2 2
+
n1
n2
1
22
1 2 = ( x1 x 2 ) z
+
n1
n2
En el caso en que se desconozcan las varianzas de la poblacin y los tamaos
de muestra sean mayores a 30 se podr utilizar la varianza de la muestra como
una estimacin puntual.
Ejemplos:
1. Se lleva a cabo un experimento en que se comparan dos tipos de motores, A
y B. Se mide el rendimiento en millas por galn de gasolina. Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se
utiliza y las dems condiciones se mantienen constantes. El rendimiento
promedio de gasolina para el motor A es de 36 millas por galn y el promedio
para el motor B es 24 millas por galn. Encuentre un intervalo de confianza
de 96% sobre la diferencia promedio real para los motores A y B. Suponga
que las desviaciones estndar poblacionales son 6 y 8 para los motores A y
B respectivamente.
Solucin:
Es deseable que la diferencia de medias sea positiva por lo que se recomienda
restar la media mayor menos la media menor. En este caso ser la media del
motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es de 2.05.
2
A
B2
36 64
B A = (x B x A ) z
+
= (42 36) 2.05
+
nA
nB
50 75
3.43<B-A <8.57
La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la
diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galn a
favor del motor B. Esto quiere decir que el motor B da mas rendimiento promedio
que el motor A, ya que los dos valores del intervalo son positivos.
2. Una compaa de taxis trata de decidir si comprar neumticos de la marca A
o de la B para su flotilla de taxis. Para estimar la diferencia de las dos
marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los
neumticos se utilizan hasta que se desgastan, dando como resultado
promedio para la marca A 36,300 kilmetros y para la marca B 38,100
kilmetros. Calcule un intervalo de confianza de 95% para la diferencia
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen
41
A
2
5000 2 6100 2
B A = (xB xA ) z
+ B = (38100 36300) 1.96
+
nA
nB
12
12
-2662.68<B-A <6262.67
Grficamente:
0.95
B A = 2662.68
B A = 6262.67
B A = 0
Como el intervalo contiene el valor cero, no hay razn para creer que el
promedio de duracin del neumtico de la marca B es mayor al de la marca A,
pues el cero nos est indicando que pueden tener la misma duracin promedio.
Estimacin de la Diferencia de dos Proporciones
En la seccin anterior se vio el tema de la generacin de las distribuciones
muestrales, en donde se tena el valor de los parmetros, se seleccionaban dos
muestras y podamos calcular la probabilidad del comportamiento de los
estadsticos. Para este caso en particular se utilizar la distribucin muestral de
diferencia de proporciones para la estimacin de las misma. Recordando la
formula:
( p p 2 ) ( P1 P2 )
z= 1
P1 q1
Pq
+ 2 2
n1
n2
Despejando P 1-P 2 de esta ecuacin:
Pq
Pq
P1 P2 = ( p1 p 2 ) z 1 1 + 2 2
n1
n2
Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al
hacer el despeje nos queda las dos proporciones poblacionales y es
precisamente lo que queremos estimar, por lo que se utilizarn las proporciones
de la muestra como estimadores puntuales:
pq
p q
P1 P2 = ( p1 p 2 ) z 1 1 + 2 2
n1
n2
Ejemplos:
1. Se considera cierto cambio en un proceso de fabricacin de partes
componentes. Se toman muestras del procedimiento existente y del nuevo
42
Usuaria
1246
42
0.0337
No Usuaria
11178
294
0.0263
43
Como n debe de ser un nmero entero, redondeamos hacia arriba todos los
resultados fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el
error de estimacin se convierte en:
z N n
=
n N 1
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:
n=
z 2 2 N
2 ( N 1) + z 2 2
Ejemplos:
1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el
estado de Maryland. Un estudio anterior de diez ciervos cazados mostr que
la desviacin estndar de sus pesos es de 12.2 libras. Qu tan grande debe
ser una muestra para que el bilogo tenga el 95% de confianza de que el
error de estimacin es a lo ms de 4 libras?
44
Solucin:
z
(1.96 )(12.2 )
n =
=
= 35.736
4
45
Esta frmula est algo engaosa, pues debemos utilizar p para determinar el
tamao de la muestra, pero p se calcula a partir de la muestra. Existen
ocasiones en las cuales se tiene una idea del comportamiento de la proporcin
de la poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe
nada referente a esa proporcin entonces se tienen dos opciones:
Tomar una muestra preliminar mayor o igual a 30 para proporcionar una
estimacin de P. Despus con el uso de la frmula se podra determinar de
forma aproximada cuntas observaciones se necesitan para proporcionar el
grado de precisin que se desea.
Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se
obtiene el tamao de muestra mayor posible. Observe el siguiente ejemplo:
Se desconoce el valor de P, por lo que se utilizarn diferentes valores y se
sustituirn en la formula para observar los diferentes tamaos de muestras. El
nivel de confianza que se utilizar es del 95% con un error de estimacin de
0.30.
z 2 pq
p
n
2
(1.96) 2(0.10)(0.90)
0.10
3.84
(0.30)2
(1.96) 2(0.20)(0.80)
0.20
6.82
(0.30)2
(1.96)2(0.30)(0.70)
0.30
8.96
(0.30) 2
(1.96) 2(0.40)(0.60)
0.40
10.24
(0.30)2
(1.96)2(0.50)(0.50)
0.50
10.67
(0.30) 2
(1.96)2(0.60)(0.40)
0.60
10.24
(0.30) 2
(1.96)2(0.70)(0.30)
0.70
8.96
(0.30) 2
(1.96) 2(0.80)(0.20)
0.80
6.82
(0.30)2
(1.96) 2(0.90)(0.10)
0.90
3.84
(0.30)2
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamao de la
muestra alcanza su mximo valor.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el
error de estimacin se convierte en:
pq N n
=z
n N 1
46
Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad
de Hamilton, Canad, se encuentra que 340 estn suscritas a HBO. Qu
tan grande se requiere que sea una muestra si se quiere tener 95% de
confianza de que la estimacin de P est dentro de 0.02?
Solucin:
Se tratarn a las 500 familias como una muestra preliminar que proporciona una
estimacin de p=340/500=0.68.
2
z 2 pq (1.96) (0.68)(0.32 )
n= 2 =
= 2090
(0.02) 2
Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de
tamao 2090, se puede tener una confianza de 95% de que nuestra proporcin
muestral no diferir de la proporcin real por ms de 0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qu proporcin del electorado conoce la opinin de ella, respecto al
uso de fondos estatales para pagar abortos. Qu tamao de muestra se
necesita si se requiere un confianza del 95% y un error mximo de
estimacin de 0.10?
Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que
conoce la opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.
2
z 2 pq (1.96) (0.50 )(0.50)
n= 2 =
= 96.04
(0.10) 2
Se requiere un tamao de muestra de 97 residentes para que con una confianza
del 95% la estimacin tenga un error mximo de 0.10.
Clculo del Tamao de la Muestra para Estimar la Diferencia de Medias
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que
error esta dado por:
21 2 2
=z
+
n1
n2
En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamao de muestra son diferentes .
47
Poblaci
n 1
Poblacin 2
n1=Kn2
z 2 21 + k 22
n2 =
k 2
Ejemplo:
Un director de personal quiere comparar la efectividad de dos mtodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operacin
de montaje. Se divide un nmero de operarios en dos grupos iguales: el primero
recibe el mtodo de entrenamiento 1, y el segundo, el mtodo 2. Cada uno
realizar la operacin de montaje y se registrar el tiempo de trabajo. Se espera
que las mediciones para ambos grupos tengan una desviacin estndar
aproximadamente de 2 minutos. Si se desea que la estimacin de la diferencia
en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95, cuntos trabajadores se tienen que incluir en cada
grupo de entrenamiento?
z 2 21 + 2 2
1.96 2 2 2 + 2 2
n=
=
= 31
2
12
Cada grupo debe contener aproximadamente 31 empleados.
) (
)(
48
z 2 ( p1q1 + p 2 q 2 )
2
Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamao y se sabe que una es K veces
mayor que la otra.
n=
Poblaci
n 1
Poblacin 2
n1=Kn2
z 2 ( p1q1 + kp2 q 2 )
n2 =
k 2
Ejemplo:
Una compaa de productos alimenticios contrat a una empresa de
investigacin de mercadotecnia , para muestrear dos mercados, I y II, a fin de
comparar las proporciones de consumidores que prefieren la comida congelada
de la compaa con los productos de sus competidores. No hay informacin
previa acerca de la magnitud de las proporciones P1 y P2. Si la empresa de
productos alimenticios quiere estimar la diferencia dentro de 0.04, con una
probabilidad de 0.95, cuntos consumidores habr que muestrear en cada
mercado?
z 2 ( p1q1 + p 2 q2 ) 1.96 2 [(0.5)(0.5) + (0.5)(0.5)]
n=
=
= 1200.5
2
0.04 2
Se tendr que realizar encuestas a 1201 consumidores de cada mercado para
tener una estimacin con una confianza del 95% y un error mximo de 0.04.
Problemas propuestos
1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se
encontraron 40 defectuosos. Estime el intervalo que contiene, con un
coeficiente de confianza de 0.90, a la verdadera fraccin de elementos
defectuosos.
2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un
trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para
terminar un trabajo de montaje. Si la experiencia previa sugiere que = 16
seg. mide la variacin en el tiempo de montaje entre un trabajador y otro al
realizar una sola operacin de montaje, cuntos operarios habr que incluir
en la muestra?
3. El decano registr debidamente el porcentaje de calificaciones D y F
otorgadas a los estudiantes por dos profesores universitarios de
matemticas. El profesor I alcanz un 32%, contra un 21% para el profesor II,
con 200 y 180 estudiantes, respectivamente. Estime la diferencia entre los
49
50
0.07532 P 0.1246
n= 44
0.0222 P1- P 2 0.1978
33.412 34.588
n= 6147
0.059 PB-P A 0.141
n= 1086
12.22 1-2 13.98
n= 8
51