Está en la página 1de 79

CURSO DE

ESTADISTICA APLICADA I

Mg. Emma Prez Palacios
Elizabeth Kathleen Aquio Jaimes
Inferencia Estadstica
Es una parte de la estadstica que permite hacer afirmaciones
sobre los parmetros de la poblacin bajo estudio con base a
las observaciones de una muestra. La inferencia provee los
procedimientos inductivos y las mediciones de
incertidumbre para efectuar estas afirmaciones.
Los pilares de los procedimientos de inferencia estadstica
son: La Estimacin y la Prueba de Hiptesis.
Inferencia Estadstica
Estimacin Estadstica Prueba de Hiptesis
Puntual Intervlica
2
Estimacin Estadstica
La estimacin estadstica consiste en utilizar datos
muestrales para determinar los valores de los parmetros
desconocidos de una poblacin. Este proceso puede
adoptar la forma de un slo punto o de un intervalo.

Esto quiere decir que se tiene:
^
Estimacin Puntual =


Estimacin por Intervalos p( Li< < Ls ) = o

o = la probabilidad conocida de acertar o nivel de
confianza
3
Estimacin Estadstica
1.Estimacin Puntual

Si se tiene una muestra de tamao n de la poblacin X; se
dice que una estadstica T (estadgrafo) de la muestra es un
estimador puntual del parmetro u de la poblacin, si es una
funcin de las observaciones de la muestra. Asigna un valor
nico al Parmetro, que esta sujeto a error muestral,
llamado tambin error de estimacin .

^

Error de muestreo =| - |
4
EstimacinPuntual
Si utilizamos el valor de un estadgrafo para
calcular un parmetro de una poblacin, este
valor es una estimacin puntual del parmetro.

Estas estimaciones reciben el nombre de
estimacin puntual porque son nmeros nicos,
o puntos situados en el eje real.

El estadgrafo cuyo valor se utiliza para la
estimacin puntual del parmetro se llama
Estimador, y el valor de este estimador ser el
valor estimado del parmetro.
5
Definiciones Bsicas
Parmetro es una medida resumen que describe una
caracterstica de toda una poblacin, y para determinar su
valor es necesario utilizar toda la informacin de la poblacin.

Estadgrafo: es una medida resumen que describe una
caracterstica con los datos u observaciones de una muestra.

Estimador: Es el estadgrafo que proporciona un valor
(estimacin) para el parmetro.

6
Principales Estimadores Puntuales
La media muestral es un
estimador puntual de la
media de la poblacin.


La varianza muestral es
un estimador puntual de
la varianza de la
poblacin.


La proporcin de la
muestra es un estimador
puntual de la proporcin
de la poblacin
7

As, por ejemplo:


ser un estimador de y el valor numrico de
ser la estimacin puntual de
el estimador de la proporcin poblacional H , y
el valor numrico de ser la estimacin
puntual del parmetro H

S
2
ser el estimador de o
2
y el valor numrico de
S
2
ser la estimacin puntual de o
2


En general diremos que ser el estimador de u, y el
valor de ser la estimacin puntual de u
x
p
p

x
8
Estimacin Estadstica
La estimacin estadstica consiste en utilizar datos
muestrales para determinar los valores de los parmetros
desconocidos de una poblacin. Este proceso puede
adoptar la forma de un slo punto o de un intervalo.

Esto quiere decir que se tiene:
^
Estimacin Puntual =


Estimacin por Intervalos p( Li< < Ls ) = o

o = la probabilidad conocida de acertar
o nivel de confianza
9
Como los estimadores son variables aleatorias.
Estamos interesados en estudiar ciertas propiedades
de los estimadores para decidir cual de los estimadores
es el ms apropiado, para un determinado parmetro, en
una situacin dada.

Las propiedades especficas, de los estimadores, que
estudiaremos a continuacin son:

- Insesgabilidad
- Consistencia
- Eficiencia
- Suficiencia

10
Un Buen Estimador Puntual
Una estadstica (estadigrafo) muestral que cumple las
siguientes propiedades, se puede considerar como un
buen estimador puntual:

Insesgamiento
S su valor esperado es igual al parmetro.
Consistencia
Debe cumplir con dos propiedades asintticas es decir
en lmite cuando n: el tamao se muestra se incrementa
hasta acercase al infinito.
Eficiencia
S y slo s tiene una varianza ms pequea que otro
estimador similar.
Suficiencia
Si es capaz de sustraer de la muestra toda la
informacin que sta contenga acerca del parmetro.
11
Estimacin por Intervalos o Intervalos de
Confianza
En la estimacin puntual existe el denominado error de estimacin o
error de muestro, debido que se est tomado losa datos de una
muestra.
Por tanto, es necesario la construccin de un intervalo, de tal modo,
que con un grado de confianza se pueda sostener que dentro de sus
lmites se incluye al valor del parmetro.
12
Donde: Li: el lmite inferior
Ls : el lmite superior
o: Probabilidad de acertar en la estimacin o
nivel de confianza
o= Probabilidad de error en la estimacin o
nivel de significancia.
INTERVALOS DE CONFIANZA
Se dice que el intervalo ( T
1
, T
2
) es un intervalo de
confianza 1-o para estimar el parmetro u.

Si y slo s:
P( Li< u <Ls ) = o =1-o
Se lee: El valor del parmetro poblacional esta comprendido
entre los valores Li
1
y Ls con una probabilidad de o.
adems se tiene que: o= (1 - o ), 0 < o < 1.
13
Intervalos de Confianza para la Media
a) Caso de varianza o
2
conocida
Si se conoce el valor de la varianza de la poblacin o
2
, se puede afirmar
que el Intervalo de Confianza 1-o para estimar la Media de la poblacin
esta dado por:
1 /2
x
IC( ) x z
o
= o
donde V( X )=

n
=
x
o
o
es el error estndar de la media muestral.
Si se conoce el tamao de la poblacin, el error estndar o desviacin de
la media muestral estar dado por:
|
.
|

\
|
N
N o
= o
1
n
n
2
x
siempre y cuando:
n
0,95 n
1 20
N N
s >
N
14
Intervalos de Confianza para la Media
o: nivel de confianza
o =
15
Intervalos de Confianza para la Media
b) Caso de varianza o
2
desconocida
Si no se conoce el valor de la varianza de la poblacin o
2
,

se
puede afirmar que el Intervalo de Confianza 1-o para estimar la
Media de la poblacin esta dado por:
(n-1; 1 /2)
x

IC( ) x t
o
= o
donde

n
s
=
x
o

es el error estndar estimado de la media muestral


Si se conoce el tamao de la poblacin, el error estndar estimado de la media
muestral estar dado por:
|
.
|

\
|
N
N
= o
1
n
n
s
2
x

siempre y cuando:
20
n 0,95
1
n N
> s
N
N
n > 0.05
N
16
Un analista de investigacin de mercados desea estimar
el ingreso mensual promedio de los hogares de un determinado sector de Lima
Metropolitana. Para tal efecto decide que su estimacin debe tener una confianza del
95%. Adems cuenta con los datos de una muestra de 100 hogares donde se
comprob que el ingreso promedio de los hogares entrevistados fue de US$ 1 500, y
segn cifras oficiales la desviacin estndar de los ingresos mensuales de los
hogares de dicho sector es de US$ 300. Diga usted entre qu valores se encuentra
el ingreso promedio mensual de todos los hogares de dicho sector de Lima
Metropolitana?
Solucin.-
Se tiene que el nivel de confianza es de 100(1- o)% = 95%.
Esto es, 1-o =0,95 y 1-o/2 = 0,975. Luego se tiene que z
1-o/2
= 1,96.

Adems se sabe que:
30 y 1500 x 300 100 n
x
= o = = o = , ,
Ejemplo 1.-
17
x
/2 1
z x ) IC( o =
o
Es un caso de varianza o
2
conocida, luego se debe usar:
Reemplazando datos se tiene que para el 95% confianza, el intervalo esta
dado por:
IC() = { 1500 (1,96)(30) }
Ejemplo 1.-
o = 0.95
Z = -1.96 Z = 1.96
En la distrib. Normal:
Nivel de confianza 95% o = 0.95 = 1 - o
0.05/2
0.05/2
Nivel de significancia (error) o = 0.05

p( 1441,2 s s 1558,8) = 0,95

Es decir:
El ingreso muensual de los hogares de Lima esta comprendido ente S/. 1441.20
y S/. 1558.8 con un 95 % de confianza
Interpretacin:
18
19
20
Los resultados de la revisin de una muestra de 100 cuentas de ahorros en
US dlares de BANAMEX, mostraron que el saldo promedio de las cuentas
fue de US$ 1000 con una desviacin estndar de US$ 500.
a) Cul ser el intervalo de confianza del 95% del saldo promedio de
todas las cuentas de ahorros en US dlares de BANAMEX?
b) Si se sabe que BANAMEX tiene 1000 cuentas de ahorros en US dlares,
cul ser el intervalo de confianza del 95% del saldo promedio de todas
las cuentas?
Solucin a)
Se tiene que el nivel de confianza es de 100 o % = 100(1- o)% = 95%.
Esto es, o =1-o =0,95 y 1-o/2 = 0,975.
Adems se sabe que
0 5 y 000 1 x 00 5 s 100 n
x
= o = = =

, ,
Ejemplo
21
x
/2) 1 1; - (n
t x ) IC( o =
o

Es un caso de varianza o
2
desconocida, luego se debe usar la
distribucin t:
Reemplazando datos se tiene que para el 95% confianza el intervalo esta
dado por:
IC() ={ 1000 (1,98422)(50)}
Es decir:
Ejemplo 2.-
o = 0.95
-t
(99, 0.025)
= -1.9842 t
(99, 0.975)
= 1.9842
0.05/2
0.05/2
p( 900,79 s s 1099,21) = 0,95
Interpretacin: El saldo promedio de todas las cuentas se varia entre S/. 900,79
y S/. 1099,21 con un 95% de confianza
22
23
24
2 2
x
s n 500 1000 100

47, 458
n 1 100 1000 1
N
| | | |
o = = =
| |
N
\ . \ .
Luego se debe modificar el error estndar estimado de la media muestral, el
mismo que estar dado por:
Reemplazando datos se tiene que para el 95% confianza el intervalo esta
dado por:
IC() = {1000 (1,98422)(47,458) }
Es decir:
P( 905,833 s s 1094,167) = 0,95
Ejemplo 2.-
Solucin b)
Como se me conoce el tamao de la poblacin, esto es, N = 1000. Luego se
debe calcular el factor de correccin por finitud:
0,95 0,9009
1 1000
100 1000
1
n
s =

=
N
N
25
A una muestra de 35 cigarrillos de una marca conocida
en el mercado se le midi el contenido promedio de nicotina obtenindose un valor
de 3,0 miligramos. Asumiendo que el contenido de nicotina por cigarrillo tiene una
distribucin normal con una desviacin estndar de 1,0 miligramos.
a) Cul cree que sean los intervalos de confianza del 90%, 95%, y 99% que
contengan el verdadero contenido promedio de nicotina por cigarrillo de dicha
marca?
b) Si el tamao de muestra fuese de 45 cigarrillos y se comprueba que el
contenido promedio tambin es de 3,0 miligramos de nicotina por cigarrillo.
Cul cree que sea el intervalo de confianza del 95% que contenga el
verdadero contenido promedio de nicotina por cigarrillo de dicha marca?
Ejemplo 3.-
Solucin a) Se tiene que los niveles de confianza son:
1-o =0,90 y 1-o/2 = 0,95, luego z
1-o/2
= 1,645
1-o =0,95 y 1-o/2 = 0,975, luego z
1-o/2
= 1,96
1-o =0,99 y 1-o/2 = 0,995, luego z
1-o/2
= 2,58
26
169 0 y 0 3 x 0 1 35 n
x
,

, ; , ; = o = = o =
Ejemplo 3.-
Es un caso de varianza o
2
conocida, luego se debe usar:
Reemplazando datos se tiene que el intervalo:
Para el intervalo de 90% de confianza IC() = { 3,0 (1,645)(0,169) }
P( 2,72 s s 3,28) = 0,90
Para el intervalo de 95% de confianza IC() = { 3,0 (1,96)(0,169) }
P( 2,67 s s 3,33) = 0,95
Para el intervalo de 99% de confianza IC() = { 3,0 (2,58)(0,169) }
P( 2,56 s s 3,44) = 0,99
x
/2 1
z x IC o =
o

) (
Se sabe que:
Interpretacin:
El contenido de nicotina en los cigarrillo vara entre 2.56 y 3.44 miligramos
con una confianza de 99%
27
Ejemplo 3.-
o % =

X ~ N (, o
2
/n )
o % =
o % =
28
Solucin b)
Se tiene que el nivel de confianza es de 100(1- o)% = 95%
Esto es, 1-o =0,95 y 1-o/2 = 0,975.
Luego se tiene que z
1-o/2
= 1,96.

Adems se sabe que:
149 0 y 0 3 x 0 1 5 4 n
x
,

, , , , = o = = o =
Reemplazando datos se tiene que para el 95% confianza el intervalo esta
dado por:
IC() = { 3,0 (1,96)(0,149) }
Es decir:
P( 2,71 s s 3,29) = 0,95
x
/2 1
z x IC o =
o

) (
Ejemplo 3.-
29
Ejemplo 4.-
30
El gerente de Edelnor desea estimar la facturacin
promedio del consumo de luz elctrica de las casas unifamiliares del
distrito de Lince para un determinado mes. Se sabe que para distritos
similares la desviacin del consumo de luz elctrica es de $20.
Ejercicio
a) Realizar la estimacin intervlica de la facturacin promedio del
consumo de luz elctrica, con una probabilidad de error del 5%.
Para este fin se tom una muestra de 110 casas unifamiliares,
obtenindose un consumo promedio de luz elctrica de $50.
a.1) Se asuma facturacin promedio era de $60.00 a la luz de los datos
El supuesto era acertado?
b) Qu tamao de muestra (nmero de casas) de debe de tomar para
estimar a facturacin promedio del consumo de luz elctrica, si se
desea tener un nivel de confianza del 90%, y un error mximo
permisible de $5, en la estimacin?.
a) One-Sample Z
The assumed standard deviation = 20
N Mean SE Mean 95% CI
110 50.0000 1.9069 (46.2625, 53.7375)
a1) No era acertado el
supuesto, ya que $60 no es
parte del intervalo de confianza
31
Tamao de Muestra para Estimar la Media
a) Caso de poblacin infinita .- El error de estimacin de la media de la
poblacin , est dado por:
Luego se puede determinar el tamao de la muestra mediante
n z B
/2 1
o =
o
Luego se puede determinar el tamao de la muestra mediante:
2
2 2
/2 1
B
z
n
o
=
o
b) Caso de poblacin finita .- El error de estimacin de la media de la
poblacin , est dado por:
|
.
|

\
|

o
=
o
1 N
n N
n
z B
2
/2 1
2
2 1
2 2
2 2
2 1
z 1)B (N
z N
n
/
/
o
o
o +
o
=
32
523 88 522
3
35 96 1
B
z
n
2
2 2
2
2 2
/2 1
~ = =
o
=
o
,
) ( ) , (
Solucin a) .-
Se asume que el nivel de confianza 1-o =0,95, luego se tiene que
z
1-o/2
=1,96. Adems se sabe que B = 3 y o = 35. Luego se tiene:
Se desea tener una estimacin de los montos por cobrar de los arbitrios
municipales del presente trimestre. Se sabe que en el trimestre anterior la
desviacin estndar de dichos montos fue S/. 35 .
a) Cul ser el tamao de muestra necesario de contribuyentes, si se
desea tener un lmite de error de estimacin de S/.3 y una certeza del
95%?
b) Si se sabe que el municipio tiene 5000 contribuyentes, cual ser el
tamao de muestra necesario de contribuyentes, si se desea tener un
lmite de error de estimacin de S/.3 y una certeza del 95%?
Ejemplo
33
Solucin b) .-
Se asume que el nivel de confianza 1-o =0,95, luego se tiene que
z
1-o/2
=1,96. Adems B = 3, N = 5000 y o = 35.
74 4 473,46558 n
)(35) (1,96 ) 1)(3 (5000
)(35) (1,96 5000
z 1)B (N
z N
n
2 2 2
2 2
2 2
/2 1
2
2 2
/2 1
= =
=
+
=
=
+
=

Ejemplo
Se debe de considerar a 474 contribuyentes para calcular el monto
promedio de arbitrios.
34
Intervalo de Confianza de la Proporcin
}

{

p /2 1
z p ) IC( o = t
o
donde:
n
p) - p(1
=
p

o
es el error estndar estimado de la
proporcin muestral.
Si se conoce el tamao de la poblacin, el error estndar estimado de la proporcin
muestral estar dado por:
siempre y cuando:
20
n 0,95
1
n N
> s
N
N
Si el tamao de muestra es grande (n > 30), se puede afirmar que el Intervalo de
Confianza 1-o para estimar la Proporcin t de la poblacin esta dado por:
|
.
|

\
|
N
N
o
1
n
n
p) - p(1
=
p

35
Ejemplo
El gerente de produccin de artefactos elctricos garantiza que el 95%
de los artefactos que se producen estn de acuerdo con las
especificaciones estndares exigidas. Para verificar la afirmacin se
examin una muestra de 200 unidades de dichos artefactos se encontr
que 25 son defectuosos.
Si se pone en duda la afirmacin del gerente de produccin

a) Cul ser el intervalo de confianza del 95% para la proporcin de
artefactos que estn de acuerdo con las especificaciones estndares
exigidas?
b) Si se produjeron 2000 artefactos, con los mismos datos anteriores,
Cul ser el intervalo de confianza del 95% para la proporcin de
artefactos que estn de acuerdo con las especificaciones estndares
exigidas?
Se tiene que el nivel de confianza es de 100(1- o)% = 95%.
Esto es, 1-o =0,95 y 1-o/2 = 0,975. Luego se tiene que
z
1-o/2
= 1,96.

= = = o = =
p
p(1 p)
n 200 k 175 p 0,875 0,0234
n
p : Es la proporcin muestral de artefactos de acuerdo a las
especificaciones estndares = 175/200 = 0,875
36
Ejemplo
Luego, si reemplaza los datos anterior en la formula siguiente, se
tiene:

o
t = o
t =
s t s
1 /2 p
IC( ) { p z }
IC( ) { 0,875 1,96(0,0234) }
P(0,829166 0,920834)=0,95
O bien:
P ( 82,92 % < t < 92,08% ) = 0.95
El porcentaje de artefactos bajo las especificaciones de calidad,
vara entre un 82,92% y 92,08% con una confianza del 95%
Interpretacin:
La afirmacin del gerente no es cierta ya que
95% no es parte del intervalo.
Adems:
37
Seleccionar
38
Test and CI for One Proportion

Sample X N Sample p 95% CI
1 175 200 0.875000 (0.829166, 0.920834)

Using the normal approximation.
39
Tamao de Muestra para Estimar la Proporcin
a) Caso de poblacin infinita .- El error de estimacin de la proporcin de la
poblacin t est dado por: E =
Luego se puede determinar el tamao de la muestra mediante:
1 /2
B z p(1 p) n
o
=
Luego se puede determinar el tamao de la muestra mediante:
2
1 /2
2
z p(1 p)
n
B
o

=
b) Caso de poblacin finita .- El error de estimacin de la proporcin de
la poblacin t, est dado por:
1 /2
p(1-p) N n
B z
n N 1
o

| |
=
|

\ .
2
1 /2
2 2
1 /2
N z p(1 p)
n
(N 1)B z p(1 p)
o
o

=
+
40
NOTA:

SI NO SE TIENE NINGUNA INFORMCION SOBR EL VALOR
DE LA PROPORCION MUESTRAL p

ASIGNAR p = 0.5
41
Se desea realizar una encuesta de mercado para estimar la
proporcin de amas de casa que prefieren un producto al que vende la
competencia. Asimismo requiere que el error al estimar la proporcin no
sea mayor de 4 puntos porcentuales con un grado de confianza del 95%.
El Dpto. de muestreo estima que el 20% de las amas de casa podran
preferir el producto. Si cuesta US$ 4 000 poner en marcha la encuesta y
US$ 65 por entrevista.
a) Cul ser el costo total de la encuesta?
b) Cul ser el costo total de la encuesta, si no se ninguna estimacin para la
proporcin de la preferencia del producto?
Solucin.-
Se sabe que el nivel de confianza 1-o =0,95, luego se tiene que z
1-o/2
=1,96.
Adems se sabe que B= 0,04 y p = 0,20
385 384,16
) 04 , 0 (
) 80 , 0 )( 20 , 0 ( ) 96 , 1 (
B
) 1 ( z
n
2
2
2
2
/2 1
~ = =

=

p p
o
Luego el Costo Total = 4 000+(65)(385) = 29 025 dlares
Ejemplo
42
c) Si se sabe que el numero de amas de casa de la zona de estudio es de 1 500.
- Cul ser el numero de entrevistas a realizar?
- Cul ser el costo total del estudio?
Intervalo de Confianza de la Varianza
El Intervalo de Confianza 1-o para estimar la varianza de la
poblacin s
2
est dado por:


= o
o o
2
/2) 1, - (n
2
2
/2) 1 1, - (n
2
2
1)s (n 1)s (n
C I ; ) (
o = 1 - o
o/2
_
1
2
= _
2
(n-1, o/2)

_
2
(n-1, 1-o/2)=
_
2
2
o/2
43
En la fabricacin de anillos para motores, se sabe que el dimetro
promedio es de 5 cm. con una desviacin estndar mxima a 0,006 cm. El
proceso es vigilado en forma peridica mediante la seleccin aleatoria de
24 anillos, midiendo sus dimetros. As en la ltima muestra se obtuvo
una desviacin estndar de 0,0065 y se consider que la variabilidad de
los dimetros estaba bajo control Cules son los lmites de la
variabilidad esperados con un nivel del 95% de confianza?
Solucin.-
Se sabe que n = 24, s = 0,0065 y que el nivel de confianza 1-o =0,95, luego
se tiene que:
8,076 3
,689 11
2
) 975 , 0 (23;
2
) 2 / 1 1; - (n
2
) 025 , 0 (23;
2
) 2 / 1; - (n
= =
= =
_ _
_ _
o
o
Ejemplo
44
Si reemplazando obtenemos lo siguiente:
{ }
( )
{ }
( )
2 2
2
2 2
(n-1, 1 /2) (n-1, /2)
2 2
2
2
2
(n 1)s (n 1)s
IC( ) ;
(23)(0, 0065) (23)(0, 0065)
IC( ) ;
38,076 11,689
IC( ) 0, 000026; 0, 000083
P 0, 000026 0, 000083 0, 95
IC( ) 0, 0051; 0, 0091
P 0, 0051 0, 0091 0, 95
o o



o =
`

)

o =
`
)
o =
s o s =
o =
s o s =
_ _
Ejemplo
Nota: No hay opcin en el
Minitab -14 para calcular
automticamente
el intervalo de confianza para
la varianza.
Statistics

N StDev Variance
24 0.00650 0.000042

95% Confidence Intervals

Method CI for StDev CI for Variance
Standard (0.00505, 0.00912) (0.000026, 0.000083)
Interpretacin: ambos lmites no son
menores que 0.006 que es la desv.
del control de calidad especificado
Entones el proceso no esta est bajo
control totalmente
45
Intervalo de Confianza de la Diferencia de Proporciones

El Intervalo de Confianza 1-o para estimar la diferencia de
proporciones de poblaciones independientes t
1
t
2
, est dado
por:
}

{ ) (
2 1
p p /2 1 2 1 2 1
z ) p (p IC
o
o = t t
donde:
2
2 2
1
1 1
p p
n
) p - (1 p
n
) p - (1 p
=
2 1
+ o

es el error estndar estimado de la diferencia de proporciones


muestrales.
Requisito: Los tamaos los tamaos de la muestras deben ser
grandes, esto es n1 + n2 >30.
46
En este tipo de Intervalo de Confianza 1-o se debe tener en
cuenta, los signos de los lmites inferior y superior, para poder
concluir que:
Si ambos limites son (+) t
1
> t
2
Si ambos limites son (-) t
1
< t
2
Si T
1
(-) y T
2
(+) t
1
= o ~ t
2
Hay diferencia
significativa
No Hay diferencia
significativa
47
En una muestra al azar de 250 bateras tomada de la lnea de produccin de
CAPSA se encuentra que 20 son defectuosas y en una muestra al azar de
300 unidades sacada de la lnea de fabricacin de VOLTA, 18 son
defectuosas. Cul ser el intervalo del 99% de confianza para la verdadera
diferencia de la proporcin de bateras defectuosas entre CAPSA y VOLTA.
Solucin.-
Se sabe que el nivel de confianza 1-o =0,99, luego se tiene que z
1-o/2
=2,58.
Adems se sabe que
1 1 1 1 2
2 2 2
CAPSA n 250 k 20 p 0, 08 p p 0, 02
VOLTA n 300 k 18 p 0, 06
= = = =
= = =
1 2
p p
(0, 08)(0, 92) (0, 06)(0, 94)
0,022
250 300

o = + =
Ejemplo
48
Reemplazando en:
} z ) p (p { ) ( C I
2 1
p p /2 1 2 1 2 1 o
o = t t
IC (t
1
t
2
) = { 0,02 (2,58)(0,022) }
Es decir:
P( 0,0366 s t
1
t
2
s 0,0766 ) = 0,99
Ejemplo
No hay diferencia significativa entre la proporcin de bateras
defectuosos entre CAPSA y Volta.
Interpretacin
49
50
Difference = p (1) - p (2)
Estimate for difference: 0.02
99% CI for difference: (-0.0365745, 0.0765745)
Test for difference = 0 (vs not = 0): Z = 0.91 P-Value = 0.363
Fisher's exact test: P-Value = 0.400
51
Intervalos de Confianza de la Razn de Varianzas
El Intervalo de Confianza 1-o para estimar la razn de varianzas de dos
poblaciones independientes est dado por:
2 1 2 1
2 2
2 2 1 1
1 2 (n 1; n 1; /2) (n 1; n 1; 1 /2)
2 2
2 2
s s
IC( ) F ; F
s s
o o

o o =
`
)
donde:
2
2
2
1
s y s
son las
varianzas
muestrales.
Nota:
A diferencia del clculo de probabilidades para S
2
1
/S
2
2
Los grados de libertad de los valores de la distribucin F son:
n
2
-1 y n
1
-1 respectivamente ( y no al revs)
F
2
tal que:
F
1

o/2
o/2
o
~ F
(n2-1,n1-1)

F
1
F
2
52
En este tipo de Intervalo de Confianza se debe tener en cuenta, que:
o
2
1
o
2
2
<1 o
2
1
< o
2
2

=1 o
2
1
= o
2
2

>1 o
2
1
> o
2
2

Entonces
Nota: El Minitab no tiene disponible la opcin de
IC para al razn de varianzas poblacionales
53
Durante el perodo de 15 das se registraron los precios de dos tipos de acciones.
Los resultados indicaron que las acciones tipo A, tenan un precio promedio de
40,33 y una varianza de 1,54; mientras que las acciones tipo B, un precio promedio
de 42,54 y una varianza de 2,96. Asumiendo una confianza del 95%, se puede
afirmar que la variabilidad de los precios de las acciones es significativamente
diferentes?
Solucin.- Se sabe que el nivel de confianza 1-o =0,95 y adems se sabe que:
96 , 2 s 15 n B Tipo
54 , 1 s 15 n A Tipo
2
2 2
2
1 1
= =
= =
2,97859 F 0,335730 F
975 0 14 14 025 0 14 14
= =
) , ; ; ( ) , ; ; (
Ejemplo
Inverse Cumulative Distribution Function
F distribution with 14 DF in numerator and 14 DF in denominator
P( X <= x ) x
0.025 0.33573
0.975 2.97859
54
Reemplazando en
( )
( )
2 1 2 1
2 2
2 2
1 1
1 2 (n 1; n 1; /2) (n 1; n 1; 1 /2)
2 2
2 2
2 2
1 2
s s
IC F ; F
s s
1, 54 1, 54
IC 0,335730 ; 2,97859
2, 96 2, 96
o o

o o =
`
)

| | | |
o o =
`
| |
\ . \ .
)
Es decir:
Ejemplo
Las varianzas de las dos poblaciones, no tienen
diferencias significativas
1 e IC ( 0,17467 1,549671)
El razn de las varianzas poblacionales vara de 0.17467 a 1.549671
con un 95% de confianza.
Adems:
55
Intervalo de Confianza de la Diferencia de Medias
a) Caso de varianzas conocidas

Si se conoce el valor de las varianzas de las dos poblaciones
independientes, se puede afirmar que el Intervalo de Confianza 1-
o para estimar la Diferencia
1
-
2
de Medias de dos Poblaciones
Independientes, esta dado por:
donde:
( )
2 2
1 2
1 2
1 2 1 /2
1 2
IC ( x x ) z
n n
o

o o

= +
`

)
56
b. Intervalo de Confianza de la Diferencia de Medias
donde:
b.1) Caso de varianzas desconocidas, pero iguales
Si no se conoce el valor de las varianzas de las dos poblaciones
independientes, pero se sabe que son varianzas iguales, se
puede afirmar que el Intervalo de Confianza 1-o para estimar la
Diferencia 1 2 de Medias de dos Poblaciones
Independientes, esta dado por:
( )

|
|
.
|

\
|
+ =
o +
2 1
2
p /2) 1 2; - n (n
2 1
2 1
n
1
n
1
s t x x IC
2 1
) (
es la varianza ponderada
2 n n
s 1 n s 1 n
s
2 1
2
2 2
2
1 1 2
p
+
+
=
) ( ) (
57
Intervalo de Confianza de la Diferencia de Medias
Si no se conoce el valor de las varianzas de las dos poblaciones
independientes, pero se sabe que son diferentes, se puede
afirmar que el Intervalo de Confianza 1-o para estimar la
Diferencia 1 2 de Medias de dos Poblaciones
Independientes, esta dado por:
donde:
V: Los grados de libertad
de la distribucin t.
( )

+ =
o
2
2
2
1
2
1
/2) 1 (G;
2 1
2 1
n
s
n
s
t x x IC ) (
b.2) Caso de varianzas desconocidas, pero diferentes
1 n 1 n
V
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
+
|
|
.
|

\
|
+
+
|
|
.
|

\
|
(

+
~
n
S
n
S
n
S
n
S
V
58
Nota Importante:

Es importante sealar que para los casos de
varianza poblacional desconocida, debe de realizar
previamente la comparacin de varianzas
poblacionales, segn el resultado de esta estimacin
se proceder a aplicar los casos b.1 o b.2

59
Intervalo de Confianza de la Diferencia de Medias
En este tipo de Intervalo de Confianza 1-o se debe tener en
cuenta, los signos de los lmites inferior y superior, para poder
concluir que:
IC(
1
-
2
) =

( (-), (-) ) :
1
<
2

IC(
1
-
2
) =

( (+), (+) ) :
1
>
2

IC(
1
-
2
) =

( (-), (+) ) :
1
=
2


60
Se esta analizando la vida til en aos de dos
marcas motores: A y B para refrigeradores, para lo cual se tiene la
informacin previa de que la variabilidad cuantificada mediante la
desviacin estndar es de: 1.3 y 1.6 respectivamente.
Si se calcula los lmites de confianza del 90% para la diferencia de
tiempo de vida til de ambas marcas:
A
-
B
.
A qu conclusin llegara usted?
Ejemplo 1.-
Marca
Tamao de
Muestra
Duracion
Promedio
A 50 12.0
B 50 13.8
T1 = -2.28
T2 = - 1.32
p ( -2.28 <
A
-
B
< -1.32) = 0.90
61
La siguiente informacin se refiere a la vida til
en aos de dos marcas motores para refrigeradores:
Marca
Duracin
Promedio
Desviacin Estndar Tamao de muestra
A 12 1.2 50
B 13.8 1.5 50
Si se calcula los lmites de confianza del 90% para
A
-
B
. A qu
conclusin llegara Ud.? Asuma que la variabilidad es la misma
Solucin.- Se sabe que:
5 1 s 8 13 x 50 n B Marca
-1,8 x x 2 1 s 0 12 x 50 n A Marca
2
2
2
2 1
1
1
1
, ,
, ,
= = =
= = = =
2 2
2
p
(50 1) 1, 2 (50 1) 1, 5
s 1,845
50 50 2
+
= =
+
Ejemplo 2.-
1,66055 t
2 1 2 n n
2 1
=
o + ) / ; (
62
Es un caso de varianzas desconocidas, pero iguales :
Reemplazando datos se tiene que para el 95% confianza el
intervalo esta dado por:
IC(
1
-
2
) = -1,8 (1,66055)(0,27166) )
Es decir: p(-2,2511 s
1
-
2
s -1,3489) = 0,90
Ejemplo 2.-
( )

|
|
.
|

\
|
+ =
o +
2 1
2
p /2) 1 2; - n (n
2 1
2 1
n
1
n
1
s t x x IC
2 1
) (
La diferencia del promedio de vida til de las dos marcas de
motores vara entre: -2.25 y -1.345 aos.

Adems como T
1
(+)

y T
2
(-), entonces la vida
til de la segunda marca es mejor.
63
Para varianzas
poblacionales iguales
64
65
b) Mediante el intervalo de confianza del 95% verificar si las
varianzas son similares.
c) Si la mxima variabilidad en trminos de la desviacin
estndar permitida para la marca A fuera de 1.5, que podra
concluir

d) Si los datos muestrales hubieran sido:
Mediante el intervalo de confianza del 95% verificar si las
varianzas son similares o diferentes, de acuerdo a los
resultados realizar el intervalo de confianza de comparacin de
tiempos de vida til de cada marca.
66
i) Intervalos de Confianza para la comparacin de Varianzas Poblacionales
o = 0.95
~ F
F
1=
0.16919
F
2=
5.52097
Inverse Cumulative Distribution Function
F distribution with n
2
=49 DF in numerator and n
1
=39 DF in
denominator
P( X <= x ) x
0.025 0.55303 = F
1
0.975 1.84629 = F
2
T
1
= 0.16919 x 5.2
2
/ 1.5
2
= 4.57898
T
2
= 5.46712 x 5.2
2
/ 1.5
2
= 147.8309
p ( 4.5789 < o
2
1
< 147.8309 ) = 0.95
o
2
2
1 IC las varianzas poblacionales son diferentes
T
1
> 1, T
2
>1 o
2
1
> o
2
2
(n
2-
1=49 , n
1
-1 =39)
Ejemplo 2d.-
P( X <= x ) x
0.025 0.55303
0.975 1.84629
ver
67
3) Intervalos de Confianza para la comparacin de Medias Poblacionales
T
1
= (12.0 13.8) 2.01537 \ (5.2
2
/40 + 1.5
2
/50)
T
2
= (12.0 13.8) 2.01537 \ (5.2 2/40 + 1.5 2/50)
o = 0.95
~ t
(V )

-1.98729
1.98729
5.2
2
+ 1.5
2 2
V= 40 50 = 44.2 = 44
5.2
2

2
+ 1.5
2 2
40 50
39 49


p( -3.51128 <
1
-
2
< - 0.08872) = 0.95
Como T1 y T2
tienen signos =
Las medias son s:
T1 y T2 (-)

1
<
2
Inverse Cumulative Distribution Function
Student's t distribution with 44 DF
P( X <= x ) x
0.025 -2.01537
0.975 2.01537
DATOS MUESTRALES
MARCA MEDIA DESVIACION n
A 12 5.2 40
B 13.8 1.5 50
68
69
70
La Real S.A. es una empresa aseguradora que opera a nivel
nacional y esta empeada en lograr la certificacin ISO 9001. Como parte de
este proceso el comit de autoevaluacin realiz un test entre el personal de
las reas de marketing y finanzas con el propsito de tener una medida de la
satisfaccin laboral. Las puntuaciones obtenidas fueron:
A qu conclusin podra usted llegar con base en el intervalo de confianza del 98%
para la diferencia entre las puntuaciones promedio?
Ejercicio (28-Gua N3)
1 2 3 4 5 6 7 8 9 10
rea
Marketing:
n
1
= 10
75 82 80 92 68 84 95 78 87 93
rea
Finanzas:
n
2
= 9
69 75 88 76 92 88 69 74 81
1 Calcular la media y varianza muestral.
2 Realizar el intervalo de confianza al 98% para la comparacin de varianzas
poblacionales. o
2
1
= o
2
2
o o
2
1
o
2
2
3 Segn el resultado anterior realizar la diferencia de medias.
4 Conclusin: Qu grupo tuvo mejores puntuaciones de satisfaccin laboral?
Rpta.
71
Results for: MINITAB
Descriptive Statistics: C2, C3
Total
Variable Count Mean StDev Variance
C2 =Mark. 10 = n
1
83.40 = X
1
8.59= S
1
73.82 = S
2
1
C3 = Finz. 9 = n
2
79.11 = X
2
8.55= S
2

73.10 = S
2
2

2) Intervalos de Confianza para la comparacin de Varianzas Poblacionales
o = 0.98
~ F
F
1=
0.16919
F
2=
5.52097
Inverse Cumulative Distribution Function
F distribution with n
2
=8 DF in numerator and n
1
=9 DF in denominator
P( X <= x ) x
0.01 0.16919 = F
1
0.99 0.56712 = F
2
T
1
= 0.16919 x 73.82/73.10 = 0.70856
T
2
= 5.46712 x 73.82/ 73.10 = 5.52097

p ( 0.7086 < o
2
1
< 5.52097 ) = 0.98
o
2
2
1 e IC las varianzas poblacionales son iguales
1) Calculando la Media y Varianza Muestrales
(n
2-
1=8 , n
1
-1 =9)
ver
72
3) Intervalos de Confianza para la comparacin de Medias Poblacionales
T
1
= (83.40 79.11) 2.5393 \ 82.1235 ( 1/10 + 1/9)
T
2
= (83.40 79.11) 2.5393 \ 82.1235 ( 1/10 + 1/9)
o = 0.98
~ t
(n1-n2-2)= (9+10-2)
= (17)

Inverse Cumulative Distribution Function
Student's t distribution with 17 DF
P( X <= x ) x
0.01 -2.56693
0.99 2.56693
-2.56693
2.56693
Sp
2
= 9 x 83.4 + 8 x 79.11 = 82.1235
10+8-2
p( -5.82 <
1
-
2
< 14.40) = 0.98
Two-Sample T-Test and CI: C2, C3
Difference = mu (C2) - mu (C3)
98% CI for difference: (-5.82172, 14.39950)
Como T1 y T2
tienen signos s
Las medias son iguales:

Ambos grupos tienen
igual puntaje promedio
73
|
.
|

\
|

o
n
S
t d
d
) 2 / 1 ; 1 n (
Diferencia de Medias con de Poblaciones
Relacionadas o con Datos Pareados
Los datos apareados son (x
i
, y
i
)
Se crea la variable: d
i
= x
i
- y
i

Se calcula: i) La media aritmtica: d = E d
i
n
ii) La desviacin estndar S
d
= E (di d )
2

\ n -1
74
Una empresa le ofrecen impartir un curso de capacitacin para aumentar
el rendimiento de sus trabajadores. La empresa decide enviar a quince
de sus trabajadores elegidos al azar de toda la plantilla. Para comprobar
si el curso es beneficioso, se controla el tiempo que tardaban estos
trabajadores en realizar un trabajo antes de realizar el curso y despus
de realizar el curso. Los resultados se reflejan en la tabla adjunta.
a) Realizar la estimacin intervlica de la diferencia de medias al 95%
b) Qu conclusiones pude obtener respecto al rendimiento de los
trabajadores? Mejor el rendimiento despus de la capacitacin?
Trabajador 1 2 3 4 5 6 7 8
Antes 235 120 210 220 191 215 221 204
Despus 174 204 200 200 184 186 186 153
9 10 11 12 13 14 15
183 216 233 210 221 230 120
165 180 163 180 128 155 180
Ejercicio 31 Gua 3
75
Hay tres formas de resolver el ejemplo con el Minitab:

1) Forma manual: Calcular di, la media y desviacin estndar
Stat, Basic Stat , One sample T , digitar: n, media y desv.
2) Stat, Basic Stat ,Calcular di, One sample T, seleccionar columna.
3) Stat, Basic Stat ,Paried T, seleccionar columnas: primera
muestra y segunda muestra. (Es la opcin mas directa)
76
p(-0.0321 <
1
-
2
< 52.1654 ) = 0.95
T
1
(+) y T
2
((-) No existe diferencia significativa entre el
rendimiento. El rendimiento no mejor
La capacitacin no fue efectiva.
La diferencia del tiempo promedio entre ambos grupos vara
entre 0.0321 y 52.1654 minutos
Por tanto:
De la forma manual:
Inverse Cumulative Distribution Function
Student's t distribution with 14 DF
P( X <= x ) x
0.01 -2.62449
0.99 2.62449
T
1
= 26.1- 2.62449 x 47.1/ 15
Descriptive Statistics: C4
Total
Variable Count Mean StDev Variance
C4 15 26.1 47.1 2221.1

T
2
= 26.1+ 2.62449 x 47.1/ 15
77

a) Calcule e interprete, en trminos del enunciado, el intervalo de
confianza del 95% para el monto promedio pagado a todos los
distribuidores que recibieron esta bonificacin extra.
b) Si BEAUTY S.A tiene 1200 distribuidores a nivel nacional,
con 95% de confianza entre que valores se hallar el porcentaje del
distribuidores de la empresa que reciben incentivos monetarios?.
Uno de los aspectos relevantes en toda organizacin
empresarial es la de otorgar incentivos a sus colaboradores ms
destacados. En este sentido, BEAUTY S.A premia a sus distribuidores
a nivel nacional con dinero segn el volumen de ventas alcanzado en
un periodo dado. En una muestra de distribuidores de la empresa, 30
de ellos recibieron bonificaciones monetarias por el nivel de ventas
alcanzado. Los montos, en dlares, recibidos por cada uno de ellos
son:
60 54 76 80 77 93 77 81 84 64
97 94 88 79 70 76 73 80 88 69
71 68 65 81 69 68 70 75 93 95
Ejercicio N 43 (Guia 3):
78
Manual del Mintitab
Fuente: Manual de Minitab 14 para Windows: Josefa Marn
Fernandez Universidad de Murcia - Espaa 2006
79