Está en la página 1de 12

UNIVERSIDAD DEL ATLÁNTICO

ESTADÍSTICA INFERENCIAL
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIÓN

Si los números respectivos de éxitos son !" y !# , y las proporciones muestrales


' '
correspondientes se denotan por %̂" = ( y %̂# = * , un intervalo de confianza de 1 − - 100%
)( )*
para %" − %# está dado por:

43( "5 43( 43* "5 43* 43( "5 43( 43* "5 43*
%̂" − %̂# − 01 2 + < %" − %# < %̂" − %̂# + 01 2 +
* )( )* * )( )*

8
Donde 01 es el valor de 0 que limita un área de a su derecha en la gráfica de función normal estándar.
* #

Dr. Freddy Marín González, 2017.


Ejemplo 13: Si 132 de 200 votantes hombres y 90 de 150 votantes mujeres están a
favor de cierto candidato que hace campaña para gobernador de Illinios, encuentre
un intervalo de confianza del 99% para la diferencia entre las proporciones reales de
votantes hombres y votantes mujeres que están a favor del candidato.

#%& +'
Solución: Se sustituye "̂# = = 0.66, "̂& = = 0.60 y -'.'', = 2.575 en la fórmula del intervalo de
&'' #,'
confianza se obtiene:

0.66 2 0.34 0.60 2 0.40 0.66 2 0.34 0.60 2 0.40


0.66 − 0.60 − 2.575 2 + < "# − "& < 0.66 − 0.60 + 2.575 2 +
200 150 200 150

Que se reduce a: −0.074 < "# − "& < 0.194

Interpretación: Con 99% de confianza, los datos de la muestra permiten afirmar que la diferencia entre
proporciones reales de votantes hombres y mujeres que favorecen al candidato oscilan entre -0.074 y 0.194. Se
observa que el intervalo contiene el cero, entonces no se puede concluir que existe una diferencia real entre las
dos proporciones.

Dr. Freddy Marín González, 2017.


INTERVALOS DE CONFIANZA PARA EL COCIENTE DE VARIANZA

Teorema:
Si s"# y s## son las varianzas de muestras aleatorias independientes de tamaño n" y n# tomadas
de poblaciones normales con varianzas σ"# y σ## , respectivamente, entonces, un intervalo de
confianza de (1 − α)100% para σ"# y σ## es:

'() " 0)
( '()
< < 1+(2
')) * + 0)
) ')) ) ) ;2( )
(- ;- )
) ( )

3
Donde 1+(2 es el valor de una variable aleatoria que deja un área de a la derecha de la distribución 1 con
) ( ;2) ) #
4" = 6" − 1 y 4# = 6# − 1 grados de libertad.

Dr. Freddy Marín González, 2017.


Ejemplo 14: Una compañía fabrica propulsores para uso en motores de turbinas. Una de las
operaciones consiste en esmerilar el terminado de una superficie particular con aleación de
titanio. Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que
tienen la misma rigurosidad superficial promedio. Al ingeniero de manufactura le gustaría
seleccionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie. Para ello
toma una muestra de !"= 12 partes del primer proceso, la cual tiene una desviación estándar
muestral de #"= 5.1 micro pulgada, y una muestra aleatoria de !$ = 15 partes del segundo
proceso, la cual tiene una desviación estándar muestral de #$= 4.7 micro pulgadas. Se desea
%'
encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas %&' . Suponga que
'
los procesos son independientes y que la rigurosidad de la superficie está distribuida
normalmente.
Solución: Para un intervalo de confianza del 90%, ( = 0.1. Por lo tanto, -.../; "1,"" = 2.564 y -.../; "","1 = 2.74.
%'
&
Por tanto, el intervalo de confianza del 90% para , es:
%'
'
/."' " %'
& /."'
9 < < 9 (2.74)
1.8 ' $./:1 %'
' 1.8 '

%'
&
Que se reduce a: 0.46 < < 3.23
%'
'

Interpretación: Puesto que este intervalo de confianza incluye la unidad, no es posible afirmar que las desviaciones
estándar de la rigurosidad de la superficie de los dos procesos sean diferentes con un nivel d confianza del 90%.

Dr. Freddy Marín González, 2017.


INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

Caso I: Varianzas Conocidas o desconocidas y muestras grandes


Teorema: Sean "̅# y "̅$ las medias de muestras aleatorias independientes de tamaños %# & %$ de
poblaciones con medias µ# , y µ$ varianzas σ#$ , σ$$ , respectivamente. Supongamos que se
cumple alguna de las siguientes condiciones:
1. Ambas poblaciones son normales y ambas varianzas poblaciones son conocidas;
2. Ambas poblaciones son desconocidas o no normales, ambas varianzas poblacionales σ#$ , σ$$ son conocidas o
desconocidas y %# ≥ 30, %$ ≥ 30. Entonces, un intervalo de confianza de (1 − α)100% para µ# − µ$ es:

σ#$ σ$$ σ#$ σ$$


"̅# −"̅$ − -. + < µ# − µ$ < "̅# −"̅$ + -. +
$ %# %$ $ %# %$
Donde, -1 es el valor de: .
2
5 6 −5 2 7(9 6 79 2 )
Que deja un área de a la derecha de la distribución normal. En el caso en que las
$
z= varianzas poblacionales son desconocidas, utilizamos las desviaciones muestrales
;2 2
6 = ;2
<6 <2 repectivas como estimación de las correspondientes desviaciones poblacionales.

Dr. Freddy Marín González, 2017.


Ejemplo 15: Para una muestra aleatoria de 321 fumadores, el número medio de horas de
absentismo laboral al mes fue de 3.01 y la desviación típica muestral fue de 1.09 horas al mes.
Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el
número medio de horas fue de 2,88 y la desviación típica muestral fue de 1,01 horas al mes.
Calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales.

Solución: Dado que los tamaños muestrales son grandes, podemos utilizar las varianzas muestrales en lugar de las
varianzas poblacionales desconocidas de la siguiente manera:
(#$ ($$ (#$ ($$
"̅# −"̅$ − &' + < µ# − µ$ < "̅# −"̅$ + &' +
$ )# )$ $ )# )$

Siendo
)# = 321 "̅# = 3.01 (# = 1.09
)$ = 94 "̅$ = 2.88 ($ = 1.01
1.09 $ 1.01 $ (1.09)$ (1.01)$
3.01 − 2.88 − 1.96 + <µ# − µ$ < 3.01 − 2.88 + 1.96 +
321 94 321 94

o bien −0.11 < µ1 − µ2 < 0.37

Dado que el cero está dentro del intervalo de confianza, no hay suficiente evidencia en los datos como para
rechazar la idea de que ambas poblaciones tienen la misma media.

Dr. Freddy Marín González, 2017.


Caso II: Varianzas poblacionales σ#" $ σ## iguales, desconocidas y muestras pequeñas
Tratamos ahora el caso en el cual los tamaños muestrales no son grandes y se
requiere un intervalo de confianza para la diferencia de medias de dos poblaciones
normales. De hecho, cuando las varianzas poblacionales son desconocidas, este
problema resulta difícil de abordar de forma general. Sin embargo, en los casos
especiales en los que se pueda asumir que las varianzas poblacionales son iguales, se
puede utilizar el siguiente teorema:

Teorema:
Sean &̅' y &̅) las medias de muestras aleatorias independientes de tamaños *' < 30 y *) < 30 de poblaciones
normales con medias µ' , µ) y varianzas -') , -)) iguales y desconocidas. Entonces, un intervalo de confianza de
(1 − α)100% para µ' − µ) es:
1) 1) 1) 1)
&̅' −&̅) − /0 + < µ' − µ) < &̅' −&̅) + /0 +
) *' *) ) *' *)
Donde:
4 5 6' 758 9(4 8 6')788 ? 5 −? 8 6( @ 5 6 @ 8 )
1) = y /< es el valor de t =
4 5 94 8 6) 8 A8 A8
9
B5 B8

0
Que deja un área de a la derecha de la distribución t de Student con ν = *' + *) − 2 grados de libertad.
)

Dr. Freddy Marín González, 2017.


Ejemplo 16: En un estudio sobre los efectos de la planificación en el rendimiento financiero de los bancos,
se extrajo una muestra aleatoria de seis instituciones financieras que contaban con un sistema de
planificación formal, y se comprobó que el porcentaje medio anual de crecimiento de los ingresos netos en
dicha muestra era de 9.972 con una desviación típica de 7.470. La media de dicho crecimiento en otra
muestra aleatoria independiente de nueve bancos que no recurrían a la planificación fue de 2.098 con una
desviación típica de 10.834. Suponiendo que las dos poblaciones son normales y tienen la misma varianza,
calcular un intervalo de confianza del 90% para la diferencia de medias

Solución: Los datos muestrales son: !" = 6, &"̅ = 9.972, +" = 7.470, !. = 9, &̅. = 2.098, +. = 10.834

Claramente podemos verificar que se cumplen los supuestos del teorema. Debido a que el valor de la varianza muestral combinada es:
5 (7.470).+(8)(10.834).
+. = = 93.7
13
Ya que 67 = 69,9; = 1.771 es el valor de una variable aleatoria que tiene distribución t de Student con v = !" + !. − 2 = 13 grados
8
de libertad, entonces, el intervalo de confianza del 90% para la diferencia de los incrementos medios porcentuales es:

93.7 93.7 93.7 93.7


(9.972 − 2.098) − 1,771 + <µ" − µ. < (9.972 − 2.098) + 1,771 +
6 9 6 9
o bien 1.161<µ1 − µ2 < 16.909
El intervalo incluye el cero, lo cual sugiere que no existe evidencia suficiente en la muestra como para rechazar la idea de la igualdad
de medias entre ambas poblaciones.

Dr. Freddy Marín González, 2017.


Caso III: Varianzas poblacionales σ#" $ σ## diferentes, desconocidas y muestras pequeñas
Teorema:
Sean &'̅ y &̅) las medias de muestras aleatorias independientes de tamaños *' < 30 y *)< 30 de
poblaciones normales con medias µ' , µ) y varianzas σ#" $ σ## diferentes y desconocidas. Entonces,
un intervalo de confianza de (1 − α)100% para es µ' − µ) es:

0') 0)) 0') 0))


&̅' −&̅) − ./ + < µ' − µ) < &̅' −&̅) + ./ +
) *' *) ) *' *)
Donde:
7 8 −7 4 9( ; 8 9 ; 4 )
.3 es el valor de t =
4 =4 4
8 ? =4
>8 >4

/
Que deja un área de a la derecha de la distribución t de Student con:
)
=4 4 4
8 ? =4
>8 >4
v= 4 4 , grados de libertad. Dado que ν rara vez es un entero, se redondea al entero más cercano.
=4
8 =4
4
>8 >4
?
>8 A8 >4 A8

Dr. Freddy Marín González, 2017.


Ejemplo 16: El departamento de zoología de cierto instituto llevó a cabo un estudio para estimar la
diferencia en la cantidad de cierta sustancia química medida en dos estaciones diferentes de un río. La
sustancia se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1 y 12 muestras de la
estación 2. Las 15 muestras de la estación 1 tuvieron un contenido promedio de sustancia química de 3.84
miligramos por litro y una desviación estándar de 3.07 miligramos por litro, mientras que las 12 muestras
de la estación 2 tuvieron un contenido promedio de 1.49 miligramos por litro y una desviación estándar de
0.80 miligramos por litro. Encuentre un intervalo de confianza del 95% para la diferencia en el contenido
promedio real de sustancia en estas dos estaciones. Suponga que las observaciones vienen de poblaciones
normalmente distribuidas con varianzas diferentes.

Solución: Los datos muestrales son: !" = 15, '"̅ = 3.84, ," = 3.07, !/ = 12, '̅/ = 1.49, ,/ = 0.80
Como las varianzas poblacionales se suponen diferentes, sólo podemos encontrar un intervalo de confianza de 95% aproximado
basado en la distribución t de Student con:
7
3,56 7 5.;5 7
89
: 87
v= 7 7 = 16.2 ∼ 16 grados de libertad. Debido a que ?@ = ?A,A/B = 2.120, entonces, el intervalo buscado es:
3.56 7 5,;5 7 7
89 87
8<
: 88

3.07 / 0.80 / 3.07 / 0.80 /


3.84 − 1.49 − 2.120 + < µ" − µ/ < 3.84 − 1.49 + 2.120 +
15 12 15 12
o bien 0.60<µ1 − µ2 < 4.10
Por ello tenemos una confianza del 95% de que el intervalo de 0,60 a 4,10 miligramos por litro contiene la diferencia de los contenidos
promedio reales de sustancia para estos dos lugares. Como el 0 no está incluido en el intervalo, podemos afirmar que estos dos
contenidos promedios son diferentes.

Dr. Freddy Marín González, 2017.


Referencias Bibliográficas

Referencias bibliográficas de apoyo:

1. G.C Canavos. Probabilidad y Estadística – Aplicaciones y Métodos. Mc. Graw Hill. México.

2. J. E. Freund, I Miller & M. Miller. Estadística Matemática Con Aplicaciones. Pearson Prentice Hall, Mexico

3. Walpole, Myers. Probabilidad y Estadística para Ingeniería y ciencias. Pearson. México.

Dr. Freddy Marín González, 2017.

También podría gustarte