Está en la página 1de 8

Intervalos de Confianza en dos

SEMANA 4   MUESTRAS  
 
 

 
 
 
 

 
 
 

 
 
 
 

 
 
 

 
 
 
 

 
 
 
   

[ ESTADÍSTICA INFERENCIAL ]
 

INTERVALOS  DE  CONFIANZA  EN  DOS  MUESTRAS  


 

 INTERVALO  DE  CONFIANZA  PARA  LA  DIFERENCIA  DE  MEDIAS  CON  VARIANZAS  
CONOCIDAS  
 INTERVALO  DE  CONFIANZA  PARA  LA  DIFERENCIA  DE  MEDAS  CON  VARIANZAS  
DESCONOCIDAS  
 INTERVALOS  DE  CONFIANZA  PARA  MUESTRAS  PAREADAS.  

PALABRAS  CLAVE:  

Intervalo  de  confianza,  diferencia  de  medias,  diferencia  de  proporciones,    nivel  de  confianza,  
distribución  normal,  distribución  t  Student.  

INTRODUCCIÓN  

Un  problema  que  es  tan  importante  como  la  estimación  de  una  sola  media  poblacional  para  
una  población  cuantitativa  es  la  comparación  de  dos  medias  poblacionales.  En  forma  similar  
una   extensión   de   la   estimación   de   una   proporción   para   una   población   cualitativa,   es   la  
estimación  de  la  diferencia  entre    dos  proporciones:  

  1.  Diferencia  de  medias  con  varianzas  poblacionales  conocidas  


Se   comparan   dos   procesos   de   fabricación,   los   dos   procesos   tienen   distribución   normal   y   con  
base  en  registros  pasados  se  determine  que  las  varianzas  eran  41,16  y  28,59  respectivamente.  
Se   toman   dos   muestras,   una   de   36   artículos   de   la   primera   producción   y   otra   de   64   de   la  
segunda  obteniendo  medias  de  75  y  60  respectivamente.  

Encontrar  los  límites  de  confianza  del  98%  para  la  diferencia  de  las  medias  poblacionales.  

Solución:  

n1=  36                n2=  64                    !! = 75!! = 60!!! = 41,16!!! = 28,59  

Se  ubica  el  valor  de  la  distribución  normal  con  nivel  del  98%,    Z=  2,33.  

El  intervalo  queda  en  la  forma:  

σ 12 σ 22
( X1 - X2 ) ± Z +  
n1 n2

41,16 28,59
(75  –  60)    ±  2.33 +  
36 64

 
2   [ POLITÉCNICO GRANCOLOMBIANO ]
 

15±2,33(1,26)  

15+2,94=17,94  

15-­‐2,94=12,06.  

La  diferencia  de  medias  esta  entre  12,06  y  17,94  con  una  confiabilidad  del  98%.  Es  decir  que  en  
promedio   el   número   de   artículos   producidos     por   el   primer   proceso   es   superior   al   del  
Segundo  proceso.  Esto  porque  el  intervalo  da  diferencias  positivas.  

 
2.  Diferencia  entre  medias  de  dos  poblaciones  normales  con  varianzas  
  poblacionales  desconocidas  pero  iguales    y  muestras  pequeñas  (n1<  30      y  n2  <30)  

  1 1
( X 1 - X 2 ) ± t. S P +  
n1 n 2

En  esta  expresiónt  tiene  distribución  t  Student  con  (n1+n2-­‐2)  grados  de  libertad.  

Y  la  desviación  estándar  Sp:  

(n1 − 1) S12 + (n2 − 1) S 22


Sp =  
n1 + n2 − 2

Ejemplo:  

Dos  proveedores  diferentes  proporcionan  lotes  de  500  piezas.  Para  comparar  la  calidad  de  
los  lotes  se  toman  muestras  aleatorias  de  seis  lotes  de  cada  proveedor  y  se  examinan  para  
determinar  el  número  de  piezas  que  no  cumplen  las  condiciones.  Los  resultados  obtenidos  
son:  

PROVEEDOR  A   PROVEEDOR  B  

28   22  

37   27  

34   29  

29   20  

31   18  

33   30  

 
[ ESTADÍSTICA INFERENCIAL ] 3
 

a. Con  un  nivel  de  confianza  del  95%    diga  si  hay  diferencias  significativas  en  el  número  
de  piezas  que  no  cumplen  las  condiciones  en  los  dos  proveedores.  Suponga  varianzas  
de  la  población  iguales  
b. Con   la   información   de   la   parte   a.     responda,   ¿Si   debe   decidir   entre   un   proveedor,     a  
cual  elige?    
 
  3.  Diferencia  entre  medias  de  dos  poblaciones  normales  con  varianzas  poblacionales.  
   
Cuando  las  varianzas  de  las  poblaciones  son  desconocidas  se  trabaja  con  las  varianzas  en  la  
desconocidas  pero  diferentes,  muestras  pequeñas    (n1<  30      y  n2  <30)  
muestra  con  la  siguiente  expresión:  
 
S12 S 22
(X1 - X2 ) ± t +  
n1 n2

En   esta   expresión   t   es   el   valor   de   la   tabla   t   Student   con   grados   de   libertad   v   que   se  


determinan  con  la  siguienteexpresión:  

 
2
⎛ S12 S 22 ⎞
  ⎜⎜ + ⎟
⎝ n1 n2 ⎟⎠
ν= 2 2
  ⎛ S12 ⎞ ⎛ S 22 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ n1 ⎠ + ⎝ n2 ⎠
n1 − 1 n2 − 1
Ejemplo:  

Una  compañía  de  transporte  de  carga  desea  escoger  la  mejor  ruta  para  llevar  la  mercancía  de  
un   depósito   a   otro.   La   mayor   preocupación   es   el   tiempo   de   viaje.   En   el   estudio   se  
seleccionaron  al  azar  cinco  choferes  de  un  grupo  de  10  y  se  asignaron  a  la  ruta  A,  los  cinco  
restantes  se  asignaron  a  la  ruta  B.  Los  datos  obtenidos  fueron:  

RUTA  A   20   26   32   21   30  

RUTA  B   24   29   34   25   35  

¿Con  un  intervalo  de  confianza  del  95%  se  podrá  pensar  que  la  ruta  A  es  la  mejor?  Asuma  
varianzas  poblacionales  desconocidas  pero  iguales.  

 
Intervalo  para  diferencia  de  proporciones.  
 
 

 
4   [ POLITÉCNICO GRANCOLOMBIANO ]
 

Cuando   el   interés   es   comparar   las   muestras   de   poblaciones   en   donde   la   característica   de  


observación   es   de   carácter   cualitativo   entonces   se   utiliza     la   siguiente   expresión:
veamos  con  un  ejemplo:    

  P1 (1 − P1 ) P2 (1 − P2 )
( P1 − P2 ) ± Z +
  n1 n2
El  departamento  de  control  de  calidad  de  una  gran  industria  quiere  establecer  con  un  nivel  
de  confianza  del  95%  si  existe  alguna  diferencia  entre  el  número  de  productos  defectuosos  
que   son   encontrados   en   la   producción,   en   dos   turnos   de   trabajo.   El   departamento   toma  
muestras   de   1000   productos   en   cada   turno,   el   turno   A   encuentra   un   18%   de   productos  
defectuosos  mientras  que  en  el  turno  B  este  porcentaje  era  del  14%.  

Se  definen  los  valores:  

n1=  1000            n2=  1000        P1=  0,18            P2=  0,14    (1-­‐α  )=  0,95  

Para  el  nivel  de  confianza  del  95%  se  ubica  el  valor  Z  en  la  tabla  de  la  distribución  normal.  

Z  =  1,96.  

(0,18)(0,82) (0,14)(0,86)
(0,18 − 0,14) ± 1,96 +
1000 1000  
0,04  +  0,032  =  0,0721  

0,04  –  0,032  =  0,0079.  

Con   un   nivel   de   confianza   del   95%   se   puede   decir   que   la   diferencia   en   la   proporción   de  
productos  defectuosos  esta  entre  0,0079  y  0,0721.  Este  resultado  indica  que  la  proporción  de  

Diferencia  de  muestras  pareadas  


 
 
[ ESTADÍSTICA INFERENCIAL ] 5
 

defectuosos  es  mayor  en  el  turno  A,  la  conclusión  se  da  porque  los  dos  limites  del  intervalo  
son  positivos.  

La  diferencia  de  medias  tratada  anteriormente  corresponde  a  muestras  independientes.  En  


este  caso  se  trata  de  establecer  la  diferencia  para  muestras  dependientes  o  relacionadas  en  
situaciones  en  donde  se  analiza  el  mismo  sujeto  o  la  misma  unidad  en  dos  momentos,  como  
en  los  casos  antes,  después  o  pre  y  post.  

El  intervalo  entonces  toma  la  forma:  

Sd
d ±t
n  

En  donde  d  es  la  diferencia  entre  el  valor  antes  y  el  valor  después  

d  barra    es  la  media  de  las  diferencias  

Sd      es  la  desviación  estándar  de  las  diferencias  

t  con  (n-­‐1)  grados  de  libertad.  

Ejemplo:  

Se   tienen   los   puntajes   de   la   prueba   de   10   empleados   antes   y   después     de   habérseles  


impartida  capacitación  laboral  adicional  .Se  quiere  establecer    un  intervalo  de  confianza  del  
90%  para  la  media  de  la  diferencia  en  los    puntaje    antes  y  después  de  la  capacitación.  

 Los  puntajes  aparecen  en  la  tabla:    

Solución:  

 Empleado       Puntaje  antes  de     Puntaje  después  de            

La  capacitación  del     La  capacitación  del            

empleado   empleado   d i   d i2  

1   9.0   9.2   -­‐0.2   0.04  

2   7.3   8.2   -­‐0.9   0.81  

3   6.7   8.5   -­‐1.8   3.24  

 
6   [ POLITÉCNICO GRANCOLOMBIANO ]
 

4   5.3   4.9   0.4   0.16  

5   8.7   8.9   -­‐0.2   0.16  

6   6.3   5.8   0.5   0.25  

7   7.9   8.2   -­‐0.3   0.09  

8   7.3   7.8   -­‐0.5   0.25  

9   8.0   9.5   -­‐1.5   2.25  

10   8.5   8.0   -­‐0.5   0.25  

                                                                     7.4                                  7.9                                                              -­‐5.0                                            7.38  

La  media  de  las  diferencias  es:  

− 5.0
d =     10  =    -­‐  0.5    (estimador  puntual  insesgado  de   µd )  

 Se   establece   que   la   variable   aleatoria   que   es   función   del   estimador   y   del   parámetro   cuya  
distribución  este  definida.  

d − µD
  T  =   sd / n                    con      n  -­‐  1  grados  de  libertad.  

De  acuerdo  al  nivel  de  confianza  del  90%  se    ubica  el  valor  de  la  tabla  t  Student  con  (n-­‐1)  =  (10  
-­‐  1)  =  9  grados  de  libertad.    El  valor  t=  1,833        

                                                                                   
Para  el  intervalo  se  calcula:                                                                                                                                                          

d=
∑d i − 5.0
n =     10    =  -­‐0.5  

 
[ ESTADÍSTICA INFERENCIAL ] 7
 

∑ (d i − d )2 7.38 − 10 ( − 0.5) 2
Sd = = 0.736
    n −1    =       9  

0.736
 Límite  superior  de  confianza      -­‐0.5  +  (1.833) 10 =      -­‐0.073  

0.736
 Límite  inferior  de  confianza        -­‐0.5  +  (1.833) 10 =      -­‐0.927.  

 Debido   a   que   se   restan   los   puntajes   posteriores   al   entrenamiento   de   los   puntajes   anteriores  
al   entrenamiento,   produciendo   valores   negativos,   se   puede   estar   90%   seguro     de   que   la  
media  de  los  puntajes  posteriores  al  entrenamiento    está  entre  0.073  y  0.927  más  altos.  Por  
lo   tanto   se   puede   decir   que   los   puntajes   después   del   entrenamiento   son   mayores   a   los  
puntajes  de  antes  del  departamento.  

BIBLIOGRAFÍA    
FREUND,  John  E.,  MILLER,  Irwin  y  MILLER,  Marylees.  Estadística  Matemática    con  
aplicaciones.  6ed.  Madrid  Prentice  Hall,  2000.  

GUTIERREZ,  Humberto  y    DE  LA  VARA,  Román.  Control  estadístico  de  Calidad  y  Seis  Sigma  
(6s).  México:  McGraw-­‐Hill,  2005.    

KENNET,  Ron  S.,  y  ZACKS,  Shelemyahu.  Estadística  Industrial  Moderna.  Barcelona,    Thomson,    
2000.  

MONTGOMERY,  Douglas  C.  y    RUNGER,  George  C.  Probabilidad    y  Estadística  aplicadas  a  la  
Ingeniería.  2ed.  México:  Limusa,    2002.  

NEWBOLD.  Paul.  Estadística  para  los  Negocios  y  la  Economía.  4ed.  Madrid  Prentice  Hall,  1988.  

WALPOLE  Ronal,  E.,  MYERS,  Raymond  H.    y    MYERS,  Sharon  L.  Probabilidad  y  Estadística  para  
Ingenieros.    6ed.  Madrid  Prentice  Hall,  1998.  

 
8   [ POLITÉCNICO GRANCOLOMBIANO ]

También podría gustarte