Está en la página 1de 6

8.

5 Intervalo de confianza para la diferencia de medias 1   2 de dos poblaciones


normales. Muestras emparejadas

Muestras emparejadas: X1 y X 2 están asociadas. El tamaño de ambas muestras n1 y


n2 es igual. Ambas variables se miden sobre los mismos sujetos u objetos o bien sobre
objetos que han sido emparejados según características comunes.

Si X 1  N (1 , 1 ) y X 2  N ( 2 ,  2 ) y se toma una muestra de tamaño n1 de X1 y una


muestra de tamaño n2 de X 2 y cov( X1 , X 2 )  12 , entonces la variable,

D  X 1  X 2  N ( D ,  D ) donde D  1  2 y  D   12   22  2 12

Si  X 11, X 12 ,..., X 1n  y  X 21, X 22 ,..., X 2 n  son las muestras de X1 y X 2 respectivamente,


entonces tenemos una muestra de diferencias

D   D1, D2 ,..., Dn    X 11  X 21, X 12  X 22 ,..., X 1n  X 21

Y construir el intervalo de confianza de 1  2 equivale a construir un intervalo de


confianza de la media D , y si  D es desconocida, tenemos

D  D
 tn 1
SD
n
Siendo,
n

D D i
D i 1
la media de la muestra de las n diferencias
n
n

  D  D
2
i
SD  i 1
la desviación típica de la muestra de n diferencias
n 1

tn1 la distribución t de Student con n -1 grados de libertad.

El intervalo de confianza vendrá dado por,

D  D
P ( tn 1,  t  tn 1, )  1    P ( tn 1,   tn 1, )  1  
2 2 2 SD 2

SD SD
P(tn 1,  D   D  tn 1, )  1
2 n 2 n

SD
Multiplicando por , sumando D y multiplicando por -1 nos queda,
n
SD SD
P( D  tn 1,   D  D  tn 1, )  1
2 n 2 n

 D   D  tn 1, S D , D  tn 1,
SD  es decir,  D   D  tn 1, S D 
 2 n 2 n   2 n 

Ejemplo
Se utilizan dos métodos para la determinación de cloro residual en efluentes de
aguas residuales. Ambos métodos se aplican a las mismas muestras que se han tomado
de lugares diferentes y distintos tiempos de contacto con el efluente. A continuación se
muestra la tabla de resultados de concentración de cloro residual en ppm para ambos
métodos aplicados sobre la misma muestra.

Muestra Método I Método II


1 0.39 0.36
2 0.84 1.35
3 1.76 2.56
4 3.35 3.92
5 4.69 5.35
6 7.70 8.33
7 10.52 10.70
8 10.92 10.91

a) Justifique si se trata de muestras independientes o emparejadas.


b) Halle el intervalo para un 95% de nivel de confianza
c) Según los resultados del apartado b) ¿puede afirmarse que los resultados de cloro
residual en ppm por ambos métodos sobre la misma muestra son distintos para un 95%
de confianza?

Solución
a) Se trata de muestras emparejadas puesto que se prueban dos métodos diferentes sobre
la misma muestra.
b) Nos piden hallar el intervalo de confianza de la diferencia de medias poblacionales
para muestras emparejadas.
Definir las variables normales:

X1 : concentración cloro residual en ppm en la muestra por el Método I X 1  N (1 , 1 )

X 2 : concentración cloro residual en ppm en la muestra por el Método II X 2  N ( 2 ,  2 )

Nivel de confianza P  1    0.95    0.05    0.025


2
Tamaño de las muestras: n1  n2  n  8

Valor crítico: tn 1,  t81,0.025  t7,0.025  2.306


2

di , i = 1,2,..20 son las diferencias para cada muestra de la concentración de cloro residual
en ppm por el Método I y por el Método II

Calculando las diferencias para cada muestra, la media y desviación típica de las
diferencias.
Muestra Método Método di ( di  d ) 2
I II
1 0.39 0.36 0.03 0.1990
2 0.84 1.35 -0.51 0.0088
3 1.76 2.56 -0.8 0.1473
4 3.35 3.92 -0.57 0.0236
5 4.69 5.35 -0.66 0.0594
6 7.70 8.33 -0.63 0.0457
7 10.52 10.70 -0.18 0.3554
8 10.92 10.91 0.01 0.1816
8 n

 di  3.33  d  (0.4162)   1.0208


2
i
i 1 i 1
n 8 n
 di  di  d d 
2
i
d 1
 1
 0.4162 1.0208
Sd  i 1

n 8 n 1 8 1
S d  0.3818

Sustituyendo,

 D   D  tn 1, S D , D  tn 1,
SD 
 2 n 2 n 

 D   0.4162  (2.306) (0.3818) , 0.4162  (2.306) (0.3818) 


 8 8 

 D   0.7274, 0.1049 para un 95% de confianza

c) Según los resultados del apartado b) como ambos extremos del intervalo son negativos,
puede afirmarse que el contenido de cloro residual en ppm determinado por el método I
ha dado menor que el determinado por el método II para un 95% de nivel de confianza
Ejercicios Propuestos
1.- Un estudio reporta los niveles de dioxina TCDD (2,3,7,8 - tetraclorodibenzo-p-
dioxina) en 20 personas expuestas a dicho contaminante. Se presentan los niveles de
dioxina en plasma y en tejido adiposo. Calcule el intervalo de confianza del 95% para
1  2 donde 1 y 2 representan las medias de niveles de TCDD en plasma y en tejido
adiposo respectivamente. Suponga que la distribución de diferencias es casi normal.
(tomado de Walpole et al “Probabilidad y Estadística para ingeniería y ciencias”)

Solución

Nos piden el intervalo de confianza de la diferencia de medias D  1  2 de dos


poblaciones normales con varianzas desconocidas y observaciones emparejadas.
Definir las variables normales:

X1 : Niveles de TCDD en plasma X 1  N (1 , 1 )

X 2 : niveles de TCDD en tejido adiposo X 2  N ( 2 ,  2 )

Nivel de confianza P  1    0.95    0.05    0.025


2

Tamaño de las muestras: n1  n2  n  20

Valor crítico: tn 1,  t20 1,0.025  t19,0.025  2.093


2

di , i = 1,2,..20 son las diferencias para cada persona del nivel de TCDD en plasma y
tejido adiposo
n 20

 di d i
d 1
 1
 0.87
n 20
n n

 d i d   d  ( 0.87) 
2 2
i
168.422
Sd  i 1
 i 1
  2.977
n 1 20  1 19
Sustituyendo,

 D   D  tn 1, S D , D  tn 1,
SD 
 2 n 2 n 

 D   0.87  (2.093) (2.977) , 0.87  (2.093) (2.977) 


 20 20 

 D   2.2634, 0.5234 para un 95% de confianza

Y, como el intervalo incluye el 0, podemos afirmar que 1  2 o, lo que es lo


mismo, que no hay diferencias significativas entre las dos medias, para un 95% de
confianza, por lo que podemos concluir que los niveles medios de TCDD en plasma y
tejido adiposo son similares.

2.- Un artículo publicado en Journal of Strain Analysis (1983, Vol.018, No. 2) compara
dos métodos: Karlsruhe y Lehigh para predecir la resistencia al corte en N / m 2 de vigas
de placas de acero. Se aplican ambos métodos a una muestra de nueve vigas y se obtienen
los siguientes resultados:
Viga S1/1 S2/1 S3/1 S4/1 S5/1 S2/1 S2/2 S2/3 S2/4
Karlsruhe 1.180 1.151 1.322 1.339 1.203 1.402 1.365 1.537 1.559
Method
Lehigh 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052
Method

Calcule el intervalo de confianza del 95% para 1  2 donde 1 y 2 representan las


medias de resistencia al corte en N / m 2 de las vigas predichas por el Método Karlsruhe
y el Método Lehigh respectivamente. Suponga que la distribución de diferencias es es
normal.
Solución
Definir las variables normales:

X1 : resistencia al corte de las vigas de acero en N / m 2 predicha por el Método Karlsruhe


X 1  N (1 , 1 )

X 2 : resistencia al corte de las vigas de acero en N / m 2 predicha por el Método lehigh


X 2  N ( 2 ,  2 )

Nivel de confianza P  1    0.95    0.05    0.025


2
Tamaño de las muestras: n1  n2  n  9

Valor crítico: tn 1,  t20 1,0.025  t19,0.025  2.093


2

di , i = 1,2,..9 son las diferencias de resistencia al corte de vigas de acero en N / m 2 por


los dos métodos
Calculando las diferencias por muestras.
Viga S1/1 S2/1 S3/1 S4/1 S5/1 S2/1 S2/2 S2/3 S2/4
Karlsruhe 1.180 1.151 1.322 1.339 1.203 1.402 1.365 1.537 1.559
Method
Lehigh 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052
Method
Diferencias 0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507
di
n 9 n n

 di  di   di  d  d  (0.2736) 
2 2
i
d 1
 1
 0.2736 Sd  i 1
 i 1
 0.1356
n 9 n 1 9 1
Sustituyendo,

 D   D  tn 1, S D , D  tn 1,
SD 
 2 n 2 n 

 D  0.2736  (2.093) (0.1356) ,0.2736  (2.093) (0.1356) 


 9 9 

 D   46.03, 46.58 para un 95% de confianza

Como los extremos del intervalo tienen signos contrarios, puede decirse que  D = 0 para
un 95% de confianza, es decir, puede afirmarse que no existe diferencia en la predicción
de la resistencia al corte en N / m 2 en vigas de placa de acero entre ambos métodos.

También podría gustarte