Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Para determinar el estimador por IC o realizar una PH para la diferencia de las medias
de dos distribuciones normales en un diseño completamente aleatorizado (DCA) y
desconocidas las varianzas, se necesita verificar estadísticamente el supuesto ¿ 12 = 22
2
?. Esto puede realizarse por medio de un IC o con una PH para 12 .
2
12
En la unidad 4 se determinó el estimador por IC del 100(1-α)% para de dos
22
distribuciones normales en un DCA:
S12 12 S12
F(1− 2 ); n 2 −1, n1 −1 2 2 F 2; n 2 −1, n1 −1
S22 2 S2
donde P(Fn2 −1, n1 −1 F 2; n2 −1, n1 −1 ) = / 2 y P(Fn2 −1, n1 −1 F(1− 2); n2 −1, n1 −1) = 1 − ( / 2) .
Notas:
1. Si el IC incluye al valor uno entonces la razón de las varianzas puede tomar el valor 1,
es decir, 12 = 22 estadísticamente con nivel de confianza 1 − .
2. El supuesto para el uso correcto del IC es que la variable de estudio se distribuya
normal en ambas poblaciones.
Supuestos
Y11, Y12,…, Y1n1 y Y21, Y22,…, Y2 n 2 m.a.i. de dos distribuciones normales con medias 1 y
2 desconocidas, y varianzas 12 y 22 también desconocidas.
Hipótesis
H0 : 12 = 22 vs H1 : 12 22 (a)
H1 : 12 22 (b)
H1 : 12 22 (c)
Estadístico de prueba
S2
Si H0 es cierta F = 12 ~ Fn1 −1, n 2 −1
S2
144
Región de rechazo
F F; n1 −1, n2 −1 (a)
(b) H1 : 12 22 .
¿Cómo proceder?
Note que se tiene la libertad de identificar a cualquiera de las dos poblaciones como la
población 1. Por lo tanto, si se intercambian las designaciones 1 y 2 de las dos
poblaciones (y los subíndices correspondientes para los tamaños de las muestras, las
varianzas muestrales, etc.) la hipótesis alternativa se convierte en H1 : 12 22 y se
procede de manera similar al caso (a).
(c) H1 : 12 22 .
Como los valores de la cola superior se pueden determinar directamente de la tabla de
la distribución F proporcionada ¿Cómo se determina los valores críticos de la cola
inferior? Para evitar la determinación de los valores críticos de la cola inferior, se procede
de la siguiente manera. Sean nvg y nvp los tamaños muestrales asociados a la varianza
muestral más grande y más pequeña respectivamente. Localice la mayor varianza
muestral en el numerador ( s 2g ) y la menor varianza muestral en el denominador ( sp2 ) de
s2g
F y rechace H0 : 12 = 22 en favor de H1 : 12 22 si f = F , en donde
sp2 2
; n vg −1, n vp −1
F se determina tal que P Fn vg −1, n vp −1 F = .
; n vg −1, n vp −1 ; n vg −1, n vp −1
2 2 2
145
5.3.2. PH para 𝛍𝟏 − 𝛍𝟐 , tanto para muestras independientes como dependientes
Casos en una prueba estadística para 𝜇1 − 𝜇2 cuando las muestras aleatorias son
independientes:
(i) Se tienen dos m.a.i: Y11, Y12,…, Y1n1 de una N(µ1, 12 ) y Y21, Y22,…, Y2 n 2 de una
N(µ2, 22 ). Además 12 y 22 son conocidas.
(ii) Se tienen dos m.a.i: Y11, Y12,…, Y1n1 con (µ1, 12 ) y Y21, Y22,…, Y2 n 2 con (µ2, 22
), y se cumplen las condiciones del TLC (con n1≥30 y n2≥30). Además, 12 y
22 son conocidas; en caso de desconocidas pueden estimarse
(ˆ 12 = S12 y ˆ 22 = S22 ) .
(iii) Se tienen dos m.a.i: Y11, Y12,…, Y1n1 de una N(µ1, 12 ) y Y21, Y22,…, Y2 n 2 de una
N(µ2, 22 ). Además 12 y 22 son desconocidas.
Resumen general de las pruebas de hipótesis para los casos (i) y (ii).
Hipótesis
H0 : 1 − 2 = (1 − 2 )0 = D0
1 − 2 D0 (alternati va de cola superior)
Ha : 1 − 2 D0 (alternati va de cola inferior)
− D
1 2 0 (alternati va de dos colas)
D0: valor hipotético de la diferencia de medias. La situación más usual es suponer que D0
=0
Estadístico de prueba
( Y 1 − Y 2 ) − D0
Si H0 : 1 − 2 = D0 es cierta entonces Z = ~ N(0,1) Caso (i)
12 22
+
n1 n2
( Y 1 − Y 2 ) − D0 •
Si H0 : 1 − 2 = D0 es cierta entonces Z = ~ N(0,1) Caso (ii)
12 22
+
n1 n2
Si no se conocen las varianzas se utilizan ˆ 12 = S12 y ˆ 22 = S22 .
146
z z (RR de cola sup erior)
α
z z z z o z −z
2 2 2
Supuestos
a) Las dos m.a.i. se obtienen de poblaciones con distribución normal.
b) Probar estadísticamente si 12 = 22 o 12 22 .
Hipótesis
H0: 1 - 2 = D0 vs. H1: 1 - 2 > D0 (a)
vs. H1: 1 - 2 < D0 (b)
vs. H1: 1 - 2 D0 (c)
D0: valor hipotético de la diferencia de medias. La situación más usual es suponer que
D0 = 0
Si H0 es cierta entonces
147
( Y 1 − Y 2 ) − D0
T= ~t
1 1 n +n −2
+
1 2
SP
n1 n2
(n1 − 1)S12 + (n2 − 1)S22
donde SP =
n1 + n2 − 2
Y 1 , Y 2 son las medias muestrales; S12 y S 22 son las varianzas muestrales.
Región de rechazo
t> t (a)
, n + n − 2
1 2
t < -t (b)
, n + n − 2
1 2
t> t (c)
, n +n −2
2 1 2
Si H0 es cierta entonces
( Y1 − Y 2 ) − D0 •
T= ~ t
S12 S 22
+
n1 n 2
2
s12 s 22
+
= 12
n n2
2
s12 s 22
n1 + n2
n1 − 1 n2 − 1
Nota. Si puede rechazarse H0 con base en la distribución T10, también lo será con base
a la distribución T11. El recíproco no se cumple necesariamente.
Región de rechazo
t > t, (a)
t < -t, (b)
t> t/2, (c)
Ejemplo
148
Un ingeniero en computación está investigando la utilidad de un lenguaje de
programación entre programadores del sexo masculino y femenino. A 24 programadores
expertos (12 hombres) y (12 mujeres) familiarizados en dicho lenguaje se les piden que
codifiquen una función y se registra el tiempo en minutos como puede observarse en la
siguiente tabla:
Tiempo (min)
Hombres Mujeres
17 18
16 14
21 19
14 11
18 23
24 21
16 10
14 13
21 19
23 24
13 15
18 20
Solución
Primero se presentan los resultados obtenidos con un software estadístico, luego se
resuelve “a mano” empleando los pasos en una prueba de hipótesis.
Hombres Mujeres
------------------------------------------------------------
Frecuencia 12 12
Media 17.9167 17.25
Mediana 17.5 18.5
Varianza 13.1742 21.1136
149
Desviación típica 3.62963 4.59496
Error estándar 1.04779 1.32645
------------------------------------------------------------
99.9
99
95
porcentaje
80
50
20
5
1
0.1
13 15 17 19 21 23 25
Hombres
99.9
99
95
porcentaje
80
50
20
5
1
0.1
10 13 16 19 22 25
Mujeres
Nota. Se observa en los dos gráficos de probabilidad normal que los puntos forman
prácticamente una “línea recta”, es decir, el tiempo de programación se ajusta a una
distribución normal en ambas poblaciones.
Hipótesis
𝐻0 : 𝜎12 = 𝜎22 vs 𝐻1 : 𝜎12 ≠ 𝜎22
150
GL 11 11
Notas:
1) Las varianzas poblacionales no difieren significativamente (F=0.6239,
P=0.4465>0.05).
2) También puede probarse por medio del IC, 0.1796 ≤ 𝜎𝐻2 ⁄𝜎𝑀 2
≤ 2.1675, note que
el IC incluye al uno, es decir, las varianzas no difieren significativamente con un
coeficiente de confianza de 95%
Comparación de Medias
---------------------
95.0% intervalo de confianza para la media de Hombres: 17.9167 +/- 2.30616
[15.6105,20.2228]
95.0% intervalo de confianza para la media de Mujeres: 17.25 +/- 2.9195
[14.3305,20.1695]
95.0% intervalos de confianza para la diferencia de medias:
suponiendo varianzas iguales: 0.666667 +/- 3.5056 [-2.83894,4.17227]
Decisión
Como P=0.697088>0.05 no se rechaza H0 : H = M con α=5%, es decir, el tiempo
promedio de programación de la función no difirió significativamente entre programadores
del sexo masculino y femenino.
151
Identificación de elementos y supuestos
Nota. Al inicio de la solución se incluyó las gráficas de probabilidad normal para los datos
de los hombres y de las mujeres, en ambas se tiene que el tiempo de programación se
ajusta a una distribución normal. También se verificó que las varianzas poblacionales no
difieren significativamente.
H0 : H − M = 0 vs H1 : H − M 0
H0 : H = M vs H1 : H M
2. Estadístico de prueba
Si H0 es cierta entonces
( YH − YM ) − 0
T= ~t
1 1 22
SP +
12 12
(11)SH2 + (11)SM2
donde SP =
22
4. RR
Con α=5% rechace H0 si t c t / 2, 22 = t 0.025 , 22 = 2.0739
5. Decisión
Como tc=0.3964<2.0739 no se rechaza H0 : H = M con α=5%, es decir, el tiempo
promedio de programación de la función no difirió significativamente entre programadores
del sexo masculino y femenino.
152
P=2P(T22 ≥ |tc|)=2P(T22 ≥ 0.3964), P/2=P(T22 ≥ 0.3964).
Como P(T22 0.6858 ) = 0.25 es el valor más grande de α en la tabla entonces:
P
= P(T22 0.3964 ) P(T22 0.6858 ) = 0.25
2
P
0.25 P 0.50
2
Así, con α=5% se tiene que P>0.05 y H0 no se rechaza H0 : H = M , obteniéndose la
misma decisión.
Ejemplo
En un estudio sobre hábitos de alimentación en murciélagos, se marcan 25 hembras y
11 machos y se les rastrea por radio. Una variable de interés es la distancia que recorren
volando en una pasada en busca de alimento. El experimento proporcionó la siguiente
información (supóngase normalidad):
Hembras Machos
n1 = 25 n 2 = 11
y1 = 205 metros y 2 = 135 metros
s1 = 100 metros s 2 = 90 metros
¿La distancia media recorrida por las hembras es mayor que la de los machos? Utilice
= 0.05 .
Solución
Identificación de elementos y supuestos
153
H0 : 12 = 22 vs. H1 : 12 22
2. Estadístico de prueba
S12
Si H0 es cierta entonces F = 2 Fn1 −1, n2 −1 = F24, 10
S2
4. RR
s 2g
fc = F
sp2 2
; nvg −1, nvp −1
0.8
= P F f
0.6
0.025 =
0.4 2 2
5. Decisión
Como fc = 1.235 3.37 no se rechaza H0, es decir, no existe suficiente evidencia con
= 5% para concluir que 12 22 estadísticamente.
H0 : 1 − 2 = 0 H1 : 1 − 2 0
vs.
(1 = 2 ) (1 2 )
154
2. Estadístico de prueba
Si H0 es cierta entonces
T=
(Y − Y ) − 0
1 2
t con n1 + n 2 − 2 = 25 + 11 − 2 = 34 g.l.
1 1
Sp +
n1 n2
y1 − y 2 205 − 135
tc = = = 1.991
1 1 1 1
sp + sp +
n1 n 2 25 11
24(100 ) + 10(90 )
2 2
sp2 = = 9441 .176 sp = 97.166
34
4. RR
Rechace H0 si t c t , 34 con = 0.05 ¿ t , 34 = t 0.05, 34 ?
0.4
0.3
0.2
0.1
0
-3.5 -1.5 0.5 2.5 4.5
0 t t
RR
5. Decisión
Como t c = 1.991 1.6909 rechace H0 con = 0.05 y decida por Ha : 1 2 , es
decir, la distancia media recorrida por las hembras en una pasada en busca de
alimento resultó significativamente mayor que la recorrida por los machos.
155
Ejemplo
En un estudio de metabolismo de carbohidratos, se compara el crecimiento de la raíz en
guisantes cultivados en agua a 6 °C con el de las plantas cultivadas en una solución
fructuosa a la misma temperatura. Se dispone de la siguiente información (supóngase
normalidad):
Solución
Identificación de elementos y supuestos
2. Estadístico de prueba
S12
Si H0 es cierta entonces F = Fn1 −1, n2 −1 = F15, 24
S 22
El valor observado de F es fc =
(0.53)2 = 4.494
(0.25)2
Note que la varianza más grande se encuentra en el numerador y la más pequeña
en el denominador.
156
4. RR
Con = 0.05 ¿ f = f0.025 con (n1 − 1, n2 − 1) = (15, 24 ) g.l.?
2
5. Decisión
Como fc = 4.494 2.44 rechace H0 con = 0.05 y decida por H1 : 12 22
Por lo tanto, el estadístico de prueba t a emplear es cuando las varianzas son diferentes.
H0 : 1 − 2 = 0 vs. H1 : 1 − 2 0
( 1 = 2 ) ( 1 2 )
2. Estadístico de prueba
Si H0 es cierta entonces
T=
(Y 1 )
− Y 2 − D0
=
Y1 − Y 2 •
~ t (aproximadamente t con gl)
S12 S22 S12 S22
+ +
n1 n2 n1 n2
El valor de es:
(0.53 )2 (0.25 )2
2
+
16 25 4.0225316 x 10 − 4
= = = 19 .331153 19
(0.53 )2
2
(0.25 )2
2
2.0808544 x 10 − 5
16 + 25
15 24
y1 − y 2 9.48 − 9.46
tc = = = 0.141
S12 S22
+
(0.53 )2 + (0.25 )2
16 25 16 25
4. RR
Con = 0.05 rechace H0 si t c t
,
2
157
0.4
= 0.025 = P(T t 0.025 , )
0.3
0.2
0.1 2
0
-3.5 -1.5 0.5 2.5
- t/2 0 t/2 t
RR RR
t 0.025 , 19 = 2.093
Rechace H0 si t c = 0.141 = 0.141 t 0.025 , 19 = 2.093
5. Decisión
Como t c = 0.141 2.093 no se rechaza H0 con = 5% , es decir, los datos no
presentan suficiente evidencia de diferencia estadística significativa entre los
crecimientos medios de la raíz en guisantes cultivados en agua y fructosa.
158
PH para comparar dos medias cuando las muestras son dependientes o pareadas
Muestras relacionadas
Cuando los mismos sujetos son expuestos a dos tratamientos, las comparaciones entre
tratamientos no son independientes debido a que en las dos condiciones se usan los
mismos sujetos.
Con el fin de eliminar la variación de factores ajenos al de interés, se usa una muestra
como su propio grupo control, haciendo una prueba antes y otra después del tratamiento
al mismo grupo. Así, los pares de observaciones son similares respecto a muchas
variables excepto la variable que se está midiendo.
Ejemplo
Doce sujetos participaron en un experimento para estudiar la efectividad de cierta dieta,
combinada con un programa de ejercicio, en la reducción de los niveles de colesterol en
el suero. La tabla siguiente muestra los niveles de colesterol en el suero para los doce
sujetos al principio del programa (Antes) y al final del programa (Después).
Y
X
Sujeto Después
Antes mg/dl
mg/dl
1 201 200
2 231 236
3 221 216
4 260 233
5 228 224
6 237 216
7 326 296
8 235 195
9 240 207
10 267 247
11 284 210
12 201 209
Ejemplo
Una empresa opera 24 horas al día, cinco días a la semana. Los trabajadores cambian
de turno cada semana. La gerencia está interesada en saber si hay alguna diferencia en
el número de unidades producidas cuando los empleados laboran en dos turnos. Se
seleccionó a 14 obreros y se registró su producción en cada turno. Cada empleado es un
bloque porque se espera que las mediciones del mismo empleado sean más parecidas
entre sí que las mediciones de varios empleados. Al nivel de significancia 0.05, ¿puede
concluirse diferencias en la producción por turno?
159
1 31 35
2 33 33
3 28 30
4 30 28
5 28 27
6 25 26
7 32 30
8 31 24
9 29 28
10 27 26
11 33 34
12 34 31
13 30 29
14 29 32
Otro ejemplo, al comparar dos métodos de análisis, el material a analizar puede ser
dividido en dos partes iguales de tal forma que cada mitad se asigne aleatoriamente a
cada método.
Nota. Cuando se tienen muestras pareadas se trabaja con las diferencias de los pares
de observaciones en vez de las observaciones individuales. La figura de abajo muestra
el diseño.
Población de
diferencias
Muestras de D=X-Y
Población I
Población II tamaño n
Muestra de Muestra
tamaño n paralela de
tamaño n D1=X1-Y1
X1 Y1
D2=X2-Y2
X2 Y2 .
. . .
. . .
. .
Xn Pares naturales Yn Dn=Xn-Yn
x = ?x − y = ? = ? =?
y
Datos Emparejados
D = ?
Datos emparejado s generadore s
de una población de diferencia s
Nótese que hay asociada con esta situación una población de diferencias D = X − Y y
una m.a. de diferencias que se seleccionan de esta población, D i = X i − Yi , i = 1,2,,n.
Supuestos
160
D=X-Y se distribuye normal con media D .
Hipótesis
Ha : D 0 (X − Y 0; X Y ) (a )
H0 : D = X − Y = 0 = D0
vs. D 0 (X − Y 0; X Y ) (b)
( X = Y ) D 0 (X − Y 0; X Y ) (c )
𝜇𝐷0 no necesariamente es cero, puede ser D0 = k donde k es una constante elegida por
el investigador, siendo común que k sea cero.
Estadístico de prueba
D − D 0
Si H0 : D = X − Y = D0 es cierta entonces T = tn-1
SD
n
Región de rechazo
t t , n −1 (a )
t −t , n −1 (b)
t t (c )
, n −1
2
Ejemplo
Doce sujetos participaron en un experimento para estudiar la efectividad de cierta dieta,
combinada con un programa de ejercicio, en la reducción de los niveles de colesterol en
el suero. La tabla siguiente muestra los niveles de colesterol en el suero para los doce
sujetos al principio del programa (Antes) y al final del programa (Después).
Y
X Diferencia
Sujeto Después
Antes mg/dl (X-Y)
mg/dl
1 201 200 1
2 231 236 -5
3 221 216 5
4 260 233 27
5 228 224 4
6 237 216 21
7 326 296 30
8 235 195 40
9 240 207 33
10 267 247 20
11 284 210 74
12 201 209 -8
161
¿El programa dieta ejercicio es efectivo en la reducción de los niveles de colesterol en el
suero? Use = 5% .
Solución
Identificación de elementos y supuestos
Variable de respuesta
Xi: nivel de colesterol en el suero del i-ésimo sujeto antes del programa dieta-ejercicio.
Yi: nivel de colesterol en el suero del i-ésimo sujeto después del programa dieta-ejercicio,
i=1, 2,…,12.
Parámetros: medias poblacionales.
Sean X y Y los niveles medios de colesterol en el suero de los sujetos antes y después
del programa dieta-ejercicio respectivamente.
Sea D = X − Y y D = x − y
99.9
n:12
99 Mediana:20.5
Sigma:21.4815
95
80
porcentaje
50
20
5
1
0.1
-8 12 32 52 72 92
X-Y
1. Hipótesis
2. Estadístico de prueba
D − D 0 D − 0
Si 𝐻0 : 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 = 0 es verdadera entonces T = = t11
SD SD
n 12
162
d − 0 20 .167 − 0
El valor observado de T es t c = = = 3.020
sd 23 .131
n 12
4. RR
RR = t t , n −1 ¿ t , n −1 ?
P(Tn −1 t , n −1) = P(T11 t 0.05, 11 ) = 0.05
t 0.05,11 = 1.796 RR = t 1.796
5. Decisión
Como t c = 3.02 1.796 se rechaza 𝐻0 : 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 = 0 y se decide por H1 : D 0
, es decir, los datos presentan suficiente evidencia con = 5% de que el programa
dieta-ejercicio es efectivo en la reducción de los niveles de colesterol en el suero.
163
Gráfico de Probabilidad Normal
99.9
n:12
99 Mediana:20.5
Sigma:21.4815
95
80
porcentaje
50
20
5
1
0.1
-8 12 32 52 72 92
X-Y
Notas:
1. Aunque en cierto sentido se tienen dos muestras, los niveles antes y los niveles
después, no tiene que preocuparse por la igualdad de las varianzas como en las
muestras independientes, ya que la variable es la diferencia entre lecturas en el
mismo individuo y, por tanto, sólo interviene una varianza.
164
2. Si se conociera la varianza de la población de las diferencias, la estadística de
D − D
prueba apropiada habría sido Z = . En la práctica, es improbable que se
D
n
conozca D .
P Tn −1 t = .
, n −1
2 2
5.3.4. Prueba del signo y prueba de rangos con signo de Wilcoxon (cuando las
muestras son dependientes)
165
5.3.5. Prueba de hipótesis para una diferencia de proporciones (𝒑𝟏 − 𝒑𝟐 ).
Situación:
Hay dos poblaciones de interés, en cada población se estudia el mismo rasgo o
característica, cada miembro de cada población puede clasificarse en función a tener el
rasgo o a no tenerlo y en cada población es desconocida la proporción de los que tienen
el rasgo.
Población I Población II
Supuestos
Dos m.a.i y se cumplen condiciones del TLC para p̂1 y p̂2 (
n1 p1 5, n1 q1 5 y n2 p2 5, n2 q2 5 ). Mendenhall et al. (2010) indican utilizar las
estimaciones de p1 y p2, es decir, ni(yi/ni)=yi>5 y ni(1-(yi/ni))=ni-yi>5 para i=1, 2. Sin
embargo, Triola (2004) señala para el Caso ii) H0 : p1 − p2 = (p1 − p2 )0 = 0 , verificar nip>5
𝑌 +𝑌
y niq>5 para i=1, 2 (ambas muestras) con p estimada por medio de 𝑝̂ = 𝑛1 +𝑛2 y q
1 2
𝑌1 +𝑌2
estimada con 𝑞̂ = 1 − 𝑝̂ = 𝑛 .
1 +𝑛2
Hipótesis
H0 : p1 − p 2 = (p1 − p 2 )0 vs H1 : p1 − p 2 (p1 − p 2 )0 (a)
H1 : p1 − p 2 (p1 − p 2 )0 (b)
H1 : p1 − p 2 (p1 − p 2 )0 (c)
H0 : p1 − p 2 = 0 vs H1 : p1 − p 2 0 ; p1 p 2 (a)
(p1 = p 2 ) p1 − p 2 0 ; p1 p 2 (b)
p1 − p 2 0 ; p1 p 2 (c)
Estadístico de prueba
166
Caso i) cuando H0 : p1 − p2 = (p1 − p2 )0 donde (p1 − p2 )0 0
Nota. Esta prueba (caso ii) resulta equivalente a la prueba de homogeneidad (tabla de
contingencia 2x2) de dos poblaciones binomiales (Christensen, 1997).
Ejemplo
En un estudio diseñado para comparar un nuevo tratamiento para la migraña con el
tratamiento estándar, 78 de los 100 individuos que recibieron el tratamiento estándar
respondieron favorablemente. De los 100 individuos que recibieron el nuevo tratamiento,
90 de ellos respondieron satisfactoriamente. ¿El nuevo tratamiento es más efectivo que
el estándar? Utilice α=5%.
Solución
Identificación de elementos y supuestos
Variable de respuesta Yi: número de personas que respondieron favorablemente el i-
ésimo tratamiento, 𝑖 ∈ {1: 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟, 2: 𝑁𝑢𝑒𝑣𝑜}.
Parámetros: proporciones poblacionales.
p1: proporción de personas que respondieron favorablemente al tratamiento estándar.
p2: proporción de personas que respondieron favorablemente al tratamiento nuevo.
167
Verificación del supuesto de muestras grandes ( n1 p1 5, n1 q1 5 y n2 p2 5, n2 q2 5 ).
Como se desconocen p1 y p2, utilice sus estimadores para obtener las estimaciones. Así,
n1(y1/n1)=y1=78>5, n1(1-(y1/n1))=n1-y1=100-78=22>5 y n2(y2/n2)=y2=90>5, n2(1-
(y2/n2))=n2-y2=100-90=10>5. Por lo tanto, se satisfacen las condiciones del TLC.
1. Hipótesis
H0 : p1 − p 2 = 0 vs H1 : p1 − p 2 0 ; p1 p 2
2. Estadístico de prueba
(p̂1 − p̂2 ) − 0 p̂1 − p̂2 •
Si H0 : p1 = p2 es cierta entonces Z = = ~ N(0,1)
p̂q̂ p̂q̂ 1 1
+ p̂q̂ +
n1 n2 n1 n2
3. Cálculo del estadístico de prueba
Un valor observado de Z es
y1 y 2 78 90
− −
n1 n2 100 100
zc = =
y1 + y 2 y1 + y 2 1 1 78 + 90 78 + 90 1 1
1 − + 1 − +
n1 + n2 n1 + n2 n1 n2 100 + 100 100 + 100 100 100
− 0.12
zc = = −2.3146
(0.84 )(0.16 )(0.02)
4. RR
Con α=0.05, zc −z = −z0.05 = −1.645
5. Decisión
Como zc = −2.3146 −1.645 rechace H0 con α=0.05 y decida por H1 : p1 p2 , es decir,
la proporción de personas que respondieron favorablemente con el tratamiento estándar
resultó significativamente menor que con el tratamiento nuevo, por lo que el tratamiento
nuevo es más efectivo que el estándar.
168
Tamaños de la Muestra = 100 y 100
Hipótesis Nula: diferencia entre proporciones = 0.0
Alternativa: menor que
Estadístico z calculado = -2.31455
p-Valor = 0.0103187
Advertencia: la aproximación normal no es apropiada para muestra de
pequeño tamaño.
169