Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema3esp PDF
Tema3esp PDF
Contenidos
I Hipótesis para la diferencia entre las medias de dos poblaciones:
muestras pareadas
I Hipótesis para la diferencia entre las medias de dos poblaciones:
muestras independientes
I Dos poblaciones normales con varianzas iguales (y desconocidas)
I Dos poblaciones normales con varianzas conocidas
I Dos poblaciones no normales y muestras grandes
I Dos poblaciones Bernoulli
I Hipótesis para la razón de las varianzas de dos poblaciones:
muestras independientes
Tema 3. Comparaciones de dos poblaciones
Objetivos de aprendizaje
Al finalizar este tema, debieras ser capaz de:
I Llevar a cabo un contraste de hipótesis para la diferencia de las
medias y para el cociente de las varianzas de dos poblaciones
I Construir intervalos de confianza para la diferencia o el cociente
I Diferenciar las situaciones en las que un contraste basado en
muestras pareadas es adecuado, de aquellas en las que se debe
aplicar un contraste basado en muestras independientes
I Calcular la potencia de un contraste y la probabilidad de un error de
Tipo II
Tema 3. Comparaciones de dos poblaciones
Referencias
I Newbold, P. “Estadı́stica para administración y economı́a”
I Capı́tulo 9 (9.6-9.9)
I Ross, S. “Introducción a la Estadı́stica”
I Capı́tulo 10
Introducción
producto: i 1 2 3 4 5 6 7 8 9 10
recuerdo fuerte: xi 137 135 83 125 47 46 114 157 57 144
recuerdo débil: yi 53 114 81 86 34 66 89 113 88 111
dif.: di = xi − yi 84 21 2 39 13 −20 25 44 −31 33
Contrastes para la diferencia entre dos medias: muestras
pareadas
I Sea X una población con media µX e Y otra población con media
µY .
I Disponemos de una muestra aleatoria de n observaciones pareadas
de ambas poblaciones, {(Xi , Yi )}. Denotaremos como
d1 = x1 − y1 , d2 = x2 − y2 , . . . , dn = xn − yn
'
Muestra: d̄ =
MAS: n = 10
210
10 = 21
142022−10(21)2
D0 = 0
d̄ = 21
t =
n = 10
√
sd = 1088 = 32.98
d̄ − D0
√
sd2 = 10−1 = 1088 sd / n
21
Objetivo: contrastar = √ = 2.014
32.98/ 10
D0
z}|{
H0 : µX − µY ≤ 0 frente a H1 : µX − µY > 0
(Contraste unilateral)
Contrastes para la diferencia entre dos medias: muestras
pareadas
Ejemplo: cont.
p-valor = P(T ≥ 2.014)
∈ (0.025, 0.05) ya que
t9;0.05 t9;0.025
z }| { z }| { t=
1.833 < 2.014 < 2.262
2.014
Por tanto, como p-valor < α = 0.05, p−valor
rechazamos la hipótesis nula a este =area
nivel.
Densidad tn−1
||
1.833 2.262
Conclusión: La evidencia muestral apoya que en promedio la actividad cerebral
es mayor para el grupo con recuerdo fuerte que para el grupo con recuerdo
débil. Si la actividad cerebral promedio fuese igual para ambos grupos, la
probabilidad de obtener muestras tan extremas o más que la observada estarı́a
entre 0.025 y 0.05 (un valor bajo).
Contrastes para la diferencia entre dos medias: muestras
pareadas
Ejemplo: cont. En Excel: Ir al menu “Datos”, submenu “Análisis de
datos”, seleccionar la opción: “Prueba t para medias de dos muestras
emparejadas”
Columnas A y B (datos), en amarillo se muestran el valor observado del
estadı́stico y el p-valor.
Contraste bilateral para la diferencia entre dos medias via
IC: muestras pareadas
X̄ − Ȳ − D0
T = q ∼H0 tn1 +n2 −2
sp n11 + n12
donde el estimador de la varianza común para las dos poblaciones es
(n1 − 1)sX2 + (n2 − 1)sY2
sp2 =
n1 + n2 − 2
Nota: grados de libertad = n1 + n2 − 2 (número de observaciones de
las muestras menos dos - por tener que estimar µX y µY )
I La región de rechazo (para un nivel de significación α) es:
RRα = {t : t < −tn1 +n2 −2;α/2 o t > tn1 +n2 −2;α/2 }
Contrastes para la diferencia entre dos medias: muestras
normales independientes, varianzas de poblaciones iguales
Ejemplo: 9.8 (Newbold) Se estudia el efecto que la presencia de un moderador
puede tener en el número de ideas generadas en un grupo de trabajo. Se
observan grupos de cuatro personas, con y sin moderador. En una muestra
aleatoria de cuatro grupos con moderador el número promedio de ideas
generadas por grupo fue 78.0, con cuasi desviación tı́pica muestral de 24.4.
Para una muestra independiente de cuatro grupos sin moderador el promedio
de ideas generadas fue 63.5, y su cuasi desviación tı́pica fue 20.2. Suponiendo
que distribuciones normales con varianzas iguales, contraste la hipótesis nula
(para α = 0.1) de igualdad de medias, frente a la alternativa de que la media
de la población es mayor para grupos con moderador.
Población 1: Población 2:
X = “número de ideas en grupos Y = “número de ideas en grupos sin
con moderador” moderador”
X ∼ N(µX , σX2 ) X ∼ N(µY , σY2 )
' MAS: n1 = 4
Muestra: x̄ = 78.0
sx = 24.4
' MAS: n2 = 4
Muestra: ȳ = 63.5
sy = 20.2
Suponemos muestras normales independientes y σX2 = σY2 = σ 2
Contrastes para la diferencia entre dos medias: muestras
normales independientes, varianzas de poblaciones iguales
√
Ejemplo: 9.8 (Newbold cont.) sp = 501.7 = 22.4
x̄ − ȳ
t = p
Objetivo: contrastar sp 1/n1 + 1/n2
D0 78.0 − 63.5
= p = 0.915
22.4 1/4 + 1/4
z}|{
H0 : µX − µY = 0
frente a
Región de rechazo:
H1 : µX − µY > 0
(Test unilateral) 1.440
z }| {
Estadı́stico del contraste: RR0.1 = {t : t > t6;0.1 }
T = rX̄ −Ȳ ∼H tn +n −2
1 + 1 0 1 2
sp Como t = 0.915 ∈ / RR0.1 , no podemos rechazar la hipótesis
n1 n2
nula a un nivel del 10%.
Valor observado del estadı́stico:
D0 = 0 n1 = 4 n2 = 4
x̄ = 78.0 sx = 24.4 ȳ = 63.5 sy = 20.2 Conclusión: Los datos muestrales no
contienen suficiente evidencia para
(n1 − 1)sx2 + (n2 − 1)sy2 pensar que en promedio se generan más
2
sp =
n1 + n2 − 2 ideas en grupos con moderador. Pero
(4 − 1)24.42 + (4 − 1)20.22
para tamaños muestrales tan pequeños
= el contraste tiene potencia baja y serı́an
4+4−2
necesarias diferencias muy grandes
= 501.7
entre las medias de las poblaciones para
rechazar la hipótesis nula.
Contrastes para la diferencia entre dos medias: muestras
normales independientes, varianzas de poblaciones iguales
Muestra: x̄ = 4.059
sx = 0.839
' MAS: n2 = 172
Muestra: ȳ = 3.680
sy = 0.966
Contrastes para la diferencia entre dos medias: muestras
grandes independientes o dos poblaciones normales con
varianzas conocidas
Ejemplo: 9.7 (Newbold cont.)
Región de rechazo:
4.059 − 3.680
= q = 3.95
0.8392 /186 + 0.9662 /172
Contrastes para la diferencia entre dos medias: muestras
grandes independientes o dos poblaciones normales con
varianzas conocidas
donde
n1 p̂X + n2 p̂Y
p̂0 =
n1 + n2
I La región de rechazo (para un nivel de significación α) es:
75
250
= 0.300
Contrastes para la diferencia entre dos proporciones:
muestras grandes independientes
Ejemplo: 9.9 (Newbold cont.) p̂x − p̂y
z = r “ ”
p̂0 (1 − p̂0 ) n1 + 1
n2
Objetivo: contrastar 1
H0 : pX = pY 0.404 − 0.300
= q ` 1 ´ = 2.43
frente a 1
0.352(1 − 0.352) 250 + 250
H 1 : pX > pY
(Contraste unilateral) p-valor = P(Z ≥ z) = P(Z ≥ 2.43) = 0.0075
son dos conjuntos de variables
aleatorias independientes, con
Densidades F
distribución N(0, 1). La variable
aleatoria (cociente de dos v.a.s
chi-cuadrado normalizadas)
1.2
1 Pn 2
i=1 Xi
F = n1 Pm
1.0
2
m i=1 Yi gl1=30 gl2=30
gl1=10 gl2=15
0.8
sigue una distribución Fn,m con n y
m grados de libertad. Para el gl1=8 gl2=8
gl1=5 gl2=3
0.6
resultado de la transparencia
anterior:
χ2n1 −1
z }| { 0.4
(n1 − 1)sX2
0.2
1
2
sX n 1 −1
σ2
=H0 ∼ Fn1 −1,n2 −1
sY2 1 (n2 − 1)sY2
0.0
n2 −1 2
| σ {z } 0 2 4 6 8
χ2n2 −1
Contrastes para el cociente de varianzas: muestras
normales
' MAS: n1 = 17