Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contraste de Hipótesis
Parte B.
EL CONTRASTE DE
HIPÓTESIS
1
1. El concepto del contraste de hipótesis
2. Las hipótesis estadísticas
3. Los supuestos
4. El estadístico de contraste
5. La regla de decisión
6. La decisión
7. Errores tipo I y tipo II
8. Potencia de un contraste
9. Comprobación de hipótesis acerca de algunos
parámetros
10. Comprobación de hipótesis acerca de la media
BIBLIOGRAFÍA BÁSICA
Amón, J. (1991). Estadística para psicólogos. Vol. 2. Probabilidad. Estadística
inferencial.Madrid: Pirámide.
Pardo, A. y San Martín, R. (1998). Análisis de Datos en Psicología II. Madrid:
Pirámide.
BIBLIOGRAFÍA COMPLEMENTARIA
Bernardo, J.M. (1981). Bioestadística. Una perspectiva bayesiana. Barcelona:
Vicens Vives.
DeGroot, M.H. (1988). Probabilidad y Estadística. México: Addison-Wesley
Iberoamericana.
Gonick, L. y Smith, W. (1999). Estadística en cómic. Barcelona: Zambrera y
Zariquiey.
Maciá, A., Lubin, P. y Rubio, P. (1997). Psicología Matemática II. (3 vol.).
Madrid: UNED.
Martín, Q. (2001). Contraste de Hipótesis. Madrid: La Muralla-Hespérides.
Martínez-Arias, M.R., Maciá, A. y Pérez, J.A. (1989). Psicología Matemática II
(2). Madrid: UNED.
Peña, D. (2001). Fundamentos de Estadística.. Madrid: Alianza Universidad.
Walpole, R.E. y Myers, R.H. (1994). Probabilidad y Estadística. Méjico:
McGraw Hill.
Welkowit, J.; Even, R.B. y Cohen, J. (1981). Estadística aplicada a las ciencias
de la educación. Madrid: Santillana.
2
1. LA LÓGICA DEL CONTRASTE DE
HIPÓTESIS
Inferencia estadística: extraer conclusiones acerca de
la población a partir de los datos obtenidos en una muestra.
Dos formas de inferencia estadística:
•Estimación de parámetros
•Contraste de hipótesis: procedimiento que nos permite
decidir si una proposición acerca de una población puede
ser mantenida o debe ser rechazada
En la investigación psicológica, o de otro tipo, es frecuente
encontrase con cuestiones del tipo:
¿produce el estímulo “a” tiempo de reacción más corto que
el estímulo “b”?
¿es la terapia A más apropiada que la terapia B para aliviar
los síntomas depresivos?
¿rinden los sujetos motivados más que los no motivados?
¿difieren los hombres y las mujeres en inteligencia?
3
El primer paso para realizar un contraste de hipótesis es transformar
una hipótesis científica en una hipótesis estadística.
Hipótesis científica: “los hombres y las mujeres no difieren en
inteligencia”
Hipótesis estadística: µh=µm (esta hipótesis indicaría que en la
población de varones el promedio en inteligencia no difiere del
promedio de inteligencia en la población de mujeres)
4
Resumiendo: “un contraste de hipótesis es un proceso de decisión
en el que una hipótesis formulada en términos estadísticos es
puesta en relación con los datos empíricos para determinar si
es o no compatible con ellos”
5
Todo contraste de hipótesis se basa en la formulación de dos
hipótesis:
LA HIPÓTESIS NULA (H0): Es la que se somete a prueba estadística.
Consiste en una afirmación concreta sobre la forma de una
distribución de probabilidad o sobre el valor de alguno de los
parámetros de esa distribución.
H0: π1=π2
H0:μ1=μ2
H0: μ1=3
H0: distribución Normal de la variable en la población
El signo = o modelo del azar, lo que representa que los grupos son
iguales. El modelo del azar siempre se incluye en la hipótesis nula,
la que se somete a contraste estadístico, ya sea exacta (v = m) o
inexacta ( acierto 0.5)
6
2. Los supuestos
Son un conjunto de afirmaciones que necesitamos establecer (sobre
la población de partida y sobre la muestra), para poder determinar
la distribución de probabilidad en la que se basará nuestra
decisión sobre la hipótesis nula. En general, los supuestos básicos
de una técnica estadística, son los requisitos que se deben cumplir
para que la técnica pueda ser aplicada.
3. El estadístico de contraste
Es un resultado muestral que permite:
• Proporcionar información empírica relevante sobre la
afirmación propuesta en la hipótesis nula
• Posee una distribución muestral conocida
4. La regla de decisión
Es el criterio que vamos a seguir para decidir si la hipótesis nula
se mantiene o se rechaza. Se basa en la partición de la
distribución muestral del estadístico en dos zonas mutuamente
exclusivas:
7
La regla de decisión: Consiste en rechazar H0 si el estadístico de
contraste toma un valor que pertenece a la zona de rechazo o
crítica o mantener H0 si toma un valor que pertenece a la zona de
aceptación
8
5. La decisión
El ultimo paso del contraste de hipótesis consiste en calcular el
estadístico de contraste a partir de los datos de la muestra y tomar
una decisión como se ha indicado previamente, siguiendo las
pautas que ofrece la regla de decisión.
9
Siendo H0 la hipótesis nula y H1 la hipótesis
alternativa, tendremos el cuadro siguiente:
H0 es verdadera H0 es falsa
10
7. Potencia de un contraste
La potencia de un contraste (1-β) es la probabilidad de rechazar una
hipótesis nula que es falsa.
9. COMPROBACIÓN DE HIPÓTESIS
ACERCA DE ALGUNOS PARÁMETROS
Al comprobar hipótesis sobre diferentes parámetros
seguiremos el siguiente esquema:
1. Proposición de una hipótesis nula (H0) y una alternativa
(H1) acerca de alguno o algunos parámetros de cierta
población
2. Características de esta población, especialmente la
distribución de probabilidad a la que dicha población
obedece .
3. Características de la muestra extraída de dicha población
11
4. Estadístico, calculado a partir de la muestra que nos
servirá para contrastar H0 frente a H1, y que por esta
razón llamaremos estadístico de contraste
5. Distribución muestral de estadístico de contraste, es
decir, distribución de probabilidad del mismo. Conviene
recordar que la desviación típica correspondiente a
dicha distribución suele ser llamada error típico del
estadístico de que se trate
6. Región crítica que se deriva del nivel de significación, α,
impuesto por nosotros de antemano
7. Criterio decisorio: rechazo o aceptación de H0, según
que el valor del estadístico, obtenido mediante una
muestra concreta, caiga dentro o fuera de la región
crítica.
12
1. Una sola media
a) Supuesta conocida σ
Z Z
Z Z1
7. Criterio de decisión siendo Z k el valor de Z obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Z k Z y Z k Z1
2 2
Z k Z
Z k Z1
13
1. Una sola media
b) Supuesta desconocida σ
1. Planteamiento de las hipótesis
H 0 : 0 H 0 : 0 H 0 : 0
1
H : 0 H1 : 0 H1 : 0
2. Población :Normal
3. Muestra : observaciones independientes de tamaño n
X
4. Estadístico de contraste : T ~ 0
s
n
5. Distribución muestral de T : Tn -1
6. Región crítica :
Tk T , n 1
y Tk T1 , n 1
2 2
Tk T ,n 1
Tk T1 ,n 1
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk T , n 1
y Tk T1 , n 1
2 2
Tk T ,n 1
Tk T1 ,n 1
n1 n2
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica :
Z Z y Z Z1
2 2
Z Z
Z Z1
7. Criterio de decisión siendo Z k el valor de Z obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Z k Z y Z k Z1
2 2
Z k Z
Z k Z1
14
2. Dos medias (diferencia de medias) con observaciones
independientes
b) Supuestas desconocidas σ1 y σ2, pero iguales
1. Planteamiento de las hipótesis
H 0 : 1 2 H 0 : 1 2 H 0 : 1 2
H 1 : 1 2 H 1 : 1 2 H 1 : 1 2
2. Poblaciónes : Ambas normales con desviaciones típicas poblacionales desconocidas
pero iguales
3. Muestra : n 1 y n 2 observaciones, todas ellas independientes entre sí.
X1 X 2
4. Estadístico de contraste : T
(n1 1)~
s12 (n2 1)~
s 22 1 1
n1 n2 2 n1 n2
5. Distribución muestral de T : Tn1 n2 2
6. Región crítica :
Tk T , n1 n2 2
y Tk T1 , n1 n2 2
2 2
Tk T , n1 n2 2
Tk T1 ,n1 n2 2
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk T , n1 n2 2
y Tk T1 , n1 n2 2
2 2
Tk T , n1 n2 2
Tk T1 ,n1 n2 2
n1 1 n2 1
6. Región crítica :
Z Z y Z Z1
2 2
Z Z
Z Z1
7. Criterio de decisión siendo Z k el valor de Z obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Z k Z y Z k Z1
2 2
Z k Z
Z k Z1
15
3. Dos medias (diferencia de medias) con observaciones dependientes
a) Conocida σd
Tk T ,n 1
Tk T1 ,n 1
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk T , n 1
y Tk T1 , n 1
2 2
Tk T ,n 1
Tk T1 ,n 1
Tk T ,n 1
Tk T1 ,n 1
7. Criterio de decisión siendo Tk el valor de T obtenido a partir de una muestra concreta,
rechazaremos H 0 si :
Tk T , n 1
y Tk T1 , n 1
2 2
Tk T ,n 1
Tk T1 ,n 1
16
Ejercicio 1
La literatura científica establece que el tiempo medio de aprendizaje de
ciertas técnicas de terapia es de 1500 horas. Un psicólogo afirma
que el tiempo medio de aprendizaje de dichas técnicas es menor
que 1500 horas. Elegida una muestra aleatoria simple de 81
psicólogos clínicos que han sido sometidos al aprendizaje de dichas
técnicas, vemos que han tardado un total de 1450 horas en
manejarlas. Suponiendo que la desviación típica de la población
vale 180 horas, ¿tiene razón el psicólogo clínico en cuanto a la
duración del aprendizaje de dichas técnicas a un nivel de
significación de 0.01?
7. Criterio de decisión
Como 2.5 es menor que 2.33, entonces rechazo H 0
Luego lleva razón segundo psicologo que afirma que el tiempo medio de aprendizaje de las
técnicas es menor de 1500 h.
17
Ejercicio 2.
De acuerdo con los datos recogidos durante los últimos años por un
psicólogo escolar, los estudiantes de COU que no reciben
orientación vocacional obtienen una media de 190 en una prueba
de madurez. El psicólogo opina que los estudiantes que sí reciben
orientación vocacional obtienen un promedio superior en la
mencionada prueba. Para obtener alguna evidencia sobre su
sospecha, toma una muestra aleatoria de 81 estudiantes entre los
que habían recibido orientación vocacional y les pasa una prueba
de madurez. Obtiene una media de 198 y una desviación típica
insesgada de 24 ¿podemos pensar con un nivel de significación de
0.05 que estos datos apoyan la opinión del psicólogo?
6. Región crítica :
Tk T1 ,n 1
7. Criterio de decisión
Como 2.99 es mayor que 1.66 rechazamos H 0
Luego concluimos que el promedio obtenido en una prueba de madurez por los estudiantes de
COU que reciben orientción vocacional es significativamente superior al obtenido por los
estudiantes que no la reciben. Los datos apoyan por tanto la opinión del psicólogo.
18
Ejercicio 3
n1 n2
74 79 5
Z 2.12
144 324 2.36
50 120
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : con 0.01, en la tabla de la curva normal
Z Z y Z Z 1
2 2
19
Ejercicio 4
Se sabe que el cociente intelectual de los alumnos de cierta universidad sigue una distribución
normal de media desconocida y desviación típica 15. Si en una muestra de 50 alumnos se
observó un cociente intelectual de 116 puntos ¿podríamos afirmar a un nivel de
significación de 0.01 que la media de los alumnos de dicha universidad es superior a 125
puntos?
1. Planteamiento de las hipótesis
H 0 : 0 125
Contraste unilateral a la derecha
H 1 : 0 125
2. Población :Normal
3. Muestra : 50 observaciones independientes
X 0
4. Estadístico de contraste : Z
n
116 125 9
Z 4.24
15 2.121
50
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : eligiendo 0.01, en la tabla de la curva normal :
Z 0.990 2.33 (es un contraste unilateral a la derecha por eso es 1 - )
7. Criterio de decisión
Como 4.24 es menor que 2.33, nos encontramos en la zona de aceptación de H 0
Luego, no podemos afirmar que la media de los alumnos de dicha universidad sea mayor
que 125
Ejercicio 5
Los resultados obtenidos por 501 niños en un test de aptitud numérica reflejan una puntuación
media de 59 puntos y una desviación típica insesgada de 20 puntos ¿Se puede aceptar a
un nivel de significación de 0.01 que la puntuación media obtenida por niños cualesquiera
será mayor de 60 puntos?.
1. Planteamiento de las hipótesis
H 0 : 0 60
Contraste unilateral a la derecha
H 1 : 0 60
2. Población :Normal
3. Muestra : observaciones independientes de tamaño 501
X
4. Estadístico de contraste : T ~ 0
s
n
59 60 1
T 1.118
20 0.894
501
5. Distribución muestral de T : Tn -1
T
0.990 500 2.334
6. Región crítica :
Tk T1 ,n 1
7. Criterio de decisión
Como - 1.118 es menor que 2.334, se encuentra dentro de la zona de aceptación, luego
no rechazamos H 0
Así, la puntuación media obtenida por los niños no es mayor de 60 puntos
20
Ejercicio 6
n1 n2
95 75 20
Z 7.299
144 324 2.74
50 70
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica : con 0.05, en la tabla de la curva normal
Z Z1-
Z0.950 1.65
7. Criterio de decisión : como 7.299 1.65 (se encuentra dentro de la región crítica)
rechazamos H 0
Luego, podemos afirmar que con el método nuevo se obtienen mejores resultados que
con el método tradicional
21
Ejercicio 7
22
Ejercicio 8
Supongamos que en el ejemplo anterior no se especifica que σ1 y σ2 son iguales
(con lo cual damos por hecho que son desconocidas y distintas)
1. Planteamiento de las hipótesis
H 0 : 0
H1 : 0
2. Poblaciónes : Normales . Carecemos ahora de motivos que nos permitan
suponer que 1 y 2 son iguales
3. Muestra : n1 41 y n1 61 observaciones, todas ellas independientes entre si
X1 X 2
4. Estadístico de contraste : Z
~
s12 ~
s2
2
n1 n2
74 79 5
Z 1.326
182 20 2 3.8
41 61
5. Distribución muestral de Z : Z N(0,1)
6. Región crítica (con 0.01)
Z Z y Z Z1
2 2
Ejercicio 9
23
Caso: Dos medias dependientes con σD conocida
Ejercicio 10
Suponga cinco niños a los que aplicamos una prueba de memoria en
dos ocasiones la primera dos horas tras el aprendizaje de una lista de
palabras y la segunda una semana mas tarde del aprendizaje y los
resultados son los siguientes:
¿Podemos afirmar a un nivel de significación de 0.05 que el recuerdo
disminuye al aumentar el tiempo de recuerdo?
4 0 4 1 1
9 4 5 2 4
7 8 -1 -4 16
10 6 4 1 1
15 12 3 0 0
45 30 15 0 22
24
Con los datos anteriores podemos calcular:
X 1 45 / 5 9
X 2 30 / 5 6
d 15 / 5 3
~ 2 22
sd 5.5
5 1
~
s d 2.345
Con estos datos nos encontramos ante un contraste de dos medias dependientes
con d desconocida.
1. Planteamiento de las hipótesis
H 0 : 1 2
H 1 : 1 2
2. Poblaciones : normales con d desconocida
3. Muestra : observaciones dependientes de tamaño 5
D
4. Estadístico de contraste : T ~
sD
n
3 3
T 2.84
2.345 / 5 1.049
5. Distribución muestral de T : Tn -1
T51
6. Región crítica (contraste unilateral a la derecha)
0.950T4 2.132
Ejercicio 11
25
Caso: Dos medias independientes con σ1 y σ2 desconocidas e iguales
1. Planteamiento de las hipótesis
H 0 : 1 2
Contraste bilateral a la derecha
H 1 : 1 2
2. Poblaciónes : Ambas normales con desviaciones típicas poblacionales desconocidas
pero iguales
3. Muestra : 41 y 61 observaciones, todas ellas independientes entre sí.
X1 X 2
4. Estadístico de contraste : T
(n1 1)~
s12 (n2 1)~
s22 1 1
n1 n2 2 n1 n2
Pr oblema : tenemos las desviaciones típicas pero no son insesgadas
La forma de obtenerlas
~ n ~ 41 ~ 61
S ·S S1 ·0.9 0.922 S1 ·0.5 0.508
n -1 41 - 1 61 - 1
7.75 5.03 2.72 2.72
T 19.19
(41 1)0.922 2 (61 1)0.5082 1 1 34.003 15.484 0.141
·0.2
61 41 2 61 41 100
5. Distribución muestral de T : Tn1 n2 2
T41 61 2
T100
6. Región crítica : 0.95T100 1.66 (complementario de T
0.95 100 1.66)
Como 19.29 es mayor que 1.66, se encuentra dentro de la región de rechazo de H 0,
Luego podemos afirmar que los alumnos de Ingeniería tienen una media mayor que
los estudiantes de Filosofía
Ejercicio 12
26
Caso: Dos medias independientes con σ1 y σ2 desconocidas y distintas
Ejercicio 13
27
Caso: Dos medias dependientes conocida σD
T 1.676
0.95 50
Ejercicio 14
28
Caso: Dos medias dependientes desconocida σD
Ejercicio 15
La altura media de una muestra aleatoria simple de 20 varones fue de
175cm y la de una muestra de 22 mujeres fue de 167cm. La
varianza insesgada de la muestra de varones vale 0,50 y la de la
muestra de mujeres vale 0,40. Suponiendo que la altura, tanto en la
población de varones como en la de mujeres se distribuye según
una distribución Normal, ambas con igual varianza, ¿es compatible
con los resultados obtenidos la hipótesis de igualdad en las alturas
promedio en ambas poblaciones? (α=0,01)
Solución: No es compatible dicha hipótesis con los datos obtenidos
Ejercicio 16
Una medicina A es aplicada a 26 pacientes aquejados de cierta
enfermedad. Otra medicina B es aplicada a otros 26 pacientes
aquejados de la misma enfermedad. Los resultados fueron los
siguientes: duración media requerida por la medicina A para curar la
enfermedad = 20 días, duración media requerida por la medicina B
para curar la enfermedad=17 días, siendo las varianzas insesgadas,
de A 37 y de B 35. ¿Son compatibles los resultados obtenidos con
la hipótesis de que el tiempo medio requerido para curar la
enfermedad por la medicina A y B es el mismo? (α=0,05)
Solución: Si, los datos son compatibles con dicha hipótesis
29
VARIANZAS
1. Una varianza poblacional
Estadístico de contraste : X
n 1~s 2 X n21
2
0
~s 2 (X X ) 2
n 1
T
n2 x 2
1 x 22 T tn2
x12 x 22 x1 x 2
2
2
30
Ejercicio 17
x x
1 2
2
7200 x2
1 121; x 2
2 100
Ejercicio 18
31
Ejercicio 19
Ejercicio 20
Ejercicio 21
Los diámetros de 31 piezas –componentes de un aparato de registro-,
elegidos al azar de entre los producidos en cierta2 planta industrial
tienen una varianza insesgada de ~s 0,0625mm . ¿Es compatible
2
32
Ejercicio 22
En cinco días elegidos al azar, dos talleres fabricantes del mismo tipo
de piezas, han producido las siguientes piezas:
Taller 1: 8 9 7 8 8
Taller 2: 11 11 9 10 9
Ejercicio 23
33