Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 Por supuesto, no todas las hipótesis científicas requieren de la utilización del contraste de hipótesis
para ser verificadas. Recordemos a este respecto lo dicho en la introducción sobre los fenómenos
deterministas y aleatorios. Una afirmación del tipo «este sujeto posee una inteligencia superior a la
media» puede ser verificada simplemente observando a ese sujeto. Sin embargo, una afirmación del tipo
«las personas radicales poseen un nivel intelectual superior a la media» no puede ser verificada
recurriendo a la observación: dificilmente podríamos observar a todas las personas radicales. Es
justamente en las situaciones en las que no tenemos acceso a todos los elementos de la población donde
se hace necesario recurrir a la inferencia estadística (y, por tanto, al contraste de hipótesis) para poder
verificar una hipótesis científica.
© Ediciones Pirámide
Contraste de hipótesis / 129
conseguir: parece razonable pensar que, si una hipótesis concreta referida a una
distribución poblacional es correcta, al extraer una muestra de esa población
debemos encontrarnos con un resultado muestra) similar al que esa hipótesis
propone para la distribución poblacional. O lo que es lo mismo: una hipótesis será
compatible con los datos empíricos cuando a partir de ella sea posible deducir o
predecir un resultado muestra! (un estadístico) con cierta precisión.
Supongamos que nuestra hipótesis consiste en afirmar que los varones y las
mujeres no difieren en inteligencia. En términos estadísticos: µv = µm. Si nuestra
hipótesis es correcta, debemos esperar que, al extraer una muestra aleatoria de la
población de varones y otra de la de mujeres, las medias observadas X v y X m en
inteligencia sean similares. Una discrepancia importante entre la afirmación pro-
puesta en nuestra hipótesis y el resultado muestral encontrado puede estar indicado
dos cosas diferentes: bien nuestra hipótesis es correcta y la discrepancia observada
es producto de fluctuaciones esperables por azar; bien nuestra hipótesis es incorrec-
ta y, por tanto, incapaz de proporcionarnos predicciones acertadas. La cuestión
clave que se nos plantea en ese momento es la de determinar cuándo la discrepancia
encontrada es lo bastante grande como para poder considerar que el resultado
muestral observado es incompatible con la hipótesis formulada y, en consecuencia,
para hacernos pensar que esa discrepancia encontrada no es explicable por fluctua-
ciones debidas al azar sino por el hecho de que la hipótesis planteada es incorrecta.
Necesitamos, y este es el tercer paso del proceso, una regla de decisión. Y esa
regla de decisión debe establecerse en términos de probabilidad. Si en el ejemplo
planteado sobre la inteligencia de los varones y de las mujeres pudiéramos trabajar
con las poblaciones completas de varones y mujeres (es decir, si pudiéramos medir
la inteligencia de todos los varones y todas las mujeres), no tendríamos que recurrir
a la teoría de la probabilidad porque tampoco sería necesario efectuar ningún tipo
de contraste de hipótesis: conoceríamos los valores de µ,, y µm, y sabríamos si son
iguales o no. Pero la necesidad de trabajar con muestras en lugar de poblacio-
nes nos obliga a establecer una regla de decisión en términos de probabilidad.
Ahora bien, el número de reglas de decisión que podemos establecer en una
situación particular es casi ilimitado. Por supuesto, unas reglas serán mejores o más
útiles que otras y, probablemente, ninguna de ellas será lo bastante buena como
para resultar de utilidad en todo tipo de situaciones. Afortunadamente, la teoría de
la decisión se ha encargado de proporcionarnos unos cuantos principios elementales
que podemos trasladar al contexto del contraste de hipótesis. En general, la regla de
decisión que utilizaremos será una afirmación de este tipo: si el resultado muestral
observado es, suponiendo correcta nuestra hipótesis, muy poco probable, considera-
remos que nuestra hipótesis es incompatible con los datos; por el contrario, si el
resultado muestral observado es, suponiendo correcta nuestra hipótesis, probable,
consideraremos que nuestra hipótesis es compatible con los datos 2 •
Imaginemos que deseamos averiguar si un psicólogo posee o no la capacidad de
detectar, por medio de la escritura, la presencia de trastornos de tipo neuróti\:O.
2 Sobre el significado de los términos probable y poco probable volveremos más adelante.
© Ediciones Pirámide
130 / Análisis de datos en psicología 11
3 Aunque este razonamiento será matizado más adelante, puede servirnos como primera aproxima-
ción a la lógica del contraste de hipótesis.
4 En la inferencia estadística no existe un único punto de vista. Es frecuente encontrarse con la
distinción entre el enfoque clásico, en el que se considera que la única información disponible sobre la
población es la contenida en la muestra, y el enfoque bayesiano, en el que, además de la información
muestra!, se hace uso de conocimientos previos. Las ideas sobre el contraste de hipótesis, tal como va ser
expuesto aquí, introducidas inicialmente por Ronald A. Fisher en varios trabajos (1925, entre otros) y
consolidadas más tarde por Neyman y Pearson (1932, 1933), deben ser enmarcadas dentro del enfoque
clásico.
© Ediciones Pirámide
Contraste de hipótesis / 131
l · Edu.:mne~ P1ram1de
132 / Análisis de datos en psicología 11
H1:µ1<µ2
H 1 : p#O
H 1 : n < 0,5
Cuando en H 1 aparece el signo « # », decimos que el contraste es bilateral o
bidireccional. Cuando en H 1 aparecen Jos signos « < » o « > » decimos que el
contraste es unilateral o unidireccional. Más adelante trataremos detenidamente
esta cuestión.
Las hipótesis nula y alternativa suelen plantearse como hipótesis rivales. Son
hipótesis exhaustivas y mutuamente exclusivas, Jo cual implica que si una es
verdadera, Ja otra es necesariamente falsa. Considerando los ejemplos que hemos
venido comentando, podemos plantear, con Jo que ya sabemos, las siguientes
hipótesis:
a) Ho:µv=µm
H¡: µv "# µm
b) H o: 1tacierto ~ 0,5
H 1: 1tacierto > 0,5.
Las hipótesis a se refieren al ejemplo sobre diferencias en inteligencia entre
varones y mujeres. La hipótesis nula afirma que Jos varones y las mujeres no
difieren en inteligencia; Ja hipótesis alternativa afirma que sí existen diferencias. Son
hipótesis exhaustivas y mutuamente exclusivas. Las hipótesis b se refieren al
ejemplo del psicólogo capaz de diagnosticar a través de Ja escritura. La hipótesis
nula afirma que el psicólogo no posee esa capacidad; la hipótesis alternativa afirma
que sí la posee. También estas dos hipótesis son exhaustivas y mutuamente
exclusivas.
~ El nombre de hipótesis nula para la hipótesis que se somete a contraste se debe a que, cuando se
está trabajando con dos o más parámetros, H 0 suele afirmar que el valor de esos parámetros es el mismo,
es decir, que la diferencia entre ellos es nula.
© Ediciones Pirámide
Contraste de hipótesis / 133
entonces será posible predecir con cierta precisión qué es lo que podemos encon-
trarnos al extraer una muestra aleatoria de esa población.
Un ejemplo sencillo nos ayudará a comprender mejor estas ideas. Supongamos
que deseamos contrastar la hipótesis nula H 0 : µ = 30 frente a la alternativa H 1 :
µ -:f. 30. En la hipótesis nula se hace referencia a una distribución poblacional con
media 30, pero nada más; nada sabemos sobre su forma ni sobre su varianza. Para
tomar una decisión respecto al valor de µ necesitamos recurrir a la evidencia
muestral. En concreto, necesitamos extraer una muestra de tamaño n y calcular el
valor de X. Si el valor de X es parecido a 30, diremos que la hipótesis nula
planteada es compatible con los datos. Pero si el valor de X es muy diferente de 30
diremos que la hipótesis nula es incompatible con los datos. Ahora bien, para
decidir cuándo el valor tomado por X es lo bastante parecido a 30 debemos
establecer, según veremos enseguida, una regla de decisión en términos de probabili-
dad. Y, según sabemos ya, para conocer las probabilidades asociadas a los diferen-
tes valores de X debemos servirnos de la distribución muestral de X. Esa distribu-
ción muestral es normal con parámetros µ y u/Jn. Como desconocemos u, pues
nada se ha dicho de ella en la hipótesis, tendremos que estimarla, en cuyo caso la
transformación T = (X - µ)/(S" _ d Jn)
seguirá el modelo de probabilidad t de
Student con n - 1 grados de libertad 6 ; de modo que la transformación T nos
permitirá conocer las probabilidades asociadas a los diferentes valores de X. Ahora
bien, para poder utilizar esa transformación, es decir, para que la transformación T
se distribuya según la t de Student, es necesario que la distribución poblacional de
partida sea normal y que la muestra utilizada para obtener X sea aleatoria. Y dado
que nada de eso está afirmado en H 0 , necesitamos formularlo como supuesto. Sólo
de este modo la distribución poblacional de partida quedará completamente
especificada: se tratará de una distribución normal, con parámetros µ = 30 y u
desconocida pero estimada a partir del valor tomado por sn - 1 en una muestra
aleatoria extraída de esa población. Bajo estas condiciones, la distribución muestral
de X es conocida y, por tanto, susceptible de ser utilizada para tomar una decisión
sobre H 0 en términos de probabilidad.
Otro ejemplo. Recordemos al psicólogo supuestamente capaz de detectar
trastornos de tipo neurótico a través de la escritura. Para verificar si el psicólogo
posee o no esa capacidad, planteábamos las hipótesis estadísticas: H 0 : nacierto ~ 0,5;
H 1 : 1tacierto > 0,5. Y para contrastar estas hipótesis presentábamos al psicólogo 1O
pares de muestras de escritura. Pues bien, si los 1O pares de muestras de escritura se
presentan de forma independiente y en cada presentación sólo hay dos resultados
posibles (acierto-error) con 1tacierto = 0,5 en cada presentación, la variable número de
aciertos tendrá una distribución de probabilidad completamente especificada 7 (la
binomial, con parámetros n = 10 y n = 0,5) y eso nos permitirá poder tomar una
decisión respecto a H 0 en términos de probabilidad.
Vemos, por tanto, que los supuestos de un contraste de hipótesis hacen referen-
6 Puede consultarse, en el capítulo 1, el apartado 1.3.2 sobre la distribución muestra! de la media.
7 Puede consultarse, en el capítulo 1, el apartado 1.3.4 sobre la distribución muestra! de la
proporción.
© Ediciones Pirámide
Contraste de hipótesis / 135
cia al conjunto de condiciones que deben cumplirse para poder tomar una decisión
sobre la hipótesis nula H 0 basada en una distribución de probabilidad conocida.
Pero ese conjunto de condiciones que hemos necesitado establecer no se refieren
únicamente a la distribución poblacional de partida. También hacen referencia a
ciertas características de los datos muestrales: si la muestra es aleatoria .... si las
presentaciones son independientes ... Esto significa que, para apoyar nuestra decisión
en una distribución de probabilidad conocida, necesitamos, por un lado, especificar
por completo la distribución poblacional a partir de la cual se establecen las
predicciones formuladas en H 0 (normalidad, simetría, etc.) y, por otro, definir las
características de los datos con los que se contrastarán esas predicciones (muestra
aleatoria, nivel de medida, etc).
Resumiendo:
Algunos de estos supuestos son más restrictivos o exigentes que otros. Para
contrastar la hipótesis H 0 : µ = 30 del primer ejemplo comentado hemos necesitado
suponer que la distribución poblacional de partida era normal y que la muestra
extraída de ella era aleatoria. Sin embargo, para contrastar la hipótesis H 0 :
1tacierto :::;; 0,5 del segundo ejemplo, sólo hemos necesitado suponer que las 1O
presentaciones eran independientes (muestra aleatoria de 10 elementos) y que la
probabilidad de acierto en cada presentación era la misma (1tacierto = 0,5). Es más
difícil conseguir que se cumplan los supuestos necesarios para contrastar H 0 :
µ = 30 que los necesarios para contrastar 1tacierto = 0,5 y, en ese sentido, decimos de
los supuestos del primer contraste que son mas restrictivos o exigentes que los del
primero.
Es importante tener presente que el incumplimiento de uno o varios supuestos
podría invalidar el contraste y llevarnos a una decisión errónea. Conviene, por
tanto, que los supuestos sean pocos y poco exigentes. Aun así, en muchas ocasiones
nos veremos en la necesidad de establecer varios y muy exigentes. No obstante,
veremos que existen procedimientos para comprobar el cumplimiento de la mayor
parte de los supuestos que necesitemos establecer.
Suponiendo, según hemos señalado antes, que las presentaciones de los to pares
de muestras de escritura son independientes y que la probabilidad de cada uno de
los dos resultados posibles (acierto-error) es la misma en cada presentación,
la distribución muestral de las variables o estadísticos de contraste X y P será la
binomial con parámetros n = 10 y n = 0,5. Según esto, la probabilidad asociada
a cada uno de los valores de X y P (tabla 3.1) vendrá dada por la función 8 :
8 Por supuesto, las probabilidades asociadas a los estadisticos X y P también pueden obtenerse a
partir de la tabla de la distribución binomial, con n = 10 y n: = 0,5, sin necesidad de realizar cálculos.
© Ediciones Pirámide
Contraste de hipótesis / 137
TABLA 3.1
Distribución muestra/ de X y P
con n = 0,5 y n = l O
X p f(x)
o 0,0 0,001
1 0,1 0,010
2 0,2 0,044
3 0,3 0,117
4 0,4 0,205
5 0,5 0,246
6 0,6 0,205
7 0,7 0,117
8 0,8 0,044
9 0,9 0,010
10 1,0 0,001
Así pues, se rechaza una hipótesis sometida a contraste cuando el valor del
estadístico de contraste cae en la zona crítica; y se rechaza porque eso significa que
el valor tomado por el estadístico de contraste se aleja demasiado de la predicción
establecida en esa hipótesis, es decir, porque, si la hipótesis planteada fuera
verdadera, el estadístico de contraste no debería haber tomado ese valor (sería muy
poco probable que lo tomara); como de hecho el estadístico ha tomado ese valor, la
conclusión más razonable será que la hipótesis planteada no es verdadera.
El tamaño de las zonas de rechazo y aceptación se determina fijando el valor de
tx, es decir, fijando el nivel de significación con el que se desea trabajar. Por
supuesto, si tenemos en cuenta que tx es la probabilidad que vamos a considerar
como lo bastante pequeña para que valores con esa probabilidad o menor no
ocurran bajo H 0 verdadera, comprenderemos que tx será, necesariamente, un valor
pequeño. Cómo de pequeño es algo que debe establecerse de forma arbitraria 9 , si
bien los niveles de significación habitualmente propuestos para :x en la literatura
estadística y utilizados en la investigación empírica son 0,01 y 0,05 (también
referidos como 1 por 100 y 5 por 100, respectivamente).
Recordemos ahora que, dependiendo de cómo formulemos H 1 • los contrastes de
hipótesis pueden ser bilaterales o unilaterales:
l. Contraste bilateral: H 0 : µ .. = µm
H1: µ,. # µm
2. Contraste unilateral: H 0 : 1tacierto ~ 0,5
H 1: 1tacierto > 0,5.
La forma de dividir la distribución muestra! en zona de rechazo o crítica y zona
de aceptación depende de si el contraste es bilateral o unilateral. La zona crítica
debe estar situada allí donde puedan aparecer los valores muestrales incompatibles
con H 0 , es decir, allí donde puedan aparecer los valores muestrales que apunten en
la dirección propuesta en H 1 • Así, en el contraste 1, dada la afirmación establecida
en H 1 , la zona crítica debe recoger tanto los valores muestrales que vayan en la
" En ocasiones, no tan arbitrariamente. Más adelante veremos que, en todo contaste, pueden
cometerse dos tipos de errores. Pues bien, hay ocasiones en que el nivel de significación :x conviene fijarlo
buscando minimizar la probabilidad de comerter uno de esos dos errores.
© Ediciones Pirámide
Contraste de hipótesis / 139
dirección X,. - Xm >O, como los que vayan en la dirección X,. - Xm <O. Dicho de
otra forma: si H 0 : µ,, = µm es falsa, lo será tanto si µ,. es mayor que µm como si µ,. es
menor que µm, por lo que la zona crítica deberá recoger ambas posibilidades. Por
esta razón, en los contrastes bilaterales, la zona crítica se encuentra, generalmente 10 ,
repartida a partes iguales entre las dos colas de la distribución muestra/ (figura 3.1.A).
A B
Figura 3.1.--Ejemplo de zonas críticas en un contraste bilateral (figura A) y un contraste unilateral
derecho (figura B) con una distribución muestra! de forma normal.
1 0 Decimos generalmente porque. dependiendo del tipo de distribución muestra! que utilicemos, nos
© Ediciones Pirámide
140 / Análisis de datos en psicología 11
Cuando decidimos mantener una hipótesis nula, queremos significar con ello
que consideramos que esa hipótesis es compatible con los datos.
Cuando decidimos rehazar una hipótesis nula, queremos significar con ello
que consideramos probado que esa hipótesis es falsa.
La razón de que esto sea así es doble. Por un lado, dada la naturaleza
inespecífica de H 1 , raramente es posible afirmar que H 1 no es verdadera; las
desviaciones pequeñas de H 0 forman parte de H 1 • por lo que al mantener una H 0
particular, también se están manteniendo, muy probablemente, algunos valores de
H 1 ; debe concluirse, por tanto, que se mantiene o no rechaza H 0 , pero nunca que se
acepta como verdadera. Por otro lado, en el razonamiento estadístico que lleva a la
toma de una decisión respecto a H 0 , puede reconocerse el argumento deductivo
modus tollens, aunque de tipo probabilístico: si H 0 es verdadera, entonces, muy
probablemente. el estadístico de contraste T tomará valores comprendidos entre a y b;
T no toma un valor comprendido entre a y b; luego, muy probablemente, H 0 no es
verdadera. Este argumento es impecable, nada hay en él que lo invalide desde el
11 El propio Fisher mantendría una postura más radical en este punto: si una hipótesis sometida a
contraste no puede ser rechazada, debemos suspender el juicio, no decidir nada, porque nada podemos
probar sobre esta hipótesis (Fisher, 1955).
© Ediciones Pirámide
Contraste de hipótesis / 141
punto de vista lógico. Sin embargo, si una vez establecida la primera premisa se
continúa de esta otra manera: T toma un valor comprendido entre a y b; luego H 0 ,
muy probablemente, es verdadera, se comete un error lógico llamado falacia de la
afirmación del consecuente: obviamente, T puede haber tomado un valor comprendi-
do entre a y b por razones diferentes de las contenidas en H 0 12 .
Estas ideas proporcionan una valiosa pista a la hora de decidir cómo plantear
las hipótesis nula y alternativa en un contraste concreto. Si estamos interesados en
determinar si una afirmación sobre una distribución poblacional es falsa, debemos
plantear esa afirmación como hipótesis nula; así, si la rechazamos, podremos
concluir que hemos probado que esa hipótesis es falsa. Si, por el contrario, estamos
interesados en determinar si esa afirmación es verdadera, debemos plantearla como
hipótesis alternativa; así, si rechazamos la hipótesis nula, lo haremos en favor de la
alternativa (pues la hipótesis alternativa es, recordémoslo, la negación de la nula).
Todo esto sin olvidar que el signo « = » siempre debe ir en la hipótesis nula.
EJEMPLO 3.1. Al describir cada uno de los pasos de que consta un contraste de
hipótesis hemos comentado, entre otros, un ejemplo referido a un psicólogo supuesta-
mente capaz de diagnosticar trastornos de tipo neurótico a través de la escritura.
Vamos a utilizar ahora ese mismo ejemplo para resumir los pasos descritos.
Supongamos que presentamos al psicólogo los 10 pares de muestras de escritura
(recordemos que en cada par de muestras de escritura el psicólogo debe decidir cuál de
las dos escrituras corresponde al paciente con trastornos de tipo neurótico) y que éste
consigue efectuar un diagnóstico correcto en 7 de ellos. Con este resultado muestra),
¿qué podemos concluir sobre la supuesta capacidad del psicólogo?
l. Hipótesis:
H 0: 0,5. (H 0 : el psicólogo no posee capacidad de diagnóstico).
1tacierto :::;;
2. Supuestos:
- 1O ensayos independientes con dos resultados posibles en cada ensayo: acierto
y error.
- La probabilidad de cada resultado permanece constante en cada ensayo; en
concreto, 1tacierto = 1terror = 0,5.
12 Este punto de vista, por otra parte, es perfectamente coherente con el comúnmente aceptado por
los filósofos de la ciencia sobre la verificación de una hipótesis científica: nunca podemos afirmar la
verdad de una hipótesis o teoría científica; podemos, simplemente, sentirnos más seguros de ella a medida
que se va mostrando repetidamente conforme con la evidencia empírica; en realidad, sólo podemos
considerarla como provisionalmente verdadera (Popper, 1982; Hempel, 1984; etc.). De ahí que la labor
investigadora deba ir más orientada hacia la falsación o refutación de teorías que hacia la verificación de
las mismas (sobre esta temática puede consultarse la discusión de Klayman y Ha, 1987).
© Ediciones Pirámide
142 / Análisis de datos en psicologla 11
4. Regla de decisión:
Rechazar H 0 si T toma un valor tan grande que la probabilidad de obtener un
valor como ése o mayor es menor que :x.
Los valores habituales de :x son, según hemos señalado, 0,05 y 0,01. Pero en
este ejemplo concreto, por sencillez (y por conveniencia, según veremos más tarde
al estudiar el concepto de potencia), vamos a fijar un :x de 0,011. Fijar un :x de
0,011 equivale a establecer la siguiente regla de decisión: rechazar H 0 si T toma un
valor igual o mayor que 9 (ver la distribución muestra) de Ten el apartado 3.1.3).
5. Decisión:
Dado que en la muestra de 10 presentaciones hemos obtenido 7 aciertos y que
7 es menor que 9 (o, de otro modo, dado que la probabilidad de obtener valores
mayores o iguales que 7 vale 0,172 y que 0,172 es mayor que :x = 0,011), debemos
tomar la decisión de mantener H 0 •
Podemos concluir que no disponemos de evidencia empírica suficiente para
rechazar H 0 ; por lo que no podemos pensar que el psicólogo posea la capacidad
de diagnosticar correctamente trastornos de tipo neurótico a través de la escritura.
A pesar de que 7 aciertos son más de los que cabría esperar por puro azar (cabría
esperar 5), es un número de aciertos cuya probabilidad de ocurrencia, suponiendo
n = 0,5, es mayor que el riesgo que nosotros estamos dispuestos a asumir en nuestra
decisión. Es decir, respondiendo al azar, la probabilidad de obtener 7 o más aciertos es
mayor que 0,05, por lo que podemos pensar que ese resultado es compatible (puede
ocurrir) si la hipótesis n :o::; 0,5 es verdadera.
(A lo largo de las páginas que siguen volveremos repetidamente sobre este ejemplo;
presentaremos además gráficos de diferente tipo que nos ayudarán a entender mejor
cada uno de los pasos seguidos.)
EJEMPLO 3.2. Algunos trabajos sobre memoria icónica indican que el promedio
de letras recordadas en presentación taquistoscópica de 1 segundo, por un sujeto
normal, es de 4,5, con una desviación típica de 1,4. Sin embargo, los trabajos que se
vienen realizando en la Universidad Autónoma de Madrid no parecen estar de
acuerdo con esa hipótesis. Deseamos, por tanto, contrastar la hipótesis 11 = 4,5. Para
ello. hemos seleccionado una muestra aleatoria de 25 sujetos y. tras presentarles un
conjunto de letras por taquistoscopio. hemos encontrado un promedio de palabras
recordadas de 5,1. Utilizando un nivel de significación de :x = 0,05, ¿a qué conclusión
llegaremos?
1. Hipótesis:
H 0 : µ = 4,5.
H 1 : µ '# 4,5 (contraste bilateral).
© Ediciones Pirámide
Contraste de hipótesis / 143
2. Supuestos:
El estadístico de contraste capaz de proporcionarnos información relevante
sobre µ es X. Debemos, por tanto, establecer las condiciones necesarias para
conocer la distribución muestra( de X:
- La variable número de palabras recordadas se distribuye normalmente en la
población.
- La muestra de 25 observaciones es aleatoria.
4. Regla de decisión:
Rechazar H 0 si el estadístico de contraste Z toma un valor mayor que el per-
centil 100(1 - '1./2) = 100(1 - 0,025) = 97,5 o menor que el percentil 100('1./2) =
= 100(0,025) = 2,5 de la distribución N(O, 1), es decir, un valor mayor que 1,96 o
menor que -1,96.
5. Decisión:
Dado que z = 2,14 es mayor que 1,96, debemos rechazar H 0 y concluir que el
promedio de letras recordadas es distinto de 4,5. La figura 3.2 nos ilustra la
situación.
z = 2,14
© Ediciones Pirámide
144 / Análisis de datos en psicología 11
Naturaleza de Ha
Verdadera Falsa
© Ediciones Pirámide
Contraste de hipótesis / 145
mismo tamaño para a, vamos ensanchando poco a poco las dos distribuciones: el
resultado será que el tamaño del área f3 irá aumentando.
En el siguiente apartado, al hablar de la potencia (1 - /3), aprenderemos a
calcular el valor de {3. Pero antes, debemos hacer un último comentario sobre los
errores de tipo 1 y 11. En general, un buen contraste o una buena regla de decisión
debe tender a minimizar los dos tipos de error inherentes a toda decisión. Ya
sabemos que el valor de a lo establece arbitrariamente el investigador procurando
que sea un valor pequeño (habitualmente, 0,05 o 0,01). Por tanto, disminuir la
probabilidad de cometer un error de tipo 1 (a) en un determinado contraste es tan
sencillo como seleccionar para a un valor tan pequeño como deseemos. Pero
acabamos de ver que disminuir a tiene como resultado directo un aumento de {3. La
reducción arbitraria de a, por tanto, no representa una solución razonable.
Más razonable parece detenerse a considerar cuál de los dos errores que
podemos cometer podría resultar más grave en una situación concreta y procurar
disminuirlo a costa del otro. Así, si es importante evitar cometer un error de tipo 1
(por ejemplo, decidir aplicar un tratamiento que conlleva graves efectos secundarios
cuando en realidad no es necesaria la aplicación del mismo), será conveniente
seleccionar un valor muy pequeño para a (0,001, por ejemplo). Si es importante
evitar cometer un error de tipo 11 (por ejemplo, mandar a alguien a casa cuando de
hecho necesita tratamiento inmediato), será conveniente seleccionar para a un valor
más grande (0,10 o 0,20, por ejemplo). Con todo, de entre los diferentes factores de
los que depende el valor de {3, la manipulación del tamaño muestral n es el que
proporciona una solución más eficaz, al tiempo que sencilla (en el apéndice 3 tra-
tamos esta cuestión).
14 Probablemente (como sugiere Howell, 1992, pág. 204) existen varias razones históricas que
justifican este descuido. Entre ellas, la escasa atención prestada en los manuales de estadística a los
problemas relacionados con la potencia, o un tratamiento de los mismos poco apropiado para ser
digerido por el nivel de preparación medio de la comunidad investigadora. Hoy, sin embargo, después de
los trabajos aparecidos en los últimos años, especialmente impulsados por Cohen (ver Cohen, 1988), las
cuestiones relacionadas con la potencia parecen lo basta!He clarificadas y divulgadas como para merecer
nuestra atención.
© Ediciones Pirámide
Contraste de hipótesis / 149
este ejemplo concreto, dadas las probabilidades individuales de la distribución muestra! de T1 bajo H 0 ,
un a de 0,011 nos permite simplificar el problema.
© Ediciones Pirámide
150 / Análisis de datos en psicología 11
TABLA 3.2
Distribuciones muestra/es de T 1 bajo H 0 : n = 0,5
y H 1 : n = 0,7
H 0 : n = 0,5 H 1: n = 0,7
T, P(T,=t.) T, P(T, = r 1 )
o 0,001 o 0,000
1 0,010 1 0,000
2 0,044 2 0,001
3 0,117 3 0,009
4 0,205 1-IX 4 0,037 /f
5 0,246 5 0,103
6 0,205 6 0,200
7 0,117 7 0,267
8 0,044 8 0,233
0,010 0,121
9
10 0,001 } iX
9
10 0,028
} 1- /f
0.25
0.20
0.15
0.10
0.05
o 2 3 4 5 6 7 8 9 10
Figura 3.6. Error tipo 11 y potencia en un contraste unilateral derecho con H 1: rr = 0,7 y n = 10.
© Ediciones Pirámide
152 / Análisis de datos en psicología 11
P(T, =1 1 )
0,40
0,35
0,30
0,25
0,20
0,15
0,10·
0,05
o 2 3 4 5 6 7 8 9 10
Figura 3.7.-Error tipo 11 y potencia en un contraste unilateral derecho con H 1 : '/[ = 0,9 y n = 10.
z = (X ± 0,5) - mi:
(3.1)
Jmr(l - n)
(9 - 0,5) - 10(0,5)
z= = 2 21
jl0(0,5)(0,5) '
proporción.
© Ediciones Pirámide
Contraste de hipótesis / 153
mayores que z = 2,21. Esa probabilidad, suponiendo que el verdadero valor del
parámetro n es 0,5, puede obtenerse en la tabla de la distribución normal estandari-
zada: P(Z ~ 2,21) = 0,0136. Así pues, con la regla de decisión adoptada y utilizando
el estadístico Z, la probabilidad de cometer un error de tipo 1 (oc) vale 0,0136 (valor
muy parecido al utilizado anteriormente con el estadístico T1 y la distribución
binomial).
Ahora bien, si la hipótesis H 0 : n = 0,5 es falsa, corremos el riesgo de cometer un
error de tipo 11, el cual, como sabemos, se proáucirá cuando tomemos la decisión de
mantener esa H 0 . ¿Cuál será la probabilidad de cometer ese error? Es decir, ¿cuál
será el valor de f3? Si suponemos que la hipótesis verdadera es H 1 : n = 0,7, el valor
de f3 vendrá dado por la probabilidad de encontrar valores menores que 9 (único
caso en el que decidiríamos mantener H 0 : n = 0,5) en la distribución definida por
n = 0,7. Utilizando el estadístico Z obtenemos:
(9 - 0,5) - 10(0, 7)
z= = 1,04
jl0(0,7)(0,3)
© Ediciones Pirámide
154 / Análisis de datos en psicología 11
p= 0,8508
o
Figura 3.8.--Áreas correspondientes a las probabilidades ex. {J. 1 - ex y 1 - fJ en un contraste unilateral
derecho (H 1 : ¡¡ = 0,7; n = 10).
2,14
A
Figura 3.9. ·-Zonas críticas en un contraste bilateral con ac = 0,05 (figura A) y ac = 0,01 (figura B).
© Ediciones Pirámide
156 / Análisis de datos en psicología 11
se obtiene, generalmente, multiplicando por 2 la probabilidad asociada a los valores mayores (si el
estadístico de contraste cae en la cola derecha) o menores (si el estadístico cae en la cola izquierda) que el
estadístico de contraste. Pero, como veremos en próximos capítulos, existen contrastes bilaterales en los
que la zona crítica está situada, toda ella, en la cola derecha de la distribución muestral. En estos casos,
el nivel crítico es la probabilidad asociada a los valores mayores que el estadístico de contraste.
© Ediciones Pirámide
Contraste de hipótesis / 157
ventaja adicional que nos permite superar, en parte, el segundo de los inconvenien-
tes atribuidos líneas más arriba a la utilización de un nivel de significación
establecido a priori. El nivel crítico, no sólo nos ayuda a tomar una decisión sobre
H 0 , sino que su tamaño nos informa sobre el grado de compatibilidad o discrepan-
cia existente entre la evidencia muestra) observada y esa H 0 . Un nivel crítico de
0,70, por ejemplo, nos está indicando que el resultado muestral obtenido es
perfectamente compatible con la hipótesis planteada; es decir, un nivel crítico de ese
tamaño nos está indicando que, si suponemos que la H 0 planteada es verdadera, la
probabilidad de encontrar un resultado muestra) como el encontrado o más
extremo vale 0,70. Un nivel crítico de 0,05 nos está indicando que el resultado
muestra) observado es poco compatible con H 0 ; sólo encontraríamos un valor como
ese o más extremo en 5 de cada 100 contrastes idénticos que lleváramos a cabo. Un
nivel crítico de 0,000001 nos está indicando que el resultado muestra) observado se
encuentra tan alejado de la predicción efectuada en H 0 que sólo en 1 de cada millón
de contrastes idénticos encontraríamos un resultado semejante; con un nivel crítico
de 0,000001 podríamos sentirnos razonablemente seguros de que la H 0 planteada es
falsa. Podemos decir, por tanto, que el tamaño del nivel crítico nos está inforinando
sobre el grado en el que la evidencia empírica obtenida se muestra incompatible con
la H 0 planteada (información ésta que pasa desapercibida cuando nos limitamos a
tomar la decisión de mantener o rechazar H 0 apoyados en un nivel de significación
previamente establecido).
Pero recordemos en este momento que el tamaño del error típico de la distribu-
ción muestra) de un estadístico se ve fuertemente afectado por el tamaño de la
muestra utilizada (en el apartado 3.2 de este mismo capítulo hemos tratado esta
cuestión). Permaneciendo todo lo demás constante, el valor del estadístico de con-
traste será tanto más extremo (es decir, tomará un valor tanto más alejado de la
predicción formulada en H 0 ) cuanto mayor sea el tamaño de la muestra. En el
estadístico Z utilizado en los ejemplos 3.2 y 3.3 se puede apreciar claramente este
hecho. Cuanto mayor sea n, menor será el denominador (el error típico de la me-
dia) y más extremo el valor de Z. De manera que con la misma media muestra)
X, la misma media poblacional µ y la misma varianza poblacional a 2, aumentando
n obtendremos un valor Z más extremo y, en consecuencia, un nivel crítico más
pequeño.
Por supuesto, lo que ocurre con el estadístico Z puede generalizarse a otro tipo
de estadísticos. Con todos ellos el nivel crítico tiende a O y, por tanto, a indicar gran
discrepancia entre H 0 y el estadístico de contraste, a medida que el tamaño
muestra) n va aumentando (lo que tiene relación directa con el hecho de que la
potencia tienda a 1 a medida que n va aumentando; puede consultarse, en este
mismo capítulo, el apéndice 3 y, en especial, el ejemplo 3.4).
Estos comentarios sugieren que la utilización del nivel crítico como una medida
del grado de discrepancia entre la H 0 planteada y la evidencia muestra) observada
tiene el inconveniente de que el valor del nivel crítico está condicionado por el
tamaño de la muestra concreta utilizada. Necesitamos, por tanto, otra medida de
ese grado de discrepancia que no dependa del tamaño de la muestra. Precisamente
© Ediciones Pirámide
158 / Análisis de datos en psicología 11
20 En León (1984) puede encontrarse una interesante discusión sobre el significado del concepto
significativo utilizado en el contexto del análisis de datos y fuera de él. Decir que un resultado muestra( es
estadísticamente significativo no implica necesariamente que ese resultado es teóricamente relevante.
21 Ver capítulo 8.
© Ediciones Pirámide
Contraste de hipótesis / 159
En situaciones de este tipo, el investigador o bien no posee una idea previa sobre
la dirección en la que se pueden producir resultados muestrales incompatibles con
H 0 , o bien considera relevante que los resultados muestrales se muestren incompati-
bles con H 0 tanto en una dirección como en la otra. En el caso 1, H 0 será rechazada
tanto sin es mayor que 0,5 como si es menor; en el caso 2, H 0 será rechazada tanto
si µ 1 es mayor que µ 2 como si µ 1 es menor que µ 2; en el caso 3, H 0 será rechazada
tanto si la relación es positiva como si es negativa. A este tipo de contrastes se les
llama bilaterales o bidireccionales. Las hipótesis formuladas no contienen ninguna
predicción sobre la dirección en la que se puede producir un resultado muestra)
incompatible con la afirmación establecida en H 0 . Lo cual está reflejado en H 1 con
el signo « # ».
Así, por ejemplo, si se quiere estudiar si los varones y las mujeres difieren en
inteligencia, y no existe una expectativa justificada (estudios previos, intereses
concretos, etc.) sobre cuál de los dos grupos es más inteligente, lo razonable será
plantear un contraste bilateral: H 0 : µv = µm; H 1 : µv # µm.
Cuando se utiliza la distribución normal o la distribución t de Student en un
contraste bilateral, la zona crítica está repartida, generalmente en partes iguales,
entre las dos colas de la distribución muestra) (ver figura 3.lA). De ahí el nombre
de bilateral. No obstante, existen contrastes bilaterales en los que la zona crítica se
encuentra, toda ella, en la cola derecha de la distribución. Tal es el caso de algunos
contrastes en los que se utiliza la distribución x2 o la F. Esto es algo que tendremos
ocasión de estudiar con detalle en los próximos capítulos.
La situación cambia cuando un investigador desea comprobar si el valor de un
parámetro ha aumentado, si un grupo supera o es mejor que otro en alguna
variable, si dos variables se encuentran negativamente relacionadas, etc., puede
someter a contraste hipótesis como éstas:
l. H 0 : n ~ 0,65
H 1 : n > 0,65
© Ediciones Pirámide
160 / Análisis de datos en psicología 11
2. H 0 : µ 1 ~ µ2
H1: µ¡ >µ2
3. H 0 :p~O
H 1 : p <0
Aquí, el investigador, o bien posee una idea previa sobre la dirección en la que
se producirán los resultados muestrales incompatibles con H 0 , o bien considera que
sólo son relevantes los resultados muestrales que se muestren incompatibles con H 0
en una de las dos direcciones. En el caso 1, H 0 será rechazada si n es mayor que
0,65, pero no si es menor; en el caso 2, H 0 será rechazada si µ 1 es mayor que µ 2 ,
pero no si es menor; en el caso 3, H 0 será rechazada si la relación es negativa, pero
no si es positiva. A este tipo de contrastes se les llama unilaterales o unidireccionales.
Las hipótesis contienen una predicción concreta sobre la dirección en la que se
puede producir un resultado muestral incompatible con la afirmación establecida en
H 0 . Lo cual está reflejado en H 1 con los signos « < » y « > ».
Si deseamos comprobar, por ejemplo, si un psicólogo posee o no la capacidad
de diagnosticar correctamente trastornos de tipo neurótico a través de la escritura,
consideraremos que el psicólogo posee tal capacidad cuando, al presentarle pares de
muestras de escritura pertenecientes a un sujeto con trastorno y a otro sin trastor-
no, su proporción de aciertos sea mayor que la proporción de aciertos que cabe
esperar por azar; y consideraremos que no posee esa capacidad cuando su propor-
ción de aciertos sea igual o menor que la esperable por azar. Las hipótesis que
tendrá sentido plantear serán: H 0 : 7l:acierto ~ 0,5; H 1 : nacierto > 0,5.
Cuando se utiliza la distribución normal o la distribución t de Student en un
contraste unilateral, la zona crítica está en una de las dos colas de la distribución
(ver figura 3.1 B). De ahí el nombre de unilateral. Con otras distribuciones ocurre algo
parecido, pero esto también es algo que tendremos ocasión de estudiar con más
detenimiento en los próximos capítulos.
Conviene saber que los contrastes bilaterales y los unilaterales no poseen la
misma potencia. Dada una situación experimental concreta, si la verdadera H 1 se
separa de H 0 en la dirección de la zona crítica, los contrastes unilaterales son más
potentes que los bilaterales para cualquier valor posible de oc Por el contrario, si la
verdadera H 1 se aleja de H 0 en dirección contraria a la zona crítica, los contrastes
unilaterales son menos potentes que los bilaterales (en estos casos, la potencia de los
contrastes unilaterales no será mayor que ex).
Estas consideraciones, sin embargo, no deben guiar nuestra decisión sobre si en
una situación concreta debe utilizarse un contraste bilateral o unilateral. Esto debe
decidirse únicamente atendiendo a los intereses del investigador, es decir, atendien-
do a aquello que el investigador desea poner a prueba. Si deseamos comprobar si
un nuevo método terapéutico supera en proporción de mejoras al método tradicio-
nal, el contraste deberá ser unilateral: concluiremos que el nuevo método no
consigue aumentar la proporción de mejoras tanto si con él se obtienen menos
mejoras que con el tradicional, como si obtienen las mismas. Pero si lo que estamos
interesados en comprobar es si los pacientes histéricos difieren de los obsesivos en
© Ediciones Pirámide
Contraste de hipótesis / 161
0,025
µo+ l,96ux
intervalo son falsas. Y lo mismo ocurnra con cualquier otro parámetro sobre el
que deseemos construir un intervalo de confianza o efectuar un contraste de hipó-
tesis.
a) Hipótesis:
H 0 : /1 = 23.
H 1 : f1 # 23 (contraste bilateral).
b) Supuestos:
Muestra aleatoria de 100 observaciones.
Las puntuaciones en conservadurismo se distribuyen normalmente.
© Ediciones Pirámide
Contraste de hipótesis / 163
d) Regla de decisión:
Rechazar Ha si el estadístico de contraste Z toma un valor mayor que el
percentil 100(1 - 'Y./2) = 100(1 - 0,025) = 97,5 o menor que el percentil 100(':1./2) =
= 2,5 de la distribución N(O, 1), es decir, un valor mayor que za. 975 = 1,96 o menor
que za.a 25 = -1,96.
e) Decisión:
Dado que Z = 3 es mayor que za. 975 = 1,96, debemos rechazar Ha y concluir
que disponemos de evidencia empírica suficiente para pensar que Ha: µ = 23 es
falsa. Podemos concluir que la población estudiada ha alterado su promedio en
conservadurismo.
Veamos qué ocurre si, en lugar de efectuar un contraste de hipótesis, intentamos
responder a la pregunta construyendo un intervalo de confianza para µ:
AP~NDICE 3
Curva de potencias
Hemos visto que la potencia de un contraste se ve afectada (al igual que ocurre con la
probabilidad de cometer un error de tipo 11) por el valor concreto de H 1 • Ya sabemos que H 1
es una afirmación inexacta, en el sentido de que asigna diferentes valores al parámetro de
referencia o a la forma de una distribución. La hipótesis H 1: n: > 0,5, por ejemplo, está
asignando al parámetro n: todos los posibles valores mayores de 0,5 y, por tanto, no está
asignando un valor concreto, sino muchos. Pues bien, tanto la potencia como la probabilidad
de cometer un error de tipo 11 dependen de cuál de todos esos valores incluidos en H 1
consideremos como verdadero. Según hemos visto, cuanto más alejado se encuentre el
verdadero parámetro del valor propuesto para él en H ª' menor será la probabilidad de
encontrar valores compatibles con Ha y menor también, por tanto, la probabilidad de tomar
una decisión incorrecta (/J). Lo cual significa que existirán tantos valores para fJ (y, por tanto,
para 1 - /J) como valores para el parámetro en cuestión estén definidos en H 1 • En este
sentido, se habla de curva o función de potencias para expresar, en un contraste concreto, la
relación entre cada uno de los valores asignados al parámetro en H 1 y la potencia correspon-
diente a esos valores. permaneciendo todo lo demás constante.
Sigamos con nuestro ejemplo del psicólogo supuestamente capaz de diagnosticar a través
de la escritura. Habíamos planteado las hipótesis: Ha: n: :::;; 0,5, H 1 : n: > 0,5. Como H 1 es una
© Ediciones Pirámide
164 / Análisis de datos en psicología 11
TABLA 3.3
Distribución muestra/ del estadístico T1 con n = 1O y diferentes valores de rr
T, 110 = 0,50 11, = 0,60 11, = 0,70 11¡ = 0,80 11, = 0,90 11, = 0,95 11, = 0,99
22 Todo lo dicho sobre la curva de potencias y los factores de los que depende ha estado referido a
un contraste unilateral (H 0 : 7t .;; 0,5; H 1 : 7t > 0,5). En un contraste bilateral es posible obtener la potencia
y la curva de potencias utilizando razonamientos similares a los expuestos. Estos razonamientos pueden
consultarse, por ejemplo, en San Martín, Espinosa y Fernández, 1987, apartado 6.7.
© Ediciones Pirámide
Contraste de hipótesis / 165
1 - {J
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
o
0,50 0,60 0,70 0,80 0,90 0,99
0,95
TABLA 3.4
Potencia asociada a diferentes valores de n: 1 y oc
(resultados obtenidos a partir de la tabla 3.3)
© Ediciones Pirámide
166 / Análisis de datos en psicología 11
Según hemos estudiado en el apartado 3.3, el primero de los factores que afectan a la
potencia es el valor concreto de H 1 considerado como verdadero. Pero lo cierto es que saber
esto no nos sirve de mucho a la hora de intentar aumentar la potencia de un contraste. Por
un lado, el verdadero valor de un parámetro concreto no es algo que dependa de nuestros
intereses, por lo que dificilmente podremos manipular ese valor para conseguir con ello
modificar la potencia de un contraste. Por otro lado, puesto que desconocemos cuál es el
verdadero valor del parámetro estudiado (si lo conociéramos no necesitaríamos efectuar un
contraste sobre él) ni siquiera podemos determinar cuál de todas las afirmaciones abarcadas
por H 1 es la verdadera para, con ello, conocer la potencia del contraste.
En segundo lugar, ya sabemos que un aumento de IX tiene como consecuencia directa una
reducción de la probabilidad de cometer un error de tipo 11 (fi) y, por tanto, un aumento de
la potencia. Podríamos, pues, aumentar arbitrariamente IX y conseguir, de esa forma tan
sencilla, una reducción automática de p y un aumento de la potencia. Pero ya sabemos que
aumentar IX significa aumentar la probabilidad asociada al error de tipo l. Por lo que un
aumento de IX con la finalidad de conseguir hacer más potente el contraste no parece
constituir una solución lo bastante razonable (excepto en el caso de que cometer un error de
tipo 11 sea claramente más grave que cometer un error de tipo 1).
Más razonable parece intentar conseguir un aumento de la potencia a través de una
reducción del error típico de la distribución muestra( del estadístico utilizado en el contraste.
Según hemos visto en el apartado 3.2, con una operación tan sencilla como aumentar el
tamaño de la muestra podemos obtener una reducción del tamaño del error típico de la
distribución muestra( del estadístico utilizado y, como consecuencia de ello, una disminución
de P y un aumento de la potencia.
Continuando con nuestro ejemplo del psicólogo supuestamente capaz de diagnosticar
trastornos de tipo neurótico a través de la escritura, recordemos que al contrastar la hipótesis
nula H 0 : n: = 0,5 frente a la alternativa H 1 : n: = 0,7 mediante el estadístico Z y con un
tamaño muestra( n = 10, hemos obtenido una potencia de 0,1492 (apartado 3.3.1).
Manteniendo la misma regla de decisión que entonces y, por tanto, el mismo valor para IX (es
decir, 0,0136), veamos qué ocurre ahora si, en lugar de utilizar una muestra de tamaño
n = 10, utilizamos una muestra de tamaño n = 25 (permaneciendo igual lo demás).
Dado que IX vale 0,0136, rechazaremos H 0 cuando el estadístico Z tome un valor igual o
mayor que 2,21 (ver figura 3.8; esto no ha cambiado respecto a la situación anterior: 2,21 era
y sigue siendo el valor en puntuaciones Z que corresponde a la línea vertical en la
distribución de H 0 ). Esto equivale a decir que rechazaremos H 0 cuando T1 (el número de
aciertos) tome un valor mayor o igual que 18,525, pues:
© Ediciones Pirámide
Contraste de hipótesis / 167
Cl = 0,0136
17,5 18,525
--------..-------z
o 0,23
Figura 3.12. Áreas correspondientes a las probabilidades ex, p, 1 - ex y 1 - p en un contraste unilateral
derecho (H i: n = O, 7; n = 25).
~ = 0,0136
El efecto del tamaño muestra! sobre la potencia puede apreciarse con toda claridad
observando la curva de potencias. Para un nivel de significación ex dado, la curva de potencias
muestra un notable incremento en la potencia de un contraste a medida que el tamaño
muestra! va aumentando. La figura 3.14 ilustra esta idea. En ella están representadas las
curvas de potencias obtenidas al contrastar H 0 : n = 0,5 frente a H 1 : n > 0,5. Esas curvas se
han dibujado a partir de los datos de la tabla 3.5, los cuales se han obtenido utilizando la
tabla de la distribución binomial con: n = 0,5, 0,6, ... , 0,99; n = 10, 20; y ex = 0,001.
Por supuesto, al decir que la potencia de un contraste aumenta conforme lo hace el
tamaño muestra), lo que estamos diciendo es que la probabilidad de rechazar la H 0 sometida
a contraste es tanto mayor cuanto mayor es el tamaño de la muestra utilizada. La consecuen-
cia de esto es tan llamativa que no nos puede pasar desapercibida: cualquier hipótesis que se
nos ocurra plantear puede terminar siendo rechazada con la única condición de que el
23 La relación entre la potencia y el tamaño de la muestra es similar a la relación antes vista entre la
potencia y el verdadero valor de H 1 • Hemos visto que, a medida que el valor propuesto para el
parámetro en H 1 se va alejando del valor propuesto en H 0 , la potencia va aumentando. Del mismo
modo, a medida que 11 va aumentando, también la potencia lo va haciendo, permaneciendo todo lo
demás igual.
© Ediciones Pirámide
Contraste de hipótesis / 169
1-P
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
o
0,50 0,60 0,70 0,80 0,90 0,99
0,95
TABLA 3.5
Potencias asociadas a diferentes tamaños muestra/es
( n = 10 y n = 20) al contrastar
H 0 : n = 0,5 frente a H 1 : n > 0,5 con :x = 0,001
1 - p con n = 10 1-Pconn=20
"•
0,50 0,001 0,001
0,60 0,006 0,015
0,70 0,028 0,108
0,80 0,107 0,412
0,90 0,349 0,867
0,95 0,599 0,984
0,99 0,904 1,000
tamaño de la muestra sea lo bastante grande (siempre, claro está, que esa hipótesis no sea
exactamente verdadera; es decir, siempre que exista una ligera discrepancia, por pequeña que
sea, entre la hipótesis plateada y la situación verdadera). Un sencillo ejemplo nos ayudará a
comprender esta idea.
© Ediciones Pirámide
170 / Análisis de datos en psicología 11
riamente una muestra de 25 personas radicales y, tras medir su CI obtiene una media
de 102. ¿Podemos, con estos datos y con un nivel de confianza de 0,95, afirmar que la
inteligencia media de las personas radicales es superior a la de la población española?
Se trata de un contraste sobre la media de una población. El procedimiento que
debemos seguir es idéntico al expuesto en el ejemplo 3.2.
l. Hipótesis:
H 0 : µ = 100.
H 1 : µ > 100 (contraste unilateral derecho).
2. Supuestos:
Podemos suponer, como se nos dice, que la variable CI se distribuye normal-
mente en la población.
Extraemos una muestra aleatoria de 25 observaciones.
4. Regla de decisión:
Rechazar H 0 si el estadístico de contraste Z toma un valor mayor que el
percentil 100(1 - oc)= 100(1 - 0,05) = 95 de la distribución N(O, 1), es decir, un
valor mayor que z0 . 95 = 1,64 (contraste unilateral derecho).
5. Decisión:
Dado que z = 0,67 es menor que z0 • 95 = 1,64, debemos mantener H 0 y
concluir que no disponemos de evidencia suficiente para pensar que H 0 : µ = 100
es falsa. No podemos concluir que la población de personas radicales poseen un
CI superior al del resto de la población.
A esta conclusión hemos llegado utilizando una muestra de 25 sujetos. Veamos qué
ocurre si vamos aumentando el tamaño de la muestra y suponemos que el CI
observado es siempre el mismo: 102. Comencemos con un tamaño muestra! de 50:
z = (102 - 100)/(15/.jSo) = 0,94. Dado que z = 0,94 es menor que z0 •95 = 1,64, con
n = 50 seguimos manteniendo H 0 .
Con n = 100: z = (102 - 100)/(15/..jTOO) = 1,33. Como z = 1,33 es menor que
z0 •95 = 1,64, también con n = 100 mantenemos H 0 .
Con n = 200: z = (102 - 100)/(15/)200) = 1,89. Como z = 1,89 es mayor que
z0 , 95 = 1,64, rechazamos H 0 •
A pesar de que una discrepancia de 2 puntos (la que hay entre 100 y 102) es
bastante pequeña en términos de CI, aumentando el tamaño muestra) lo suficiente
(hasta 200) hemos terminado rechazando la hipótesis H 0 : µ = 1OO.
© Ediciones Pirámide
Contraste de hipótesis / 171
Llegados a este punto, cabe preguntarse cuál ha de ser el tamaño de la muestra para
conseguir que un contraste concreto alcance una determinada potencia. Continuemos con el
ejemplo del psicólogo supuestamente capaz de diagnosticar a través de la escritura. Plantee-
mos la hipótesis nula H 0 : n = 0,5 frente a la alternativa H 1 : n = O, 7 y llamemos Pe al punto
que separa la zona crítica de la zona de aceptación. Si nos fijamos en la figura 3.13 podremos
constatar que, en la distribución correspondiente a H 0 , se verifica:
(3.2)
(3.4)
por lo que:
(3.5)
La ecuación (3.5) nos permite obtener el tamaño muestra! necesario para alcanzar una
determinada potencia, con un nivel de significación oc y una distancia dada entre n 0 y n 1 . Es
decir, el tamaño necesario para que el contraste sea capaz de detectar, con una probabilidad
1 - p, que H 0 : n = n 0 es falsa (y siendo verdadera H 1 : n = n ¡). En todo momento nos
estamos refiriendo a un contraste unilateral (derecho o izquierdo, indistintamente). Si el
contraste es bilateral, basta con sustituir z 1 - · por z 1 _ 012 •
En ocasiones, obtener una determinada potencia requerirá un tamaño muestra! demasia-
do grande, un tamaño tal vez dificil de conseguir. Muchas de las investigaciones llevadas a
cabo en el contexto de las ciencias sociales, y especialmente en psicología, necesitan utilizar
diseños en los que resulta muy costoso y nada fácil trabajar con muestras grandes. Es el
investigador quien debe evaluar la importancia de cometer cada tipo de error en una
situación concreta y si la ganancia que se obtiene al aumentar la potencia del contraste
compensa el esfuerzo necesario para incrementar el tamaño muestra!.
La ecuación (3.5) es fácilmente generalizable a otro tipo de situaciones. Incluso puede
simplificarse considerablemente cuando el error típico de la distribución muestra! utilizada
sea el mismo bajo H 0 y H 1 , como en el caso de la media. Dado que ax= a/Jn,
tendremos,
de acuerdo con (3.4):
(J (J
por lo que:
(3.7)
© Ediciones Pirámide
172 / Análisis de datos en psicologfa 11
nos permitirá obtener el tamaño muestra) necesario para alcanzar una determinada potencia,
para un nivel de significación IX y para una distancia dada entre µ 0 y µ 1 • Si desconocemos u 2 ,
podemos estimarla.
0,7 - 0,5
l,64J0,25 - (-0,84)J0,21) 2
=( = 36 297
0,2 '
Redondeando al entero mayor, vemos que el tamaño necesario para obtener una
potencia de 0,80, con IX = 0,05 y n 1 - n 0 = 0,2 es de 37.
EJERCICIOS
3.4. Queremos contrastar la hipótesis de que el nivel de ingresos medio de cierto colectivo
español es de 115.000 pesetas, con u = 30.000, frente a la hipótesis alternativa de que el nivel
de ingresos medio es de 100.000 pesetas. Si utilizamos una muestra aleatoria de 25 sujetos y
un nivel de confianza de 0,95, ¿cuál será la potencia del contraste?
© Ediciones Pirámide
Contraste de hipótesis / 173
3.6. ¿Cuánto vale, utilizando un nivel de riesgo de 0,01, la probabilidad de cometer un error
de tipo 11 al contrastar la hipótesis nula H 0 : µ = 60 frente a la alternativa H 1 : µ = 65 con una
muestra aleatoria de 40 sujetos extraída de una población normal con a 2 = 160?
3.7. ¿Qué tamaño debería tener la muestra del ejercicio anterior para que la potencia del
contraste aumentara un 15 por ciento? (ver apéndice 3).
3.9. Utilizando ex= 0,05 y una muestra aleatoria de 20 sujetos extraída de una poblaciór1
normal con a 2 = 80, trace la curva de potencias que se obtendría al contrastar la hipótesis
nula H 0 : µ = 30 frente a las alternativas H 1 : µ = 31, H 1 : µ = 32, H 1 : µ = 33, H 1 : µ = 34, H 1 :
µ = 35, H 1 : µ = 36 y H 1 : µ = 37 (ver apéndice 3).
3.10. ¿Qué curva de potencias obtendríamos si efectuáramos los contrastes del ejercicio
anterior con el mismo nivel de significación pero con una muestra de 80 sujetos? (ver
apéndice 3).
TABLA 3.6
TABLA 3.7
X o 1 2 3 4
© Ediciones Pirámide
174 / Análisis de datos en psicología 11
3.15. Supongamos que la variable aleatoria C¡ se distribuye N(µ, 10) en una determinada
población. Planteamos dos hipótesis acerca del parámetro desconocido µ:
H 0 : µ = 50
H 1 : µ = 58
3.16. Para contrastar la hipótesis de que el 50 por 100 de los sujetos de una ciudad española
se encuentran en paro se adoptó la siguiente regla de decisión: rechazar dicha hipótesis si en
una muestra de tamaño 100 seleccionada aleatoriamente de esa ciudad se obtienen menos de 40
o más de 60 sujetos en paro: mantenerla en caso contrario. Averiguar:
a) La probabilidad de rechazar la hipótesis cuando en realidad es verdadera.
b) La probabilidad de mantener la hipótesis cuando en realidad hay un 70 por 100 de
parados.
© Ediciones Pirámide
Contraste de hipótesis / 175
3.17. Los habitantes de Niagara-Falls (Estados Unidos) corren el riesgo de sufrir taras
genéticas irremediables debidas a ciertos desechos químicos enterrados en el subsuelo. Las
autoridades proponen evacuar la ciudad si más de la quinta parte de la población presenta
anomalías cromosómicas.
Hace unas semanas se tomaron aleatoria e independientemente muestras de sangre de 36
habitantes, 11 de los cuales presentaron anomalías cromosómicas. Ante los datos obtenidos
en la muestra:
a) ¿A partir de qué nivel de significación se tomará la decisión de evacuar la población?
b) ¿Cuál es la potencia del contraste frente a la hipótesis de que la verdadera proporción
de afectados es de un tercio?
3.20. Consideremos una población en la que la variable aleatoria Y¡ se distribue N(µ, 15). Se
desea contrastar la hipóteis nula H 0 : µ = 30 frente a la alternativa H 0 : µ = 33, con una
muestra de tamaño 100. Deseamos que la probabilidad de mantener H 0 siendo verdadera
valga como mínimo 0,95.
a) ¿Cuál será el valor de rY.?
b) ¿Cuál será el valor de fJ?
e) ¿Cuál ha de ser el tamaño de la muestra para que, sin modificar rY., el valor de Pquede
reducido a la mitad?
SOLUCIONES
3.1. La e y la d.
(2) p
(4) 1 -(1.
(1) 1 -P
© Ediciones Pirámide
176 / Análisis de datos en psicología 11
3.5. O, 1651.
3.7. n = 47.
3.19. a) P(Z ~ 2,333) < 0,01; por tanto, rechazamos H 0 y concluimos que, con los datos
disponibles, existe evidencia suficiente para pensar que la media de la población
española es mayor que 100.
b) 1 - p = P(Z ~ 0,33) = 0,3707.
e) /1 = 395.
© Ediciones Pirámide