Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4 Contraste de hiptesis
2
Ejemplo: Existen diferencias estadsticamente significativas en la puntuacin media de
hombres y mujeres en la prueba X de orientacin espacial
He : X Mujeres X Hombres
3
(4) La variabilidad de las puntuaciones en la escala de inteligencia de Weschler es distinta para
los asiticos y para los europeos.
(5) Los esquizofrnicos tienen mayor capacidad en el reconocimiento de patrones visuales
repetitivos que los que no estn diagnosticados de esta patologa.
(6) Existe algn tipo de relacin entre el nivel de inseguridad y la agresividad de las personas.
1.3. La lgica del contraste de hiptesis
El contraste de hiptesis representa un desarrollo de la estadstica inferencial que permite, a partir
de la obtencin de informacin en muestras, poner a prueba hiptesis a nivel poblacional.
Obviamente, no tendr sentido su aplicacin cuando se tenga acceso a la informacin poblacional,
caso en el que la verificacin de la He es inmediata.
Ejemplo: Sea el caso de la hiptesis En el actual plan de estudios de la licenciatura de
Psicologa de la UVEG, el rendimiento acadmico (notas) en las asignaturas de 2 es mayor que
en las de 1, cuyo contraste se va a plantear segn la He: Notas 2 > Notas1 . Cmo se llevara a
cabo en la prctica?
La comprobacin de He sera inmediata cuando se dispusiese de de las notas de 1 y 2 para
todos los estudiantes en el actual plan de estudios: bastara con obtener la nota media en ambas
poblaciones y comparar ambas medias. Esto no es lo ms habitual en la prctica, as que en el
caso en que slo dispusisemos de las notas para una muestra de estudiantes -dos en realidad,
una muestra de estudiantes de 1 y otra de 2-, habra que plantear el contraste hiptesis
derivado de la aplicacin de la estadstica inferencial que permita inferir si esas 2 medias son
diferentes a nivel poblacional.
El modo de proceder en el contraste de hiptesis se sustenta sobre la lgica falsacionista, esto es, se
asume a priori que es cierta la hiptesis que plantea la relacin contraria a la planteada en la He. A
esta hiptesis se le suele denominar como hiptesis nula (Ho) dado que en la misma se recoge la
igualdad o inexistencia de relacin entre los atributos implicados en la He; por su parte, a esta ltima
se le suele denominar tambin como hiptesis alternativa (H1), dada su complementariedad con la Ho.
Ambas hiptesis son exhaustivas, en tanto que recogen todos los posibles resultados, y mutuamente
excluyentes.
4
Ejemplos para las hiptesis formuladas anteriormente,
He: Notas 2 > Notas1
5
obtenidos a partir de los datos recogidos en una muestra: (1) el basado en la realizacin de pruebas de
significacin estadstica (muy divulgado y utilizado, sigue siendo la estrategia implementada por la
mayora de los paquetes estadsticos y la que tiene ms presencia en las publicaciones cientficas); (2)
el basado en la utilizacin de intervalos de confianza (ms intuitivo e informativo, su divulgacin en
la docencia de la estadstica, as como su aparicin en las publicaciones cientficas, se va extendiendo
de forma paulatina). Ambos permiten tomar una decisin sobre el mantenimiento o el rechazo de la
Ho y, en consecuencia, sobre el apoyo o no a la He.
A continuacin se va a describir el fundamento de ambas aproximaciones, as como su aplicacin en
la realizacin de algunos de los contrastes de hiptesis ms utilizados. En temas sucesivos, sin
embargo, se volcar la atencin hacia la estrategia basada en pruebas de significacin, no por una
mayor predileccin hacia la misma, sino por ser coherentes con la mayor presencia de stas en
programas informticos y publicaciones.
2.1. Contraste de hiptesis basado en pruebas de significacin
El contraste de hiptesis basado en pruebas de significacin consiste en calcular la probabilidad de
que se d un resultado como el obtenido en la muestra, partiendo del supuesto de que es cierto lo que
aparece expresado en la Ho. Si esa probabilidad, conocida como nivel de significacin (P o Sig), es
muy pequea se rechaza la Ho y se acepta la He. El valor por debajo del cual se considera lo
suficientemente pequea esa probabilidad es una convencin en la prctica de la estadstica, es
denominado o nivel de riesgo, y se establece generalmente en 0,05 o 0,01. En consecuencia, la
prueba de significacin conduce a un rechazo de la Ho siempre que P < .
En la prctica de la ejecucin de una prueba de significacin, la obtencin del nivel de significacin
(P o Sig) asociado al resultado obtenido en una muestra para un determinado estadstico (por
ejemplo, el valor de la media aritmtica de una variable), asumiendo que la Ho es cierta, supone:
1) Transformar ese resultado muestral de acuerdo a una expresin conocida como estadstico
de contraste, de los que existe un amplio repertorio adecuado a los distintos parmetros que
pueden aparecer implicados en una He.
2) Dicho estadstico es una variable aleatoria que tiene una distribucin muestral que se ajusta
a un patrn conocido, suponiendo que es cierta la Ho. Las distribuciones muestrales para los
Estadstica Inferencial en Psicologa
Mara F. Rodrigo, J. Gabriel Molina
Curso: 2010-2011
6
estadsticos de contraste ms utilizados se ajustan a las siguientes distribuciones de
probabilidad: la curva normal, la distribucin binomial, la distribucin ji-cuadrado, la
distribucin t y la distribucin F. Para estas distribuciones existen tablas que se pueden
encontrar en los apndices de la mayora de los libros de Estadstica.
3) Obtener, en la tabla estadstica que se corresponda con la distribucin muestral del
estadstico de contraste utilizado, el nivel de significacin (Sig), es decir, la probabilidad
asociada al valor del estadstico de contraste obtenido en la muestra.
H e : X > k H o : X k (contrasteunilateral )
H e : X k H o : X = k (contrastebilateral )
H e : X < k H o : X k (contrasteunilateral )
2. Explorar si la proporcin emprica obtenida en la muestra parece apoyar, en principio, la
hiptesis estadstica planteada. Si no la apoya no tiene sentido continuar y se mantendra la Ho. El
resultado puede resultarnos de inters a la hora de plantear hiptesis estadsticas ms afinadas en el
futuro.
3. Se obtiene el siguiente estadstico de contraste (este estadstico no es ms que la tipificacin del
valor de la proporcin obtenido en la muestra, tal y como se ilustrar en el siguiente ejemplo):
z=
pk
k (1 k ) n
7
estadstico de contraste o ms extremo, esto es, el nivel de significacin (P o Sig). Multiplicar por
dos el valor obtenido si el contraste que se lleva a cabo es bilateral, esto es,
Sig (bilateral) = Sig (unilateral) 2
5. Decisin: se mantiene la Ho si Sig > , se rechaza la Ho si Sig < .
(contraste unilateral)
z=
0, 65 0, 40
= 2, 27
0, 40 0, 60
20
P [ E ( pXi )] = 0, 40 ;
Xi
[ EE ( pXi )] =
PXi
0, 40 0,60
= 0,11
20
La proporcin obtenida en la muestra (p=0,65) es una de entre todas las que se podran haber
obtenido y pertenece a la distribucin normal anterior. Por tanto, si queremos obtener cul es
la probabilidad de obtener, en una muestra determinada, una proporcin como la que hemos
obtenido slo tenemos que estandarizar esta proporcin (transformarla en una puntuacin z)
para poder utilizar las tablas de la distribucin normal unitaria o estandarizada. As pues, el
estadstico de contraste anterior no es ms que la tipificacin de la proporcin obtenida en la
muestra utilizando como distribucin de referencia la que tericamente se obtendra si es
cierta la Ho.
4. El nivel de significacin (P o Sig) se obtiene de las tablas de la distribucin normal
estandarizada y es igual a:
Sig = P( z 2,27 ) = 0,0116
La interpretacin de Sig es la siguiente: Si la Ho es cierta, esto es, si en la poblacin de
colegios pblicos de Espaa hay, como mximo, una proporcin de 0,40 que tienen pizarras
digitales, la probabilidad de obtener en una muestra de 20 colegios de esa poblacin una
proporcin de 0,65 o superior es de 0,0116. En consecuencia, es poco verosmil la Ho, los
datos empricos no la apoyan.
5. Decisin: dado que 0,0116 < 0,05 se rechaza la Ho y se mantiene, en consecuencia, la
hiptesis alternativa de que la proporcin de colegios con pizarra digital es superior a 0,4.
Ntese que si hubiera fijado en 0,01, la decisin hubiera sido mantener la Ho dado que
0,0116 > 0,01.
La siguiente figura ilustra el desarrollo de la prueba de significacin estadstica para el ejemplo
anterior:
9
POBLACIN DE SUJETOS
t = 0.4
Muestreo aleatorio
Muestra 1
Muestra 2
Muestra j
p1=0.5
p2=0.3
pj=0.25
3.5
EE =
0.4 0.6
= 0.109
20
Probabilidad
3
2.5
2
1.5
1
0.5
0
p
0
z=
0.1
0.2
0.3
=0.4 0.5
p=0.65
0.8
0.9
Ejemplo con SPSS a partir de los datos obtenidos con el Cuestionario de Vida Acadmica:
La proporcin de mujeres entre los estudiantes de Estadstica en Psicologa de la UVEG en una
muestra de n = 174 sujetos de dicha materia y titulacin es de 0,816. Sabiendo que la
proporcin de mujeres entre los estudiantes de Estadstica en Psicologa de la Universidad
10
Complutense de Madrid (UCM) es del 80% Podemos afirmar que la proporcin de mujeres en
la poblacin de estudiantes de Estadstica de la UVEG es distinta con =0.05?
He: (UVEG) 0,80 Ho: (UVEG) = 0,80 (contraste bilateral);
p = 0,816; n=174;
EE ( p) =
Prueba de significacin: z =
0.80 0.20
= 0,03
174
sexo
Grupo 1
Grupo 2
Total
Categora
Mujer
Hombre
N
142
32
174
Proporcin
observada
,816
,184
1,0
Prop. de
prueba
,8
Sig. asintt.
(unilateral)
,337a
Sig. exacta
(unilateral)
,337
a. Basado en la aproximacin Z.
Nota: El resultado obtenido con SPSS no coincide exactamente con el obtenido al realizar la
prueba de significacin. Para obtener con el programa la significacin bilateral hay que
multiplicar por dos la significacin unilateral: (P = 0,3372) = 0,674
11
1. Se decide el nivel de riesgo () que se desea asumir en el contraste de hiptesis y se plantean las
hiptesis estadstica y nula. Tres posibles hiptesis en este caso:
H e : X > k H o : X k (contrasteunilateral )
H e : X k H o : X = k (contrastebilateral )
H e : X < k H o : X k (contrasteunilateral )
2. Explorar si la media emprica obtenida parece apoyar, en principio, la hiptesis estadstica
planteada. En caso contrario, no tiene sentido continuar con los siguientes pasos del contraste de
hiptesis y se mantendra la Ho. El resultado puede resultarnos de inters a la hora de plantear
hiptesis estadsticas ms afinadas en el futuro.
3. Se calcula uno de los dos siguientes estadsticos de contraste:
- En el caso de ser conocida la varianza en la poblacin: Z = X k
X
n
12
2. El resultado muestral ( X = 5,1 ) parece apoyar, en un principio, la hiptesis de que la media
de letras recordadas no es de 4,5.
3. Clculo del estadstico de contraste:
zX =
X k
X
n
5,1 4,5
= 2,14
1, 4
25
1, 4
= 0, 28
25
Ho: (UVEG) = 22
Prueba de significacin:
EE ( X ) =
t=
5,06
= 0,384
174
21,15 22
= 2, 21
0,384
13
Estadsticos para una muestra
N
edad
174
Media
21,15
Desviacin
tp.
5,060
Error tp. de
la media
,384
edad
t
-2,217
gl
173
Sig. (bilateral)
,028
Diferencia
de medias
-,851
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1,61
-,09
14
IC95%( )
No contiene t en su recorrido
Estadsticamente significativo
Se rechaza la H0 y se acepta la He
Estimaciones puntuales de
Valor terico t bajo la H0
IC95%( )
Contiene t en su recorrido
Estadsticamente no significativo
Se mantiene la H0 y se rechaza la He
Losilla y cols. (2005): Contraste de hiptesis en base al intervalo de confianza del parmetro poblacional.
Ejemplo de contraste de hiptesis acerca de una media poblacional: Diferentes trabajos sobre
memoria icnica han mostrado que el promedio de letras recordadas por sujetos normales en
presentacin taquistoscpica durante 1 segundo es de 4,5 letras ( = 4,5 letras). Sin embargo, un
grupo de investigadores sospecha que tal afirmacin puede no ser correcta y, a fin de comprobarlo,
selecciona a una muestra de 35 sujetos a los que se les aplica la citada tarea, obtenindose un
promedio de palabras recordadas de 5,1 ( X = 5,1 letras), con una cuasi-desviacin tpica de 1,4 (sx =
1,4 letras).
1. Nivel de riesgo () = 0,05, o lo que es lo mismo, un nivel de confianza (1- ) = 0,95
He : 4,5 Ho : = 4,5
sX
1,4
2. IC (1 )( X ) = X z1 2
15
El rechazo de la Ho en un contraste de hiptesis depender fundamentalmente del grado de
discrepancia entre el enunciado de la Ho y el resultado muestral. Ahora bien, una misma discrepancia
puede ser estadsticamente significativa o no en funcin de factores como: el tamao de la muestra, el
riesgo de error fijado a priori para el contraste y que este contraste sea unilateral o bilateral.
Estimacin puntual de
IC95% (n grande)
Error estndar pequeo
Asociado a muestras grandes
Muchos resultados significativos
IC95% (n pequea)
Error estndar grande
Asociado a muestras pequeas
Pocos resultados significativos
Losilla y cols. (2005). Relacin entre la significacin estadstica, la magnitud de la diferencia observada y el tamao muestral.
16
considerar que hay una mejora en la puntuacin en la prueba para los estudiantes que reciben
orientacin vocacional?
x = 190 Contraste de hiptesis: = 0,05
H e : X > 190
H o : X 190
Supnganse los dos casos siguientes en que slo vara el tamao de muestra considerado:
Caso 1
Muestra A:
n = 30
X = 195
S X' = 24
Muestra B:
n = 100
X = 195
S X' = 24
Muestras A, B, C y D: X = 195
H e : X > 190
H o : X 190
S X' = 24
Muestra A (n = 30)
Muestra B (n = 100)
Muestra C (n = 170)
Muestra D (n = 240)
Por otra parte, la prueba de significacin tambin se ve influida por el tamao de la muestra ya que,
al disminuir el EE de la distribucin muestral del estadstico (media o proporcin), aumentar el
valor del estadstico de contraste y, en consecuencia, disminuir el valor de Sig.
Se ha planteado alguna estrategia alternativa a la decisin dicotmica de considerar la relacin
planteada en la Ho como estadsticamente significativa o no (o sea, rechazo de la Ho vs.
mantenimiento de la Ho). Una de ellas se basa en la utilizacin de indicadores de tamao del efecto,
esto es, un tipo de indicador continuo (no dicotmico) de la magnitud de la diferencia o de la relacin
planteada en la Ho y que tiene la particularidad de no estar influido por el tamao de la muestra.
17
Un problema asociado a los mismos viene determinado a la hora de establecer una decisin relativa a
la magnitud de esos ndices (cundo se puede decir que es pequeo, o grande, el valor de los
mismos?).
3.2. Otros factores
El rechazo de la Ho en un contraste de hiptesis depender tambin del riesgo de error fijado a
priori para el contraste y de que este contraste sea unilateral o bilateral. As, por ejemplo, si al
contrastar una determinada Ho se obtiene que P=0,03, sta se rechazar si = 0,05, pero no si fijamos
el valor = 0,01.
En cuanto a que el contraste sea unilateral o bilateral si, por ejemplo, al realizar el contraste de una
hiptesis unilateral obtenemos que P = 0,03 se rechazara Ho (siendo = 0,05), pero si el contraste
anterior fuera bilateral el valor P sera igual a 0,06 (0,032) y la decisin sera mantener la Ho
(siendo = 0,05). As pues, un contraste bilateral es siempre ms conservador que un contraste
unilateral, de manera que si una hiptesis se rechaza siendo el contraste bilateral, tambin se
rechazara si fuera unilateral, pero no a la inversa.
18
1998 se decidi evaluar la eficacia de dicha campaa, para lo que se seleccion al azar una muestra
de 70 sujetos afectos de esquizofrenia, de quienes se obtuvo el porcentaje que representaba el
consumo real de frmacos respecto al consumo dictado por el terapeuta, es decir, la adherencia al
tratamiento. Se hall que, la media de la dosis prescrita que tomaban los sujetos era del 76%, con una
cuasi-desviacin tpica de 15.
x = 71
Muestra: n = 70
X = 76
S X' = 15
H e : X > 71 H o : X 71
X = 76
S X' = 15
H e : X > 71 H o : X 71
- Si se considerase, por los motivos que sea, que c = 1 (una unidad por encima del parmetro
de referencia), entonces, aparte de una diferencia estadsticamente significativa, podremos decir
que la diferencia es relevante en la prctica (y, por tanto, relevante el efecto de la campaa
informativa).
19
70
71
75
c=1
76
c=3
80
c=10
- Si, por ejemplo, se considera como criterio de relevancia prctica c = 10, entonces,
tendramos una diferencia que sigue siendo estadsticamente significativa pero que no es
relevante en la prctica.
- Y, como ltimo ejemplo, en el caso que se considerase c = 3, nada cambia respecto a la
significacin estadstica, pero no se podra afirmar nada respecto a la significacin prctica,
tan slo decir que el resultado es no concluyente al respecto y sugerir que se repita el estudio
y, a poder ser, con un mayor tamao muestral a fin de incrementar la precisin del intervalo
de confianza.
Como se deriva de la exposicin anterior, aunque IC y prueba de significacin son dos
procedimientos alternativos que nos permiten tomar una decisin sobre el rechazo o no de la Ho, la
aproximacin basada en el IC es ms informativa ya que, adems, nos permite estimar el valor del
parmetro poblacional de inters y, por tanto, valorar la relevancia prctica del resultado obtenido en
el estudio.
Ejercicio 3 (basado en el enunciado del ejercicio de la orientacin vocacional y la prueba de
madurez con una muestra de tamao n = 100, media muestral 195 y cuasi-desviacin tpica 8). De
acuerdo a los resultados del contraste de hiptesis, sealar cul es la significacin estadstica y
prctica en cada uno de los cuatro casos siguientes:
(1) Los tericos de la madurez consideran como un efecto relevante de la formacin en
orientacin vocacional, que en la media de la prueba de madurez haya una mejora de dos
puntos.
(2) haya una mejora de cuatro puntos.
(3) haya una mejora de seis puntos.
(4) haya una mejora de ocho puntos.
Estadstica Inferencial en Psicologa
Mara F. Rodrigo, J. Gabriel Molina
Curso: 2010-2011
20
x = 190
Muestra: n = 100
X = 195
S X' = 8
H e : X > 190
H o : X 190
Decisin correcta
Se rechaza la Ho
Error Tipo I
Se mantiene la Ho
Error Tipo II
Se rechaza la Ho
Decisin correcta
P = 1-
Verdadera
Ho
Falsa
P =
P =
P = 1-
21
stos, mayor es tambin (1). El clculo de la potencia es facilitado por el programa SPSS slo para
algunas pruebas de contraste de hiptesis.
Referencias
Pardo, A. y San Martn, R. (1998). A nlisis de datos en psicologa II (2 ed.). Madrid: Pirmide.
Losilla, J. M., Navarro, B., Palmer, A., Rodrigo, M. F., y Ato, M. (2005). Del contraste de hiptesis
al modelado estadstico. Documenta Universitaria. [www.edicionsapeticio.com]