Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso 2022-2023
Índice
1 Introducción 2
5 Ejercicios 11
i
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
1 Introducción
En el tema anterior abordamos el problema de la estimación, tanto puntual como por intervalos.
En este tema nos centraremos en la otra gran tarea de la Inferencia Estadística, que consiste en
responder a preguntas concretas sobre parámetros de la población, por ejemplo, ¿la proporción de
población con miopía se encuentra en el 25%? ¿Es la edad media del profesorado de la USC superior
a 45 años?
Como vemos, estas preguntas se plantean en términos de una hipótesis que debemos aceptar o
rechazar, esta decisión la tomaremos basándonos en una realización muestral. Cuando los datos
muestrales discrepen mucho de la hipótesis de partida, en nuestro ejemplo, cuando la proporción
muestral de pacientes con miopía sea muy distinta del 25% o cuando la media muestral de edades
del profesorado sea muy superior a 45 años. rechazaremos la hipótesis. Veremos a continuación
cómo formalizar estas ideas.
Llamamos error de tipo I al que cometemos cuando rechazamos la hipótesis nula, siendo esta cierta;
y error de tipo II al que cometemos cuando aceptamos la hipótesis nula, siendo esta falsa. A partir
de estos errores se definen:
Nivel de significación: es la probabilidad del error de tipo I y la denotamos por Ó:
Debemos adoptar un criterio que, a partir de la muestra, nos permita decidir si aceptamos o rechaz-
amos la hipótesis nula. Obviamente, queremos minimizar las probabilidades de los errores de tipo I
y II. Pues bien, la forma de minimizar la probabilidad del error de tipo I (el nivel de significación) es
mediante un criterio que acepte H0 la mayor parte de las veces. Sin embargo, así se incrementa la
probabilidad del error de tipo II, esto es, disminuye la potencia del test. Una forma de proceder ante
un problema con dos objetivos como es éste, consiste en fijar el nivel de significación y escoger el
criterio que nos proporcione la mayor potencia posible.
El criterio de contraste suele estar basado en un estadístico de contraste, que es una operación que
se realiza sobre la muestra de modo que refleje si los datos muestrales son más compatibles con
2
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
la hipótesis nula o con la alternativa. Sobre la base del estadístico de contraste se construyen dos
regiones:
Región de rechazo o región crítica: si el estadístico de contraste cae en esta región, se rechaza la
hipótesis nula. Al haber fijado el nivel de significación Ó, hay que construir esta región de modo
que su probabilidad bajo H0 sea Ó, como mucho. Como Ó es una probabilidad pequeña, cuando
el estadístico cae en la región de rechazo, consideramos que hay pruebas significativas para
rechazar H0 y para demostrar estadísticamente Ha .
Región de aceptación: si el estadístico de contraste cae en esta región, se acepta la hipótesis nula.
Es simplemente el complementario de la región de rechazo. Cuando el estadístico cae en la
región de aceptación, consideramos que no ha habido pruebas suficientes para rechazar H0 y
por eso la aceptamos.
Al igual que ocurría con los intervalos de confianza, los contrastes se definen dependiendo del
parámetro sobre el que versen. Así, veremos contrastes para una proporción, y para una media y una
varianza en poblaciones Normales.
3
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
Sobre las regiones de aceptación y rechazo, sólo falta decidir los puntos de corte que las separan.
Pues bien, esto se hará respetando el nivel de significación, Ó. Supongamos que hemos determinado
ya Ó. Podemos buscar entonces z1−Ó/2 en la distribución Normal de forma que la región crítica tenga
probabilidad Ó, pues ésta sería la probabilidad de que, siendo p = p0 , el estadístico cayera en esa
región y en consecuencia se rechazara la hipótesis.
La forma de la región de rechazo depende, por lo visto anteriormente, del tipo de contraste, así
tenemos:
Otra alternativa para resolver el contraste sin necesidad de determinar la región de rechazo es
proporcionar la probabilidad que contendría una región crítica limitada por el valor observado del
estadístico. A esta probabilidad le llamamos nivel crítico o p-valor y viene a representar el mayor
nivel de significación que permite aceptar la hipótesis nula.
Así, un nivel crítico pequeño se interpreta como una prueba significativa de la alternativa, consid-
erándose pequeño en comparación con el nivel de significación al que se resuelva el contraste.
Ejemplo 1
Una empresa farmacéutica quiere comercializar un medicamento que cura cierta dolencia. Se sabe
que el 40% de los pacientes se curan sin tomar este medicamento. La empresa debe probar que
su medicamento es eficaz y para ello administra el medicamento a 100 pacientes, de los cuales se
curan 50. ¿Constituyen estos resultados una prueba significativa a un nivel del 5% de la eficacia del
medicamento?
Solución.
Definamos la variable aleatoria de interés X=‘‘¿Se cura el paciente?’’ que sigue una distribución Ber(p) con p
desconocido.
Es un problema de contraste sobre una proporción (p: proporción de pacientes que se curan).
4
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
Conclusiones
El valor del estadístico del contraste cae en la región crítica o de rechazo, por lo tanto, podemos considerar
demostrada estadísticamente la eficacia del medicamento. Hay pruebas estadísticamente significativas
que lo demuestran al nivel de significación del 5%.
Esta probabilidad se puede obtener de la tabla de la distribución N(0, 1). Entonces las pruebas son significativas
al 5% pero no lo son al 1%.
Ejemplo 2
En un ecosistema dos especies de aves A y B se encuentran en equilibrio, con igual proporción de
ambas. Se teme que los últimos acontecimientos hayan alterado el equilibrio, y para comprobarlo, se
toma una muestra de 1.600 aves, de las cuales 720 son de la especie A. ¿Podemos concluir que se ha
alterado el equilibrio a un nivel de significación del 1%?
Solución.
Definimos la variable aleatoria de interés X=‘‘¿Es el ave de la especie A?’’ que sigue una distribución Ber(p) (se
puede hacer un planteamiento análogo con la especie B).
Es un problema de contraste sobre una proporción (p: proporción de aves de la especie A).
Región crítica o de rechazo: RR = (−∞, −z1−Ó/2 )∪(z1−Ó/2 , +∞) = (−∞, −z0.995 )∪(z0.995 , +∞) = (−∞, −2.58)∪
(2.58, +∞).
Ejemplo 3
Las normas de calidad no permiten que la proporción de unidades defectuosas supere el 5%. Una
inspección toma una muestra de 400 unidades y encuentra 16 defectuosas. ¿Constituye este
resultado una prueba significativa a un nivel del 10% de que no se respeta la norma de calidad?
Solución.
Definimos la variable aleatoria de interés como X=‘‘¿es la pieza defectuosa?’’, que sigue una distribución Ber(p),
con p desconocido.
Es un problema de contraste sobre una proporción (p: proporción de unidades defectuosas).
5
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
Observación 1
Como comentario general, debemos ser muy cuidadosos en la formulación de las hipótesis nula y
alternativa, y en la redacción de las conclusiones.
Así, el contraste de hipótesis tiene dos resultados posibles:
Nunca diremos que se demuestra H0 , porque no se busca eso. Se acepta H0 sin pruebas que lo
demuestren, simplemente por falta de pruebas en su contra.
Sin embargo, con Ha es al revés. Para Ha sólo cabe demostrarla si hay pruebas significativas, o no
demostrarla cuando no hay pruebas significativas.
Si formulamos una hipótesis nueva que deseamos proponer a la comunidad, la ponemos como
alternativa, y buscamos pruebas que la demuestren. Si no hay pruebas suficientes (significativas),
simplemente retiramos la hipótesis.
Si cuestionamos una hipótesis ya aceptada por la comunidad, entonces la ponemos como nula, y
sólo si encontramos pruebas en su contra, proponemos su rechazo.
X1 , . . . , X n ∈ N(Þ, ã) independientes
6
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
Supongamos que la varianza ã 2 es conocida, y se desea contrastar una hipótesis relativa a la media.
En este caso el estadístico de contraste es:
X − Þ0
√ ∈ N(0, 1).
ã/ n
|x − Þ0 |
rechazamos H0 : Þ = Þ0 si √ > z1−Ó/2 .
ã/ n
x − Þ0
rechazamos H0 : Þ ≥ Þ0 si √ < −z1−Ó .
ã/ n
x − Þ0
rechazamos H0 : Þ ≤ Þ0 si √ > z1−Ó .
ã/ n
Podemos repetir toda la argumentación anterior, con la salvedad de que, cuando la varianza es
desconocida, no podemos usar ã y en su lugar debemos emplear un estimador adecuado, por ejemplo,
S c . Sabemos que este cambio afecta a la distribución, que pasa a ser T de Student.
En este caso, el estadístico de contraste es:
X − Þ0
√ ∈ Tn−1 .
Sc / n
|x − Þ0 |
rechazamos H0 : Þ = Þ0 si √ > tn−1,1−Ó/2 .
sc / n
x − Þ0
rechazamos H0 : Þ ≥ Þ0 si √ < −tn−1,1−Ó .
sc / n
x − Þ0
rechazamos H0 : Þ ≤ Þ0 si √ > tn−1,1−Ó .
sc / n
Ejemplo 4
En una población se ha observado una frecuencia elevada de miopía. Se piensa que quizá esta
población presente una mayor longitud axial, por encima del valor estándar de 24 mm. Para valorar
7
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
esta posibilidad, se ha determinado la longitud axial de 20 pacientes, con los resultados siguientes
(en mm):
23.5 24.6 26.5 23.0 28.3 27.9 22.4 22.8 21.8 24.7
23.4 23.7 25.3 24.8 26.0 22.9 25.7 24.2 22.1 25.3
¿Constituyen estos resultados una prueba significativa a un 5% de que la longitud axial media de la
población es mayor de 24 mm, asumiendo que la variable sigue una distribución Normal?
Solución.
Definimos la variable aleatoria de interés X=‘‘longitud axial’’(mm), que sigue una distribución N(Þ, ã).
Es un problema de contraste sobre la media con varianza desconocida.
Hipótesis nula: H0 : Þ ≤ 24
Hipótesis alternativa: Ha : Þ > 24 (lo que queremos demostrar)
Nivel de significación Ó = 0.05
Estadístico del contraste:
X − Þ0
T= √ ∈ T19 .
Sc / n
Región crítica o de rechazo: RR = (tn−1,1−Ó , +∞) = (t19,0.95 , +∞) = (1.73, +∞).
Conclusiones:
No existen evidencias significativas de que la media poblacional sea mayor que 24, por lo que aceptamos
la hipótesis nula y asumimos que la media poblacional es a lo sumo 24.
nS Þ2
∈ Xn2 .
ã 02
nS Þ2 nSÞ2
rechazamos H0 : ã 2 = ã 02 si > ç2n,1−Ó/2 o < ç2n,Ó/2 .
ã 02 ã 02
nSÞ2
rechazamos H0 : ã 2 ≥ ã 02 si < ç2n,Ó .
ã 02
8
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
nS Þ2
rechazamos H0 : ã 2 ≤ ã 02 si > ç2n,1−Ó .
ã 02
(n − 1)S c2 2
∈ Xn−1 .
ã 02
(n − 1)S c2 (n − 1)S c2
rechazamos H0 : ã 2 = ã 02 si > ç2n−1,1−Ó/2 o < ç2n−1,Ó/2 .
ã 02 ã 02
(n − 1)S c2
rechazamos H0 : ã 2 ≥ ã 02 si < ç2n−1,Ó .
ã 02
(n − 1)S c2
rechazamos H0 : ã 2 ≤ ã 02 si > ç2n−1,1−Ó .
ã 02
Ejemplo 5
En una muestra aleatoria de quince mujeres embarazadas, se analizó el líquido amniótico, en
concreto, la cantidad total de contenido proteínico (en gramos por 100 ml). Los resultados figuran a
continuación.
0.69 1.04 0.39 0.37 0.64 0.73 0.69 1.04 0.83 1.00 0.19 0.61 0.42 0.20 0.79
9
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
Ó
m 0.995 0.99 0.975 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.025 0.01 0.005
11 2.60 3.05 3.82 4.57 5.58 7.58 10.3 13.7 17.3 19.7 21.9 24.7 26.8
12 3.07 3.57 4.40 5.23 6.30 8.44 11.3 14.8 18.5 21.0 23.3 26.2 28.3
13 3.57 4.11 5.01 5.89 7.04 9.30 12.3 16.0 19.8 22.4 24.7 27.7 29.8
14 4.07 4.66 5.63 6.57 7.79 10.2 13.3 17.1 21.1 23.7 26.1 29.1 31.3
15 4.60 5.23 6.26 7.26 8.55 11.0 14.3 18.2 22.3 25.0 27.5 30.6 32.8
Conclusiones
Sí podemos afirmar, al nivel del 5%, que la varianza poblacional es mayor que 0.045, pues el estadístico
es mayor que el valor de corte (23.68), o también porque el nivel crítico es menor del 5%.
Pero si consideramos el nivel de significación del 1% la respuesta sería diferente: Aceptaríamos H0 al nivel
del 1%, pues el nivel críticoes mayor del 1%. Y observando la región crítica, el punto de corte ahora sería:
ç214,0.99 = 29.14, con lo cual, llegamos a la misma conclusión, el estadístico sería menor que dicho
punto de corte y no rechazaríamos H0 .
10
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
5 Ejercicios
1. En un servicio de odontología se sabe que el 22% de las visitas llevan una extracción dentaria
inmediata. En el último año, de 1500 visitas, 315 dieron lugar a una extracción inmediata.
¿Podemos afirmar, a un 5% de significación, que las cifras de este año son distintas de las
establecidas anteriormente? Sol. T=0.935 ; Región rechazo = (−∞, −1.96) ∪ (1.96, +∞); p-
valor=0.3472.
2. El calcio se presenta habitualmente en la sangre de los mamíferos en concentraciones con valo-
res en torno a 6 mg por cada 100 ml de sangre total, con una desviación típica de 1 mg/100ml.
Una variabilidad mayor que ésta puede ocasionar graves trastornos en la coagulación de la
sangre. Una serie de nueve pruebas realizadas sobre un paciente revelaron una media de 6.2
mg de calcio por cada 100 ml de sangre y una cuasidesviación típica de 2 mg de calcio por cada
100 ml de sangre. Asumiendo que la concentración de calcio sigue una distribución Normal,
¿hay pruebas significativas a un 5% de significación de que la desviación típica del nivel de
calcio sea más alta de la Normal? Sol. T= 32; Región rechazo = (15.5, +∞); p-valor< 0.005.
¿podemos afirmar a un nivel del 5% que la concentración media de calcio es de 6 mg/100ml?
Sol. T=0.27 ; Región rechazo =(−∞, −1.96) ∪ (1.96, +∞) ; p-valor∈ (0.6, 0.8).
3. Entre los pacientes con cáncer de pulmón, el 90% o más fallece generalmente en el espacio
de tres años. Como resultado de nuevas formas de tratamiento se cree que esta tasa se ha
reducido.
En un reciente estudio sobre 150 pacientes diagnosticados de cáncer de pulmón, 128 fallecieron
en el espacio de tres años. ¿Podemos afirmar a un nivel del 1% que los nuevos métodos de
tratamiento son más eficaces que los antiguos? Sol. T=-2.04 ; Región rechazo =(-∞,-1.96) ;
p-valor=0.02068.
4. Con objeto de mejorar la seguridad vial, se ha realizado un estudio sobre la capacidad visual de
los conductores. En una parte del estudio se plantea la preocupación de que la agudeza visual
de los conductores sea insuficiente. En concreto, se piensa que los conductores no deberían
presentar una agudeza visual inferior a 0.75 en escala Snellen.
Se ha medido la agudeza visual de diez conductores, con los resultados que figuran a contin-
uación (en escala Snellen).
0.75 0.65 0.63 1.25 0.80 0.66 0.50 0.80 0.40 1.30
Asumiendo que la agudeza visual así medida sigue una distribución Normal, ¿aportan estos
datos pruebas significativas a un 10% de significación de que la población de conductores
presenta una agudeza visual media inferior a 0.75? Sol. T=0.2596 ; Región rechazo = (-∞,-2.33)
; p-valor∈ (0.55, 0.6).
5. En el contexto del problema anterior, se piensa que quizá, más que por la agudeza visual media,
habría que preocuparse por el porcentaje de conductores que no alcanzan el umbral de 0.75.
Como los datos del problema anterior son escasos para valorar este porcentaje, se ha ampliado
el estudio hasta llegar a 150 conductores, de los cuales 20 presentaron una agudeza visual
inferior a 0.75. ¿Constituye este resultado una prueba significativa a un nivel del 5% de que
el porcentaje de conductores cuya agudeza visual es inferior a 0.75 es mayor del 10%? Sol.
T=1.225 ; Región rechazo =(1.65,+∞) ; p-valor=0.1093.
6. El exceso de presión intraocular puede derivar en los procesos patológicos conocidos como
glaucoma. La presión intraocular Normal se encuentra en torno a 15.5 mmHg, mientras que se
considera como hipertensión ocular los valores superiores a 21 mmHg.
Por otra parte, los valores de presión intraocular presentan una variación apreciable en un
mismo paciente a lo largo del día, lo cual se conoce como variación circadiana. También puede
haber variaciones debidas a otras causas, como la respiración, el pulso o los movimientos
oculares.
Se considera Normal una desviación típica en torno a 4 mmHg, mientras que una desviación
típica superior a 5 mmHg constituye un riesgo, pues implica que en ocasiones la presión es
11
Bioestadística e introducción a la investigación Tema 5. Contrastes de hipótesis
12.9 13.2 13.7 27.4 14.4 26.2 16.1 26.5 14.5 28.4 13.9 29.7
(a) ¿hay pruebas significativas de que este paciente presente una presión intraocular media
superior a 21 mmHg?, Sol. T=-0.6174 ; Región rechazo =(1.80,∞) ; p-valor> 0.5.
(b) ¿hay pruebas significativas de que la desviación típica de la presión intraocular de este
paciente supere los 5 mmHg? Sol. T=21.98 ; Región rechazo =(19.7,+∞) ; p-valor∈
(0.01, 0.025).
Como referencia se puede emplear el nivel de significación del 5% o del 1%, aunque es necesario
calcular e interpretar el nivel crítico.
12