Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tipos de hipótesis.
Los investigadores se interesan en dos tipos de hipótesis: de investigación y
estadísticas.
DEFINICIÓN
DEFINICIÓN
1. Datos. Es necesario comprender la naturaleza de los datos que forman la base de los
procedimientos de prueba, ya que esto determina la prueba particular que se ha de
utilizar. Se debe determinar, por ejemplo, si los datos constan de conteos o medidas.
Cuando las hipótesis son del tipo considerado en este estudio, el indicador de igualdad debe aparecer
en la hipótesis nula. Por ejemplo, suponga que se requiere responder a la pregunta: ¿Se puede
concluir que la media de una población es diferente de ? La hipótesis nula es:
Suponga
que se desea saber si puede concluirse que la media de la población es mayor que . Se tiene
la hipótesis:
En resumen, es posible establecer las siguientes reglas empíricas para decidir qué proposición se
utiliza como hipótesis nula y cuál como hipótesis alternativa.
Donde es un valor supuesto de la media de una población. Esta estadística de prueba está
relacionada con la estadística
Estadística de prueba =
el error estándar de .
5. Distribución de la estadística de prueba. Se ha señalado que la clave para la inferencia
estadística es la distribución muestral. Es necesario recordar esto en los casos en que sea
necesario especificar la distribución de probabilidad de la estadística de prueba. Por
ejemplo, la distribución de la estadística de prueba
sigue una distribución normal estándar si la hipótesis nula es verdadera y si satisface las
suposiciones.
6. Regla de decisión. Todos los valores posibles que la estadística de prueba puede asumir
son puntos sobre el eje horizontal de la gráfica de la distribución para la estadística y se
dividen en dos grupos: uno de ellos constituye lo que se conoce como región de rechazo y
el otro forma la región de no rechazo. Los valores de la estadística de prueba que forman la
región de rechazo son aquellos que tienen la menor probabilidad de ocurrir, mientras que
los que forman la región de no rechazo tienen la mayor probabilidad de ocurrir, si la
hipótesis nula es verdadera para ambas regiones. La regla de decisión señala que se debe
rechazar la hipótesis nula si el valor de la estadística de prueba que se calcula a partir de la
muestra es uno de los valores de la región de rechazo, y que no se debe rechazar la
hipótesis nula si el valor calculado de la estadística de prueba es uno de los valores de la
región de no rechazo.
Nivel de significación. La decisión en cuanto a qué valores van a la región de rechazo y
cuáles van hacia la región de no rechazo se toma con base en el nivel de significación
deseado, designado por . El término nivel de significación refleja el hecho de que algunas
veces la prueba de hipótesis recibe el nombre de «prueba de significación», y un valor
calculado para la estadística de prueba que cae en la región de rechazo se dice que es
significativo. El nivel de significación , designa el área bajo la curva de la distribución de la
estadística de prueba que está por encima de los valores, sobre el eje horizontal, que
constituyen la región de rechazo.
DEFINICIÓN
nivel de significación es una probabilidad y, de hecho, es la probabilidad de rechazar una
El
hipótesis nula verdadera.
Dado que rechazar una hipótesis nula verdadera sería un error, parece razonable que se
deba hacer pequeña a la probabilidad de cometerlo y, de hecho, esto es lo que se hace. Se
elige un valor pequeño de para hacer que la probabilidad de rechazo para una hipótesis
nula sea pequeña. Los valores que se encuentran con más frecuencia son .
Tipos de errores. El error que se comete cuando se rechaza una hipótesis nula verdadera
se conoce como error tipo I. El error del tipo II se comete cuando no se rechaza una
hipótesis nula falsa. La probabilidad de cometer un error del tipo II se designa con .
Siempre que se rechaza una hipótesis nula se tiene el riesgo de cometer un error del
tipo I, al rechazar una hipótesis nula verdadera. Siempre que no se rechaza una hipótesis
nula, existe el riesgo de no rechazar una hipótesis nula falsa. En general, aunque se de un
valor pequeño a no se ejerce control sobre , aunque se sabe que en la mayoría de las
situaciones prácticas es mayor que .
Nunca se sabe si se ha cometido o no uno de estos errores cuando se rechaza o no se
rechaza una hipótesis nula, ya que se desconoce el verdadero estado de las cosas. Si el
procedimiento de prueba conduce al rechazo de la hipótesis nula, puede ser un consuelo
el hecho de que al dar un valor pequeño a la probabilidad de cometer un error del tipo I
también es pequeña. Si no se rechaza la hipótesis nula, no se conoce el riesgo concurrente
de cometer un error del tipo II, ya que por lo común se desconoce , pero como se ha
señalado, en la mayoría de situaciones prácticas, se sabe que es mayor que .
Condiciones en las
que es posible
cometer un error
del tipo I o un error
del tipo II.
Cálculo de la estadística de prueba. A partir de los datos contenidos en la muestra, se
7.
calcula un valor de la estadística de prueba y se compara contra las regiones de no rechazo
y rechazo que ya fueron especificadas.
10. Valor de . El valor de es una cantidad que indica qué tan insólitos son los resultados de
la muestra, considerando que la hipótesis nula sea verdadera. Un valor de indica que no es
muy probable que los resultados de la muestra hayan ocurrido; ofrece la justificación para
dudar de la certeza de la hipótesis nula, si esta es verdadera.
Es importante aclarar que cuando la hipótesis nula no es rechazada, tampoco se puede
decir que se acepta. Se debe decir que la hipótesis nula «no se rechaza». Se evita el uso de
la palabra «aceptar» en este caso porque pudiera haberse cometido el error de tipo II.
Dado que, frecuentemente, la probabilidad de cometer un error de tipo II puede ser
realmente alta, no se pretende cometerlo al aceptar la hipótesis nula.
PRUEBA DE HIPÓTESIS PARA LA MEDIA
DE UNA SOLA POBLACIÓN.
Evaluar los datos
Formular la regla
de decisión
Revisar las
suposiciones
Calcular la
estadística de
Formular la prueba
hipótesis
Seleccionar la Formular la
No
estadística de decisión Rechazar
rechazar
estadística
prueba
Determinar la
distribución de la Concluir que Concluir que es
estadística de puede ser verdadera
prueba verdadera
Muestreo a partir de poblaciones con distribución normal y varianza conocidas. Como
se hizo notar en la clase anterior, nuevamente se destaca que las situaciones en las que la
variable de interés sigue una distribución normal con variancia conocida son casos poco
comunes. El siguiente ejemplo, sin embargo, sirve para ilustrar el procedimiento.
Ejemplo 1.
Solución.
Veamos…
Datos. Los datos disponibles para los investigadores son las edades de una muestra
1.
aleatoria simple de individuos, extraída de la población de interés. A partir de esta
muestra se calcula que la media es .
DEFINICIÓN
Dado que este intervalo no incluye a , se dice que no es un candidato para la media que se
está estimando, y por lo tanto, no es igual a y se rechaza a . Esta es la misma conclusión a
la que se llegó mediante el procedimiento de prueba de hipótesis.
Si el parámetro supuesto, , se hubiera incluido en el intervalo de confianza de , se habría
dicho que no se rechaza en el nivel de de significación. En general, cuando se prueba una
hipótesis nula por medio de un intervalo de confianza bilateral, se rechaza a en el nivel de
significación si el parámetro supuesto no está contenido dentro del intervalo de confianza de
por ciento. Si el parámetro supuesto está contenido dentro de dicho intervalo, no es posible
rechazar en el nivel de significación.
Prueba de hipótesis unilateral. El intervalo de hipótesis ilustrado en el ejemplo 1 es un
ejemplo de prueba bilateral, llamada así porque la región de rechazo se divide entre los
dos lados o colas de la distribución de la estadística de prueba. Una prueba de hipótesis
puede ser unilateral, en cuyo caso toda la región de rechazo está en una u otra cola de
distribución. El que se utilice una prueba unilateral o bilateral depende de la naturaleza de
la cuestión planteada por el investigador.
Si tanto los valores pequeños como los grandes causan el rechazo de una hipótesis nula, lo
indicado es utilizar una prueba bilateral. Cuando únicamente los valores suficientemente
«pequeños» o suficientemente «grandes» causan el rechazo de la hipótesis nula, lo
indicado es utilizar una prueba unilateral.
Ejemplo 2.
Con base en el ejemplo 1, en lugar de preguntarse la posibilidad de concluir que , suponga
que los investigadores se hubieran preguntado: ¿Es posible concluir que ? La respuesta a
esta pregunta es que puede llegarse a esta conclusión si es posible rechazar la hipótesis
nula .
Solución.
Mediante el uso del procedimiento de diez pasos y con base en una prueba unilateral se
llega a una decisión.
1. Datos. Ver el ejemplo anterior.
3. Hipótesis.
cual, cuando es verdadera, sigue una distribución de Student con grados de libertad. El
la
siguiente ejemplo ilustra el procedimiento de prueba de hipótesis cuando se supone que
la población sigue una distribución normal y se desconoce la variancia. Esta situación es
muy común en la vida real.
Ejemplo 3.
Los investigadores Castillo y Lillioja describieron una técnica, desarrollada por ellos,
para la canulación linfática periférica en seres humanos. Los autores afirman que su
técnica simplifica el procedimiento y permite la recolección de volúmenes convenientes
de linfa para estudios metabólicos y cinéticos. Los individuos estudiados fueron adultos
varones sanos representativos de un rango amplio de pesos corporales . Una de las
variables de medición fue el índice de masa corporal . Los resultados se muestran en la
tabla siguiente. Se pretende saber si es posible concluir que la media del IMC para la
población de la que se extrajo la muestra no es .
TABLA. Índice de
masa corporal (IMC),
mediciones para los
individuos varones
descritos en el
presente ejemplo.
Solución.
Datos. Los datos consisten en las mediciones del IMC de los individuos, tal como se
1.
describió previamente.
3. Hipótesis.
Regla de decisión. Sea . Dado que se tiene una prueba bilateral, se pone en cada
6.
cola de la distribución de la estadística de prueba. Los valores de a la derecha e
izquierda de los cuales está del área son y . Estos aparecen en la tabla t-Student. Las
regiones de rechazo y de no rechazo se muestran en la siguiente figura.
−2.1604
2.1604
La regla de decisión indica que es necesario calcular un valor para la estadística de prueba y que se
debe rechazar si el valor de calculado es mayor o igual que o menor o igual que .
Cálculo de la estadística de prueba. A partir de los datos de la muestra se calcula una
7.
media igual a y una desviación estándar de . Al sustituir estos datos en la ecuación
se tiene…
Cálculo el valor
de para el
presente
ejemplo.
se habría tenido una prueba unilateral con toda la región de rechazo en la cola superior
de la distribución.
Muestreo a partir de una población que no presenta una distribución normal. Si, como
ocurre con frecuencia, la muestra en la cual se basa la prueba de la hipótesis acerca de la
media de una población proviene de una población que no presenta una distribución
normal, y si la muestra es grande (mayor o igual que ), es posible utilizar el teorema del
límite central y usar como la estadística de prueba. Si no se conoce la desviación estándar
de la población, la práctica común es utilizar la desviación estándar de la muestra como
una estimación. La estadística de prueba para la prueba de la hipótesis nula entonces, es
objetivos de un estudio de los investigadores Wilbur et al. eran descubrir los estados
Los
menopáusicos, los síntomas, la energía utilizada y la condición física aeróbica en
mujeres de edad madura, y además, determinar las relaciones entre estos factores.
Entre las variables medidas estaba el consumo máximo de oxígeno . La calificación
media de para una muestra de mujeres fue de con una desviación estándar de
(Fuente: Family and Community Health, Vol. 13:3, p.73, Aspen Publishers, Inc., ©). Se
pretende saber si, con base en estos datos, es posible concluir que la calificación media
para la población de mujeres con estas características es mayor que .
Solución.
dice que los datos proporcionan suficiente evidencio para concluir que la media de la
Se
población es mayor que si puede rechazarse la hipótesis nula que dice que la media es
menor o igual que . Para tal fin, puede llevarse a cabo la siguiente prueba:
1. Datos. Los datos son las puntuaciones de para las mujeres con y .
Supuestos. Los datos constituyen una muestra aleatoria simple de una población de
2.
mujeres de edad madura con las características similares a las que se presentan en la
muestra. Se considera que la mediciones de siguen una distribución normal en tal
población.
3. Hipótesis.
5. Distribución de la estadística de prueba. En virtud del teorema del límite central, la
estadística de prueba sigue, en el peor de los casos, una distribución aproximadamente
normal con si es verdadera.
Regla de decisión. Sea . El valor crítico de la estadística de prueba es de . Las
6.
regiones de rechazo y de no rechazo se ilustran en la siguiente figura. Se rechaza si se
calcula .
Resuélvalo en Excel.
Procedimientos para otras condiciones.
Si Según lo que desearan concluir los investigadores, los datos obtenidos se podrán
utilizar para pruebas unilaterales o bilaterales, con la región de rechazo en la cola
inferior de la distribución.
Cuando se prueba una hipótesis respecto a una sola media de una población, se puede
utilizar la figura siguiente para decidir rápidamente se la estadística de prueba es o .
(*) Se emplea un procedimiento no paramétrico.
Aplicación 1.
Para cada uno de los siguientes ejercicios utilizar el procedimiento de prueba de
hipótesis de los pasos para los niveles de significación dados. Para cada ejercicio, donde
sea conveniente, explique la razón por la cual se escogió el tipo de prueba: unilateral o
bilateral.
Los investigadores Bertino et al. condujeron un estudio para examinar los datos
1.
recolectados correspondientes a la farmacocinética de la gentamicina en tres
poblaciones mayores de 18 años: pacientes con leucemia aguda, pacientes con otros
padecimientos malignos no leucémicos y pacientes sin enfermedad maligna oculta o
fisiopatologías distinta de la insuficiencia renal que se sabe alteran la farmacocinética
de la gentamicina. Entre las estadísticas reportadas por los investigadores estaba el
valor como media inicial calculada de la depuración de creatina, con una desviación
estándar de para una muestra de pacientes con enfermedad maligna distinta de la
leucemia. Se pretende saber si es posible concluir que la media para la población de
individuos que presenta el mismo cuadro patológico es menor que . Sea .
Uno de los estudios de los investigadores Klesges et al. tiene como propósito averiguar
2.
los factores asociados con las discrepancias entre los niveles de carboxihemoglobina y el
estado de tabaquismo autodeclarado. Una muestra de no fumadores autodeclarados
presentó un nivel medio de carboxihemoglobina de con una desviación estándar de . Se
pretende saber si es posible concluir que la media de la población es menor que . Sea .
Los siguientes datos se refieren a los niveles de presión intraocular (en mm Hg)
3.
registrados en una muestra de individuos de edad avanzada:
La prueba de hipótesis que involucra la diferencia entre las medias de dos poblaciones se
utiliza con más frecuencia para determinar si es razonable o no concluir que las dos son
distintas entre sí. En tales casos, se puede formular una u otra de las siguientes, hipótesis:
Muestreo a partir de poblaciones que siguen una distribución normal con varianza
conocida.
Cuando cada una de las muestras aleatorias simples e independientes son extraídas de una
población que sigue una distribución normal con varianza conocida, la estadística de
prueba para la hipótesis nula de las medias iguales de dos poblaciones es
Muestreo a partir de poblaciones que siguen una distribución normal con varianza
desconocida.
Tal como se dijo anteriormente, cuando las variancias poblacionales no se conocen,
existen dos posibilidades. Las variancias de dos poblaciones pueden ser iguales o pueden
ser diferentes. La estadística de prueba para es
Muestreo a partir de poblaciones que no presentan distribución normal.
Cuando el muestreo se realiza a partir de poblaciones que no presentan distribución
normal, es posible utilizar los resultados del teorema del límite central si el tamaño de las
muestras es grande (por ejemplo, ). Esto permite el uso de la teoría normal pues la
distribución de la diferencia entre las medias de las muestras será aproximadamente
normal. Cuando se extraen dos muestras aleatorias simples independientes de gran
magnitud de una población que no sigue una distribución normal, la estadística de prueba
para es
cual, cuando es verdadera, sigue una distribución normal estándar. Si se conocen las
la
variancias de las poblaciones, se utilizan; pero si se desconocen, como suele ocurrir, se
usan como estimaciones las variancias de las muestras, que por necesidad se basan en
muestras grandes.
Aplicación 2.
equipo de investigadores desea saber si los datos que han recolectado proporcionan la
Un
evidencia suficiente para indicar una diferencia entre las concentraciones medias de ácido
úrico en el suero de individuos normales e individuos con síndrome de Down. Los datos
consisten en las lecturas de ácido úrico en el suero de individuos con síndrome de Down y
individuos sanos. Las medias son y respectivamente. Con una varianza igual a para la
población con síndrome de Down, y de para la población sana. Ambas muestras aleatorias
simples han sido extraídas de una población que sigue una distribución normal.
Aplicación 3.
artículo publicado por Becker et al. en la revista American Journal of Health Promotion
Un
describe el desarrollo de una herramienta para medir las barreras para promover la salud
entre personas discapacitadas. Los autores afirman que los problemas de barreras
sobresalen especialmente de personas discapacitadas que las experimentan en situaciones
como: empleo, transporte, alojamiento, educación, seguros de vida, acceso
arquitectónico, programas subtitulados y actitudes de la sociedad. Los estudios sugieren
que las mediciones de las barreras pueden mejorar la comprensión de los profesionales de
salud respecto a la probabilidad de que la gente participe en varias conductas o actividades
de promoción de la salud, y probablemente sean un constructo importante en la
evaluación de conductas de salud de las personas discapacitadas. Para medir este
constructo, los investigadores desarrollaron la Escala de barreras en las actividades de
promoción de la salud en personas discapacitadas. Se obtuvieron los siguientes resultados
al aplicar la escala a una muestra de discapacitados (D) y a personas no discapacitadas
(ND):
Se pretende saber si es posible concluir, con base en estos resultados, que, en general, las
personas con discapacidad, en promedio, califican más alto en la escala de barreras.