Está en la página 1de 8

UNIVERSIDAD NACIONAL DE COLOMBIA

FACULTAD DE CIENCIAS-BIOESTADISTICA FUNDAMENTAL

PRUEBAS DE HIPOTESIS

María Alejandra Avendaño Luque


David Santiago Barbery Vaquiro
Paola Riaño García
Julián Tello Quiroz
Andrés Mateo Tache Victorino
1. ¿En qué consiste la teoría de pruebas de hipótesis en estadística? (1)
Una hipótesis se define simplemente como una proposición acerca de una o más poblaciones.
En general, la hipótesis se refiere a los parámetros de las poblaciones para las cuales se hace
una proposición. Por medio de la prueba de hipótesis se determina si tales proposiciones son
compatibles o no con los datos disponibles, los investigadores se interesan en dos tipos: de
investigación y estadísticas.
La hipótesis de investigación es la conjetura o suposición que motiva la investigación. La
hipótesis estadística se establece de tal forma que puede ser evaluada por medio de técnicas
estadística adecuadas. Las hipótesis de investigación conducen directamente a las hipótesis
estadísticas.
Pasos para la prueba de hipótesis.
1. Datos: es necesario comprender la naturaleza de los datos que forman base de los
procedimientos de prueba, ya que esto determina la prueba, ya que esto determina la prueba
particular que se ha de utilizar.

2. Supuestos (restricciones): diferentes suposiciones conducen a modificar los intervalos


de confianza. Lo mismo ocurre con las pruebas de hipótesis: un procedimiento general se
modifica según las suposiciones. De hecho, las mismas suposiciones que son importantes
en la estimación, también lo son para la prueba de hipótesis. Se ha visto que estas incluyen,
entre otras, suposiciones respecto a la normalidad de la distribución de la población,
igualdad de variancias e independencia de la muestra.

3. Hipótesis: en la prueba de hipótesis se trabaja con dos hipótesis estadísticas que deben
anunciarse explícitamente. La primera es la hipótesis que debe probarse, mejor conocida
como hipótesis nula, Y que se designa por el símbolo de 𝐻0 . La hipótesis nula a veces se
conoce como hipótesis de no diferencia, ya que es una proposición de conformidad con (o
sin diferencia respecto a) condiciones que se suponen ciertas en la población de interés. La
hipótesis nula se establece con el propósito de ser rechazada. EN consecuencia, el
complemento de la conclusión que el investigador desea alcanzar se convierte en el
enunciado de la hipótesis nula. En el proceso de prueba la hipótesis nula se rechaza o no se
rechaza. Si la hipótesis nula no se rechaza, se dirá que los datos sobre los cuales se basa la
prueba no proporcionan evidencia suficiente que se cause el rechazo. Si el procedimiento de
prueba conduce al rechazo, se concluye que los datos disponibles no son compatibles con la
hipótesis nula, pero sirven como apoyo a alguna otra hipótesis. La hipótesis alternativa,
identificada mediante el símbolo 𝐻𝐴 , es una proposición que se creerá cierta si los datos de
la muestra llevan al rechazo de la hipótesis nula. En general, la hipótesis alternativa y la
hipótesis de investigación son la misma, se utilizan los dos términos indistintamente.

4. Estadística de prueba: la estadística de prueba es alguna estadística que se puede


calcular a partir de los datos de la muestra. Como regla, existen muchos valores posibles
que puede asumir la estadística de prueba, y el valor particular observado depende de la
muestra particular extraída. La estadística de prueba sirve como un productor de decisiones,
ya que la decisión de rechazar o no la hipótesis nula depende de la magnitud de la
estadística de prueba.
Formula general para la estadística de prueba.

𝑬𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒂 𝒓𝒆𝒍𝒆𝒗𝒂𝒏𝒕𝒆 − 𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐 𝒔𝒖𝒑𝒆𝒔𝒕𝒐


𝑬𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒂 𝒅𝒆 𝒑𝒓𝒖𝒆𝒃𝒂 =
𝑬𝒓𝒓𝒐𝒓 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓 𝒅𝒆 𝒍𝒂 𝒆𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒂 𝒓𝒆𝒍𝒆𝒗𝒂𝒏𝒕𝒆

5. Distribución de la estadística de prueba: se ha señalado que la clave para la inferencia


estadística es la distribución muestral. Es necesario recordar esto en los casos en que sea
necesario especificar la distribución de probabilidad de prueba.

6. Regla de decisión: todos los valores posibles que la estadística de prueba puede asumir
son puntos sobre el eje horizontal de la gráfica de la distribución para esta estadística y se
dividen en dos grupos: la región de rechazo y la región de no rechazo. Aquellos que forman
parte de la región de rechazo son aquellos que tienen la menor probabilidad de ocurrir,
mientras que los que dormán la región de rechazo tienen la mayor probabilidad de ocurrir,
si la hipótesis nula es verdadera para ambas regiones.

7. Cálculo de la estadística de prueba: a partir de los datos contenidos en la muestra, se


calcula un valor de la estadística de prueba y se compara contra las regiones de no rechazo
y rechazo que ya fueron especificadas.

8. Decisión estadística: la decisión estadística consiste en el rechazo o no rechazo de la


hipótesis nula. Se rechazará si el valor calculado de la estadística de prueba cae en la región
de rechazo, y no se rechaza si el valor calculado de la estadística de prueba cae en la región
de no rechazo.

9. Conclusión: si 𝐻0 se rechaza, se concluye que 𝐻𝐴 es verdadera. Si 𝐻0 no sé rechaza, se


concluye que 𝐻0 puede ser verdadera

10. Valor de p: el valor de 𝑝 es una cantidad que indica qué tan insólitos son los resultados
de la muestra, considerando que la hipótesis nula sea verdadera. Un valor 𝑝 indica que no es
muy probable que los resultados de la muestra hayan ocurrido; ofrece la justificación para
dudar de la certeza de la hipótesis nula, si ésta es verdadera.
Es importante aclarar que cuando la hipótesis nula no es rechazada, tampoco se puede decir que se
acepta. Se debe decir que la hipótesis nula “no se rechaza “.
2. ¿Qué es el nivel de significancia en la teoría de pruebas de hipótesis? (1)
Es la probabilidad de rechazar como una hipótesis nula verdadera. El termino nivel de
significación refleja el hecho de que algunas veces la prueba de hipótesis recibe el nombre de
“prueba de significación”, y un valor calculado para la estadística de prueba que cae en la
región de rechazo se dice que es significativo. El nivel de significación 𝛼, designa el área bajo
la curva de la distribución de la estadística de prueba que ésta por encima de los valores, sobre
el eje horizontal, que constituyen la región de rechazo.
Dado que rechazar una hipótesis nula verdadera sería un error, parece razonable que se deba
hacer pequeña la probabilidad de cometerlo y, de hecho, esto es lo que se hace. Se elige un
valor pequeño de 𝛼 para hacer que la probabilidad de rechazo para una hipótesis nula sea
pequeña. Los valores que se encuentran con más frecuencia son 0.01, 0.05 y 0.10
¿En qué consiste el error tipo I y el error tipo II en la teoría de prueba de hipótesis?

 Error tipo I: Consiste en rechazar la hipótesis nula H0, cuando esta es verdadera. La
probabilidad de cometer este error se llama nivel de significancia de la prueba o . El
investigador deberá establecer  con el fin de evitar parcialidades.
 Error tipo II: Consiste en no rechazar la hipótesis nula H0, cuando esta es falsa.

Comúnmente, los niveles de significancia de una prueba de hipótesis toman valores como: 5% (0.05),
6% (0.06), 8% (0.08), 9% (0.09) o más bajos como 2% (0.02) o 1% (0.01). (2)
Caso de prueba de hipótesis acerca de una media o promedio poblacional μ y una varianza
conocida 𝝈𝟐
En este caso se consideran las inferencias acerca de la media μ de una sola población cuando se
conoce la varianza poblacional 𝜎 2 . Se parte del supuesto que se ha tomado una muestra aleatoria
𝑋1 , 𝑋2 , … . . , 𝑋𝑛 de la población. La media muestral X es un estimador puntual insesgado de μ. Los
supuestos restantes son mínimos: ya que la inferencia se basará en la media muestral , se supondrá
que la población tiene una distribución normal o bien que se cumplen las condiciones del teorema del
límite central. Por tanto, la distribución de es aproximadamente con media μ y varianza 𝜎 2 .
Prueba de hipótesis sobre la media
Suponga que quieren probarse la hipótesis:

𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0
Donde 𝜇0 es una constante dada. Se tiene una muestra aleatoria de 𝑋1 , 𝑋2 , … . . , 𝑋𝑛 de la población.
Puesto que tiene una distribución normal aproximada con media 𝜇0 y desviación estándar 𝜎, si la
hipótesis nula es verdadera, sería posible construir una región critica basada en el valor calculado de
la media muestral .
Suele ser más conveniente estandarizar la media muestral y utilizar un estadístico de prueba basado
en la distribución normal estándar. Es decir, en el procedimiento de prueba de 𝐻0 : 𝜇 = 𝜇0 se utilice
el estadístico de prueba
𝑥 − − 𝜇0
𝑍0 =
𝜎/√𝑛
Ecuación 1. Estadistica de prueba
Si la hipótesis nula es verdadera, entonces E(X)= 𝜇0 , y si sigue que la distribución de 𝑍0 es la
distribución normal estándar. Por consiguiente, si la hipótesis nula es verdadera, la probabilidad de
que el estadístico de la prueba 𝑍0 este entre −𝑍𝛼/2 y 𝑍𝛼/2 es 1 − 𝛼, donde 𝑍𝛼/2 es el punto porcentual
100𝛼/2 de la distribución estándar normal. Se observa que la probabilidad de que el estadístico de
la prueba 𝑍0 este en la región 𝑍0 > 𝑍𝛼/2 o 𝑍0 < −𝑍𝛼/2 es cuando 𝛼 cuando la hipótesis nula es
verdadera. Si una muestra que produzca un valor que este fuera de los rangos de la distribución, es
extraño si la hipótesis nula es verdadera, por lo tanto, se trata de un indicio de que la hipótesis es
falsa, así que la hipótesis debe rechazarse si 𝑍0 > 𝑍𝛼/2 y 𝑍0 < −𝑍𝛼/2 y no podrá rechazarse la
hipótesis si −𝑍𝛼/2 ≤ 𝑍0 ≥ 𝑍𝛼/2 .

 Rechazar la hipótesis nula si 𝑥 − > 𝑎 o 𝑥 − < 𝑏 donde


𝜎 𝜎
𝑎 = 𝜇0 + 𝑍𝛼/2 𝑛 𝑏 = 𝜇0 − 𝑍𝛼/2 𝑛 (3)
√ √
Ecuacion 2
Ejemplo
Un grupo de investigadores está interesado en conocer la edad media de cierta población. Por decirlo
así, se preguntan lo siguiente: ¿Se puede concluir que la edad media de una población es diferente de
30 años?

 Solución: se puede contestar que es posible concluir que la edad media de una población es
diferente de 30, solo si se puede rechazar la hipótesis nula que indica que la media es igual a
30.
1. Datos: los datos disponibles son las edades de una muestra aleatoria de 10 individuos
de la población. A partir de esto, se calcula que la media es igual a 27.
2. Supuestos: se supone que la muestra de valores proviene de una distribución
aproximadamente normal. Se supone que la población tiene una varianza conocida
igual a 20.
3. Hipótesis: la hipótesis nula es: la edad media de una población es igual a 30. La
hipótesis alternativa indica que la edad media es diferente de 30.
𝐻0 : 𝜇 = 30
𝐻1 : 𝜇 ≠ 30
4. Estadística de prueba: esta se obtiene a partir de la ecuación 1 descrita anteriormente.
5. Distribución de la estadística: se sabe que la estadística de prueba tiene una
distribución normal, con una media igual a 0 y una varianza de 1, si 𝐻0 es verdadera.
Dado que se extrajo una sola muestra de la población, se tiene solo uno de los valores
posibles en el que se apoya la decisión.
6. Regla de la decisión: esta regla indica si 𝐻0 debe ser rechazada si el valor calculado
de la estadística de prueba cae en la región de rechazo, y no se rechaza si el valor cae
en la zona de no rechazo. Toca especificar las magnitudes de la estadística de prueba
para determinar la región de rechazo. El valor extremo de la estadística de prueba
depende del tamaño de la probabilidad de cometer un error tipo I.
En este ejemplo 𝛼 = 0.5 y 𝛼/2 = 0.25. Se calcula el valor para establecer el rango
de rechazo, el cual es 1.96, eso quiere decir que para que la hipótesis nula no sea
rechazada debe estar entre -1.96 y 1.96.
7. Calculo de la estadística de prueba
27 − 30
𝑍= = −2.12
√20/10

8. Decisión estadística: se puede rechazar la hipótesis nula porque -2.12 está en la


región de rechazo.
9. Conclusión: se concluye que µ no es igual a 30 y que las acciones del grupo de
investigadores deberán estar de acuerdo con esta conclusión.
10. Valor de p: p es la probabilidad de obtener un valor más extremo del observado, si
la hipótesis nula es verdadera. En este caso p= 0.0340, esto quiere decir que la
probabilidad de obtener un valor tan extremo como 2.12, cuando la hipótesis nula
es verdadera, es de 0.0340. El valor de p para una prueba puede definirse como el
valor más pequeño de 𝛼 por el cual la hipótesis nula se puede rechazar.

Prueba de 𝑯𝟎 por medio de un intervalo de confianza


A continuación se muestra como se hubiera podido llegar a la misma conclusión del ejemplo anterior
mediante el uso de un intervalo de confianza de 100(1 − 𝛼) por ciento. El intervalo de confianza de
95 por ciento para μ es

27 ± 1.96 √20/10

27 ± 1.96(1.4142)
27 ± 2.7718
24.2282, 29.7718
Dado que este intervalo no incluye a 30, se dice que 30 no es un candidato para la media que se está
estimando y, por lo tanto, μ no es igual a 30 y se rechaza la hipótesis nula. Esta es la misma
conclusión a la que se llegó mediante el procedimiento de prueba de hipótesis.
Prueba de hipótesis unilateral: el intervalo de hipótesis ilustrado por el ejemplo anterior, es un
ejemplo de prueba bilateral, llamada así porque la región de rechazo se divide entre dos lados o
colas de la distribución de la estadística de prueba. Una prueba de hipótesis puede ser unilateral, en
cuyo caso toda la región de rechazo está en una u otra cola de la distribución. El que se utilice una
prueba unilateral o bilateral depende de la naturaleza de la cuestión planteada por el investigador.
Si tanto los valores pequeños como los grandes causan el rechazo de una hipótesis nula, lo indicado
es utilizar una prueba bilateral. Cuando únicamente los valores suficientemente “pequeños” o
suficientemente “grandes” causan el rechazo de la hipótesis nula, lo indicado es utilizar una prueba
unilateral. (1)
Referencias
1. Wayne D. Bioestadística. Base para el análisis de las ciencias de la salud. Cuarta edición.
Editorial Limusa. México, 2007.
2. Blair, C., Taylor, Richard., (2008) Bioestadística, México, Pearson Educación
3. Montgomery D.C. y Runger G.C., Probabilidad y Estadística aplicadas a la Ingeniería.
Segunda edición. Editorial Limusa Wiley – México, 2002 pág. 309-310

Caso de prueba de hipótesis acerca de una media o promedio poblacional μ y una varianza
desconocida. (1)
La aplicación de la t de Student tanto para los intervalos de confianza como para la prueba de hipótesis
se desarrolla bajo los siguientes supuestos. Las variables aleatorias X1 , X2 ,..., Xn representan una
muestra aleatoria de una distribución normal con μ y σ 2 desconocidas. Entonces, la variable aleatoria
𝑋−𝜇
√𝑛 𝑆
tiene una distribución t de Student con n – 1 grados de libertad.

Para la hipótesis bilateral.


H0 : μ = μ0 , H1 : μ ≠ μ0
rechazamos H a un nivel de significancia α cuando el estadístico t calculado:
𝑥−μ
𝑡 = 𝑠/ (2)
√𝑛

excede a t α/2,n - 1 es menor que –t α/2,n - 1 .

Ejemplo:
Los individuos estudiados fueron 14 adultos varones sanos representativos de un rango amplio de
pesos corporales. Una de las variables de medici6n fue el indice de masa corporal (IMC) = peso
(kg)/estatura2(m2). Los resultados se muestran en la tabla 1. Se pretende saber si es posible concluir
que la media del IMC para la poblaci6n de la que se extrajo la muestra no es 35.

 Solución: Se logrará concluir que la media de la poblaci6n no es 35 si los investigadores


pueden rechazar la hip6tesis nula que dice que la media de la poblaci6n es igual a 35.
1. Datos: Los datos consisten en las mediciones del IMC de los 14 individuos, tal como se
describi6 previamente.
2. Supuestos: Los 14 individuos constituyen una muestra aleatoria de una poblaci6n de
individuos con las mismas características.
3. Hipótesis.
Ho: μ = 35
H1: μ≠35
Tabla 1. IMC para varones descritos.

4. Estadística de prueba: Dado que se desconoce la variancia de la poblad6n, la estadística de


prueba se obtiene mediante la ecuación 2.
5. Distribución de la estadística de prueba: La estadística de prueba sigue una distribuci6n t de
Student, con n - 1 = 14 – 1=13 grados de libertad, si Ho es verdadera.
6. Regla de decisión: Sea a = .05. Dado que se tiene una prueba bilateral, se pone a/2 = .025 en
cada cola de la distribuci6n de la estadística de prueba. Los valores de tala derecha e izquierda
de los cuales está .025 del área son 2.1604, y -2.1604. Estos valores aparecen en la tabla de
distribución t- Student. La regla de decisi6n indica que es necesario calcular un valor para la
estadística de prueba y que se debe rechazar Ho si el valor de t calculado es mayor 0 igual que
2.1604 0 menor 0 igual que -2.1604.
7. Cálculo de la estadística de prueba: A partir de los datos de la muestra se calcula una media
igual a 30.5 y una desviaci6n estándar de 10.6392. AI sustituir estos datos en la ecuaci6n 2 se
tiene:
30.5 − 35
𝑡= = −1.58
10.6392/√14
8. Decisión estadística: No se rechaza Ho' ya que -1.58 cae en la regi6n de no rechazo.
9. Conclusión. La conclusión, con base en estos datos, es que la media de la población de la
cual se extrajo la muestra puede ser 35.
10. EI valor de p: EI valor exacto de p para esta prueba no se puede obtener de la tabla de
distribución t de Student debido a que solo presenta valores de t para percentiles seleccionados.
Sin embargo, el valor puede enunciarse como un intervalo. En este ejemplo, -1.58 es menor que
-1.350, el valor de t ala izquierda del cual está .10 del área bajo t con 13 grados de libertad, pero
mayor que -1.7709, a la izquierda del cual está .05 del área. En consecuencia, cuando Ho es
verdadera, la probabilidad de obtener un valor de t menor 0 igual que -1.58 es menor que .10,
pero mayor que .05. Es decir, .05 < p(t -1.58) < .10. Dado que la prueba es bilateral, debe
permitirse la posibilidad de un valor calculado de la estadística de prueba tan grande en la
direcci6n opuesta como el observado. La tabla E revela que .05 < p(t 1.58) < .10. EI valor de p,
entonces, es de .10 < P< .20.
Si en el ejemplo anterior la hip6tesis hubiera sido
Ho: μ ≥35
HA : μ < 35
el procedimiento de prueba habría conducido a una prueba unilateral con toda la regi6n de
rechazo en la cola inferior de la distribuci6n, y si la hip6tesis hubiera sido
Ho: μ≤ 35 HA: μ > 35
se habría tenido una prueba unilateral con toda la regi6n de rechazo en la cola superior de la
distribuci6n.

También podría gustarte