Está en la página 1de 7

ORIENTADORA 10

SOCIOMEDICA 3
En el día de hoy se estudiará la prueba de hipótesis como uno de los procedimientos empleados para la ayuda
a la toma de decisiones en torno a una población a partir de una muestra obtenida de ella.

Con el estudio de estos contenidos ustedes podrán identificar los elementos a tener en cuenta para el
planteamiento de una prueba de hipótesis estadística así como reconocer su importancia para las
investigaciones clínicos epidemiológicos.

Como es conocido por ustedes, la estadística tiene dos ramas la descriptiva y la inferencial:

Estadística descriptiva: es aquella que se ocupa de:


 La recolección
 Organización
 Resumen
 Presentación de la información. (mediante tablas y gráficos.)

Estadística inferencial: es un conjunto de procederes estadísticos que permiten extraer conclusiones


generales para toda la población a partir del estudio de una muestra, proveniente de ella.

Existen dos formas de hacer Inferencia Estadística:

1) La estimación de parámetros poblacionales, que permite estimar un parámetro a partir de los datos de
una muestra.

2) Las pruebas de hipótesis las que tienen como propósito ayudar al médico, investigador o administrador
a tomar una decisión entorno a una población al examinar una muestra de ella.

La prueba de hipótesis o contraste de hipótesis, como también se le conoce, es un procedimiento estadístico


que puede aplicarse ante situaciones en las que exista una suposición establecida relativa a una característica
de la población bajo estudio, es decir, existe una hipótesis y la misma necesita ser comprobada.

Por ejemplo si una población responde bien a un determinado medicamento y se desea conocer que si con un
tratamiento nuevo se puede tener un porcentaje de mejoría mayor con él, o cuando nos planteamos si los niños
de distintas comunidades tienen la misma talla.

Las pruebas de hipótesis ayudan al médico o investigador a tomar una decisión en torno a un parámetro
poblacional, mediante a una muestra aleatoria obtenida de esa población, es aquí donde radica su importancia
para la investigación clínica epidemiológica.

Ahora bien, ¿qué se entiende por Hipótesis?

Una hipótesis, se define como una proposición acerca de una o más poblaciones.
Los investigadores se interesan en dos tipos de hipótesis: las de investigación y las estadísticas.

Las primeras son aquellas suposiciones o conjeturas que motivan la investigación, estas conducen
directamente a las segundas, las que se establecen de forma tal que pueden ser evaluadas por medio de
procedimientos estadísticos.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones para
los cuales se hace la proposición, se refiere a parámetros como:

 Medida poblacional (µ)


 La proporción poblacional (P), entre otros.

Por medio de las pruebas de hipótesis se determina si tales proposiciones permiten ser contrastadas con los
datos disponibles en la muestra.

1
Es importante que tengan en cuenta que las hipótesis son siempre enunciados relativos a la población bajo
estudio, no enunciados entorno a la muestra.

El valor de los parámetros de la población especificado en la hipótesis suele determinarse de cuatro


maneras:

I. Puede obtenerse de la experiencia o conocimientos pasados del proceso.


II. Por una experiencia previa.
III. A partir de una teoría con respecto al objeto que se estudia.
IV. Como resultado de consideraciones experimentales ya publicadas.

Por ejemplo se tiene por estudios anteriores que la prevalencia de la hipertensión arterial en una población
determinada es de un 30%, este es el valor del parámetro de la población que se especificará en la hipótesis.

La prueba de hipótesis siempre estará integrada por la hipótesis nula y la hipótesis alternativa, ambas forman
una unidad y deben enunciarse de manera explícita.

Estas reflejan de alguna manera la idea a priori, o sea la idea que se tiene antes de iniciar la investigación, es
decir, la hipótesis de investigación la que se pretende contrastar con la realidad, lo que significa refutar con
hechos algo que se considera verdadero.

La hipótesis nula, se designa como H subcero (Ho) y es una suposición sobre una o más características de la
población, es una afirmación contraria a la hipótesis del investigador, es la que debe probarse, es decir,
aceptarse o rechazarse durante la prueba.

Mientras que la hipótesis alternativa, representada por H subuno (H1), es la suposición contraria a la
hipótesis nula (Ho), se plantea en correspondencia con la hipótesis del investigador, es lo que el investigador
quiere demostrar.

La hipótesis nula se rechaza a favor de la alternativa sólo si los resultados de la prueba favorecen la evidencia
de que los datos de la muestra sugieren que la hipótesis nula Ho es falsa. Es decir con los datos de la muestra
debemos probar mediante un test que la hipótesis nula es falsa.
Si con los datos de la muestra el resultado de la prueba no rechaza la hipótesis nula se continúa creyendo en la
validez de ésta.

Ustedes se preguntarán, ¿Como se realiza una prueba de hipótesis? Para ello se debe seguir una serie
de pasos los cuales son:

1) Formulación de la hipótesis: consiste en declarar la hipótesis nula y la hipótesis alternativa,


En dependencia de la formulación de la hipótesis alternativa será el tipo de prueba de la hipótesis que
se trabajará, es decir de una cola o de dos colas.
Una prueba es de dos colas o bilateral cuando no se establece una dirección específica de la hipótesis
alternativa. Por ejemplo si la hipótesis alternativa fuera ң: µ ≠ µn′ en esta hipótesis no se plantea si la
media poblacional es mayor (>) o menor (<) que lo general conocido µo´ el mismo describe el gráfico
siguiente:
Prueba de hipótesis de una cola H1 >

H1 <

Prueba de hipótesis de dos colas H1 ≠

2) Elección de la prueba estadística: la selección de la prueba estadística es el segundo paso del


procedimiento de la prueba de hipótesis.
Las pruebas estadísticas pueden ser de dos tipos:
-Las pruebas paramétricas son aquellas que se emplean cuando las variables son cuantitativas
continuas y las suposiciones son sobre parámetros poblaciones como es el caso de la prueba de
hipótesis sobre la media poblacional miu o sobre la proporción poblacional P.

2
-Las no paramétricas son aquellas cuyo modelo no específica las condiciones de los parámetros de la
población de las que se extrajo la muestra, las hipótesis en este caso, no se plantean sobre
parámetros poblacionales. Se emplean para variables cualitativas aunque también pueden usarse en
cuantitativas continuas, un ejemplo de esta es el Chi cuadrado (X²) que será estudiado mas adelante.

3) Especificar el nivel de significación: este es el valor máximo de probabilidad que se está dispuesto a
aceptar para rechazar la hipótesis nula (Hn) cuando ésta es verdadera. Se acostumbra a denotar este
valor por la letra griega alfa (α).
El nivel de significación por ende, es seleccionado a priori por el investigador. Es importante usar una
cifra pequeña, los valores que con más frecuencia se utilizan son 0.05 y 0.01, aunque también pueden
emplearse valores mayores lo que estará en dependencia del tipo de investigación y el tamaño de la
muestra.
¿Que significa el valor alfa de 0.05?, ello quiere decir que podemos correr el riesgo de haber
rechazado la hipótesis nula con un 5% de error de que esta fuera verdadera.
Cuanto mayor sea el valor de alfa es más probable que rechacemos la hipótesis nula equivocadamente
o sea que aceptamos como cierta la hipótesis alternativa cuando realmente no lo es.
Durante el proceso de la prueba de hipótesis, aparecen implícitamente, diferentes tipos de errores que
se pueden cometer durante éste procedimiento. Estos errores pueden ser de dos tipos:
El error de tipo I (alfa) (α): se define como la probabilidad de rechazar la hipótesis nula Hn cuando
ésta es verdadera y observen que coincide con el nivel de significación alfa (α) de la prueba.
El error tipo II (beta) ( β): se define como la probabilidad de no rechazar la hipótesis nula Hn cuando
ésta es falsa y se denota por la letra griega beta (β).
De la probabilidad con la que estemos dispuestos a asumir estos errores, dependerá, por ejemplo, el
tamaño de la muestra requerida para la investigación.

4) La elección y cálculo del estadígrafo de la prueba con su distribución muestral asociada:


consiste en determinar cuál es la distribución muestral del estadígrafo de la prueba.
El estadígrafo, es un valor que se calcula utilizando los datos de la muestra y se utiliza para determinar
si se rechaza o no la hipótesis nula, al ser comparado su valor con el valor crítico.
Tengan presente que cada estadígrafo tiene asociado un valor de probabilidad (P).
Es importante que tengan en cuenta además que el investigador tiene que decidir en relación al test
estadístico a emplear que estará en dependencia del:

 Tipo de variable.
 Del tamaño de la muestra.
 El objeto de la investigación.

Para el caso de la prueba de hipótesis de la media poblacional y cuando la desviación estándar (sigma
σ) es conocida se utiliza como estadígrafo el valor de Z calculado, que sigue una distribución normal
estándar, cuya formula siguiente:
Z calculado= (x̃ - µo) / (σ / √n).
Donde (x) barra es la media de la muestra, miú subcero (µo) es lo general conocido, sigma (σ) es la
desviación estándar y (n) el tamaño de la muestra.
Ahora bien, sucede que en la práctica, la mayoría de las veces no se conoce el valor de la desviación
estándar poblacional, es decir, el valor de sigma (σ); en este caso para la determinación de la prueba
de hipótesis acerca de la media poblacional de una sola población se debe utilizar su estimador puntual,
o sea, la desviación estándar muestral ese (s) para el calculo del estadígrafo, el que sustituiría a
sigma en la formula, la que quedaría de la siguiente forma:

Z calculado= (x̃ - µo) / (σ / √n).


Z calculado= (x̃ - µo) / (s / √n).

Teniendo en cuenta el tamaño de la muestra se puede tener dos situaciones para la aplicación de la
prueba de hipótesis cuando sigma no se conoce para la media poblacional:
a) Cuando el tamaño de3 la muestra es mayor o igual que 30 se procede como se acaba de
explicar para el cálculo del estadígrafo, se utilizará Z calculada.
b) Cuando el tamaño de la muestra n es menor que 30, se utilizaría como estadígrafo el t
calculado que sigue una distribución t de Student, que no es objeto de estudio en esta
asignatura.

3
5) Definir la región de rechazo: es el conjunto de valores que conducen a rechazar la hipótesis nula Hn.
Cuando se supone que la variable se distribuye normalmente utilizaríamos el estadígrafo Z, en este
caso la región Región
críticade o de rechazo queda definida
Región de al seleccionarse por el investigador el nivel de
rechazo
significación alfa (α), como lo siguiente: rechazo

Región del no

α α

Z µo

En este grafico las regiones sombreadas corresponde a la región crítica o de rechazo de la hipótesis
nula (Ho) que queda definida al seleccionarse el nivel de significación alfa (α), como ya se explicó.
Como la prueba es bilateral cada región crítica o de rechazo tiene el valor de α dividido por 2. observen
que alfa dividido por 2 representa un área bajo la curva de la distribución normal estándar, que como conocen
representa un valor de probabilidad.
El área de la curva que se encuentra en las regiones críticas corresponde a la región de rechazo.
Si alfa es igual a 0,05 los valores de alfa dividido por 2 son igual a 0.025, corresponden a las áreas
sombreadas, y representan la zona o región de rechazo de la hipótesis nula, este valor de área bajo la curva se
corresponde con un valor de Z crítico en la tabla de la distribución normal estándar de 1,96, como se trata de
una prueba de hipótesis de dos colas, el valor en el gráfico es más menos 1,96.

Región de α = 0,05 α Región de


rechazo
rechazo

0,025 Región del no 0,025


α/2 α/2
rechazado

µo

Z= -1,96 Z= 1,96

6) Tomar la decisión correspondiente, en dependencia del valor de la prueba: para la regla de decisión
de la prueba de hipótesis se debe partir del conocimiento, que todos los valores posibles que el
estadígrafo de prueba puede asumir, constituyen puntos sobre el eje horizontal del gráfico de la
distribución de dicho estadígrafo, y se divide en dos grupos: los valores de la región de no rechazo de la
hipótesis nula (Hn) y los de la región crítica o de rechazo de la hipótesis nula (Ho).
En el anterior, la regla de decisión señala que se debe rechazar la hipótesis nula (Ho) si el valor del
estadígrafo de prueba, calculado a partir de los datos obtenidos en la muestra, es uno de los valores de
la zona de rechazo, y que no se debe rechazar en caso contrario.

REGLA DE DECISIÓN

Región de
Región de
rechazo
rechazo

Región del no

rechazado
4
µo

Si el valor absoluto del estadígrafo calculado, es decir, el estadígrafo de la prueba, es mayor o


igual que el valor crítico, se rechazaría la hipótesis nula pues caería en la zona de rechazo de la misma.
Por ejemplo si el valor de Z calculado en la prueba de hipótesis de la media poblacional miu
fuera de menos 2.25, con alfa igual a 0.05, el valor de Z crítico es más menos 1.96, el valor absoluto de
Z calculado, es decir, 2.25, se ubicaría en la región de rechazo de la hipótesis nula como se observa en
el gráfico, por lo que se rechazaría la misma.

Frecuencia

Región de Región de
rechazo rechazo

Región del no

rechazado

µo
α = 0,05 α
Z= -1,96 Z= 1,96

Z calculado -2.25 Z calculado 2.25

Otra forma de aplicar la regla de decisión es utilizado el valor de P es decir, la probabilidad


asociada al estadígrafo Z calculado, el mismo suele usarse con mayor frecuencia que el valor del
estadígrafo, incluso se exige en la publicación de artículos científicos de muchos editores,
aunque las conclusiones son equivalentes con ambas pruebas.
En este caso se compara el valor de P con el valor del nivel de significación prefijado, como se
observa en el gráfico, y además en el gráfico la P representa el área bajo la curva, que como pueden
apreciar se encuentra en la zona de rechazo.
Este valor se puede obtener de las tablas de distribución normal estándar, pero los programas
estadísticos de computación suelen darlo con exactitud.
Como ya se mencionó cada estadígrafo tiene asociado un valor de probabilidad P.

Frecuencia
Región de Región de
rechazo rechazo

Área Región del no Área

rechazado

µo
α = 0,05 α
Z crítico Z crítico

Z calculado Z calculado

Otra regla de decisión para una prueba de hipótesis de 2 colas o bilateral tomando en cuenta la
probabilidad P asociada al estadígrafo sería:

5
 Si p ≤ α se rechaza la hipótesis nula Ho a ese nivel de significación de alfa (α).
 Si p > α no se rechaza la hipótesis nula Ho a ese nivel de significación de alfa (α).
Por ejemplo para Z igual a menos 2.25 la p seria igual a .0.0244 y α es igual a 0.05.
Como p es igual a (0.0244) ≤ menor que 0.05 se rechaza la hipótesis nula Hn con un nivel de significación
de alfa de 0.05.
Esta decisión coincide con la anterior donde se comparan los resultados del Z calculado con el Z crítico.

7) Formular la conclusión a la que se arribe: las conclusiones de una prueba de hipótesis bebemos
expresarlas en términos de rechazo o no rechazo de la hipótesis nula y son avaladas por los resultados
obtenidos a partir de los estadígrafos muéstrales y por los resultados de la prueba de hipótesis,
dependerán además del tipo de investigación.

Resumen sobre la decisión en relación a la hipótesis nula.

Decisión sobre Hn
Si Ho es: verdadera No rechazar acción correcta Rechazar error de tipo I (α)
Si Ho es: falsa No rechazar error de tipo II (β) Rechazar acción correcta
o Es importante ser muy cuidadoso a la hora de dar conclusiones e interpretaciones.
o La decisión estadística no debe interpretarse como definitiva, ella sólo es parte de la evidencia que
influye sobre la decisión investigativa o clínica.
o La estadística es una ciencia que ayuda a decidir pero no decide en el campo de la investigación clínico
epidemiológica.
o La toma de decisiones del investigador no depende solamente del resultado de la prueba estadística.

Procedimiento de la prueba de hipótesis.


 Formular la hipótesis.
 Seleccionar la prueba estadística.
 Escoger el nivel de significación alfa.
 Definir la región de rechazo.
 El cálculo del estadígrafo de la prueba.
 Toma de la decisión correspondiente.
 Formular la conclusión relativa a la prueba de hipótesis

EJEMPLO se ha determinado que, en general el nivel de colesterol en sangre sigue una distribución normal
con media poblacional miu (µ) de 5,2 mmol/L y desviación estándar poblacional sigma (σ) de 1,02 mmol/L.
Un grupo de investigadores de un Instituto de Enfermedades Cardiovasculares realizo un estudio en
una prueba aleatoria de 150 individuos de esa misma población que consumen una dieta rica en vegetales y
practican de forma sistemática ejercicios físicos, determinándose que el nivel promedio muestral (equis barra
superior) del nivel de colesterol en sangre en dicho conjunto de personas es de 3,8 mmol/L.
Se quiere saber por parte del investigador si los individuos cuya ingesta está compuesta sólo por
vegetales no tienen el nivel de colesterol en sangre de 5,2 mmol/L, que representa lo general conocido.

Apliquemos el procedimiento de prueba de hipótesis al ejemplo anterior.

De los datos del problema se tiene que:


 Tamaño de la muestra (n):150.
 Desviación estándar poblacional (σ): 1,02 mmol/L.
 Media muestra: 3,8 mmol/L.
 General conocidos: 5,2 mmol/L.

Primero se debe formular la hipótesis. Como se trata de una prueba de hipótesis estadística sería:
o Hipótesis nula Ho: la media poblacional miu µ de los vegetarianos es = µo 5,2 mmol/L.
o Hipótesis alternativa H1: la media poblacional miu µ de los vegetarianos es desigual ≠ a 5,2
mmol/L.
Ahora se procede a seleccionar la prueba estadística, en este caso es una prueba paramétrica pues
estamos en presencia de una variable cuantitativa continua y la hipótesis se ha planteado en función de la
media poblacional, miu.

6
El tercer paso sería proceder a fijar el nivel de significación que en nuestro ejemplo es igual a 0.05, cuyo
valor con respecto a la Z crítica en la distribución normal es de 1.96.
La elección y cálculo del estadígrafo de la prueba con su distribución muestral asociada, es el cuarto
paso del procedimiento de la prueba de la hipótesis como ya saben.
Como vimos anteriormente es estadígrafo es un valor que se calcula utilizando los datos de la muestra
y se utiliza para determinar si se rechaza o no la hipótesis nula, al ser comparado su valor con valor crítico, para
el ejemplo que nos ocupa el estadígrafo es Z calculado que sigue una distribución normal estándar, cuya
fórmula se muestra a continuación:
Z calculado= (x̃ - µo) / (σ / √n).
X̃: 3,8 mmol/L
µo: 5,2 mmol/L
σ: 1,02 mmol/L
n: 150

Sustituyendo en la formula de Z calculado se obtiene menos 16,8 lo que nos da el valor del estadígrafo de la
prueba.
Como ya sabemos el valor de significación fijado para esta prueba fue alfa igual a 0.05 y su valor de Z crítico es
de más menos 1.96, lo cual nos define la región crítica o de rechazo de la hipótesis nula.

Para la regla de decisión, que sería el sexto paso, comparamos el Z calculado con el Z crítico, como
pueden observar el valor absoluto de Z calculado es de 16.8 el cual es mayor que el valor de Z crítico que es
1,96, por lo que estaría ubicado en la zona de rechazo de la hipótesis nula.
Recuerden que la regla de decisiones se puede formular en función de la probabilidad correspondiente
al estadígrafo, como sabemos la probabilidad P asociada al área de la curva del estadígrafo Z calculado para
este ejemplo es 0.0012, siendo este valor menor que alfa igual a 0.05, por lo que se arriba a la misma
conclusión anteriormente expresada.
Como último paso del procedimiento de la prueba de hipótesis ante estos resultados en el ejemplo, se
concluye, que se rechaza la hipótesis nula con un nivel de significación alfa de 0.05.
La utilidad de los resultados de la prueba de hipótesis en el ejemplo anterior nos permiten desde el
punto de vista clínico epidemiológico inferir por los resultados de la misma que el nivel de colesterol en el grupo
de individuos que consumen una dieta rica en vegetales y practican ejercicios físicos de manera sistemática
difiere del encontrado en la población general, con una media inferior a ésta.
Reiteramos que es importante ser muy cuidadosos a la hora de dar conclusiones e interpretaciones.
Además, la decisión estadística no debe interpretarse como definitiva, ella solo es parte de la evidencia que
influye sobre la decisión investigativa o clínica.

En relación a las pruebas de hipótesis acerca de una proporción poblacional.

Se realizan casi de la misma forma utilizadas para las medias poblacionales cuando se cumplen las
suposiciones necesarias para cada caso.
Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situación particular.
Las hipótesis se enuncian de manera similar al caso de la media poblacional (µ), pero utilizando las
proporción poblacional (P).

También podría gustarte