Está en la página 1de 4

UNIVERSIDAD DE

GUAYAQUIL
FACULTAD DE CIENCIAS
TAREA 6
Nombre: Daniela Irene Castro Loor
Fecha: 06/09/2022

Una mirada al valor de p en investigación


Este artículo ofrece elementos y conceptos que serán de ayuda para identificar y
entender los componentes de una prueba de hipótesis, interpretar adecuadamente los
valores de p, reconocer las ventajas que tiene el uso de intervalos de confianza frente a
los valores de p, diferenciar entre significación estadística y significación clínica en una
prueba de hipótesis y reconocer la importancia del cálculo del tamaño de la muestra.

Según las variables del estudio y los datos obtenidos de cada uno se plantean hipótesis
que pueden ser corroboradas mediante pruebas estadísticas. Los valores de p indican el
uso de pruebas de hipótesis en los parámetros de las poblaciones de interés. A partir de
los resultados de las muestras seleccionadas en un estudio, se derivan conclusiones para
las poblaciones de interés.

Estadísticamente, el desarrollo de una prueba de hipótesis requiere plantear dos


enunciados excluyentes que se refieran al parámetro que se desea evaluar, denominados
hipótesis nula e hipótesis alterna. La hipótesis nula recibe su nombre por afirmar la
inexistencia de asociación o de diferencia; mientras que la hipótesis alterna corresponde
a la negación de la hipótesis nula y usualmente expresa lo que el investigador desea
concluir: que existe diferencia o asociación.

La estadística parte del supuesto de que la hipótesis nula (que niega lo esperado por el
investigador) es verdadera, evalúa en términos de probabilidad la validez del supuesto, a
la luz de la información contenida en la(s) muestra(s). Si la probabilidad de validez del
supuesto es muy pequeña, se concluye que la hipótesis nula es falsa (existe asociación),
y se acepta el enunciado establecido por la hipótesis alterna (la conclusión esperada); en
otro caso, no puede argumentarse la falsedad de la hipótesis nula y, por lo tanto, no se
rechaza.

Así es como al realizar el análisis de los resultados de pruebas de hipótesis orientadas a


encontrar diferencias significativas entre dos muestras independientes, se busca
comprobar que no existen diferencias significativas (hipótesis nula); por ejemplo, que
una especie de pez registre mayor tamaño según las condiciones oceanográficas, en
este caso se comprobará que no existen diferencias significativas, por lo que una
probabilidad de validez del supuesto baja indicará que sí existen diferencias
significativas, y por lo tanto las condiciones oceanográficas si juegan un papel
importante en el desarrollo de la talla de los peces.
Sin embargo, las pruebas de hipótesis no están exceptas de fallar. Puede presentarse uno
de los dos tipos de error mencionados a continuación:

 Error tipo I: falso positivo. Consiste en rechazar una hipótesis nula a pesar de
que es verdadera, conocido como error alfa (α).
 Error tipo II: falso negativo. Consiste en no rechazar una hipótesis nula aun
cuando es falsa, se le conoce como error beta (β).

Cuando se emplea un método de muestreo probabilístico es posible controlar a priori y


cuantificar a posteriori la magnitud en probabilidad de estos errores. Se tiene evidencias
de que existe una probabilidad controlada de que el resultado es acertado.

El resultado de la prueba de hipótesis se basa en el cálculo de probabilidad, de la fuerza


de los hallazgos a favor de la hipótesis nula. Esta probabilidad recibe el nombre de valor
de p, y se define como la probabilidad de cometer un falso positivo por efecto del azar,
cuando la hipótesis nula es verdadera. Es decir, se acepta la hipótesis nula, pero existe
una determinada probabilidad de que la hipótesis sea aceptada pero el resultado
presentado sea erróneo. Lo que significa que mientras mayor sea el valor de p, mayores
serán las posibilidades de que se presenten falsos positivos, por lo que los resultados no
son fiables para afirmar que la hipótesis nula es verdadera y no hay diferencias, existe
asociación.

Es preciso definir un umbral por debajo del cual se rechace la hipótesis nula. Este
umbral recibe el nombre de nivel de significación, y representa el máximo nivel en
términos de probabilidad que el investigador está dispuesto a cometer un falso positivo
(α). En la bibliografía científica los niveles de significación comúnmente utilizados son
0,10, 0,05 y 0,01. Para establecer una conclusión se compara el valor de p y el nivel de
significación alfa fijado antes.

En ocasiones no se puede rechazar la hipótesis nula, pero tampoco se la acepta, puesto


que puede estarse en presencia de un error tipo II. Dado el caso, se concluye diciendo
que las pruebas aportadas por las muestras son insuficientes para rechazar la hipótesis
nula o en su defecto aceptarla.

Si el nivel de significación no es establecido con anterioridad, el criterio para rechazar


la hipótesis nula se restringe a valores de p menores a 0,01. Por el contrario, para
aceptar la hipótesis nula el valor de p debe ser mayor o igual a 0,10. Si el valor de p se
encuentra dentro del rango de 0,01 y 0,10 no se podrá establecer una conclusión
definitiva y será necesario hacer un nuevo muestreo y repetir la prueba de hipótesis
ahora sí determinando el nivel de significación previamente.

Interpretación de los valores de p

El primer paso consiste en establecer un nivel de significación como umbral para


comparar el valor de p obtenido de la prueba de hipótesis. En segundo lugar, debe
establecerse con claridad cuál es la hipótesis nula que se va a probar en cada situación y
cuál es la respectiva hipótesis alterna. Finalmente, se debe comparar el α establecido y
el valor de p encontrado, indicando una conclusión adecuada con la naturaleza del
estudio.

Retomando el ejemplo de los peces en el mar, en donde planteábamos que de acuerdo a


las condiciones oceanográficas los peces variarán en tamaño. Nuestra hipótesis nula
sería que las muestras de peces tendrán un tallaje semejante, mientras que la hipótesis
alterna afirmaría la muestra perteneciente a la población A registra un tallaje superior
al de la muestra de la población B. Si imaginariamente el valor de p hubiese sido
menor a 0.003, se pudiera concluir que la magnitud de la diferencia entre las muestras
corresponde a una fuerte evidencia de que las muestras de la población A tienen tallas
superiores a las de la población B, de acuerdo a las condiciones oceanográficas. En
otras palabras, este resultado señala que la probabilidad de que la diferencia
observada entre el tallaje de las muestras se deba al efecto del azar es escasamente
posible.

El ejemplo presentado anteriormente usaba una hipótesis alterna unilateral, al


establecer una única dirección para evaluar la diferencia, se usa en situaciones donde
se tenga una expectativa a priori del sentido en el que se puede observar la diferencia
de interés o cuando se tiene conocimiento de la imposibilidad biológica, física, etc. Sin
embargo, también existen hipótesis alternas bilaterales. Por ejemplo, si la hipótesis
nula plantease que las poblaciones de una especie de tiburón tienen un tallaje
semejante según la variación de las condiciones oceanográficas y la hipótesis alterna
enuncia que las especies de tiburón muestran diferencias en el tallaje, pues se estaría
frente a una hipótesis alterna bilateral ya que no se especifica si una muestra presenta
un tallaje mayor. Este tipo de hipótesis suelen plantearse cuando se desconoce la
dirección en que puede presentarse la diferencia de interés y solamente se quiere
establecer la existencia de una diferencia sin concluir específicamente una dirección.

En este ejemplo, si imaginariamente el valor de p fuera 0.06, se concluiría que no hay


suficiente evidencia para afirmar que hay una diferencia entre los tallajes. Así mismo,
tampoco se podría concluir que las dos muestras son semejantes. De esta forma se
reduce la posibilidad de cometer error y la conclusión en términos prácticos es no
rechazar la hipótesis nula de igualdad.

Diferencia estadísticamente significativa frente a la diferencia clínicamente


significativa

El rechazo de la hipótesis nula depende del tamaño de la muestra: cuando es grande casi
siempre permitirán rechazar la hipótesis nula, mientras que cuando es pequeño,
difícilmente podrán concluir significación estadística.

La significación práctica representa la verdadera magnitud de la diferencia que se


considera útil o relevante para la naturaleza del problema. Dentro de la investigación en
salud este concepto es conocido como diferencia clínicamente significativa o tamaño
del efecto.

Valores de p frente a los intervalos de confianza

Para controlar el error de tipo muestral (variaciones al hacer diferentes muestreos y el


error aleatorio) se recomienda construir un intervalo de confianza (IC) para el parámetro
de interés. Se sugiere además la inclusión del O en el IC ya que así no se descarta que
no haya diferencias de la magnitud de ambas muestras.

El IC es informativo, permite al lector hacer mejores y más completas interpretaciones


ya que, a diferencia de las pruebas de hipótesis, no hay falsos negativos. Por lo que de
preferencia se debe presentar tanto los intervalos de confianza como los valores de p.

Tamaño de la muestra

Un adecuado tamaño de muestra asegura al investigador obtener resultados con una


precisión deseada y a la vez controlar el error aleatorio.

Factores que influyen en la determinación del tamaño de la muestra:

1. Los índices máximos aceptables de error tipo I y error tipo II. Entre menores
sean, mayor debe ser el tamaño de la muestra.
2. La diferencia mínima a detectar: a menor diferencia se requiere mayor número
de pruebas, lo que conlleva un mayor tamaño de la muestra.
3. La variabilidad de la variable de interés. Cuando la característica de interés en el
estudio es poco homogénea, es necesario un mayor tamaño de la muestra.

También podría gustarte