Está en la página 1de 6

Introducción

Difiniccion

Los niveles de significación son el completo al intervalo de confianza de una


distribución y se utiliza para contrastar la hipótesis nula (H0) en una prueba de
inferencia estadística. En otras palabras, los niveles de significación son las
probabilidades que dejamos fuera del intervalo de confianza de una distribución y
nos ayudan a determinar si el estadístico de contraste está en zona de rechazo o
no.

¿QUÉ ES EL NIVEL DE SIGNIFICANCIA (ALFA)?

El nivel de significancia, también denotado como alfa o α, es la probabilidad de


rechazar la hipótesis nula cuando es verdadera. Por ejemplo, un nivel de
significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia
cuando en realidad no hay ninguna diferencia.

Estos tipos de definiciones pueden ser difíciles de entender debido a su carácter


técnico. ¡Una imagen hace que sea mucho más fácil entender los conceptos!

El nivel de significancia determina qué tan lejos del valor de la hipótesis nula
dibujaremos esa línea en la gráfica. Para graficar un nivel de significancia de 0.05,
debemos sombrear el 5% de la distribución que está más alejado de la hipótesis
nula.

En la gráfica anterior, las dos áreas sombreadas son equidistantes del valor de la
hipótesis nula y cada área tiene una probabilidad de 0.025, para un total de 0.05.
En estadística, nos referimos a estas áreas sombreadas como la región
crítica para una prueba de dos colas. Si la media de la población es de 260,
esperaríamos obtener una media de la muestra que estuviera en la región crítica
el 5% de las veces. La región crítica define qué tan lejos debe estar nuestro
estadístico de muestra del valor de la hipótesis nula para que podamos decir que
es lo suficientemente inusual como para rechazar la hipótesis nula.

La media de la muestra (330.6) se encuentra dentro de la región crítica, lo que


indica que es estadísticamente significativa al nivel 0.05.

También podemos ver si es estadísticamente significativa usando el otro nivel de


significancia común de 0.01.

Cada una de las dos áreas sombreadas tiene una probabilidad de 0.005, lo que
suma una probabilidad total de 0.01. Esta vez nuestra media de la muestra no está
dentro de la región crítica y no podemos rechazar la hipótesis nula. Esta
comparación muestra por qué debe elegir su nivel de significancia antes de
comenzar un estudio. ¡Lo protege de elegir un nivel de significancia porque
convenientemente le da resultados significativos!

Gracias a la gráfica, pudimos determinar que los resultados son estadísticamente


significativos al nivel 0.05 sin utilizar un valor p. Sin embargo, cuando use la salida
numérica producida por el software estadístico, deberá comparar el valor p con su
nivel de significancia para tomar esa decisión.

¿QUÉ SON LOS VALORES P?

Los valores p son la probabilidad de obtener un efecto por lo menos tan extremo
como el de los datos de la muestra, asumiendo que la hipótesis nula es verdadera.

Esta definición de los valores p, aunque técnicamente correcta, es un poco


complicada. ¡Es más fácil de entender con una gráfica!

Para graficar el valor p de nuestro conjunto de datos de ejemplo, debemos


determinar la distancia entre la media de la muestra y el valor de la hipótesis nula
(330.6 - 260 = 70.6). A continuación, podemos graficar la probabilidad de obtener
una media de la muestra que sea por lo menos tan extrema en ambas colas de la
distribución (260 +/- 70.6).

En la gráfica anterior, cada una de las dos áreas sombreadas tiene una
probabilidad de 0.01556, para una probabilidad total de 0.03112. Esta probabilidad
representa la probabilidad de obtener una media muestral que sea por lo menos
tan extrema como nuestra media muestral en ambas colas de la distribución si la
media de la población es 260. ¡Ese es nuestro valor p!

Cuando un valor p es menor que o igual al nivel de significancia, se rechaza la


hipótesis nula. Si tomamos el valor p de nuestro ejemplo y lo comparamos con los
niveles de significancia comunes, coincide con los resultados gráficos anteriores.
El valor p de 0.03112 es estadísticamente significativo a un nivel de significancia
de 0.05, pero no al nivel 0.01.

Si nos ceñimos a un nivel de significancia de 0.05, podemos concluir que el costo


promedio de energía para la población es mayor que 260.

Un error común es interpretar el valor p como la probabilidad de que la hipótesis


nula sea verdadera. Para entender por qué es incorrecta esa interpretación, por
favor, lea mi publicación de blog Cómo interpretar correctamente los valores p.

DISCUSIÓN SOBRE RESULTADOS ESTADÍSTICAMENTE


SIGNIFICATIVOS

Una prueba de hipótesis evalúa dos afirmaciones mutuamente contradictorias


acerca de una población para determinar cuál afirmación es apoyada de mejor
manera por los datos de la muestra. Un resultado es estadísticamente significativo
cuando el estadístico de muestra es lo suficientemente inusual en relación con la
hipótesis nula como para que podamos rechazar la hipótesis nula para toda la
población. “Lo suficientemente inusual” en una prueba de hipótesis se define por:

 El supuesto de que la hipótesis nula es verdadera (las gráficas se centran


en el valor de la hipótesis nula).
 El nivel de significancia (¿qué tan lejos dibujamos la línea de la región
crítica?)
 Nuestro estadístico de muestra (¿se encuentra dentro de la región crítica?)

Tenga en cuenta que no existe un nivel de significancia mágico que distinga entre
los estudios en los que tenemos un efecto real y aquellos en los que no con 100%
de precisión. Los valores comunes de alfa de 0.05 y 0.01 se basan simplemente
en la tradición. Para un nivel de significancia de 0.05, espere obtener medias de la
muestra en la región crítica el 5% de las veces cuando la hipótesis nula sea
verdadera. En esos casos, usted no sabrá que la hipótesis nula es verdadera, pero
la rechazará porque la media de la muestra se encuentra en la región crítica. ¡Por
eso es que el nivel de significancia también se conoce como una tasa de error!

Este tipo de error no implica que el experimentador haya hecho algo mal ni


requiere ninguna otra explicación inusual. Las gráficas muestran que, cuando la
hipótesis nula es verdadera, es posible obtener estas medias de muestra
inusuales sin que haya alguna otra razón que no sea el error de muestreo
aleatorio. Es solo cuestión de suerte.

Los niveles de significancia y los valores p son herramientas importantes que le


ayudan a cuantificar y controlar este tipo de error en una prueba de hipótesis. Al
usar estas herramientas para decidir cuándo rechazar la hipótesis nula, aumenta
la probabilidad de tomar la decisión correcta.

Relación entre nivel de significación y nivel de confianza

Seguro que todos hemos oído alguna vez a alguien preguntar qué valor
deberíamos asignar al alpha de la distribución o con qué nivel de confianza
calculamos el intervalo, matemáticamente, (1-alpha). La respuesta acostumbra a
ser siempre 1%, 5% o 10% para el alpha o 99%, 95% y 90% para el nivel de
confianza.

Es importante tener claro lo siguiente:

 1%, 5%, 10% = alpha => Niveles de significación.


 99%, 95%, 90% = (1-alpha) => Intervalo de confianza. 

 Los intervalos de confianza y los niveles se significación son complementarios


dado que la suma de ambos es el área de la función de densidad. Entonces

Nivel de significación e intervalo de confianza se complementan


Ya sabemos que el área de la función de densidad es 1. Matemáticamente, somos
capaces de dar solución a esta integral:

Área de la función de densidad

Representación del nivel de significación

En este caso, se ha utilizado la distribución t de Student con 16 grados de libertad


para mostrar qué áreas de la función pertenecen a los niveles de significación. Los
porcentajes (2,5%, 2,5% y 95%) corresponden al área que hay bajo la función de
densidad. Como esta distribución tiene dos colas, el nivel de significación está
dividido por la mitad, entonces, 2,5% + 2,5% = 5%. El valor crítico de esta
distribución con 16 grados de libertad y 5% como nivel de significación es 2,11991
en cada cola.

2,5% + 2,5% + 95% = 1% 

Universales 

Etiquetamos a los niveles de significación como universales porque estos niveles


son conocidos y utilizados en todos los contrastes estadísticos. Es muy poco
usual encontrar un nivel de significación del 20% o 35% a no ser que sea una
condición explícita del contraste. 

Es cierto que los niveles 1% y 5% son más populares que el nivel 10%, pero es
por razones de precisión. Es mejor dar un resultado 1 de cada 100 veces (1/100 =
0,01 = 1%) o 5 de cada 100 veces (5/100 = 0,05 = 5%) que 10 de cada 100 veces
(10/100 = 0,1 = 10%), ¿verdad?
También, los niveles de significación reciben el nombre de percentil, por ejemplo,
percentil 1% o percentil 5%. Esta nomenclatura es muy utilizada para el cálculo de
la métrica valor en riesgo (VaR). 

Arbitrarios y no arbitrarios

Los niveles de significación pueden ser arbitrarios y no arbitrarios. Los arbitrarios


son los valores que escogemos a priori (antes) de saber las características del
experimento. En este caso, sería antes de calcular el estadístico de contraste. Los
no arbitrarios son los que se obtienen a partir de un resultado del experimento. En
este caso, el valor-p, porque depende del valor que tome estadístico de contraste.
Ambos dependen de la distribución que sigan los datos. (Rodó, 2023)

También podría gustarte