Está en la página 1de 4

CASO ANALISIS DE PRUEBAS DE HIPOTESIS

Clase business Analytics

¿Qué significan los niveles de significancia y los valores p en las pruebas de hipótesis? Por
cierto, ¿qué es significancia estadística? En esta publicación, me centraré en conceptos y
gráficas para ayudarle a entender de una manera más intuitiva cómo funcionan las pruebas de
hipótesis en estadística.

Para ilustrarlo con mayor claridad, agregaré el nivel de significancia y el valor p a la gráfica de
mi publicación anterior para crear una versión gráfica de la prueba t de 1 muestra. ¡Es más
fácil de entender cuando se puede ver qué significa en realidad “significancia estadística”!

Queremos determinar si la media de nuestra muestra (330.6) indica que el costo promedio de
energía de este año es significativamente diferente del costo promedio de energía del año
pasado de $260.

La gráfica de distribución de probabilidad anterior muestra la distribución de las medias de las


muestras que obtendríamos bajo el supuesto de que la hipótesis nula es verdadera (media de
la población = 260) y si tomáramos repetidamente un número grande de muestras aleatorias.
Eso nos deja con una pregunta: ¿dónde trazamos la línea de significancia estadística en la
gráfica? Ahora agregaremos el nivel de significancia y el valor p, que son las herramientas de
toma de decisiones que necesitamos.

Utilizaremos estas herramientas para probar las siguientes hipótesis:

• Hipótesis nula: La media de la población es igual a la media hipotética (260).


• Hipótesis alternativa: La media de la población es diferente de la media hipotética
(260).

¿Qué es el Nivel de Significancia (Alfa)?


El nivel de significancia, también denotado como alfa o α, es la probabilidad de rechazar la
hipótesis nula cuando es verdadera. Por ejemplo, un nivel de significancia de 0.05 indica un
riesgo de 5% de concluir que existe una diferencia cuando en realidad no hay ninguna
diferencia.

Estos tipos de definiciones pueden ser difíciles de entender debido a su carácter técnico. ¡Una
imagen hace que sea mucho más fácil entender los conceptos!

El nivel de significancia determina qué tan lejos del valor de la hipótesis nula dibujaremos esa
línea en la gráfica. Para graficar un nivel de significancia de 0.05, debemos sombrear el 5% de
la distribución que está más alejado de la hipótesis nula.

En la gráfica anterior, las dos áreas sombreadas son equidistantes del valor de la hipótesis nula
y cada área tiene una probabilidad de 0.025, para un total de 0.05. En estadística, nos
referimos a estas áreas sombreadas como la región crítica para una prueba de dos colas. Si la
media de la población es de 260, esperaríamos obtener una media de la muestra que estuviera
en la región crítica el 5% de las veces. La región crítica define qué tan lejos debe estar nuestro
estadístico de muestra del valor de la hipótesis nula para que podamos decir que es lo
suficientemente inusual como para rechazar la hipótesis nula.
La media de la muestra (330.6) se encuentra dentro de la región crítica, lo que indica que es
estadísticamente significativa al nivel 0.05.

También podemos ver si es estadísticamente significativa usando el otro nivel de significancia


común de 0.01.

Cada una de las dos áreas sombreadas tiene una probabilidad de 0.005, lo que suma una
probabilidad total de 0.01. Esta vez nuestra media de la muestra no está dentro de la región
crítica y no podemos rechazar la hipótesis nula. Esta comparación muestra por qué debe elegir
su nivel de significancia antes de comenzar un estudio. ¡Lo protege de elegir un nivel de
significancia porque convenientemente le da resultados significativos!

Gracias a la gráfica, pudimos determinar que los resultados son estadísticamente significativos
al nivel 0.05 sin utilizar un valor p. Sin embargo, cuando use la salida numérica producida por
el software estadístico, deberá comparar el valor p con su nivel de significancia para tomar esa
decisión.

¿Qué son los Valores P?


Los valores p son la probabilidad de obtener un efecto por lo menos tan extremo como el de
los datos de la muestra, asumiendo que la hipótesis nula es verdadera.

Esta definición de los valores p, aunque técnicamente correcta, es un poco complicada. ¡Es
más fácil de entender con una gráfica!

Para graficar el valor p de nuestro conjunto de datos de ejemplo, debemos determinar la


distancia entre la media de la muestra y el valor de la hipótesis nula (330.6 - 260 = 70.6). A
continuación, podemos graficar la probabilidad de obtener una media de la muestra que sea
por lo menos tan extrema en ambas colas de la distribución (260 +/- 70.6).
En la gráfica anterior, cada una de las dos áreas sombreadas tiene una probabilidad de
0.01556, para una probabilidad total de 0.03112. Esta probabilidad representa la probabilidad
de obtener una media muestral que sea por lo menos tan extrema como nuestra media
muestral en ambas colas de la distribución si la media de la población es 260. ¡Ese es nuestro
valor p!

Cuando un valor p es menor que o igual al nivel de significancia, se rechaza la hipótesis nula.
Si tomamos el valor p de nuestro ejemplo y lo comparamos con los niveles de significancia
comunes, coincide con los resultados gráficos anteriores. El valor p de 0.03112 es
estadísticamente significativo a un nivel de significancia de 0.05, pero no al nivel 0.01.

Si nos ceñimos a un nivel de significancia de 0.05, podemos concluir que el costo


promedio de energía para la población es mayor que 260.

También podría gustarte