Está en la página 1de 3

Estadı́stica para las Ciencias Sociales

Profesor: Mauricio Grotz

Guı́a para test de hipótesis y cálculo del p-valor

En el capı́tulo 6 de Agresti y Finlay está el procedimiento detallado para calcular un p-valor


y cuál es su interpretación. Aquı́ voy a seguir su ejemplo de la ideologı́a para testear si la
ideologı́a de los afroamericanos es diferente a 4

1) Hipótesis
H0 : µ0 = 4 vs Ha : µ 6= 4

2) Test
De acuerdo con los datos que presentan Agresti y Finaly, el estimador de µ es x̄ = 4, 075
y el desvı́o estándar de los datos de la muestra es s = 1, 512. La muestra es de n = 168
casos.
Queremos saber a cuántos errores estándar se encuentra el estimador del parámetro hi-
potetizado
Si se cumple el Teorema del Lı́mite Central y H0 es verdadera, entonces los estimadores
se distribuirán en forma aproximadamente normal alrededor del parámetro µ = 4
Calculamos el “puntaje z” para el estimador, o en este caso el “puntaje t”, que es el valor
del test:

x̄−µ0 (4,075−4)
t= √s
= 1,512

= 0, 68
n 168

Esto indica que el estimador (x̄ = 4, 075) está a 0,68 errores estándar por encima del
parámetro hipotetizado ( µ0 ) .
Este valor podrı́a compararlo con los valores crı́ticos que surgen a partir de definir un
nivel de significancia estadı́stica.
Con un α = 5 %, el valor crı́tico en la distribución t-student (que, por el tamaño de
muestra, n > 100, será aproximadamente igual al que surge de la distribución normal),
serı́a t∗ = 1,96, casi 2.

1
Veamos en R:
qnorm(0.975)=1.96 (cuantil 0,975 de una distribución normal estándar)
qt(0.975, 168-1)=1.97 (cuantil 0,975 de una distribución t-student con 167 grados de
libertad)

Esto ya lo sabı́amos, porque por la regla práctica, aproximadamente el 95 % de los esti-


madores estarán aproximadamente a 2 errores estándar alrededor del parámetro.
¿Que pasó entonces con nuestro estimador? Está a 0.68 errores estándar, con lo cual está
a menos de 2 errores estándar.
¿Qué significa? Que es un valor esperable, porque para que sea “raro” deberı́a estar a
más de 2 errores estándar.
¿Entonces? como el t=0,68 (observado) es menor que el t∗ = 1,96 (crı́tico), no puedo
rechazar H0 al 5 % de significancia estadı́stica.

3) Cálculo del p-valor


Si asumiera que H0 es verdadera ¿cuál es la probabilidad de que un “x̄0 ’ tome un valor
tan extremo como de 4,075 o mayor?
La probabilidad de que x̄ sea mayor a 4.075, P (X̄ > 4,075), se calcula con los pasos
tradicionales:
3a. Calcular el puntaje z. Ya lo tenemos porque es el cálculo que hicimos en el punto
anterior.
3b. Buscar en la tabla de la curva normal (o en R) ese puntaje z. (Nota: estrictamente
deberı́a ser en la distribución t, pero estamos asumiendo que coinciden porque el tamaño
es grande n > 100)
Vamos a la tabla. Busco t=0.68 como si fuera un puntaje z=0,68, y me encuentro con
que las siguientes probabilidades, dependiendo lo que busque:
P (t > 0,68) = 0,25
P (t < 0,68) = 0,75
P (0 < t < 0,68) = 0,25

Veamos en R:
pnorm(0.68)=0.75 (P (t < 0,68))
pnorm(0.68, lower.tail=F)=0.25 (P (t > 0,68))

Ahora bien, en los tests de hipótesis hay que seguir haciendo un par de cuentas.
3c. Me fijo en Ha y su signo es 6= ¿me afecta? sı́, porque la frase “tan extremo como
4,075” implica que, como el signo es “distinto de”, puede ser tanto valores por encima,
como por debajo del parámetro hipotetizado. El signo 6= implica un test a 2 colas.

2
3d. Calculo del p-valor.
La probabilidad de que un x̄ tome un valor tan extremo como de 4,075 o mayor, ya la
calculamos: P (t > 0,68) = 0, 25
Falta la probabilidad de que un x̄ tome un valor tan extremo como de 4,075, pero por
debajo del parámetro, o menor. Esto no lo calculamos, pero por propiedad de simetrı́a:
P (t < −0,68) = 0, 25
Nota: ¿qué significa que un valor tan extremo como de 4,075, pero por debajo del paráme-
tro? Sabemos que 4,075, está a 0,68 errores estándar por encima de µ = 4, uno tan extre-
mo como eso pero por debajo del parámetro, serı́a un x̄ que se encuentre a -0.68 errores
estándar. ¿Cuánto valdrı́a x̄? despejamos x̄ de la fórmula del “puntaje z”

1,512
x̄ = −0,68 ∗ √
168
+ 4 = 3, 935

Es decir que si calculamos el “puntaje z” de x̄ = 3, 935, igual que como hicimos en el


punto 2.

(3,935−4)
t= 1,512

= −0, 68
168

Entonces ¿cuál es el p-valor ?

p-valor =P (t > 0,68) + P (t < −0,68) = 0,25 + 0,25 = 2 ∗ 0,25 = 0,50

¿Que significa? Que la probabilidad de que un x̄ tome un valor tan extremo como 4,075
o mayor, o tan extremo como de 3,935 (que es tan extremo como 4,075, pero por debajo
de la media) o menor, es igual al 50 %.
¿Entonces? Bueno, si H0 fuese verdadera, entonces es altamente probable encontrarme
con un valor tan extremo como 4,075. No hay evidencia para rechazar H0 .
¿Y entonces? Bueno, como el p-valor es mayor al nivel de significancia: 0,5 > 0, 05, enton-
ces no puedo rechazar H0 . Que es la misma conclusión que obtuvimos antes comparando
el valor del test (observado) con el valor crı́tico.
4) Conclusión
No es posible rechazar H0 al 5 % de significancia estadı́stica.
5) Interpretación
No hay evidencia suficiente para afirmar que la ideologı́a de los afroamericanos es distinta
de 4, es decir, que no podrı́amos afirmar que son liberales o conservadores, ya que no hay
evidencia suficiente para rechazar la hipótesis de que son “moderados”.
FIN.
Epı́logo: Este procedimiento se repite en el contexto de regresión lineal para los coeficientes
de la regresión, donde las hipótesis son H0 : β = 0 vs Ha : β 6= 0, y el valor del estimador son
los valores de los coeficientes que surgen de la regresión.

También podría gustarte