Está en la página 1de 37

Prueba de Hipótesis

Carmen Le Foulon

ICP 0502

Lunes 2 de septiembre

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 1 / 37


Hoy veremos

1. Repaso conceptos clave

2. Pruebas de hipótesis

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 2 / 37


Repaso conceptos clave

Qué entendemos por probabilidad

Definición a penales

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 3 / 37


Repaso conceptos clave

Qué entendemos por probabilidad

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 4 / 37


Repaso conceptos clave

Qué entendemos por probabilidad

Intuitivamente, es más probable que metan un gol en el primer escenario que


en el segundo.
Esta intuición la formalizamos a través de la probabilidad.
Definimos modelos matemáticos de probabilidad que nos entregan la
regularidad dentro de la incertidumbre:
item Es decir: si bien no tenemos certeza de si va a meter un gol o no, en base
a la probabilidad de que meta un gol o no
Modelo de probabilidad: p=0.3
Podemos determinar que de 100 instancias, meterá un gol en 30 de ellas.
El parametro p nos refleja la propensión a meter un gol.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 5 / 37


Repaso conceptos clave

Probabilidad de obtener respuestas correctas en prueba de


30 preguntas de V/F

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 6 / 37


Repaso conceptos clave

Modelo de probabilidad y parámetro

Modelo de probabilidad: describe la forma de la distribución.


Ası́, por ejemplo, si la distribución es Normal, Binomial, F, etc.
Pero no basta con la forma de la probabilidad.
Por ejemplo, sabemos que la edad de inicio de consumo de alcohol se
distribuye Normal:
X ∼ N (µ, σ 2 )

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 7 / 37


Repaso conceptos clave

Edad inicio consumo alcohol

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 8 / 37


Repaso conceptos clave

Edad inicio consumo alcohol

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 9 / 37


Repaso conceptos clave

Modelo de probabilidad y parámetro

Modelo de probabilidad: describe la forma de la distribución.


Ası́, por ejemplo, si la distribución es Normal, Binomial, F, etc.
Pero no basta con la forma de la probabilidad.
Por ejemplo, sabemos que la edad de inicio de consumo de alcohol se
distribuye Normal:
X ∼ N (µ, σ 2 )
Los parámetros son µ y σ 2 .
Al tomar un valor especı́fico, por ejemplo, 10 y 25 sabemos donde se ubica y
como los valores se mueven con respecto a su media.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 10 / 37


Repaso conceptos clave

Distribución muestral

Al conocer el modelo de probabilidad de la población, podemos derivar -


proceso deductivo- la distribución muestral de un estimador.
Modelo de probabilidad: población cuya v.a. de interés X ∼ N (µ, σ 2 )
Modelo muestral: muestra aleatoria de tamaño n
Sabemos que la suma de v.a que tienen una distribución normal se distribuye
también normal. Pn
xi
Estimador de µ es x̄ = i=1
n
Como x̄ es un estimador insesgado de µ, E (x̄) = µ
La distribución muestral del estimador de la media, x̄ es Normal:

σ2
x̄ ∼ N (µ, )
n

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 11 / 37


Repaso conceptos clave

Distribución muestral

Si nuestra variable de interés se distribuye Binomial o Normal, podemos


derivar la distirbución muestral.
Pero para otras distribuciones, nos basamos en un teorema fundamental: el
Teorema del Lı́mite Central.
El Teorema del Lı́mite Central nos dice que para muestras suficientemente
grandes (cuando el tamaño de muestra tiende a infinito) la distribución de la
media muestral se distribuye Normal.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 12 / 37


Repaso conceptos clave

Inferencia

Entonces: conociendo los parámetros de la población y la forma de la


distribución, hemos derivado la distribución muestral del estimador.

Pero nuestro objetivo en inferencia es de hecho el inverso.

No conocemos los parámetros poblaciones: en base a una muestra de la


población, queremos decir algo sobre la población.

Por eso, ahora vamos a dar vuelta el problema: qué podemos inferir en base
los datos observados en nuestra muestra.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 13 / 37


Repaso conceptos clave

¿Pero qué significa el intervalo de confianza?

En intervalo de confianza (IC), la confianza es en el procedimiento.


Es decir, un intervalo de confianza con 95 % de nivel de confianza nos dice
que el 95 % de las veces (en el 95 % de muestras repetidas) el parámetro va a
estar contenido en ese intervalo.
Esto implica:
Ex-ante, hay un 5 % de probabilidad (se espera que en un 5 % de las muestras)
que el IC no contenga el parámetro poblacional.
Es decir: no es la confianza que el IC estimado en base a una muestra
contenga al parámetro, eso lamentablemente, no tenemos cómo saberlo.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 14 / 37


Repaso conceptos clave

Cómo construimos un intervalo de confianza?

Definimos el nivel de confianza, en general, 95 %.


Para una distribución Normal, se acumula el 95 % de la probabilidad entre
µ − 1,96σ y µ + 1,96σ
Por lo tanto, el intervalo de confianza es igual a:

IC = (estimador − 1,96σ; estimador + 1,96σ)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 15 / 37


Repaso conceptos clave

Intervalo de confianza

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 16 / 37


Repaso conceptos clave

Practiquemos

Determinar el porcentaje de jóvenes que inicia consumo de alcohol antes de


los 15 años.
Muestra aleatoria representativa: n= 400, número jovenes inician antes 15
años=220
Necesitamos calcular el error estándar, lo hacemos en base a nuestra
proporción muestral
proporción muestral: p̂ = 225/400 = 0,55
Error estándar se calcula como
r r
p̂ ∗ (1 − p̂) ,55 ∗ ,45
se = = = 0,0245
n 400
El intervalo es por lo tanto:

IC = (0,55 − 1,96 ∗ 0,0245; estimador + 1,96 ∗ 0,0245) = (0,5452; 0,5548)

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 17 / 37


Pruebas de hipótesis

Pruebas de hipótesis

Muchas veces nos interesa evaluar una hipótesis sobre la población


¿Es la media de la edad de inicio de consumo de alcohol es 15 años?
¿Es diferente la aprobación presidential entre mujeres y hombres?
¿Es mayor la participación electoral entre adultos que entre jóvenes?
Para ello, realizamos una prueba o test de hipótesis: en base a nuestra
muestra, y considerando la variabilidad muestral, cuán fuerte es la evidencia
en contra de nuestra hipótesis.
El test de hipótesis es una prueba por contradicción: la evidencia permite o
no rechazar nuestra hipótesis sobre el valor del parámetro poblacional.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 18 / 37


Pruebas de hipótesis

Pruebas de hipótesis

La hipótesis por tanto es una afirmación sobre la población.


Esta afirmación es sobre el valor de los parámetros poblacionales.
La hipótesis que queremos evaluar la llamamos hipótesis nula.
Para el test de hipótesis evaluamos si dada nuestra estimación, hay evidencia
o no para rechazar nuestra hipótesis nula.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 19 / 37


Pruebas de hipótesis

Pruebas de hipótesis

Hipótesis nula: es aquella que proponemos.


La prueba de hipótesis es una prueba por contradicción
Es decir: buscamos si la evidencia es suficientemente fuerte como para
rechazar nuestra hipótesis nula, considerando la variabilidad muestral.
¿Y cómo determinamos si la evidencia es lo suficientemente fuerte como para
rechazarla?
Si es muy poco probable obtener el valores igual o más extremos a los que
obtuvimos en base a nuestra muestra, si el parámetro poblacional fuera
efectivamente el de Ho.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 20 / 37


Pruebas de hipótesis

Pruebas de hipótesis

Evidencia en contra de Ho: muy poco probable obtener el valores iguales o


más extremos a nuestra estimación, si el parámetro poblacional fuera
efectivamente el de Ho.
¿Y cómo calculamos esa probabilidad?
De la distribución muestral del estimador bajo Ho.
Es decir: la distribución muestral del estimador cuando la población tiene el
parámetro postulado por Ho- nuestra hipótesis nula.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 21 / 37


Pruebas de hipótesis

Pasos Pruebas de hipótesis

Todas las pruebas de hipótesis deben seguir cinco pasos:


1 Explicitar los supuestos para construir modelo estadı́stico:
2 Definir las hipótesis
3 Calcular el test estadı́stico
4 Calcular el valor p
5 Concluir

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 22 / 37


Pruebas de hipótesis

Pasos Pruebas de hipótesis

1 Supuestos para construir modelo estadı́stico:


Modelo distribución poblacional
Modelo muestral
2 Hipótesis:
Hipótesis nula: nuestra propuesta sobre el valor del parámetro.
Hipótesis alternativa: rango de posibles valores alternativos.
3 El test estadı́stico: nos dice cuán lejos está la estimación obtenida del
parámetro dado por la hipótesis nula en términos de desviaciones estándar de
la distribución muestral.
4 El valor p: nos da la probabilidad (cuán inusual) encontrar valores iguales o
más extremos al del test estadı́stico dado que la hipótesis nula es verdadera.
Se obtiene de la distribución muestral del estimador dado Ho.
5 Conclusiones

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 23 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporcións

La pregunta de investigación es si la mayorı́a de las personas considera peor


condenar a una persona inocente que dejar libre a un culpable o no.
Nuestra hipótesis nula es si el porcentaje es igual a 50 %.
Evidencia: datos de una encuesta de opinión pública, obtenida mediante
muestreo aleatorio a 400 personas.
De las 400 entrevistas, un 55 % respondió que era peor condenar a una
persona inocente.
¿La evidencia nos permite o no rechazar la hipótesis nula?

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 24 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 1: Supuestos

De una muestra aleatoria de 400 personas, un 55 % respondió que era peor


condenar a una persona inocente.
1 Supuestos para construir modelo estadı́stico:
Modelo distribución poblacional: binomial: 400 repeticiones de v.a. que sigue
proceso Bernouilli).
Modelo muestral: muestra aleatoria de 400 personas.
Distribución muestral del estimaor: dado que es muestra suficientemen grande,
distribución muestral se aproxima a Normal
Recordando: muestra grande (AyF): np > 15 y n(1 − p) > 15
2 Hipótesis
3 Valor test estadı́stico
4 Valor p
5 Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 25 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 2: Hipótesis nula y alternativa

De una muestra aleatoria de 400 personas, un 55 % respondió que era peor


condenar a una persona inocente.
1 Supuestos para construir modelo estadı́stico:
Modelo distribución poblacional: binomial
Modelo muestral: muestra aleatoria, muestra suficientemente grande
Distribución muestral del estimador: distribución muestral se aproxima a
Normal
2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
Hipótesis de una sola cola
3 Valor test estadı́stico
4 Valor p
5 Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 26 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 3: Test estadı́stico

1 Supuestos para construir modelo estadı́stico


2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
3 Test estadı́stico:

p̂ − p0 p̂ − p0 0,55 − 0,5
z= =r =r = 2,0
es0 p0 (1 − p0 ) 0,5(1 − 0,5)
n 400
4 Valor p
5 Conclusión

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 27 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

La probabilidad de obtener un estadı́stico muestral de valores iguales más


extremos que el obtuvimos en la muestra si Ho es verdadero.
Entre más pequeño el valor p, mayor es la evidencia en contra de Ho: es
menos probable.
Recuerden que es una prueba por contradicción: buscamos que los datos nos
entreguen la evidencia en contra de Ho

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 28 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 29 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

Distribución muestral Estandarizada N(0,1) asumiendo p = 0,5

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 30 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p
Distribución muestral asumiendo p = 0,5

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 31 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 4: Valor p

De una muestra de 400 personas, un 55 % respondió que era peor condenar a una
persona inocente.
1 Supuestos para construir modelo estadı́stico
2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
3 Test estadı́stico: z = 2,0
4 El valor p: en base a la distribución muestral asumiendo que H0 es verdadera:
Prob(propmuestral ≥ 0,55) = 0,0228, lo que estandarizando
Prob(z ≥ 2,0) = 0,0228

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 32 / 37


Pruebas de hipótesis

Aplicación: prueba de hipótesis sobre una proporción


Paso 5: Conclusión

Una vez que tenemos la probabilidad de obtener un estimador con valores


iguales o más extremos a los de nuestra estimación, ¿qué?
Es decir, cuán pequeña debe ser probabilidad para que digamos que es
suficiente evidencia en contra de Ho.
Depende a la tolerancia que tengamos a equivocarnos en la decisión: el error
que estamos dispuesto a asumir.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 33 / 37


Pruebas de hipótesis

Error tipo I y error tipo II

Hipótesis Nula
Decisión Verdadera Falsa
Rechazar H0 Error tipo I Decisión correcta
No rechazar H0 Decisión correcta Error tipo II

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 34 / 37


Pruebas de hipótesis

Error tipo I y nivel de significancia

Error tipo I es el error de rechazar la hipótesis nula cuando ésta es verdadera.


El nivel de significancia de una prueba de hipótesis es la probabilidad del error
tipo I
Se denomina α a la probabilidad de error tipo I
Por lo tanto, α es el nivel de significancia estadı́stica, o el máximo riesgo
tolerable de rechazar incorrectamente H0 .
α = Prob(error tipo I ) = Prob(rechazar H0 cuando H0 es verdadera)
Ası́, la significancia estadı́stica nos da el nivel de confianza de la decisión de
rechazar H0 : 1 − α

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 35 / 37


Pruebas de hipótesis

Nivel de significancia estadı́stica

Valor predefinido: en general, α = 0,05


Se rechaza Ho si el valor p es menor o igual que ese número.
Cuando rechazamos Ho: los resultados en contra de Ho son estadı́sticamente
significativos.
Si no rechazamos Ho: Ho es plausible, pero no sabemos si es verdadera.
Por eso: nunca aceptamos Ho, Ho es plausible, pero también lo son otros
posible valores.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 36 / 37


Pruebas de hipótesis

Ejemplo: test de proporción

De una muestra de 400 personas, un 55 % respondió que era peor condenar a una
persona inocente.
1 Supuestos para construir modelo estadı́stico
2 Hipótesis:
Hipótesis nula: p = 0,5
Hipótesis alternativa: p > 0,5
3 Test estadı́stico: z = 2,0
4 El valor p: Prob(z ≥ 2,0) = 0,0228
5 Conclusión:
Definiendo α = 0,05
Como Prob(z ≥ 2,0) = 0,0228 < 0,05
Rechazamos Ho.

Carmen Le Foulon (ICP 0502) Prueba de Hipótesis Lunes 2 de septiembre 37 / 37

También podría gustarte