Está en la página 1de 48

Introducción a prueba de

hipótesis

Alex Soto Poblete


Estadístico
Pruebas de Hipótesis
Una hipótesis estadística es una afirmación con
respecto a alguna característica desconocida
(parámetro) de una población de interés.

La esencia de probar una hipótesis estadística


es el decidir si la afirmación se encuentra
apoyada por la evidencia experimental que se
obtiene a través de una muestra aleatoria.
Es una explicación posible a la situación problema o una respuesta
posible a la pregunta planteada.

 Se formula en términos afirmativos.


 Se basa en el conocimiento científico existente, en la
experiencia previa del investigador, o en la observación de
hechos relacionados con el problema.

 Las dos teorías que compiten se denominan:


- hipótesis nula
- hipótesis alternativa.

 Al proceso de decidir entre la hipótesis nula y la alternativa, se


le denomina: Prueba de hipótesis o Test de hipótesis o
Contraste de hipótesis.
Es una afirmación con respecto a alguna característica
desconocida de una población de interés. La esencia es decidir si
la afirmación se encuentra apoyada por la evidencia experimental.
Tipos de hipótesis
 Hipótesis nula (H0): Establece que nada va a suceder, no hay
efecto, no hay diferencia, no hay cambio en la población. Es el
“status quo”, lo convencional, lo que sabemos de la población, lo
aceptado hasta el momento.

La hipótesis nula se va a considerar como cierta hasta que se


tenga suficiente evidencia de lo contrario

Hipótesis alternativa (H1): Es una alternativa a la hipótesis nula.


Establece lo que el investigador espera que sea verdad, el cambio
en la población que el investigador espera encontrar.

H0: El nuevo procedimiento es tan efectivo como el antiguo


H1: El nuevo procedimiento es más efectivo que el antiguo
Una hipótesis nula debe considerarse verdadera a menos que exista
suficiente evidencia en contra.

El sistema de justicia americano tiene como principio básico que un


inculpado en un juicio debe ser considerado inocente hasta que se
pruebe que es culpable.
¿Cuál será la hipótesis nula y alternativa en el contexto de un juicio?

La hipótesis nula es de inocencia. Lo contrario de la hipótesis nula es


la hipótesis alternativa, la cual expresa una creencia de culpabilidad.
Por lo tanto, las hipótesis en un juicio criminal se escribirían:

H0: El acusado es inocente


H1: El acusado es culpable
H0: El acusado es inocente
H1: El acusado es culpable

Para probar las aseveraciones o hipótesis se lleva a cabo un juicio. El


testimonio y las pruebas obtenidas durante el juicio equivalen a la
información de la muestra. Si la información de la muestra concuerda
con la hipótesis de inocencia, no se puede rechazar la hipótesis nula
que el consignado es inocente. Sin embargo, si la información
muestral no es consistente con la hipótesis de inocencia, se
rechazará la hipótesis nula. En este caso la acción a tomar se basará
en la hipótesis alternativa de que el acusado es culpable.
Los abogados defensores y querellantes presentan sus casos. El juez
debe ponderar la evidencia presentada y decidir si es suficiente para
declarar culpable al inculpado. Pero el sistema de justicia no es
perfecto.
Sea cual sea nuestra decisión va a estar
afecta a errores….

¿Qué errores podemos cometer?


Si el juez decide que es culpable y
en realidad es inocente ….

Ocurre un error

Si el juez decide que la duda es


razonable y lo declara inocente y el
inculpado era en realidad culpable…

Estos tipos de error tienen un nombre especial


Error Tipo I: cuando rechazamos la hipótesis nula H0 siendo
esta verdadera

Error Tipo II: cuando aceptamos la hipótesis nula H0 siendo


esta falsa

La verdadera hípótesis

H0 Verdadera H1 Verdadera

Su decisión
Rechazar H0 Error tipo I
está basada
en los datos
No rechazar H0 Error tipo II
Recordemos que:

Podemos cometer Error Tipo I:


sólo si rechazamos H0

Podemos cometer Error Tipo II:

sólo si no rechazamos H0
Probando un nuevo procedimiento
H0: el nuevo procedimiento es tan efectivo como el antiguo
H1: el nuevo procedimiento es más efectivo que el antiguo
¿Cuáles son los dos tipos de errores que se pueden cometer al decidir
entre las dos hipótesis?

Error Tipo I: Concluir que el nuevo procedimiento es más efectivo que el


antiguo, cuando es igual de efectivo

Error Tipo II: Concluir que el nuevo procedimiento es tan efectivo como
el antiguo cuando en realidad es más efectivo

¿Cuáles son la consecuencias del error tipo I?

¿Cuáles son la consecuencias del error tipo II?

¿Cuál error es más grave desde un punto de vista ético?


Conceptos claves

En estadística, la probabilidad de cometer el error tipo I


se llama nivel de significancia y se denota por la letra
griega alfa, .

La probabilidad de cometer el error tipo II se denota


por la letra griega beta, .

 = Probabilidad de cometer el error tipo I (nivel de


significancia)

 = Probabilidad de cometer el error tipo II


Sin embargo, generalmente queremos proteger lo que
ya conocemos reduciendo la probabilidad de cometer el
Error Tipo I.

Pensemos....

Si el Error Tipo I es considerado grave, ¿por qué no


hacer cero su probabilidad?

Si la probabilidad de error tipo I fuera igual a cero,


significaría que nunca rechazaríamos la hipótesis nula y
entonces nunca vamos a aceptar una teoría nueva.

Tenemos que correr un pequeño riesgo.


Contrastando una hipótesis
Son
demasiados...

Creo que la edad


media es 40 años...

¡Gran
Muestra diferencia!
aleatoria
Rechazo la
hipótesis

X = 20 años
Razonamiento básico
• No hay evidencia contra H0
Si supongo que H0 es cierta...
•No se rechaza H0
•El experimento no es concluyente
¿Si una teoría hace
predicciones con •El contraste no es significativo
éxito, queda
probado que es
cierta?

 = 40
X = 38
... el resultado del experimento es coherente.
Razonamiento básico

Si supongo que H0 es cierta...

¿qué hace un
científico cuando
su teoría no
coincide con sus
predicciones?

 = 40
X = 20
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
Razonamiento básico

Si supongo que H0 es cierta...

Rechazo que
H0 sea cierta.

 = 40
X = 20
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
Significancia estadística

Los datos que obtenemos de una muestra serán


estadísticamente significativos, si las observaciones
son muy poco probables si H0 es verdadera.

Si los datos son estadísticamente significativos,


entonces rechazamos H0.

Sea cual sea nuestra decisión va a estar afecta a errores.


¿Qué hay en la bolsa?
Se tienen dos bolsas idénticas: BOLSA A y BOLSA B

Cada bolsa contiene 20 vales. El contenido de cada bolsa es:


Bolsa A tiene en total -$ 560.000

Bolsa B tiene en total +$ 1.890.000


Seleccionamos un vale, n=1

Basándose en una observación, tiene que decidir entre:

H0: la bolsa que me están mostrando es la Bolsa A


H1: la bolsa que me están mostrando es la Bolsa B

¿Cuál es el error tipo I y el Error tipo II?

¿Cómo tomamos la decisión?

Las elecciones obvias:

-$1000 Es la Bolsa A Acepto H0


$1000 Es la Bolsa B Rechazo H0
Un regla de decisión es una regla formal que establece cuando
rechazar H0, basado en los datos.

Examinemos las probabilidades de cada vale:

La dirección del extremo inferior corresponde a la posición de los


valores que son más probables bajo H1 que bajo H0.

Si los valores más grandes son más probables bajo H1 que bajo
H0, entonces la dirección del extremo es hacia la derecha.
Para determinar la regla de decisión usamos primero el valor más
extremo

H0: la bolsa que me están mostrando es la bolsa A Rechazar H0 si el


vale seleccionado
H1: la bolsa que me están mostrando es la bolsa B es de $60 mil o más
Región de rechazo, región de
aceptación y valor crítico

• A toda regla de decisión le corresponde una zona de rechazo.

• Una región de rechazo es un conjunto de valores para los

cuales rechazamos H0.


• Una región de aceptación es un conjunto de valores para los cuales

aceptamos H0.
H0: la bolsa que me están mostrando es la bolsa A
H1: la bolsa que me están mostrando es la bolsa B

Rechazar H0 si el
Zona de Rechazo:
vale seleccionado
Vales  $ 60 mil
es de $ 60 mil o más
Un valor crítico es el valor que marca el punto inicial
del conjunto de valores de la región de rechazo
H0: la bolsa que me están mostrando es la bolsa A
H1: la bolsa que me están mostrando es la bolsa B

Zona de Rechazo: Valor crítico: = $ 60 mil


Vales  $ 60 mil
Una región de rechazo se llama unilateral o de una
cola si el conjunto de valores extremos están todos en
una dirección, ya sea a la derecha (cola superior) o a la
izquierda (cola inferior).

Una región de rechazo se llama bilateral o de dos colas


si el conjunto de valores extremos están en las dos
direcciones derecha e izquierda.
H0: la bolsa que me están mostrando es la bolsa A
H1: la bolsa que me están mostrando es la bolsa B

Región de Rechazo
Zona de Rechazo: Valor crítico: = $ 60 mil unilateral (derecha):
Vales  $ 60 mil Se rechaza H0 para valores
grandes de billetes.
: probabilidad de rechazar H0
cuando H0 es verdadera

: probabilidad de aceptar H0
cuando H1 es verdadera
: probabilidad de rechazar H0 cuando H0 es verdadera
: probabilidad de aceptar H0 cuando H1 es verdadera

H0: la bolsa que me están mostrando es la bolsa A


H1: la bolsa que me están mostrando es la bolsa B

α: probabilidad sacar un billete ≥ 60 mil cuando la bolsa


mostrada es la A

α= 1/20=0.05
: probabilidad de rechazar H0 cuando H0 es verdadera
: probabilidad de aceptar H0 cuando H1 es verdadera

H0: la bolsa que me están mostrando es la bolsa A


H1: la bolsa que me están mostrando es la bolsa B

β: probabilidad sacar un billete < 60 mil cuando la bolsa


mostrada es la B

β= 12/20=0.6
: probabilidad de rechazar H0 cuando H0 es verdadera
: probabilidad de aceptar H0 cuando H1 es verdadera

H0: la bolsa que me están mostrando es la bolsa A


H1: la bolsa que me están mostrando es la bolsa B

Regla de decisión Región de Rechazo  β


#1: Rechazar H0 si
el vale seleccionado $60 o más 0,05 0,60
es de $60 mil o más

#2: Rechazar H0 si
el vale seleccionado $50 o más 0,10 0,30
es de $50 mil o más
#3: Rechazar H0 si
el vale seleccionado $40 o más 0,20 0,20
es de $40 mil o más
El valor-p
¿Cuán raros son los datos?

Nos vamos a enfocar en lo que los datos observados nos dicen.

Partimos con el supuesto de que H0 es verdadera.

Nos preguntamos:
Si H0 es verdadera (la bolsa es la A),
¿cuán probable es obtener el valor observado en la muestra o
uno más extremo?

Esta probabilidad se llama valor-p


El valor-p es la probabilidad, calculada bajo
el supuesto que H0 es verdadera, de obtener
el valor observado o uno más extremo.

Entendemos que a menor valor-p, mayor es


la evidencia de los datos en contra de la
hipótesis nula H0.
Supongamos que se selecciona un vale de la bolsa y su valor es $30
Si el nivel de significancia fuera de un 10%. ¿Qué decidiría?
Zona de Rechazo:
Nivel de significancia  =0.10 Vales  $ 50 mil
El valor p es la chance de obtener el resultado observado ($30) o un
valor mayor, si H0 es verdadera.
En nuestro ejemplo cuanto más pequeño es el valor del
vale seleccionado, más chance para la hipótesis Nula. Y
cuanto más grande es el valor del vale seleccionado, más
chance para la hipótesis alternativa
El valor-p sería la chance,
asumiendo que la bolsa
mostrada es la A, de obtener
un vale de $30 o mayor

Valor-p= 6/20=0.3 >0.1

30 < 50
Acepto H0
Relación entre valor-p y nivel de
significancia

Si valor-p   Rechazamos H0 y los datos son


estadísticamente significativos

Aceptamos H0 y los datos no son


Si valor-p >  estadísticamente significativos
Razonamiento básico
Si supongo que H0 es cierta...

Rechazo que H0
sea cierta.

Los datos son


estadísticamente
significativos.

 = 40
X = 20

... el resultado del experimento sería improbable, si H0 es verdadera


Sin embargo ocurrió.
Razonamiento básico
• No hay evidencia contra H0
Si supongo que H0 es cierta...
•No se rechaza H0
•El experimento no es concluyente
•El contraste no es significativo

 = 40
X = 38
... el resultado del experimento es coherente.
Razonamiento básico

Si supongo que H0 es cierta...

Rechazo que
H0 sea cierta.

 = 40
X = 20
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
Problema
Se tienen dos bolsas A y B, cada una contiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si es la bolsa A o no, esto es,
se tienen las hipótesis:
H0: la bolsa es A
H1: la bolsa es B
Usted puede sacar un vale y luego tomar la decisión de aceptar H0
o rechazar H0, a favor de H1.

a) ¿Es este un test de hipótesis de


una o de dos colas? Justifique.

R: es un test a dos colas, valores


menos probables de ocurrir bajo H0
están en ambos extremos.
Problema
Se tienen dos bolsas A y B, cada una contiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si es la bolsa A o no, esto es,
se tienen las hipótesis:
H0: la bolsa es A
H1: la bolsa es B
Usted puede sacar un vale y luego tomar la decisión de aceptar H0
o rechazar H0, a favor de H1.

b) Establezca una regla de decisión.

R: Rechazo H0 si el vale sacado es


de $9000 o más o es de $2000 o
menos.
Problema
Se tienen dos bolsas A y B, cada una contiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si es la bolsa A o no, esto es,
se tienen las hipótesis:
H0: la bolsa es A
H1: la bolsa es B
Usted puede sacar un vale y luego tomar la decisión de aceptar H0
o rechazar H0, a favor de H1.

c) Calcule el nivel de significación.

R: α=P(Rechazar H0 cuando H0 es
verdadera).
α=6/30=0.2
Problema
Se tienen dos bolsas A y B, cada una contiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si es la bolsa A o no, esto es,
se tienen las hipótesis:
H0: la bolsa es A
H1: la bolsa es B
Usted puede sacar un vale y luego tomar la decisión de aceptar H0
o rechazar H0, a favor de H1.

d) Calcule Beta.

R: β=P(Aceptar H0 cuando H0 es
falsa).
β=12/30=0.4
Problema
Se tienen dos bolsas A y B, cada una contiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si es la bolsa A o no, esto es,
se tienen las hipótesis:
H0: la bolsa es A
H1: la bolsa es B
Usted puede sacar un vale y luego tomar la decisión de aceptar H0
o rechazar H0, a favor de H1.

e) ¿Cómo puedo reducir Beta?

R: Aumentando α
Problema
Se tienen dos bolsas A y B, cada una contiene 30 vales. A usted le
muestran una bolsa y tiene que decidir si es la bolsa A o no, esto es,
se tienen las hipótesis:
H0: la bolsa es A
H1: la bolsa es B
Usted puede sacar un vale y luego tomar la decisión de aceptar H0
o rechazar H0, a favor de H1.

Si se saca un vale de $7.000


Calcule el valor p

Valor-p= 20/30=0.67 >0.2


No se rechaza H0, es decir se
concluye que el vale obtenido
proviene de la bolsa A

También podría gustarte