Está en la página 1de 15

03/05/2018

ESTADÍSTICA II
UAH

Clase 08: Inferencia Estadística 2.


Pruebas de hipótesis para un grupo.

~Marcela Moraga Cubillos~


memoraga@uc.cl

1. Intro

Para sacar conclusiones sobre una población a partir de una muestra…

Estimación puntual

Inferencia que busca


estimar.

Intervalos de Confianza
Inferencia estadística

Inferencia que busca


testear (verificar) Test de Hipótesis
hipótesis.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 2

~Marcela Moraga Cubillos~ 1


03/05/2018

2. Pruebas de decisión estadística


El mundo de las hipótesis.
Hipótesis en la vida Hipótesis de Hipótesis en
cotidiana. investigación estadística.

Afirmaciones cotidianas Proposiciones tentativas


Respuestas tentativas a la
sobre ciertos fenómenos o acerca del comportamiento
pregunta de investigación.
eventos. de las variables.

Diversas fuentes (sentido


común, falta de sentido Se deducen de la teoría. Se deducen de la teoría.
común, etc.).

Se someten a prueba
Deben poder someterse a
Requieren poca evidencia. (cuantitativa) vía
prueba empírica.
instrumental estadístico.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 3

2. Pruebas de decisión estadística

Hipótesis en estadística.

A través de las pruebas de decisión estadística se busca “determinar si


es probable que un valor obtenido a partir de una muestra pertenece
realmente a una población” (García Ferrando 1997: 156).

- Específicamente: Pruebas de hipótesis, test de hipótesis, docimasia de


hipótesis.

- Sirven para testear la probabilidad o improbabilidad de ocurrencia de


ciertas afirmaciones en la población (nuestras hipótesis).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 5

~Marcela Moraga Cubillos~ 2


03/05/2018

3. Formulación de hipótesis estadísticas


Dos tipos de hipótesis opuestas que se pueden someter a prueba:

1. Hipótesis nula o hipótesis estadística (H0)


− La que se somete a prueba en el análisis.
− Indica el valor en la población.
− El test de hipótesis parte del supuesto de que la hipótesis nula es verdadera.
− Permite construir una distribución muestral  Lleva el signo igual (=, ≥, ≤).

2. Hipótesis alternativa (H1)


− Contracara de la hipótesis nula.
− Cubre todas las opciones restantes.
− Es la conclusión cuando rechazamos la hipótesis nula.

Ambos tipos de hipótesis son complementarias y juntan todas las realidades


posibles.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 7

3. Formulación de hipótesis estadísticas


Ejemplo 1:

Supongamos que, a partir de una encuesta realizada a 1800 personas, determinamos que
la tasa de natalidad del País Inter Estatal es de 1,83 hijos por mujer. Queremos saber si
su tasa de natalidad es inferior a la tasa de reemplazo (2,1 hijos por mujer), para
poder afirmar que la población del PIE está envejeciendo.
(Nota: Un país „envejece‟ cuando aumenta la proporción de personas de tercera edad en comparación
con la proporción de niños).

¿Qué hipótesis estadística deberíamos someter a prueba para afirmar que la población del
PIE está envejeciendo? Formule las hipótesis nula y alternativa.

H0: µ ≥ 2,1  La tasa de natalidad del PIE es mayor o igual a


la tasa de reemplazo (2,1).
H1: µ < 2,1  La tasa de natalidad del PIE es menor a la tasa de
reemplazo (2,1) (hipótesis en el enunciado).
Valor externo (objetivo)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 8

~Marcela Moraga Cubillos~ 3


03/05/2018

3. Formulación de hipótesis estadísticas

Ejemplo 2:

Estamos investigando la igualdad de género en el acceso a cargos directivos del mismo


PIE del ejemplo anterior.
Una encuesta realizada a 2000 directivos pro (ahí todos los directivos son pro) mostró que
53% de ellos son mujeres.

¿Cuál hipótesis nula y alternativa deberíamos someter a prueba?

H0: πmujeres = 0,5  La proporción de directivos pro que son mujeres es


igual al 50% (hipótesis en el enunciado).
H1: πmujeres ≠ 0,5  La proporción de directivos pro que son mujeres es
diferente al 50% (sea mayor o menor, igual no
será acceso igualitario).
Valor externo (objetivo)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 9

3. Formulación de hipótesis estadísticas

Ejemplo 3:

Estudios señalan que en países avanzados el promedio de amigos por persona es


6,6. En una encuesta realizada en nuestro PIE favorito a 402 personas, se obtiene que el
promedio de amigos por persona es de 6,9 con una desviación estándar de 4,4.

¿Podría afirmarse que la gente de este PIE tiene un promedio mayor de amigos por
persona respecto al promedio de países avanzados, con 95% de confianza?

H0: µ ≤ 6,6  El promedio de amigos por personas del PIE es


menor o igual al valor en países avanzados (6,6).
H1: µ > 6,6  El promedio de amigos por personas del PIE es
mayor al valor en países avanzados (6,6) (hipótesis
en el enunciado)
Valor externo (objetivo)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 10

~Marcela Moraga Cubillos~ 4


03/05/2018

3. Formulación de hipótesis estadísticas


Ejemplo 4:

Cierta organización ecologista realizó una encuesta en su ciudad de origen a 400 personas. Gracias a
ella se determinó que la producción de kilos de basura per cápita anual en dicha ciudad era de 445,3
kilos.
La gente de la organización siente curiosidad por saber si la cantidad de kilos de basura producidos por
sus vecinos difieren de los kilos producidos en promedio por el país (Chile= 456 kilos per cápita anual,
según The Waste Atlas 2016).
a. Formule la hipótesis nula y alternativas (en símbolos y en palabras).
b. ¿Qué pasaría con las hipótesis nula y alternativa si lo que la organización desea demostrar es
que su ciudad recicla, en promedio, lo mismo que el país?

H0: µ = 456  El promedio de kilos de basura per cápita producidos por la ciudad es
igual al promedio del país (456).
H1: µ ≠ 456  El promedio de kilos de basura per cápita producidos por la ciudad
difiere del promedio del país (456).
Valor externo (objetivo)

Respuesta b.: Las hipótesis no cambian.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 11

3. Formulación de hipótesis estadísticas

Signo de las hipótesis

Habrá notado, a partir de los ejemplos anteriores, que las hipótesis pueden
plantearse con diferentes signos.

 Ojo: La hipótesis nula SIEMPRE debe incluir el signo


igual (=, ≥, ≤).

Hipótesis nula Hipótesis alternativa

Igual a (=) Diferente a (≠)

Mayor o igual que (≥) Menor que (<)

Menor o igual que (≤) Mayor que (>)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 12

~Marcela Moraga Cubillos~ 5


03/05/2018

3. Formulación de hipótesis estadísticas

¿De dónde obtener los valores objetivos para la formulación de hipótesis


univariadas?

1. Un valor hipotético conocido, proveniente de contextos diferentes (v. gr. Amigos en


países desarrollados, datos de otras investigaciones).
2. Un valor hipotético conocido, proveniente de mediciones pasadas.
3. Un valor ideal esperado (v. gr. Tasa de reemplazo, igualdad de género en cargos
directivos).
4. Parámetros conocidos de la población de la que se obtuvo la muestra (v. gr. Datos
censales).
- Útil para ver si la muestra es representativa

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 14

4. Resultados de la prueba de hipótesis


Resultados posibles de la prueba de hipótesis

La H0 es verdadera en la población La H0 es falsa en la población

Error Tipo I
Decisión correcta.
Probabilidad = α
Decisión: Probabilidad = (1 – β)
Rechazar H0 Nivel de significancia.
Potencia de la prueba.
(Probabilidad de rechazar una Ho
(Probabilidad de rechazar una Ho falsa).
verdadera).
Decisión correcta.
Decisión: Probabilidad = (1 – α) Error Tipo II
No rechazar Nivel de confianza. Probabilidad = β
H0 (Probabilidad de aceptar una Ho (Probabilidad de aceptar una Ho falsa).
verdadera).

Existe una relación inversa entre


α y β (no se pueden reducir ambos)
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 16

~Marcela Moraga Cubillos~ 6


03/05/2018

4. Resultados de la prueba de hipótesis


Resultados posibles de la prueba de hipótesis: Analogía legal.
¿Qué es más grave? ¿Encerrar a un inocente o dejar libre a un culpable?

La H0 es verdadera en la población La H0 es falsa en la población

Error Tipo I (α) Decisión correcta (1 – β)


Decisión:
Rechazar H0 Probabilidad de encerrar a alguien que Probabilidad de encerrar a alguien
es inocente. que es culpable.

Decisión: Decisión correcta (1 – α) Error Tipo II (β)


No rechazar Probabilidad de poner en libertad a Probabilidad de poner en libertad a
H0 alguien que es inocente. alguien que es culpable.

Se sugiere que α se mantenga muy pequeño (probar culpabilidad más allá de la duda
razonable).
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 17

4. Resultados de la prueba de hipótesis

El Nivel de Significancia (α) es la probabilidad de cometer Error Tipo I, es


decir, la probabilidad de rechazar una H0 que es verdadera.

- ¿Cuánto nivel de significancia usar?


 Depende de cuánto error estamos
dispuestos a tolerar.

- α  Es la probabilidad de
equivocarme y de que la muestra
seleccionada no contenga a μ (el
parámetro).

- No olvide: El nivel de significancia Recordar Intervalos de Confianza:


es la contracara del nivel de Si α = 0,05 = 5%  Al seleccionar 100
confianza. muestras y calcular los respectivos IC, veo
que 5 de ellas no contienen al parámetro.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 19

~Marcela Moraga Cubillos~ 7


03/05/2018

5. Funcionamiento de la inferencia por pruebas de hipótesis

Intervalo de confianza vs. Test de hipótesis.

Intervalo de confianza
Si en mi muestra encuentro
xbarra, ¿cuál es la
probabilidad de que, desde
xbarra, se elabore un
intervalo que incluya al
valor poblacional?
Test de hipótesis
¿Cuán probable es que
xbarra provenga de una
población con media μ
(hipótesis nula verdadera).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 20

5. Funcionamiento de la inferencia por pruebas de hipótesis


Funcionamiento de la prueba de hipótesis.

1. Situación hipotética: la H0 es verdadera.


- Ejemplo 3: Número de amigos del PIE.
µ ≤ 6,6 ; µ > 6,6

2. Desde la situación hipotética se elabora una


distribución muestral con centro en H0 (media
poblacional hipotética).

3. Se compara la información de la muestra (xbarra) con la media poblacional hipotética


(µ, valor esperado para la población).

4. Pregunta: suponiendo que H0 es verdad, ¿cuán probable es obtener el


promedio entregado por la muestra?
O bien, ¿cuán probable es obtener una muestra con promedio 6,9, si es que la
H0 es verdad?

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 21

~Marcela Moraga Cubillos~ 8


03/05/2018

5. Funcionamiento de la inferencia por pruebas de hipótesis

Inferencia vía pruebas de hipótesis.

Para responder esa(s) última(s) pregunta(s) existen dos vías


equivalentes:

1. Enfoque valor-p  Se basa en el cálculo de probabilidades de


obtención de la muestra.

2. Enfoque clásico  Se basa en el cálculo de los valores t y su


correspondiente comparación con un valor t teórico.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 22

5. Funcionamiento de la inferencia por pruebas de hipótesis


El valor p es una medida sobre lo probable / improbable que es un resultado muestral
suponiendo que la hipótesis nula es verdadera.
Probabilidad de obtener el valor xbarra o más extremo, suponiendo que el valor en la población
fuese μ.

Si valor p ≤ α , Si valor p > α ,


el valor de la muestra es significativamente el valor de la muestra es significativamente
diferente al esperado suponiendo que Ho es verdad. cercano al esperado suponiendo que Ho es verdad.
Se puede rechazar Ho. No se puede rechazar H0.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 23

~Marcela Moraga Cubillos~ 9


03/05/2018

5. Funcionamiento de la inferencia por pruebas de hipótesis

No olvidar…

- Son probabilidades de
Valor-p ocurrencia de ciertos eventos.

- Pueden verse como áreas


Nivel de significancia (α) bajo la curva (de la
distribución muestral).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 24

6. Inferencia con test de hipótesis


Pasos para desarrollar una prueba de hipótesis

Paso 1: Describir el parámetro de interés (μ o π)

Paso 2: Formular las hipótesis nula y alternativa (con valor objetivo).

Paso 3: Criterios de la prueba de hipótesis.

a. Distribución muestral  Uso de s o σ.


Distribución (normal, t de student o binomial) y estadístico.
b. Nivel de confianza  90%, 95%, o 99% ; Nivel de significancia  10%, 5%, 1%.

Paso 4: Presentar datos muestrales  n, gl, xbarra o p, desv. est.

Paso 5: Estandarización del dato de la muestra (observado).


a. Cálculo del estadístico observado.
b. Obtención del valor p.

Paso 6: Aplicación de la regla de decisión.


Se compara el valor p con el nivel de significancia.
Tome una decisión sobre la hipótesis nula.

Paso 7: Redacte una conclusión.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 25

~Marcela Moraga Cubillos~ 10


03/05/2018

6. Inferencia con test de hipótesis

Retomemos el ejemplo 3…

Estudios señalan que en países avanzados el promedio de amigos por persona es


6,6. En una encuesta realizada en nuestro PIE favorito a 402 personas, se obtiene que el
promedio de amigos por persona es de 6,9 con una desviación estándar de 4,4.

¿Podría afirmarse que la gente de este PIE tiene un promedio mayor de amigos por
persona respecto al promedio de países avanzados, con 95% de confianza?

H0: µ ≤ 6,6  El promedio de amigos por personas del PIE es menor o


igual al valor en países avanzados (6,6).
H1: µ > 6,6  El promedio de amigos por personas del PIE es mayor al
valor en países avanzados (6,6) (hipótesis en el enunciado)

Valor externo (objetivo)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 26

6. Inferencia con test de hipótesis: Enfoque valor-p


Enfoque valor-p: Ejemplo 3

Paso 1: Describir el parámetro de interés.


μ = Promedio de amigos en el PIE.

Paso 2: Hipótesis.
H0: μ ≤ 6,6  Promedio de amigos menor o igual a 6,6
H1: μ > 6,6  Promedio de amigos mayor a 6,6

Paso 3: Criterios de la prueba de hipótesis

a. Distribución muestral  Usaremos s (y no σ) pues es una muestra. Por eso se usará t de


student. Pero, como se tienen más de 120 casos, la distribución se comportará como si fuera
normal.
Estadístico de prueba a usar  El estadístico de prueba a usar será t (que se comportará
como z).
b. Nivel de confianza  (1- α) = 95% = 0,95 , Significancia  α = 5% = 0,05

Veamos cómo vamos: Dibuje la distribución muestral y marque todos los valores relevantes (hipótesis
nula, xbarra, nivel de significancia).
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 27

~Marcela Moraga Cubillos~ 11


03/05/2018

6. Inferencia con test de hipótesis: Enfoque valor-p


Enfoque valor-p: Ejemplo 3

Paso 4: n= 402 ; gl=399 ; xbarra= 6,9 ; Desv. Est. = 4,4

Paso 5: Estandarización del dato de la muestra (observado).

a. Cálculo del estadístico observado. X   6,9  6,6


t   1,367  1,37
s 4,4
n 402
b. Obtención del valor p:

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 28

6. Inferencia con test de hipótesis: Enfoque valor-p


Paso 5: Estandarización del dato de la muestra (observado).

a. Cálculo del estadístico observado  1,37


Tener 6,9 amigos, con D.E.=4,4 y n= 402, equivale a un valor t= 1,37.

b. Obtención del valor p:

Según la tabla z…
- la probabilidad que va entre 0 y 1,37 es
0,4147.
- la probabilidad a la derecha de 1,37 es de:
0,5-0,4147= 0,0853

La probabilidad de que mi muestra


venga de una población con μ = 6,6 es
0,085.
 A esto se le llama valor p.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 29

~Marcela Moraga Cubillos~ 12


03/05/2018

6. Inferencia con test de hipótesis: Enfoque valor-p


Paso 6: Aplicación de la regla de decisión.

El valor p se compara con la zona de rechazo α = 0,05 (marcada por el nivel de


significancia, la probabilidad de rechazar una Ho que es verdadera).

Como 0,08 > 0,05, entonces


valor p > α,
y por tanto no se rechaza Ho.

Es muy probable que mi muestra


provenga de una población en que Ho
sea verídica.

Se acepta Ho (H0: μ ≤ 6,6 ). Se afirma que la


gente de este PIE tiene un promedio de
OJO: Como la hipótesis tiene dirección, la
amigos igual o menor respecto al promedio de
significancia se acumula en una sola cola. países avanzados (con 95% de confianza).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 30

7. Reglas de decisión
Regla de decisión para valor p.

Si el valor p es menor o igual al Si el valor p es mayor que el nivel de


nivel de significancia, se rechazará significancia, no se rechazará la
la hipótesis nula. hipótesis nula.

Valor p ≤ α  Rechazo Ho Valor p > α  NO rechazo Ho

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 31

~Marcela Moraga Cubillos~ 13


03/05/2018

8. Dirección de las pruebas de hipótesis

Dirección de la prueba de hipótesis.

Ha: μ > A
Cola a la derecha.

Ha: μ ≠ A
Dos colas.

Ha: μ < A
Cola a la izquierda.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 32

9. Inferencia con test de hipótesis: Enfoque clásico

Inferencia vía pruebas de hipótesis.

Para responder esa(s) última(s) pregunta(s) existen dos vías


equivalentes:

1. Enfoque valor-p  Se basa en el cálculo de probabilidades de


obtención de la muestra.

2. Enfoque clásico  Se basa en el cálculo de los valores t y su


correspondiente comparación con un valor t teórico.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 33

~Marcela Moraga Cubillos~ 14


03/05/2018

9. Inferencia con test de hipótesis: Enfoque clásico


Enfoque clásico: Ejemplo 3
X   6,9  6,6
Paso 5.a: Cálculo del estadístico observado. t   1,367  1,37
s 4,4
Paso 5.b: (Not today)
n 402

Paso 6: Aplicación de la regla de decisión.

t obs < t teórico Como


1,37 < 1,65 t observado < t teórico
entonces el t observado cae en
zona de aceptación de Ho.

Se acepta Ho (H0: μ ≤ 6,6 ). Se afirma


que la gente de este PIE tiene un
promedio de amigos igual o menor
OJO: Como la hipótesis tiene dirección, la respecto al promedio de países
significancia se acumula en una sola cola. Corrobore en avanzados (con 95% de confianza).
la tabla el valor de z para una probabilidad de 0,05.
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 34

~Marcela Moraga Cubillos~ 15

También podría gustarte