Está en la página 1de 37

Análisis Cuantitativo y de Datos

Universidad Sergio Arboleda, 2019 -2


Pruebas de hipótesis

Juan C. Taborda Burgos, Ph.D.

juan.taborda@correo.usa.edu.co

1 / 37
Agenda

1 Temas del Curso

2 Anuncios

3 Pensar en investigación cuantitativa

4 Tema del dı́a

2 / 37
Temas del curso
Esta clase va a abordar los siguientes temas:
1 Introducción a estadı́sticas y métodos cuantitativos
2 Medición: teorı́a, validez y confiabilidad
3 Diseño de investigación

4 Estadı́sticas descriptivas
5 Datos y técnicas de recolección de datos

6 Estadı́sticas inferenciales
7 Probabilidad
8 Prueba de hipótesis
9 Medidas de asociación de variables
10 Regresión

11 Temas pendientes
3 / 37
Anuncios

1 Taller 2 para entregar antes de las 7 am el jueves


I Prefiero preguntas a través del foro del taller que por correo

4 / 37
Pensar en investigación cuantitativa

Investigación cuantitativa relacionada con temas de ideologı́a polı́tica

¿Qué determina la posición ideológica de un partido?


¿Cómo saber si un cambio hace que los partidos tradicionales adopten
posiciones más radicales?

5 / 37
Pensar en investigación cuantitativa

Investigación cuantitativa relacionada con temas de ideologı́a polı́tica

¿Qué determina la posición ideológica de un partido?


¿Cómo saber si un cambio hace que los partidos tradicionales adopten
posiciones más radicales?

¿Por qué estamos hablando de esto?


Algunos de ustedes están realizando una investigación en temas
relacionados y además es un tema central en esta campaña. ¿Cómo

contestar estas preguntas?


I Variables a observar
I Metodologı́as

6 / 37
Pensar en investigación cuantitativa

Abou-Chadi, T., & Krause, W. (2018). The Causal Effect of Radical Right Success on
Mainstream Parties’ Policy Positions: A Regression Discontinuity Approach. British
Journal of Political Science
Diseño metodológico: Diseño de regresión discontinua

Discontinuidad: Éxito de partidos de extrema derecha en el parlamento

Datos: Resultados electorales y posiciones polı́ticas para 23 paı́ses europeos entre


1980-2014
I Variable dependiente: Posición partido polı́tico tradicional frente a
polı́ticas anti-migración y proteccionismo cultural (Norris, 2005)
I Variable independiente: ± Estar en un paı́s donde un partido radical
ganó puestos en el parlamento en la elección pasada

7 / 37
Pensar en investigación cuantitativa
Resultados:
Partidos establecidos reaccionan al éxito de partidos radicales de derecha adoptando
algunas de sus posiciones radicales (en Europa: polı́ticas anti-migración y polı́ticas de
proteccionismo cultural)

I La derecha radical juega un rol fundamental en la politización del movimiento


anti-migratorio
I La transformación del espacio polı́tico en Europa no solo responde a un cambio del
electorado, sino más a la interacción estratégica entre partidos polı́ticos
I Los partidos polı́ticos no solo reaccionan a los cambios de actitudes del electorado
sino al comportamiento de otros partidos 8 / 37
Pruebas de hipótesis

Pruebas de hipótesis → Es el uso de métodos cuantitativos para evaluar


los parámetros que estimamos y ver que confiabilidad tienen. Por ejemplo,
usar pruebas de hipótesis nos permitirá evaluar si la media de una
población (σ) es igual a un valor especı́fico.
Una hipótesis es una pregunta que solicita información sobre un problema.

1 Hipótesis nula (H0 ) e hipótesis alternativa (Ha o H1 )


2 Errores tipo I y tipo II
3 Valor-p
4 Pruebas de una cola
5 Pruebas de dos colas
6 Intervalos de confianza y pruebas de hipótesis
7 ttests

9 / 37
Repaso rápido de conceptos que ya vimos y necesitamos
para prueba de hipótesis
I El valor estándarizado de una observación Xi es:
Xi − X̄
Xistand =
s

10 / 37
Repaso rápido de conceptos que ya vimos y necesitamos
para prueba de hipótesis
I El valor estándarizado de una observación Xi es:
Xi − X̄
Xistand =
s

I Si X viene de una población con media µ y la muestra es


representativa y aleatoria, sabemos que X̄ ≈ µ

11 / 37
Repaso rápido de conceptos que ya vimos y necesitamos
para prueba de hipótesis
I El valor estándarizado de una observación Xi es:
Xi − X̄
Xistand =
s

I Si X viene de una población con media µ y la muestra es


representativa y aleatoria, sabemos que X̄ ≈ µ

I El teorema del lı́mite central señala que dada una población con
media µ y s.d. σ, obtener múltiples muestra de tamaño n generará
2
una distribución con media X̄ distribuida normalmente ∼ N (µ, σn )

12 / 37
Repaso rápido de conceptos que ya vimos y necesitamos
para prueba de hipótesis
I El valor estándarizado de una observación Xi es:
Xi − X̄
Xistand =
s

I Si X viene de una población con media µ y la muestra es


representativa y aleatoria, sabemos que X̄ ≈ µ

I El teorema del lı́mite central señala que dada una población con
media µ y s.d. σ, obtener múltiples muestra de tamaño n generará
2
una distribución con media X̄ distribuida normalmente ∼ N (µ, σn )

I A medida que n crece, la distribución t con (n-1) grados de libertad


(T n − 1) se aproxima a la distribución normal estándar ∼ N (0, 1)
13 / 37
Hipótesis nula (H0 ) e hipótesis alternativa (Ha o H1 )

Uno de los temas más importantes, y más complicados de una


investigación es determinar la hipótesis nula (H0 ) y la hipótesis alternativa
(Ha o H1 ).
I Hipótesis nula (H0 ): Es la hipótesis de que nada sucede.
I Hipótesis alternativa (Ha o H1 ): Es la hipótesis que contradice el
contenido de H0 , y es usualmente la hipótesis de investigación.

14 / 37
Hipótesis nula (H0 ) e hipótesis alternativa (Ha o H1 )

Uno de los temas más importantes, y más complicados de una


investigación es determinar la hipótesis nula (H0 ) y la hipótesis alternativa
(Ha o H1 ).
I Hipótesis nula (H0 ): Es la hipótesis de que nada sucede.
I Hipótesis alternativa (Ha o H1 ): Es la hipótesis que contradice el
contenido de H0 , y es usualmente la hipótesis de investigación.

Las H0 se pueden evaluar con estadı́sticas inferenciales y por eso


evaluamos la validez de las mismas.
Si podemos rechazar H0 , tenemos que aceptar Ha , si no rechazamos la H0
no podemos asegurar o no podemos aceptar Ha

15 / 37
Hipótesis nula (H0 ) e hipótesis alternativa (Ha o H1 )

I Si la hipótesis de investigación Ha señala que un resultado se ha


producido, la H0 es que el resultado no se produjo
I Si la hipótesis de investigación Ha señala que una polı́tica tuvo un
efecto, la H0 es que polı́tica no tuvo ese efecto
I Si la hipótesis de investigación Ha señala que un cambio sucedió, la
H0 indica que no hubo cambio
I Si la hipótesis de investigación Ha señala que un valor es mayor que
50, la H0 es que el valor no es mayor que 50
I Si la hipótesis de investigación Ha señala que el puntaje del grupo de
control es menor que grupo tratado, la H0 es que el puntaje del grupo
de control no es menor que grupo tratado

16 / 37
Hipótesis nula (H0 ) e hipótesis alternativa (Ha o H1 )

I Si la hipótesis de investigación Ha señala que un resultado se ha


producido, la H0 es que el resultado no se produjo
I Si la hipótesis de investigación Ha señala que una polı́tica tuvo un
efecto, la H0 es que polı́tica no tuvo ese efecto
I Si la hipótesis de investigación Ha señala que un cambio sucedió, la
H0 indica que no hubo cambio
I Si la hipótesis de investigación Ha señala que un valor es mayor que
50, la H0 es que el valor no es mayor que 50
I Si la hipótesis de investigación Ha señala que el puntaje del grupo de
control es menor que grupo tratado, la H0 es que el puntaje del grupo
de control no es menor que grupo tratado

H0 : µ ≥ µ 0 H0 : µ ≤ µ 0 H0 : µ = µ0
Ha : µ < µ0 Ha : µ > µ0 Ha : µ 6= µ0

17 / 37
El diseño de investigación y los errores tipo I y tipo II
Depende de cómo formulamos la hipótesis, nuestra investigación será
objeto de errores de tipo I o errores de tipo II.

18 / 37
El diseño de investigación y los errores tipo I y tipo II
Depende de cómo formulamos la hipótesis, nuestra investigación será
objeto de errores de tipo I o errores de tipo II.

Si la hipótesis de investigación Ha señala que hay un embarazo, la H0


indica que no hay embarazo 19 / 37
El diseño de investigación y los errores tipo I y tipo II
Depende de cómo formulamos la hipótesis, nuestra investigación será
objeto de errores de tipo I o errores de tipo II.

I Error tipo I: Rechazo H0 → Digo que el hombre está embarazado


I Error tipo II: Acepto H0 → Digo que la mujer embarazada no está
embarazada

20 / 37
Prueba de hipótesis

Pasos para realizar una prueba de hipótesis


1 Formule la H0 y la Ha
2 Adquiera datos relevantes para probar las hipótesis
3 Evalúe H0 a la luz de sus datos
4 Acepte o rechace la H0 . Recuerde que si no rechazamos H0 , sabemos
que los datos no sirven para probar Ha

21 / 37
Ejercicio: Prueba de hipótesis
El comandante de policı́a quiere evaluar que tan efectiva ha sido la entrada en vigor del
nuevo código de policı́a. Antes del la vigencia de la ley la policı́a imponı́a 6 multas por
dı́a. Por el asunto de las empanadas al comandante lo llaman al consejo para un debate
de control polı́tico. El comandante le pide a usted que evalúe si la mano dura contra las
contravenciones ha sido una polı́tica exitosa. Usted no tiene tiempo para evaluar todos
los dı́as del año, pues el comandante necesita la información para ya. Sin embargo sabe
que si escoge 10 dı́as de manera aleatoria probablemente tendrá suficiente información
para contestar la pregunta del comandante
Dı́a Multas
1 8
2 12
3 7
1 Formule la H0 y la Ha
4 5
5 9 I H :
0
6 6 I H :
a
7 3
8 2
9 8
10 13
22 / 37
Ejercicio: Prueba de hipótesis
El comandante de policı́a quiere evaluar que tan efectiva ha sido el nuevo código de
policı́a. Antes del la vigencia de la ley la policı́a imponı́a 6 multas por dı́a. Por el asunto
de las empanadas al comandante lo llaman para un debate de control polı́tico. El
comandante le pide que evalúe si la mano dura contra las contravenciones ha sido
exitosa. Usted no tiene tiempo para evaluar todos los dı́as del año, pues el comandante
necesita la información para ya, y escoge 10 dı́as al azar para contestar la pregunta.
1 Formule la H0 y la Ha
Dı́a Multas
1 8 I H0 : Con el nuevo código de policia no hay
2 12 más de 6 multas por dı́a
3 7 I Ha : Con el nuevo código de policı́a hay más de
4 5 6 multas por dı́a
5 9
6 6
7 3
8 2
9 8
10 13

23 / 37
Ejercicio: Prueba de hipótesis
El comandante de policı́a quiere evaluar que tan efectiva ha sido el nuevo código de
policı́a. Antes del la vigencia de la ley la policı́a imponı́a 6 multas por dı́a. Por el asunto
de las empanadas al comandante lo llaman para un debate de control polı́tico. El
comandante le pide que evalúe si la mano dura contra las contravenciones ha sido
exitosa. Usted no tiene tiempo para evaluar todos los dı́as del año, pues el comandante
necesita la información para ya, y escoge 10 dı́as al azar para contestar la pregunta.
1 Formule la H0 y la Ha
Dı́a Multas
1 8 I H0 : Con el nuevo código de policia no hay
2 12 más de 6 multas por dı́a
3 7 I Ha : Con el nuevo código de policı́a hay más de
4 5 6 multas por dı́a
5 9
6 6 2 Adquiera datos relevantes para probar las hipótesis:
7 3
8 2 I X̄ = 7.3 y s = 3.53
3.53
9 8 I s.e. = √ 10
10 13
X̄ −µ 7.3−6
3 Evalúe H0 → t = s.e
= 1.17
= 1.11
24 / 37
Ejercicio: Prueba de hipótesis

Con el comando de Stata (ttail(9, 1.11)), usted calcula que sacar una
muestra con media de 7.1 es de 0.148.

¿Qué debemos hacer, aceptar la H0 o rechazarla?

25 / 37
Ejercicio: Prueba de hipótesis

Con el comando de Stata (ttail(9, 1.11)), usted calcula que sacar una
muestra con media de 7.1 es de 0.148.

¿Qué debemos hacer, aceptar la H0 o rechazarla?


I Depende de qué tan seguros queremos estar de la decisión.
Acá es donde el método del valor-p es relevante para ver que tan grande
es una probabilidad.

26 / 37
Valor-p

Valor-p → Se utiliza para saber si la H0 debe ser rechazada.

Si el valor-p es pequeño hay una evidencia mayor contra la hipótesis nula.


Cuando evaluamos H0 , la regla general es evaluar la probabilidad contra
un valor α. El objetivo de una prueba de hipótesis es conseguir un valor-p
suficientemente pequeño de modo que sean menores que un nivel de
significancia.
nivel de significancia → el error que estamos dispuestos a aceptar.
I La mejor manera de entender esto es que un α = 0.05 implica que
estamos dispuestos a tolerar un riesgo del 5% de rechazar la hipótesis
nula cuando es verdadera.
Rechazar H0 si valor-p ≤ α

27 / 37
Prueba de una cola o pruebas de dos colas

Con el método de valores-p podemos empezar a ver dónde deben estar los
datos para rechazar o no rechazar la H0

Para esto podemos utilizar las siguientes:

Prueba cola inferior Prueba cola superior Prueba de dos colas

El área en rojo se conoce como la región de rechazo

28 / 37
Pruebas con media poblacional y σ conocida

29 / 37
Pruebas con media poblacional y σ desconocida

30 / 37
Prueba de una cola o pruebas de dos colas
Teniendo clara la diferencia de las pruebas y la relación entre el valor-p y α
podemos evaluar la H0 :
Relación entre valor-p y α Relación con la zona de rechazo H0 Ha
si valor-p < α Está en la zona de rechazo Rechazar la H0 Aceptar Ha
si valor-p > α No está en la zona de rechazo No rechazar la H0 No aceptar Ha

I La decisión de cuál tipo de test utilizar se supone depende si estamos


evaluando si H0 ≥ µ0 , H0 ≤ µ0 o H0 6= µ0

I La verdad deberı́an desconfiar de los tests de una cola


I Para los efectos de esta clase (y sugiero para sus efectos académicos)
solo utilicen tests de dos colas

31 / 37
Prueba de una cola o pruebas de dos colas
Teniendo clara la diferencia de las pruebas y la relación entre el valor-p y α
podemos evaluar la H0 :
Relación entre valor-p y α Relación con la zona de rechazo H0 Ha
si valor-p < α Está en la zona de rechazo Rechazar la H0 Aceptar Ha
si valor-p > α No está en la zona de rechazo No rechazar la H0 No aceptar Ha

I La decisión de cuál tipo de test utilizar se supone depende si estamos


evaluando si H0 ≥ µ0 , H0 ≤ µ0 o H0 6= µ0

I La verdad deberı́an desconfiar de los tests de una cola


I Para los efectos de esta clase (y sugiero para sus efectos académicos)
solo utilicen tests de dos colas
¿y qué paso con el caso de las empanadas?

32 / 37
Prueba de una cola o pruebas de dos colas
Teniendo clara la diferencia de las pruebas y la relación entre el valor-p y α
podemos evaluar la H0 :
Relación entre valor-p y α Relación con la zona de rechazo H0 Ha
si valor-p < α Está en la zona de rechazo Rechazar la H0 Aceptar Ha
si valor-p > α No está en la zona de rechazo No rechazar la H0 No aceptar Ha

I La decisión de cuál tipo de test utilizar se supone depende si estamos


evaluando si H0 ≥ µ0 , H0 ≤ µ0 o H0 6= µ0

I La verdad deberı́an desconfiar de los tests de una cola


I Para los efectos de esta clase (y sugiero para sus efectos académicos)
solo utilicen tests de dos colas
¿y qué paso con el caso de las empanadas?
I En el caso de las empanadas el valor-p que calculamos es de 0.148
que es mayor al α que estabamos dispuestos a aceptar. Por eso
sabemos que no podemos rechazar la H0 lo que implica que no
podemos aceptar la Ha
33 / 37
Método de intervalo de confianza para probar una hipótesis

I Lo mismo que hemos visto, básicamente la diferencia es que


construimos el intervalo de confianza para X̄ y el valor H0 hace parte
del intervalo, no podemos rechazar H0
I Noten en la fórmula que usamos el valor z asociado a α/2
34 / 37
ttest
Cuando hablamos de un ttest simplemente estamos hablando de una
prueba de hipótesis a las medias. Básicamente lo que estamos evaluando
es si X̄ es igual a un valor o es si X̄1 y X̄2 vienen de una misma población
con µ.

Este test también nos permite averiguar si X̄1 es estadı́sticamente diferente


de X̄2
1 Calcule la media y desviación estándar para cada grupo

2 Calcule el error estándar de la media para cada grupo

3 Calcule el error estándar general o agrupado

q
s.e.d = s.e.21 + s.e.22
4 Calcule el valor t y revise si podemos aceptar o rechazar H0
X̄1 − X̄2
t=
s.e.d
35 / 37
ttest

En general hablamos de cuatro tipos de ttest:


1 ttest simple
2 ttest para muestras (observaciones) dependientes
3 ttest para muestras independientes con varianzas iguales
4 ttest para muestras independientes con varianzas diferentes

36 / 37
ttest

En general hablamos de cuatro tipos de ttest:


1 ttest simple
2 ttest para muestras (observaciones) dependientes
3 ttest para muestras independientes con varianzas iguales
4 ttest para muestras independientes con varianzas diferentes

En vez de explicar con todo el detalle cada una de las diferencias vamos a
hacer esto en Stata:
I Abran el dofile: ttest stata

37 / 37

También podría gustarte