Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo final
Análisis de regresión
1. Pregunta de investigación
2. Hipótesis
Formule las hipótesis de asociación entre la variable dependiente y cada una de las
variables independientes.
*Notas:
1) En el caso de variables independientes dicotómicas, la hipótesis debe formularse en
términos de comparación entre las categorías, y hay que decidir cuál es la categoría de
interés y cuál la de referencia.
2) En el caso de variables independientes nominales, se debe formular la hipótesis de modo
similar a las dicotómicas: seleccionar una categoría de interés y otra categoría de
referencia.
3) En el caso de variables independientes ordinales, suele ser recomendable asumirlas como
si fueran numéricas, pero sus categorías deben estar codificadas de menor a mayor.
1
3. Fuente de datos
4. Análisis descriptivos
Tabla 1
Violencia ginecológica
Gráfico 1
2
Tabla 2
Identidad étnica
Gráfico 2
3
Tabla 3
Área de residencia
Gráfico 3
4
Tabla 4
Gráfico 4
5
Tabla 5
Edad
Gráfico 5
6
5. Regresiones bivariadas
Incluya aquí la tabla con los resultados de cada una de las regresiones simples. Recuerde
editarla para una buena comprensión y presentación. Incluir título y notas al pie de tabla. A
continuación, redacte la interpretación de los resultados de los coeficientes para cada una
de las variables independientes, en conexión con las hipótesis formuladas arriba.
Tabla 6
1 2 3 4
Afroecuatoria 3.464
no/a
(1.258)
Negro/a 0.000
(1458.507
Mulato/a 0.000
(1684.138
7
Montubio/a 0.000
(1496.396
Mestizo/a 1.261
(0.736)
Blanco/a 2.156
(1.016)
Otro 0.000
(3765.847
(0.362)
Educación 1.057
(0.094)
Edad 1.009
(0.010)
Log -175.587 - - -
Likelihood 177.649 177.519 177.267
8
1. Variable independiente identidad
mayor en áreas rurales, que en áreas urbanas. El coeficiente no presenta niveles aceptables de
significación estadística.
6. Anexo: sintaxis
Sintaxis Stata
9
labelbook violencia
tab violencia
recode violencia (Si=1) (No= 0) (-3=.)
use "C:\Users\estudiantes\Downloads\201911_EnvigmuBDD_indicadores_violencia.dta",
clear
tab f4_s8_2_a
labelbook f4_s8_2_a
tab f4_s8_2_a
gen violencia= f4_s8_2_a
recode (2=0) (-5 -2=.)
recode violencia (2=0) (3=.)
tab violencia
lab def violencia 1"Si" 0"No"
lab val violencia violencia
tab
tab (2=0) (-5 -2=.)
tab violencia
tab f1_s2_16_1
labelbook f1_s2_16_1
gen educacion= f1_s2_16_1
tab educacion
tab f1_s2_3
elbook f1_s2_3
labelbook f1_s2_3
gen f1_s2_3= edad
tab edad
labelbook f1_s2_3
gen edad= f1_s2_3
tab edad
b f1_s2_6
tab f1_s2_6
labelbook f1_s2_6
gen identidad= f1_s2_6
tab f1_s2_6
tab identidad
tab area
save "C:\Users\estudiantes\Desktop\datos modificados.dta"
tab violencia
graph bar, over(violencia)
.Graph.Dimensions 584 313
graph export "C:\Users\estudiantes\Desktop\Graph 1.png", as(png) replace
tab identidad
graph bar, over(identidad)
graph export "C:\Users\estudiantes\Desktop\Graph 2.png", as(png) replace
tab area
graph bar, over(area)
graph export "C:\Users\estudiantes\Desktop\Graph 3.png", as(png) replace
10
tab educacion
graph bar, over(educacion)
graph export "C:\Users\estudiantes\Desktop\Graph 4.png", as(png) replace
sum edad
hist edad
graph export "C:\Users\estudiantes\Desktop\Graph 5.png", as(png) replace
Sintaxis R
#0. Antes de iniciar, es necesario haber examinado las variables seleccionadas y realizado los
siguientes cambios (si aplican):
#Eliminar categorias de no respuesta (no sabe, no contesta, etc.)
#Recodificar variables dicotomicas: categoria de interes como "1", categoria de referencia como
"0".
#Recodificar variables ordinales para que las categorias vayan en sentido menor a mayor
(dependiendo de la formulacion de pregunta e hipotesis).
#Una vez depuradas las variables, elaborar tablas y graficos descriptivos.
#2.Instalar paquetes
install.packages("haven")
library("haven")
install.packages("texreg")
library("texreg")
11
#6. Fijar base de datos:
attach(BASEDEDATOS2)
#7. Regresiones logisticas simples (una sola variable independiente a la vez). Sintaxis de
comando "glm": Primero va la variable dependiente seguida de un signo ~, a continuacion la
variable independiente
#IMPORTANTE: para que la estimacion funcione correctamente, la variable dependiente debe
estar codificada como 0, 1. Es decir, el valor afirmativo o de interes como 1, y el negativo como 0
(por ejemplo, "Si"=1, "No"=0)
#Regresion 1:
reg1=glm(violencia ~ identidad, family = binomial)
summary(reg1)
#Regresion 2:
reg2=glm(violencia ~ area, family = binomial)
summary(reg2)
#Regresion 3:
reg3=glm(violencia ~ educacion, family = binomial)
summary(reg3)
#Regresion 4:
reg4=glm(violencia ~ edad, family = binomial)
summary(reg4)
#Interpretacion: Odds ratio menor a 1 indica asociacion negativa; mientras, odds ratio mayor a 1
indican asociacion positiva. Mientras mas se aleje de 1, mas fuerte la asociacion.
#Para una mejor comprension, se puede transformar las odds ratio a porcentajes utilizando la
siguiente formula: (Odds ratio -1)*100. Ejemplo:
(1.019 -1)*100
#En este ejemplo obtenemos un valor de 1.9%. La interpretacion seria: La probabilidad de
definirse como una persona religiosa aumenta 1.9% con cada anio adicional de edad.
12
#Ej. Supongamos que en la variable de sexo queremos que "Mujer" sea la categoria de referencia
y "Hombre", la de interes:
levels(sexo)
reg2=glm(defrelig ~ relevel(sexo, ref = "1"), family = binomial)
summary(reg2)
13