Informe de Análisis de Regresión 1

Métodos cuantitativos de investigación
Trabajo final
Análisis de regresión
Nombre: Rebeca Villavicencio
1. Pregunta de investigación
Formule la pregunta de investigación que guía su trabajo. La pregunta debe redactarse en

términos explicativos. También debe contener la unidad de análisis del estudio.
¿Qué características de las mujeres ecuatorianas mayores de 15 años están asociadas a la

probabilidad de haber experimentado violencia durante la atención ginecológica?
2. Hipótesis
Formule las hipótesis de asociación entre la variable dependiente y cada una de las
variables independientes.
*Notas:
1) En el caso de variables independientes dicotómicas, la hipótesis debe formularse en
términos de comparación entre las categorías, y hay que decidir cuál es la categoría de
interés y cuál la de referencia.
2) En el caso de variables independientes nominales, se debe formular la hipótesis de modo
similar a las dicotómicas: seleccionar una categoría de interés y otra categoría de
referencia.
3) En el caso de variables independientes ordinales, suele ser recomendable asumirlas como
si fueran numéricas, pero sus categorías deben estar codificadas de menor a mayor.
H1: La probabilidad de haber experimentado violencia durante la atención ginecológica
tiende a ser menor en mujeres mestizas, que en mujeres indígenas.
tiende a ser mayor en áreas rurales, que en áreas urbanas.
tiende a ser menor a mayor nivel educativo.
tiende a ser mayor a mayor edad.
1
3. Fuente de datos
Nombre de la encuesta: Encuesta nacional sobre relaciones familiares y violencia de

género contra las mujeres
Institución que la realiza: INEC
Año de aplicación: 2019
País o países: Ecuador
Población objetivo: Mujeres de 15 a 99 años
Nivel de representatividad: Nacional y provincial
Tamaño de la muestra: 20. 848
Tipo de muestra: Muestreo probabilístico
4. Análisis descriptivos
Incluya aquí tablas y gráficos descriptivos para la variable dependiente y variables

independientes. Recuerde editarlos para una buena comprensión y presentación. Incluir
títulos para cada uno.
Tabla 1
Violencia ginecológica
Violencia Freq. Porcentaje

No 1,482 97.50
Si 38 2.50
Total 1,52 100.00
Gráfico 1
2
Tabla 2
Identidad étnica
Identidad Freq. Porcentaje

Indígena 2,112 12.27
Afroecuat
oriano/a 175 1.02
Negro/a 220 1.28
Mulato/a 170 0.99
Montubio/
a 385 2.24
Mestizo/a 13,698 79.59
Blanco/a 420 2.44
Otro 31 0.18
Total 17,211 100.00
Gráfico 2
3
Tabla 3
Área de residencia
Área Freq. Porcentaje

Urbana 10,98 63.80
Rural 6,231 36.20
Total 17,211 100.00
Gráfico 3
4
Tabla 4
Nivel de formación educacional
Educación Freq. Porcentaje

Ninguno 1,018 5.91
Centro de
alfabetizaci
ón 83 0.48
Primaria 5,741 33.36
Educación
Básica 769 4.47
Secundaria 4,384 25.47
Bachillerato 2,14 12.43
Superior no
Universitari
o 359 2.09
Superior
Universitari
o 2,547 14.80
Posgrado 170 0.99
Total 17,211 100.00
Gráfico 4
5
Tabla 5
Edad
Obs Media Des. Est Min Max
17,211 4.320.562 1.795.869 15 99
Gráfico 5
6
5. Regresiones bivariadas
Incluya aquí la tabla con los resultados de cada una de las regresiones simples. Recuerde
editarla para una buena comprensión y presentación. Incluir título y notas al pie de tabla. A
continuación, redacte la interpretación de los resultados de los coeficientes para cada una
de las variables independientes, en conexión con las hipótesis formuladas arriba.
Tabla 6
Odds ratio para experiencia de violencia durante la atención ginecológica
1 2 3 4
(Intercepto) 0.021*** 0.025*** 0.017*** 0.019***
(0.714) (0.195) (0.697) (0.370)
Afroecuatoria 3.464
no/a
(1.258)
Negro/a 0.000
(1458.507
Mulato/a 0.000
(1684.138
7
Montubio/a 0.000
(1496.396
Mestizo/a 1.261
(0.736)
Blanco/a 2.156
(1.016)
Otro 0.000
(3765.847
Área: Rural 1.121
(0.362)
Educación 1.057
(0.094)
Edad 1.009
(0.010)
AIC 367.173 359.299 359.038 358.533
BIC 409.785 369.952 369.691 369.186
Log -175.587 - - -
Likelihood 177.649 177.519 177.267
Deviance 351.173 355.299 355.038 354.533
Num. obs. 1520 1520 1520 1520
8
1. Variable independiente identidad
La probabilidad de haber experimentado violencia durante la atención ginecológica es 126%
[(1.261-1) *100] mayor en mujeres mestizas que en mujeres indígenas. El coeficiente no
presenta niveles aceptables de significación estadística. Este resultado contradice la hipótesis
1, pero no puede inferirse su aplicación para toda la población.
2. Variable independiente área
La probabilidad de haber experimentado violencia durante la atención ginecológica es 121%
mayor en áreas rurales, que en áreas urbanas. El coeficiente no presenta niveles aceptables de
significación estadística.
3. Variable independiente educación
4. Variable independiente edad
6. Anexo: sintaxis
Copie aquí la sintaxis de Stata y R que fue utilizada en los análisis.
Sintaxis Stata
use "C:\Users\estudiantes\Downloads\datos modificados.dta", clear

use "C:\Users\estudiantes\Downloads\201911_EnvigmuBDD_indicadores_violencia.dta",
clear
tab f4_s8_2_a
labelbook f4_s8_2_a
Si= 1, No= 0
gen violencia= f4_s8_2_a
tab violencia
9
labelbook violencia
tab violencia
recode violencia (Si=1) (No= 0) (-3=.)
use "C:\Users\estudiantes\Downloads\201911_EnvigmuBDD_indicadores_violencia.dta",
clear
tab f4_s8_2_a
labelbook f4_s8_2_a
tab f4_s8_2_a
gen violencia= f4_s8_2_a
recode (2=0) (-5 -2=.)
recode violencia (2=0) (3=.)
tab violencia
lab def violencia 1"Si" 0"No"
lab val violencia violencia
tab
tab (2=0) (-5 -2=.)
tab violencia
tab f1_s2_16_1
labelbook f1_s2_16_1
gen educacion= f1_s2_16_1
tab educacion
tab f1_s2_3
elbook f1_s2_3
labelbook f1_s2_3
gen f1_s2_3= edad
tab edad
labelbook f1_s2_3
gen edad= f1_s2_3
tab edad
b f1_s2_6
tab f1_s2_6
labelbook f1_s2_6
gen identidad= f1_s2_6
tab f1_s2_6
tab identidad
tab area
save "C:\Users\estudiantes\Desktop\datos modificados.dta"
tab violencia
graph bar, over(violencia)
.Graph.Dimensions 584 313
graph export "C:\Users\estudiantes\Desktop\Graph 1.png", as(png) replace
tab identidad
graph bar, over(identidad)
tab area
graph bar, over(area)
10
tab educacion
graph bar, over(educacion)
sum edad
hist edad
Sintaxis R
#####Regresion logistica (variable dependiente dicotomica)#####
#0. Antes de iniciar, es necesario haber examinado las variables seleccionadas y realizado los
siguientes cambios (si aplican):
#Eliminar categorias de no respuesta (no sabe, no contesta, etc.)
#Recodificar variables dicotomicas: categoria de interes como "1", categoria de referencia como
"0".
#Recodificar variables ordinales para que las categorias vayan en sentido menor a mayor
(dependiendo de la formulacion de pregunta e hipotesis).
#Una vez depuradas las variables, elaborar tablas y graficos descriptivos.
#1. Establecer directorio de trabajo

setwd("C:/Users/estudiantes/Desktop")
#2.Instalar paquetes
install.packages("haven")
library("haven")
install.packages("texreg")
library("texreg")
#3. Importar base de datos

BASEDEDATOS=read_dta("datos modificados.dta")
#4. Crear base de datos solo con variables seleccionadas

BASEDEDATOS2=BASEDEDATOS[c("violencia", "educacion", "edad", "identidad", "area")]
rm(BASEDEDATOS)
#5. Revisar tipo de datos y coercionar si es necesario:

#IMPORTANTE: para regresion logistica, la variable dependiente debe estar como "factor"
#Las variables categoricas deben estar como "factor", excepto las ordinales, que deben estar
como "numeric", si se las va a interpretar como numericas.
#Las variables numericas deben estar como "numeric".
BASEDEDATOS2$violencia=as.factor(BASEDEDATOS2$violencia)
BASEDEDATOS2$edad=as.numeric(BASEDEDATOS2$edad)
BASEDEDATOS2$area=as.factor(BASEDEDATOS2$area)
BASEDEDATOS2$educacion=as.numeric(BASEDEDATOS2$educacion)
BASEDEDATOS2$identidad=as.factor(BASEDEDATOS2$identidad)
11
#6. Fijar base de datos:
attach(BASEDEDATOS2)
#7. Regresiones logisticas simples (una sola variable independiente a la vez). Sintaxis de
comando "glm": Primero va la variable dependiente seguida de un signo ~, a continuacion la
variable independiente
#IMPORTANTE: para que la estimacion funcione correctamente, la variable dependiente debe
estar codificada como 0, 1. Es decir, el valor afirmativo o de interes como 1, y el negativo como 0
(por ejemplo, "Si"=1, "No"=0)
#Regresion 1:
reg1=glm(violencia ~ identidad, family = binomial)
summary(reg1)
#Regresion 2:
reg2=glm(violencia ~ area, family = binomial)
summary(reg2)
#Regresion 3:
reg3=glm(violencia ~ educacion, family = binomial)
summary(reg3)
#Regresion 4:
reg4=glm(violencia ~ edad, family = binomial)
summary(reg4)
###Ojo: la interpretaciÃ³n de los coeficientes en regresion logistica no es directa como en la

regresion lineal. Estan expresados en funcion logaritmica, y deben transformarse a un valor
conocido como "odds ratio".
#Exportar los resultados a Word convirtiendo coeficientes a odds ratio:
htmlreg(list(reg1, reg2, reg3, reg4), file = "Ejemplo regresiones logisticas simples.doc",
override.coef = (list(exp(coef(reg1)), exp(coef(reg2)), exp(coef(reg3)), exp(coef(reg4)))),
inline.css = FALSE, digits=3, doctype = TRUE, html.tag = TRUE, head.tag = TRUE, body.tag =
TRUE)
#Interpretacion: Odds ratio menor a 1 indica asociacion negativa; mientras, odds ratio mayor a 1
indican asociacion positiva. Mientras mas se aleje de 1, mas fuerte la asociacion.
#Para una mejor comprension, se puede transformar las odds ratio a porcentajes utilizando la
siguiente formula: (Odds ratio -1)*100. Ejemplo:
(1.019 -1)*100
#En este ejemplo obtenemos un valor de 1.9%. La interpretacion seria: La probabilidad de
definirse como una persona religiosa aumenta 1.9% con cada anio adicional de edad.
#En caso de que sea necesario:

#Cambiar categoria de referencia: en variables independientes categoricas, la primera categoria
(0) es, por defecto, la de referencia y la segunda (1) es la de interes. Si queremos modificar la
categoria de referencia hacemos lo siguiente:
12
#Ej. Supongamos que en la variable de sexo queremos que "Mujer" sea la categoria de referencia
y "Hombre", la de interes:
levels(sexo)
reg2=glm(defrelig ~ relevel(sexo, ref = "1"), family = binomial)
summary(reg2)
13

Informe de Análisis de Regresión 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Informe de Análisis de Regresión 1

Cargado por

Copyright:

Formatos disponibles

Métodos cuantitativos de investigación

Nombre: Rebeca Villavicencio

Formule la pregunta de investigación que guía su trabajo. La pregunta debe redactarse en

¿Qué características de las mujeres ecuatorianas mayores de 15 años están asociadas a la

H1: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser menor en mujeres mestizas, que en mujeres indígenas.

H2: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser mayor en áreas rurales, que en áreas urbanas.

H3: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser menor a mayor nivel educativo.

H4: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser mayor a mayor edad.

Nombre de la encuesta: Encuesta nacional sobre relaciones familiares y violencia de

Institución que la realiza: INEC

Año de aplicación: 2019

País o países: Ecuador

Población objetivo: Mujeres de 15 a 99 años

Nivel de representatividad: Nacional y provincial

Tamaño de la muestra: 20. 848

Tipo de muestra: Muestreo probabilístico

Incluya aquí tablas y gráficos descriptivos para la variable dependiente y variables

Violencia Freq. Porcentaje

Identidad Freq. Porcentaje

Área Freq. Porcentaje

Nivel de formación educacional

Educación Freq. Porcentaje

Obs Media Des. Est Min Max

17,211 4.320.562 1.795.869 15 99

Odds ratio para experiencia de violencia durante la atención ginecológica

(Intercepto) 0.021*** 0.025*** 0.017*** 0.019***

(0.714) (0.195) (0.697) (0.370)

Área: Rural 1.121

AIC 367.173 359.299 359.038 358.533

BIC 409.785 369.952 369.691 369.186

Deviance 351.173 355.299 355.038 354.533

Num. obs. 1520 1520 1520 1520

La probabilidad de haber experimentado violencia durante la atención ginecológica es 126%

[(1.261-1) *100] mayor en mujeres mestizas que en mujeres indígenas. El coeficiente no

presenta niveles aceptables de significación estadística. Este resultado contradice la hipótesis

1, pero no puede inferirse su aplicación para toda la población.

2. Variable independiente área

La probabilidad de haber experimentado violencia durante la atención ginecológica es 121%

3. Variable independiente educación

4. Variable independiente edad

Copie aquí la sintaxis de Stata y R que fue utilizada en los análisis.

use "C:\Users\estudiantes\Downloads\datos modificados.dta", clear

#####Regresion logistica (variable dependiente dicotomica)#####

#1. Establecer directorio de trabajo

#3. Importar base de datos

#4. Crear base de datos solo con variables seleccionadas

#5. Revisar tipo de datos y coercionar si es necesario:

###Ojo: la interpretaciÃ³n de los coeficientes en regresion logistica no es directa como en la

#En caso de que sea necesario:

También podría gustarte

(Intercepto) 0.021* 0.025* 0.017* 0.019*