Está en la página 1de 13

Métodos cuantitativos de investigación

Trabajo final
Análisis de regresión

Nombre: Rebeca Villavicencio

1. Pregunta de investigación

Formule la pregunta de investigación que guía su trabajo. La pregunta debe redactarse en


términos explicativos. También debe contener la unidad de análisis del estudio.

¿Qué características de las mujeres ecuatorianas mayores de 15 años están asociadas a la


probabilidad de haber experimentado violencia durante la atención ginecológica?

2. Hipótesis

Formule las hipótesis de asociación entre la variable dependiente y cada una de las
variables independientes.
*Notas:
1) En el caso de variables independientes dicotómicas, la hipótesis debe formularse en
términos de comparación entre las categorías, y hay que decidir cuál es la categoría de
interés y cuál la de referencia.
2) En el caso de variables independientes nominales, se debe formular la hipótesis de modo
similar a las dicotómicas: seleccionar una categoría de interés y otra categoría de
referencia.
3) En el caso de variables independientes ordinales, suele ser recomendable asumirlas como
si fueran numéricas, pero sus categorías deben estar codificadas de menor a mayor.

H1: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser menor en mujeres mestizas, que en mujeres indígenas.

H2: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser mayor en áreas rurales, que en áreas urbanas.

H3: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser menor a mayor nivel educativo.

H4: La probabilidad de haber experimentado violencia durante la atención ginecológica

tiende a ser mayor a mayor edad.

1
3. Fuente de datos

Nombre de la encuesta: Encuesta nacional sobre relaciones familiares y violencia de


género contra las mujeres

Institución que la realiza: INEC

Año de aplicación: 2019

País o países: Ecuador

Población objetivo: Mujeres de 15 a 99 años

Nivel de representatividad: Nacional y provincial

Tamaño de la muestra: 20. 848

Tipo de muestra: Muestreo probabilístico

4. Análisis descriptivos

Incluya aquí tablas y gráficos descriptivos para la variable dependiente y variables


independientes. Recuerde editarlos para una buena comprensión y presentación. Incluir
títulos para cada uno.

Tabla 1

Violencia ginecológica

Violencia Freq. Porcentaje


No 1,482 97.50
Si 38 2.50
Total 1,52 100.00

Gráfico 1

2
Tabla 2

Identidad étnica

Identidad Freq. Porcentaje


Indígena 2,112 12.27
Afroecuat
oriano/a 175 1.02
Negro/a 220 1.28
Mulato/a 170 0.99
Montubio/
a 385 2.24
Mestizo/a 13,698 79.59
Blanco/a 420 2.44
Otro 31 0.18
Total 17,211 100.00

Gráfico 2

3
Tabla 3

Área de residencia

Área Freq. Porcentaje


Urbana 10,98 63.80
Rural 6,231 36.20
Total 17,211 100.00

Gráfico 3

4
Tabla 4

Nivel de formación educacional

Educación Freq. Porcentaje


Ninguno 1,018 5.91
Centro de
alfabetizaci
ón 83 0.48
Primaria 5,741 33.36
Educación
Básica 769 4.47
Secundaria 4,384 25.47
Bachillerato 2,14 12.43
Superior no
Universitari
o 359 2.09
Superior
Universitari
o 2,547 14.80
Posgrado 170 0.99
Total 17,211 100.00

Gráfico 4

5
Tabla 5

Edad

Obs Media Des. Est Min Max

17,211 4.320.562 1.795.869 15 99

Gráfico 5

6
5. Regresiones bivariadas

Incluya aquí la tabla con los resultados de cada una de las regresiones simples. Recuerde
editarla para una buena comprensión y presentación. Incluir título y notas al pie de tabla. A
continuación, redacte la interpretación de los resultados de los coeficientes para cada una
de las variables independientes, en conexión con las hipótesis formuladas arriba.

Tabla 6

Odds ratio para experiencia de violencia durante la atención ginecológica

1 2 3 4

(Intercepto) 0.021*** 0.025*** 0.017*** 0.019***

(0.714) (0.195) (0.697) (0.370)

Afroecuatoria 3.464
no/a

(1.258)

Negro/a 0.000

(1458.507

Mulato/a 0.000

(1684.138

7
Montubio/a 0.000

(1496.396

Mestizo/a 1.261

(0.736)

Blanco/a 2.156

(1.016)

Otro 0.000

(3765.847

Área: Rural 1.121

(0.362)

Educación 1.057

(0.094)

Edad 1.009

(0.010)

AIC 367.173 359.299 359.038 358.533

BIC 409.785 369.952 369.691 369.186

Log -175.587 - - -
Likelihood 177.649 177.519 177.267

Deviance 351.173 355.299 355.038 354.533

Num. obs. 1520 1520 1520 1520

8
1. Variable independiente identidad

La probabilidad de haber experimentado violencia durante la atención ginecológica es 126%

[(1.261-1) *100] mayor en mujeres mestizas que en mujeres indígenas. El coeficiente no

presenta niveles aceptables de significación estadística. Este resultado contradice la hipótesis

1, pero no puede inferirse su aplicación para toda la población.

2. Variable independiente área

La probabilidad de haber experimentado violencia durante la atención ginecológica es 121%

mayor en áreas rurales, que en áreas urbanas. El coeficiente no presenta niveles aceptables de

significación estadística.

3. Variable independiente educación

4. Variable independiente edad

6. Anexo: sintaxis

Copie aquí la sintaxis de Stata y R que fue utilizada en los análisis.

Sintaxis Stata

use "C:\Users\estudiantes\Downloads\datos modificados.dta", clear


use "C:\Users\estudiantes\Downloads\201911_EnvigmuBDD_indicadores_violencia.dta",
clear
tab f4_s8_2_a
labelbook f4_s8_2_a
Si= 1, No= 0
gen violencia= f4_s8_2_a
tab violencia

9
labelbook violencia
tab violencia
recode violencia (Si=1) (No= 0) (-3=.)
use "C:\Users\estudiantes\Downloads\201911_EnvigmuBDD_indicadores_violencia.dta",
clear
tab f4_s8_2_a
labelbook f4_s8_2_a
tab f4_s8_2_a
gen violencia= f4_s8_2_a
recode (2=0) (-5 -2=.)
recode violencia (2=0) (3=.)
tab violencia
lab def violencia 1"Si" 0"No"
lab val violencia violencia
tab
tab (2=0) (-5 -2=.)
tab violencia
tab f1_s2_16_1
labelbook f1_s2_16_1
gen educacion= f1_s2_16_1
tab educacion
tab f1_s2_3
elbook f1_s2_3
labelbook f1_s2_3
gen f1_s2_3= edad
tab edad
labelbook f1_s2_3
gen edad= f1_s2_3
tab edad
b f1_s2_6
tab f1_s2_6
labelbook f1_s2_6
gen identidad= f1_s2_6
tab f1_s2_6
tab identidad
tab area
save "C:\Users\estudiantes\Desktop\datos modificados.dta"
tab violencia
graph bar, over(violencia)
.Graph.Dimensions 584 313
graph export "C:\Users\estudiantes\Desktop\Graph 1.png", as(png) replace
tab identidad
graph bar, over(identidad)
graph export "C:\Users\estudiantes\Desktop\Graph 2.png", as(png) replace
tab area
graph bar, over(area)
graph export "C:\Users\estudiantes\Desktop\Graph 3.png", as(png) replace

10
tab educacion
graph bar, over(educacion)
graph export "C:\Users\estudiantes\Desktop\Graph 4.png", as(png) replace
sum edad
hist edad
graph export "C:\Users\estudiantes\Desktop\Graph 5.png", as(png) replace

Sintaxis R

#####Regresion logistica (variable dependiente dicotomica)#####

#0. Antes de iniciar, es necesario haber examinado las variables seleccionadas y realizado los
siguientes cambios (si aplican):
#Eliminar categorias de no respuesta (no sabe, no contesta, etc.)
#Recodificar variables dicotomicas: categoria de interes como "1", categoria de referencia como
"0".
#Recodificar variables ordinales para que las categorias vayan en sentido menor a mayor
(dependiendo de la formulacion de pregunta e hipotesis).
#Una vez depuradas las variables, elaborar tablas y graficos descriptivos.

#1. Establecer directorio de trabajo


setwd("C:/Users/estudiantes/Desktop")

#2.Instalar paquetes
install.packages("haven")
library("haven")
install.packages("texreg")
library("texreg")

#3. Importar base de datos


BASEDEDATOS=read_dta("datos modificados.dta")

#4. Crear base de datos solo con variables seleccionadas


BASEDEDATOS2=BASEDEDATOS[c("violencia", "educacion", "edad", "identidad", "area")]
rm(BASEDEDATOS)

#5. Revisar tipo de datos y coercionar si es necesario:


#IMPORTANTE: para regresion logistica, la variable dependiente debe estar como "factor"
#Las variables categoricas deben estar como "factor", excepto las ordinales, que deben estar
como "numeric", si se las va a interpretar como numericas.
#Las variables numericas deben estar como "numeric".
BASEDEDATOS2$violencia=as.factor(BASEDEDATOS2$violencia)
BASEDEDATOS2$edad=as.numeric(BASEDEDATOS2$edad)
BASEDEDATOS2$area=as.factor(BASEDEDATOS2$area)
BASEDEDATOS2$educacion=as.numeric(BASEDEDATOS2$educacion)
BASEDEDATOS2$identidad=as.factor(BASEDEDATOS2$identidad)

11
#6. Fijar base de datos:
attach(BASEDEDATOS2)

#7. Regresiones logisticas simples (una sola variable independiente a la vez). Sintaxis de
comando "glm": Primero va la variable dependiente seguida de un signo ~, a continuacion la
variable independiente
#IMPORTANTE: para que la estimacion funcione correctamente, la variable dependiente debe
estar codificada como 0, 1. Es decir, el valor afirmativo o de interes como 1, y el negativo como 0
(por ejemplo, "Si"=1, "No"=0)

#Regresion 1:
reg1=glm(violencia ~ identidad, family = binomial)
summary(reg1)
#Regresion 2:
reg2=glm(violencia ~ area, family = binomial)
summary(reg2)
#Regresion 3:
reg3=glm(violencia ~ educacion, family = binomial)
summary(reg3)
#Regresion 4:
reg4=glm(violencia ~ edad, family = binomial)
summary(reg4)

###Ojo: la interpretación de los coeficientes en regresion logistica no es directa como en la


regresion lineal. Estan expresados en funcion logaritmica, y deben transformarse a un valor
conocido como "odds ratio".
#Exportar los resultados a Word convirtiendo coeficientes a odds ratio:
htmlreg(list(reg1, reg2, reg3, reg4), file = "Ejemplo regresiones logisticas simples.doc",
override.coef = (list(exp(coef(reg1)), exp(coef(reg2)), exp(coef(reg3)), exp(coef(reg4)))),
inline.css = FALSE, digits=3, doctype = TRUE, html.tag = TRUE, head.tag = TRUE, body.tag =
TRUE)

#Interpretacion: Odds ratio menor a 1 indica asociacion negativa; mientras, odds ratio mayor a 1
indican asociacion positiva. Mientras mas se aleje de 1, mas fuerte la asociacion.
#Para una mejor comprension, se puede transformar las odds ratio a porcentajes utilizando la
siguiente formula: (Odds ratio -1)*100. Ejemplo:
(1.019 -1)*100
#En este ejemplo obtenemos un valor de 1.9%. La interpretacion seria: La probabilidad de
definirse como una persona religiosa aumenta 1.9% con cada anio adicional de edad.

#En caso de que sea necesario:


#Cambiar categoria de referencia: en variables independientes categoricas, la primera categoria
(0) es, por defecto, la de referencia y la segunda (1) es la de interes. Si queremos modificar la
categoria de referencia hacemos lo siguiente:

12
#Ej. Supongamos que en la variable de sexo queremos que "Mujer" sea la categoria de referencia
y "Hombre", la de interes:
levels(sexo)
reg2=glm(defrelig ~ relevel(sexo, ref = "1"), family = binomial)
summary(reg2)

13

También podría gustarte