Está en la página 1de 20

P2_Entrega_final

GRUPO-07

2022-06-22

Table of Contents

Profesor:
Dante Randall Gallo Torres

Integrantes:
Estudiantes Carrera Porcentaje de participació n
Ingeniería Industrial 100%

Ingeniería Industrial 100%

Ingeniería Industrial 100%

Ingeniería Industrial
Ingeniería Industrial

“EL USO DE REDES SOCIALES EN LOS ESTUDIANTES DE UTEC”


Introducción
Relevancia:
Las redes sociales son un medio de interacció n muy comú n entre jó venes, má s aú n entre
universitarios que lo destinan con diversos usos, por esta razó n nos llamó la atenció n
investigar acerca de ello. Nuestro proyecto de investigació n se basa en el uso de redes
sociales en estudiantes de la universidad de ingeniería y tecnología (UTEC) para conocer el
tiempo empleado, la finalidad, ventajas y consecuencias que conlleva su uso.
Objetivo principal: Investigar el uso de redes sociales entre los estudiante de UTEC, con el
fin de analizar la relació n que existe entre las variables propuestas por nuestro proyecto.
Objetivos secundarios:
1. Determinar la finalidad de uso de Redes sociales que los estudiantes de UTEC
poseen.
2. Conocer la red social má s frecuente entre los estudiantes y el tiempo empleado.
3. Utilizar descriptores estadísticos para la relació n entre variables.

Planificación:
Realizamos un diagrama de Gantt con las actividades para la elaboracion de nuestro
proyecto, respetando las fechas de entrega durante el ciclo para lograr un trabajo ordenado
y eficaz.

Diagrama de Gantt

Datos
Proceso de recolección de datos:
Para realizar la recolecció n de datos, creamos una encuesta que cuenta con 13 variables y
está dirigida a todos los estudiantes de UTEC. Optamos por realizar nuestra propia
encuesta, debido a que estamos buscando una base de datos que se adecue de manera muy
específica al propó sito de nuestra investigació n. Las condiciones en que realizamos esta
encuesta fue de manera virtual de una forma rá pida y sencilla para los estudiantes, pues la
mayoría cuenta con un dispositivo tecnoló gico para poder realizarla. La difusió n de esta
encuesta fue a través de redes sociales, para ser específicos, WhatsApp y Telegram,
haciendo uso de los grupos de estudios de la universidad, siempre tomando en cuenta el no
generar spam. Y como estrategia para motivar a los estudiantes a realizar nuestra encuesta,
realizaremos un sorteo.
Población, muestra y muestreo:
• Població n: Estudiantes de UTEC que está n cursando el semestre 2022-1.

• Muestra: Todos los estudiantes de la universidad que tengan entre 15 y 30


añ os,nuestro tamañ o de muestra es de 203 y tiene una representatividad adecuada,
a partir de ello trabajamos a través de la recolecció n de datos para obtener nuestra
muestra.

• Muestreo: Es un muestreo por conveniencia

Variables:
Pregunta formulada Variable Tipo de Variable Restricciones
- Edad Numérica discreta En la pregunta solo
se seleccionan
alternativas dentro
de un rango de 15-
30 añ os.
- Género Categó rica nominal Pregunta cerrada
(masculino,
femenino y prefiero
no decirlo).
- Carrera Categó rica nominal La pregunta era
solo de opciones
para seleccionar
con las carreras de
la població n
estudiada(UTEC).
- Ciclo Categó rica ordinal Solo se seleccionan
nú meros enteros
con un rango de 1 a
10.
¿Cuá ntos CantiDIS Numérica discreta Se expresa con
dispositivos unidades en
tecnoló gicos tienes minutos y debe ser
para navegar en un nú mero entero
redes sociales?
¿Qué dispositivo DispoRs Numérica discreta Solo consideramos
usas con mayor a un rango de 1 a 5
frecuencia para y se seleccionan.
navegar en las redes
sociales?
Pregunta formulada Variable Tipo de Variable Restricciones
¿Cuá ntas CanAPP Numérica discreta Solo se seleccionan
aplicaciones de entre Laptop,
redes sociales Celular,
tienes instaladas? Computadora,
Tablet y IPad.
¿Cuá l es la red Rsfav Categó rica nominal Se seleccionan de
social que usas con un rango de 1 a 20
má s frecuencia? aplicaciones.
¿Cuá ntas horas HsFC Nú merica discreta Solo consideramos
estudias al día?, para seleccionar de
fuera de clases un rango de 1 a 5
horas y se
seleccionan solo
uno.
¿Revisas las redes RevRS Categó rica nominal La pregunta es
sociales antes de cerrada porque era
dormir? solo de opciones.
Aproximadamente, HorRS Numérica discreta Solo consideramos
¿cuá ntas horas al para seleccionar de
día dedicas a las un rango de 1 a 8
redes sociales? horas y se
seleccionan solo
uno.
¿Te distraes en DisCLAS Categó rica nominal La pregunta es
clase usando alguna cerrada.
red social?
¿Con qué fin usas FinRS Categó rica nominal Se seleccionan
las redes? alternativas de una
lista

Limpieza de datos
Antes de dar inicio a nuestra limpieza de datos, realizaremos la lectura de nuestra base de
datos para ejecutar todo el trabajo.
Luego de ello, observamos que en nuestra base de datos encontramos dos columnas que no
necesitaremos para nuestro estudio, las cuales son la marca temporal y la direcció n de
correo electró nico. Por ello eliminaremos estas dos columnas de la siguiente formas:
DBT <- DBT[,c(3:15)]#En esta linea de código se están eliminando "Marca
temporal" y "Dirección de correo electrónico"
DBT <- DBT[complete.cases(DBT),]
Con la funció n names, podemos conocer el nombre de todas nuestras variables.
names(DBT)

## [1] "Edad"

## [2] "Género"

## [3] "Carrera"

## [4] "Ciclo"

## [5] "¿Cuántos dispositivos tecnológicos tienes para navegar en redes


sociales?"
## [6] "¿Qué dispositivo usas con mayor frecuencia para navegar en las
redes sociales?"
## [7] "¿Cuántas aplicaciones de redes sociales tienes instaladas?"

## [8] "¿Cuál es la red social que usas con más frecuencia?"

## [9] "¿Cuántas horas estudias al día?, fuera de clases"

## [10] "¿Revisas las redes sociales antes de dormir?"

## [11] "Aproximadamente, ¿cuántas horas al día dedicas a las redes


sociales?"
## [12] "¿Te distraes en clase usando alguna red social?"

## [13] "¿Con qué fin usas las redes?"

Ahora generada la base de datos de “DatosR” a “DBT” procederemos a la modificació n de


las variables para poder manejar con mayor facilidad.
rename (DBT,
Edad = "Edad",
Genero = "Género",
Carrera = "Carrera",
Ciclo = "Ciclo",
CantiDIS = "¿Cuántos dispositivos tecnológicos tienes para navegar en
redes sociales?",
DispoRs = "¿Qué dispositivo usas con mayor frecuencia para navegar
en las redes sociales?",
CantiAPP= "¿Cuántas aplicaciones de redes sociales tienes
instaladas?",
Rsfav = "¿Cuál es la red social que usas con más frecuencia?",
HsFC = "¿Cuántas horas estudias al día?, fuera de clases",
RevRs = "¿Revisas las redes sociales antes de dormir?",
HorRs = "Aproximadamente, ¿cuántas horas al día dedicas a las redes
sociales?",DisCLAS = "¿Te distraes en clase usando alguna red social?",
FinRs = "¿Con qué fin usas las redes?"
) -> DBT

Ahora, realizaremos la verificació n de datos y el numero de casos completos e incompletos.


sum(is.na(DBT)) #cantidad de datos incompletos de DBT

## [1] 0

sum(!is.na(DBT)) # Los datos completos.

## [1] 2639

sum(complete.cases(DBT[,1:13])) # Los casos completos de la base de datos.

## [1] 203

sum(!complete.cases(DBT[,1:13])) # La cantidad de casos incompletos.

## [1] 0

Limpiamos las variables Carrera y Finalidad de uso (FinRs), mediante su verificació n ya


que estas cuentan con caracteres no permitidos.
-> Carrera
DBT$Carrera[DBT$Carrera == "Administración y Negocios digitales"] <-
"Administracion y Negocios digitales"
DBT$Carrera[DBT$Carrera == "Bioingeniería"] <- "Bioingenieria"
DBT$Carrera[DBT$Carrera == "Ciencia de la Computación"] <- "Ciencia de la
Computacion"
DBT$Carrera[DBT$Carrera == "Ingeniería de la Energía"] <- "Ingenieria de la
Energia"
DBT$Carrera[DBT$Carrera == "Ingeniería Industrial"] <- "Ingenieria
Industrial"
DBT$Carrera[DBT$Carrera == "Ingeniería Química"] <- "Ingenieria Quimica"
DBT$Carrera[DBT$Carrera == "Ingeniería Mecánica"] <- "Ingenieria Mecanica"
DBT$Carrera[DBT$Carrera == "Ingeniería Mecatrónica"] <- "Ingenieria
Mecatronica"
DBT$Carrera[DBT$Carrera == "Ingeniería Civil"] <- "Ingenieria Civil"
DBT$Carrera[DBT$Carrera == "Ingeniería Electrónica"] <- "Ingenieria
Electronica"
DBT$Carrera[DBT$Carrera == "Ingeniería Ambiental"] <- "Ingenieria Ambiental"

-> FinRS
DBT$FinRs[DBT$FinRs == "Académico"] <- "Academico"
DBT$FinRs[DBT$FinRs == "Académico, Económico"] <- "Academico, Economico"
DBT$FinRs[DBT$FinRs == "Académico, Económico, Entretenimiento"] <-
"Academico, Economico, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Entretenimiento"] <- "Academico,
Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Laboral, Económico"] <- "Academico,
Laboral, Economico"
DBT$FinRs[DBT$FinRs == "Académico, Laboral, Entretenimiento"] <- "Academico,
Laboral, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social"] <- "Academico, Social"
DBT$FinRs[DBT$FinRs == "Académico, Social, Entretenimiento"] <- "Academico,
Social, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Económico"] <- "Academico, Social,
Economico"
DBT$FinRs[DBT$FinRs == "Académico, Social, Económico, Entretenimiento"] <-
"Academico, Social, Economico, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Entretenimiento"] <- "Academico,
Social, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Laboral"] <- "Academico, Social,
Laboral"
DBT$FinRs[DBT$FinRs == "Académico, Social, Laboral, Económico,
Entretenimiento"] <- "Academico, Social, Laboral, Economico, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Laboral, Entretenimiento"] <-
"Academico, Social, Laboral, Entretenimiento"

–> RevRs
table(DBT$RevRs)#Observamos que la variable cuenta con un error en uno de sus
caracteres

##
## NO SI Sí
## 29 173 1

DBT$RevRs[DBT$RevRs == "Sí"] <- "SI"

Como tenemos dos variables con respuesta de opció n multiple, usaremos el comando grep
para poder separar las respuestas. –>Rsfav
DBT$WhatsApp <- NA
DBT$Instagram <- NA
DBT$Telegram <- NA
DBT$Tiktok <- NA
DBT$Facebook<- NA
DBT$Twitter <- NA
DBT$Youtube <- NA
DBT$Kwai <- NA
DBT$Discord <- NA

DBT$WhatsApp[grep("WhatsApp", DBT$Rsfav)] <- "Sí"


DBT$Instagram[grep("Instagram", DBT$Rsfav)] <- "Sí"
DBT$Telegram[grep("Telegram", DBT$Rsfav)] <- "Sí"
DBT$Tiktok[grep("Tik tok", DBT$Rsfav )] <- "Sí"
DBT$Facebook[grep("Facebook",DBT$Rsfav)] <- "Sí"
DBT$Twitter[grep("Twitter", DBT$Rsfav)] <- "Sí"
DBT$Youtube[grep("Youtube", DBT$Rsfav)] <- "Sí"
DBT$Kwai[grep("Kwai", DBT$Rsfav)] <- "Sí"
DBT$Discord[grep("Discord",DBT$Rsfav)] <- "Sí"

DBT$WhatsApp[is.na(DBT$WhatsApp)] <- "No"


DBT$Instagram[is.na(DBT$Instagram)] <- "No"
DBT$Telegram[is.na(DBT$Telegram)] <- "No"
DBT$Tiktok[is.na(DBT$Tiktok )] <- "No"
DBT$Facebook[is.na(DBT$Facebook)] <- "No"
DBT$Twitter[is.na(DBT$Twitter)] <- "No"
DBT$Youtube[is.na(DBT$Youtube)] <- "No"
DBT$Kwai[is.na(DBT$Kwai)] <- "No"
DBT$Discord[is.na(DBT$Discord)] <- "No"

–> FinRs
DBT$Academico <- NA
DBT$Entretenimiento <- NA
DBT$Laboral <- NA
DBT$Social <- NA
DBT$Economico <- NA

DBT$Academico[grep("Academico", DBT$FinRs)] <- "Sí"


DBT$Entretenimiento[grep("Entretenimiento", DBT$FinRs)] <- "Sí"
DBT$Laboral[grep("Laboral", DBT$FinRs)] <- "Sí"
DBT$Social[grep("Social", DBT$FinRs)] <- "Sí"
DBT$Economico[grep("Economico",DBT$FinRs)] <- "Sí"

DBT$Academico[is.na(DBT$Academico)] <- "No"


DBT$Entretenimiento[is.na(DBT$Entretenimiento)] <- "No"
DBT$Laboral[is.na(DBT$Laboral)] <- "No"
DBT$Social[is.na(DBT$Social)] <- "No"
DBT$Economico[is.na(DBT$Economico)] <- "No"

Análisis descriptivo
Descriptores numéricos y gráficos:
Edad:
• Variable numérica discreta
• La edad mínima de los estudiantes es de 16 añ os y la má xima de 28 añ os.
• El edad con má s fecuencia es de 18 añ os.
• Gracias a la grá fica del boxplot podemos notar que tenemos 6 datos atípicos que
corresponden a edades menores de 18añ os y mayores de 20 añ os.
• Un cuarto de los estudiantes tienen como má ximo 18 añ os y tres cuartos como
má ximo 19 añ os.
barplot(table(DBT$Edad), main = "Edades de los alumnos encuestados", ylab =
"Frecuencia", xlab = "Edad", col="lightblue",ylim = c(0,80),space =
0,cex.names = 0.8)
boxplot(DBT$Edad,main="Edades de los alumnos
encuestados",col="lightblue",horizontal = T)
summary(DBT$Edad)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 16.00 18.00 18.00 18.77 19.00 28.00

Genero:
• Variable categó rica nominal
• La mayoria de encuestados son del género masculino, con 106 estudiantes.
• La minoria son del género prefiero no decirlo, con 2 estudiantes.
• Con esta variable podemos definir la representatividad de nuestra muestra.
table(DBT$Genero)

##
## Femenino Masculino Prefiero no decirlo
## 95 106 2

Carrera:
• Variable categó rica nominal
• Al aplicar la funcion table, podemos determinar que la mayoria de estudiantes son
de la carrera de Ingeniería Industrial y la minoria de la carrera Ciencia de datos.
table(DBT$Carrera)

##
## Bioingenieria Ciencia de datos Ciencia de la
computación
## 19 4
8
## Ingenieria Ambiental Ingenieria Civil Ingenieria
Electronica
## 10 42
9
## Ingenieria Industrial Ingenieria Mecanica Ingenieria
Mecatronica
## 80 8
17
## Ingenieria Quimica
## 6

Ciclo:
• Variable categó rica ordinal
• Al aplicar la funcion table, podemos determinar que la mayoria de estudiantes son
del segundo ciclo.
• Solo tenemos un estudiante del octavo ciclo.
table(DBT$Ciclo)

##
## 1 2 3 4 5 6 7 8
## 17 133 27 6 9 5 5 1
¿Cuántos dispositivos tecnológicos tienes para navegar en redes sociales? - CantiDIS
• Variable numérica discreta
• Con la funcion moda, determinamos cual es el numero de dispositivos mas comunes
entre los estudiantes para navegar en las redes sociales, el cual es 2.
mfv(DBT$CantiDIS)

## [1] 2

¿Qué dispositivo usas con mayor frecuencia para navegar en las redes sociales? - DispoRs
• Variable categó rica nominal
• Al emplear la funcion table, podemos definir que mas de la mitad de los estudiantes
usan el celular como dipositivo para navegar en redes sociales y esto podemos
comprobarlo con la grafica que empleamos.
table(DBT$DispoRs)

##
## Celular Laptop Tablet o IPad
## 170 32 1

barplot(table(DBT$DispoRs), col = "lightblue", main = "Dispositivo mas


usado",cex.main = 1 ,space = 0.3, ylim = c(0,210),cex.names = 1, cex.axis =
0.8,ylab = "Cantidad de alumnos")

¿Cuántas aplicaciones de redes sociales tienes instaladas? - CantiAPP


• Variable numérica discreta
• Gracias a la funcion moda, determinamos que la mayoria de estudiantes tiene 3
aplicaciones instaladas para usar las redes sociales.
• El mínimo de aplicaciones en redes sociales instaladas es 1 y el má ximo es 20.
mfv(DBT$CantiAPP)

## [1] 3

table(DBT$CantiAPP)

##
## 1 2 3 4 5 6 7 8 9 10 12 13 14 15 17 20
## 6 14 41 35 33 23 18 19 2 3 2 2 1 2 1 1

¿Cuál es la red social que usas con más frecuencia? - Rsfav


• Variable categó rica nominal
• Luego de haber usado el comando greep para la separació n de datos de nuestra
variable (Rsfav), realizamos el siguiente có digo para poder representar nuestra
grafica de frecuencia.
• Al analizar la grá fica, se observa que la red social WhatsApp predomina ante las
otras redes que se encuentraban en las respuestas, siendo má s de la mitad del total
de datos, el cual obtuvimos con la funció n table.
table(Redeslevels)

## Redeslevels
## WhastApp Instagram Telegram Tiktok Facebook Twitter Youtube
Kwai
## 176 86 43 54 80 14 73
3
## Discord
## 27

barplot(table(Redeslevels), space = 0.5,cex.names = 0.7, ylim = c(0,200), col


= 'lightblue')
¿Cuántas horas estudias al día?, fuera de clases - HsFC
• Variable numerica discreta
• Al emplear la funció n moda, nos resulta que las horas de estudio má s comunes entre
los estudiantes es de 4 horas, pero al hacer una grafico de barras podemos notar que
no es mucha la diferencia entre 4 horas y 5 horas.
mfv(DBT$HsFC)

## [1] 4

data_HsFC<-factor(DBT$HsFC , levels = c("1","2","3", "4", "5"),ordered = T)


barplot(table(data_HsFC),col = "lightblue", main = "Horas de estudio fuera de
de clase",cex.names = 0.6,space= 0,ylim = c(0,60),cex.main = 0.8)
Aproximadamente, ¿cuántas horas al día dedicas a las redes sociales? - HorRs
• Variable numérica discreta
• Con la funcion table, obtenemos la cantidad de horas dedicadas a las redes sociales
con má s frecuencia entre los estudiantes.
table(DBT$HorRs)

##
## 1 2 3 4 5 6 7 8
## 37 75 50 24 7 4 1 5

¿Te distraes en clase usando alguna red social? - DisCLAS


• Variable categorica nominal
• La mayoria de estudiante respondieron “a veces” con respecto a la distraccion en
clase con las redes sociales.
data_DisCLAS<-factor(DBT$DisCLAS , levels = c("Siempre","Casi siempre","A
veces", "Casi nunca", "Nunca"),ordered = T)
barplot(table(data_DisCLAS),col = "lightblue", main = "Distraccion en
clases",cex.names = 0.6,space= 0,ylim = c(0,120),cex.main = 0.8)
¿Con qué fin usas las redes? - FinRs
• Variable categorica nominal
• La mayoría de estudiante usan las redes sociales con la finalidad de entretenerse.
tablafin <- table(Finlevels)
barplot(tablafin, space = 2.5,cex.names = 0.7, ylim = c(0,180),
col="lightblue")
table(Finlevels)

## Finlevels
## Academico Entretenimiento Laboral Social
Economico
## 152 154 24 140
18

Gráficos de interacción entre dos variables:


Cantidad de dispositivos - Horas de uso de redes sociales
• Con la grafica podemos definiri que los estudiantes que tienen 3 dispositivos para
navegar en redes sociales, emplean 4 horas de uso, esto representa la mayoria.
boxplot(DBT$CantiDIS ~ DBT$HorRs, xlab = "Cantidad de dispositivos", ylab =
"Horas de uso", col=c("lightblue"),varwidth=TRUE)
Ciclo - Distracción en clases
• La grafica demuestra que los estudiantes del segundo ciclo presentan mayor
distracció n ante el uso de redes sociales, pues en todas las variables presentan una
mayor densidad en comparació n con los otros ciclos.
ggplot(data = DBT) +
geom_count(aes(Ciclo, DisCLAS), colour = "lightblue")
Género - Horas de estudio, fuera de clases
• Gracias a la grá fica se puede observar que los estudiantes del género femenino,
emplean mas horas al estudio fuera de clases en comparacion al género masculino.
plot(table(DBT$Genero, DBT$HsFC), main="Horas de estudio fuera de clases por
género")
Cantidad de aplicaciones - Horas de uso
• En el grafico podemos observar que los que tiene de a 1 a 8 aplicaciones instaladas
le dedican mas tiempo a la redes sociales, incluso podemos notar los datos atípicos
que se relacionan con la finalidad de su uso.
boxplot(DBT$HorRs~DBT$CantiAPP, xlab = "Cantidad de aplicaciones", ylab =
"Horas de uso", col=c("lightblue"))
boxplot(DBT$HsFC~DBT$Edad, xlab = "Edad", ylab = "Horas de estudio",
col=c("lightblue"))

También podría gustarte