Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Informe Final
Informe Final
GRUPO-07
2022-06-22
Table of Contents
Profesor:
Dante Randall Gallo Torres
Integrantes:
Estudiantes Carrera Porcentaje de participació n
Ingeniería Industrial 100%
Ingeniería Industrial
Ingeniería Industrial
Planificación:
Realizamos un diagrama de Gantt con las actividades para la elaboracion de nuestro
proyecto, respetando las fechas de entrega durante el ciclo para lograr un trabajo ordenado
y eficaz.
Diagrama de Gantt
Datos
Proceso de recolección de datos:
Para realizar la recolecció n de datos, creamos una encuesta que cuenta con 13 variables y
está dirigida a todos los estudiantes de UTEC. Optamos por realizar nuestra propia
encuesta, debido a que estamos buscando una base de datos que se adecue de manera muy
específica al propó sito de nuestra investigació n. Las condiciones en que realizamos esta
encuesta fue de manera virtual de una forma rá pida y sencilla para los estudiantes, pues la
mayoría cuenta con un dispositivo tecnoló gico para poder realizarla. La difusió n de esta
encuesta fue a través de redes sociales, para ser específicos, WhatsApp y Telegram,
haciendo uso de los grupos de estudios de la universidad, siempre tomando en cuenta el no
generar spam. Y como estrategia para motivar a los estudiantes a realizar nuestra encuesta,
realizaremos un sorteo.
Población, muestra y muestreo:
• Població n: Estudiantes de UTEC que está n cursando el semestre 2022-1.
Variables:
Pregunta formulada Variable Tipo de Variable Restricciones
- Edad Numérica discreta En la pregunta solo
se seleccionan
alternativas dentro
de un rango de 15-
30 añ os.
- Género Categó rica nominal Pregunta cerrada
(masculino,
femenino y prefiero
no decirlo).
- Carrera Categó rica nominal La pregunta era
solo de opciones
para seleccionar
con las carreras de
la població n
estudiada(UTEC).
- Ciclo Categó rica ordinal Solo se seleccionan
nú meros enteros
con un rango de 1 a
10.
¿Cuá ntos CantiDIS Numérica discreta Se expresa con
dispositivos unidades en
tecnoló gicos tienes minutos y debe ser
para navegar en un nú mero entero
redes sociales?
¿Qué dispositivo DispoRs Numérica discreta Solo consideramos
usas con mayor a un rango de 1 a 5
frecuencia para y se seleccionan.
navegar en las redes
sociales?
Pregunta formulada Variable Tipo de Variable Restricciones
¿Cuá ntas CanAPP Numérica discreta Solo se seleccionan
aplicaciones de entre Laptop,
redes sociales Celular,
tienes instaladas? Computadora,
Tablet y IPad.
¿Cuá l es la red Rsfav Categó rica nominal Se seleccionan de
social que usas con un rango de 1 a 20
má s frecuencia? aplicaciones.
¿Cuá ntas horas HsFC Nú merica discreta Solo consideramos
estudias al día?, para seleccionar de
fuera de clases un rango de 1 a 5
horas y se
seleccionan solo
uno.
¿Revisas las redes RevRS Categó rica nominal La pregunta es
sociales antes de cerrada porque era
dormir? solo de opciones.
Aproximadamente, HorRS Numérica discreta Solo consideramos
¿cuá ntas horas al para seleccionar de
día dedicas a las un rango de 1 a 8
redes sociales? horas y se
seleccionan solo
uno.
¿Te distraes en DisCLAS Categó rica nominal La pregunta es
clase usando alguna cerrada.
red social?
¿Con qué fin usas FinRS Categó rica nominal Se seleccionan
las redes? alternativas de una
lista
Limpieza de datos
Antes de dar inicio a nuestra limpieza de datos, realizaremos la lectura de nuestra base de
datos para ejecutar todo el trabajo.
Luego de ello, observamos que en nuestra base de datos encontramos dos columnas que no
necesitaremos para nuestro estudio, las cuales son la marca temporal y la direcció n de
correo electró nico. Por ello eliminaremos estas dos columnas de la siguiente formas:
DBT <- DBT[,c(3:15)]#En esta linea de código se están eliminando "Marca
temporal" y "Dirección de correo electrónico"
DBT <- DBT[complete.cases(DBT),]
Con la funció n names, podemos conocer el nombre de todas nuestras variables.
names(DBT)
## [1] "Edad"
## [2] "Género"
## [3] "Carrera"
## [4] "Ciclo"
## [1] 0
## [1] 2639
## [1] 203
## [1] 0
-> FinRS
DBT$FinRs[DBT$FinRs == "Académico"] <- "Academico"
DBT$FinRs[DBT$FinRs == "Académico, Económico"] <- "Academico, Economico"
DBT$FinRs[DBT$FinRs == "Académico, Económico, Entretenimiento"] <-
"Academico, Economico, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Entretenimiento"] <- "Academico,
Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Laboral, Económico"] <- "Academico,
Laboral, Economico"
DBT$FinRs[DBT$FinRs == "Académico, Laboral, Entretenimiento"] <- "Academico,
Laboral, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social"] <- "Academico, Social"
DBT$FinRs[DBT$FinRs == "Académico, Social, Entretenimiento"] <- "Academico,
Social, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Económico"] <- "Academico, Social,
Economico"
DBT$FinRs[DBT$FinRs == "Académico, Social, Económico, Entretenimiento"] <-
"Academico, Social, Economico, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Entretenimiento"] <- "Academico,
Social, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Laboral"] <- "Academico, Social,
Laboral"
DBT$FinRs[DBT$FinRs == "Académico, Social, Laboral, Económico,
Entretenimiento"] <- "Academico, Social, Laboral, Economico, Entretenimiento"
DBT$FinRs[DBT$FinRs == "Académico, Social, Laboral, Entretenimiento"] <-
"Academico, Social, Laboral, Entretenimiento"
–> RevRs
table(DBT$RevRs)#Observamos que la variable cuenta con un error en uno de sus
caracteres
##
## NO SI Sí
## 29 173 1
Como tenemos dos variables con respuesta de opció n multiple, usaremos el comando grep
para poder separar las respuestas. –>Rsfav
DBT$WhatsApp <- NA
DBT$Instagram <- NA
DBT$Telegram <- NA
DBT$Tiktok <- NA
DBT$Facebook<- NA
DBT$Twitter <- NA
DBT$Youtube <- NA
DBT$Kwai <- NA
DBT$Discord <- NA
–> FinRs
DBT$Academico <- NA
DBT$Entretenimiento <- NA
DBT$Laboral <- NA
DBT$Social <- NA
DBT$Economico <- NA
Análisis descriptivo
Descriptores numéricos y gráficos:
Edad:
• Variable numérica discreta
• La edad mínima de los estudiantes es de 16 añ os y la má xima de 28 añ os.
• El edad con má s fecuencia es de 18 añ os.
• Gracias a la grá fica del boxplot podemos notar que tenemos 6 datos atípicos que
corresponden a edades menores de 18añ os y mayores de 20 añ os.
• Un cuarto de los estudiantes tienen como má ximo 18 añ os y tres cuartos como
má ximo 19 añ os.
barplot(table(DBT$Edad), main = "Edades de los alumnos encuestados", ylab =
"Frecuencia", xlab = "Edad", col="lightblue",ylim = c(0,80),space =
0,cex.names = 0.8)
boxplot(DBT$Edad,main="Edades de los alumnos
encuestados",col="lightblue",horizontal = T)
summary(DBT$Edad)
Genero:
• Variable categó rica nominal
• La mayoria de encuestados son del género masculino, con 106 estudiantes.
• La minoria son del género prefiero no decirlo, con 2 estudiantes.
• Con esta variable podemos definir la representatividad de nuestra muestra.
table(DBT$Genero)
##
## Femenino Masculino Prefiero no decirlo
## 95 106 2
Carrera:
• Variable categó rica nominal
• Al aplicar la funcion table, podemos determinar que la mayoria de estudiantes son
de la carrera de Ingeniería Industrial y la minoria de la carrera Ciencia de datos.
table(DBT$Carrera)
##
## Bioingenieria Ciencia de datos Ciencia de la
computación
## 19 4
8
## Ingenieria Ambiental Ingenieria Civil Ingenieria
Electronica
## 10 42
9
## Ingenieria Industrial Ingenieria Mecanica Ingenieria
Mecatronica
## 80 8
17
## Ingenieria Quimica
## 6
Ciclo:
• Variable categó rica ordinal
• Al aplicar la funcion table, podemos determinar que la mayoria de estudiantes son
del segundo ciclo.
• Solo tenemos un estudiante del octavo ciclo.
table(DBT$Ciclo)
##
## 1 2 3 4 5 6 7 8
## 17 133 27 6 9 5 5 1
¿Cuántos dispositivos tecnológicos tienes para navegar en redes sociales? - CantiDIS
• Variable numérica discreta
• Con la funcion moda, determinamos cual es el numero de dispositivos mas comunes
entre los estudiantes para navegar en las redes sociales, el cual es 2.
mfv(DBT$CantiDIS)
## [1] 2
¿Qué dispositivo usas con mayor frecuencia para navegar en las redes sociales? - DispoRs
• Variable categó rica nominal
• Al emplear la funcion table, podemos definir que mas de la mitad de los estudiantes
usan el celular como dipositivo para navegar en redes sociales y esto podemos
comprobarlo con la grafica que empleamos.
table(DBT$DispoRs)
##
## Celular Laptop Tablet o IPad
## 170 32 1
## [1] 3
table(DBT$CantiAPP)
##
## 1 2 3 4 5 6 7 8 9 10 12 13 14 15 17 20
## 6 14 41 35 33 23 18 19 2 3 2 2 1 2 1 1
## Redeslevels
## WhastApp Instagram Telegram Tiktok Facebook Twitter Youtube
Kwai
## 176 86 43 54 80 14 73
3
## Discord
## 27
## [1] 4
##
## 1 2 3 4 5 6 7 8
## 37 75 50 24 7 4 1 5
## Finlevels
## Academico Entretenimiento Laboral Social
Economico
## 152 154 24 140
18