Está en la página 1de 11

UNIVERSIDAD PRIVADA DEL VALLE

FACULTAD DE CIENCIAS EMPRESARIALES Y SOCIALES

EXAMEN FINAL

BASE DE DATOS R STUDIO

STUDENTS-POR

ESTUDIANTE: Maria Rene Rocha Rojas

ASIGNATURA: METODOS ESTADISTICOS II GRUPO A

DOCENTE: Virginia Fernandez Daza

COCHABAMBA-BOLIVIA

GESTION 2023
1. LA ESTRUCTRA DE LA BASE DE DATOS

 STR
2. INTERPRETACION:

La base de datos tiene 649 datos con 33 variable, aparentemente todas sus variables son
numéricas alguna de ellas son escalas de Likert otras son variables cadena, otras variables
dicótomas

 HEAD: Permite Ver Las 6 Primeras Filas De La Base De Datos Student-Por

 TAIL: permite ver las ultimas filas base de datos de student-por

 VIEW: permite ver la base de datos


3. SUMMARY:

INTERPRETACION: Proporciona un resumen de cada una de las variables incluidas en


el marco de datos, mostrando estadísticas como mínimo, primer cuartil, mediana, media,
tercer cuartil, máximo, Para variables categóricas, muestra el número y la proporción de
observaciones en cada nivel del factor.

 SEXO (sex):(0=FEMENINO) (1=MASCULINO):


o En mínimo se muestra el valor observado en la variable es 0.
o En el primer cuartil indica el valor del conjunto de datos es 0.
o En la mediana se muestra el valor que se encuentra en la mitad del conjunto
de datos cuando se ordena de menor a mayor en este caso, es 0.
o En la media representa el promedio de los valores en la variable y en este caso
es aproximadamente 0.4099.
o En el tercer cuartil indica el valor es 1.
o En el máximo muestra el valor máximo observado en la variable que es 1.
En conclusión, la interpretación de estos resultados es que aproximadamente el
40.99% de los registros en la base de datos tienen el valor igual a 1, lo que indica el
género masculino, mientras que aproximadamente el 59.01% de los registros tienen
el valor igual a 0, lo que indica el género femenino.
 EDAD (age): (15,16,17,18,19,20,21,22 años de edad):
o En el valor mínimo de la variable es 15.00, lo que indica que el estudiante
menor tiene 15 años
o En el primer cuartil es 16.00, lo que significa que el 25% de los estudiantes
en la base de datos tienen 16 años o menos.
o En la mediana es 17.00, que es el valor que se encuentra justo en el medio de
los datos ordenados de menor a mayor. El 50% de los estudiantes en la base
de datos tienen 17 años o menos.
o En la media es 16.74, este valor indica que, en promedio, los estudiantes
tienen aproximadamente 16 años.
o En el tercer cuartil es 18.00, lo que significa que el 75% de los estudiantes en
la base de datos tienen 18 años o menos.
o En el valor máximo de la variable es 22.00 lo que indica que el estudiante con
más edad es de 22 años

En conclusión, la base de datos contiene un rango de edades desde 15 hasta 22 años. La


mayoría de los estudiantes se encuentran en el rango de 16 a 18 años, con una edad promedio
de aproximadamente 16.74 años.

 TIEMPO DE ESTUDIO (studytime):) (1 hora, 2 horas, 3 horas, 4 horas)


o El mínimo de horas de estudio es 1.000, lo que significa que al menos un
estudiante ha registrado 1 hora de estudio.
o El primer cuartil (25%) es 1.000, lo que indica que el 25% de los estudiantes
ha estudiado 1 hora o menos.
o La mediana es 2.000, lo que significa que el 50% de los estudiantes ha
estudiado 2 horas o menos.
o La media es 1.931, lo que indica que los estudiantes han estudiado un
promedio de aproximadamente 1 hora.
o El tercer cuartil (75%) es 2.000, lo que el 75% de los estudiantes ha estudiado
2 horas o menos.
o El máximo de horas de estudio es 4.000, lo que significa que al menos un
estudiante ha registrado 4 horas de estudio.

En conclusión, la mayoría de los estudiantes ha estudiado entre 1 y 2 horas, con una mediana
de 2 horas. Sin embargo, hay algunos estudiantes que han estudiado hasta 4 horas.

 TIEMPO LIBRE (freetime): (1 hora, 2 horas, 3 horas, 4 horas, 5 horas)


o El mínimo de horas de tiempo libre registrado en la base de datos es 1.00, es
decir al menos un estudiante tiene solo 1 hora de tiempo libre.
o El primer cuartil (25%) es 3.00, es decir que el 25% de los estudiantes tienen
3 horas o menos de tiempo libre.
o La mediana es 3.00, es decir que el 50% de los estudiantes tienen 3 horas o
menos de tiempo libre.
o La media da un promedio de 3.18, indica el promedio de las horas de tiempo
libre de todos los estudiantes en la base de datos. Es ligeramente mayor que
la mediana, lo que sugiere que podría haber algunos valores más altos que
están afectando la media.
o El tercer cuartil (75%) es 4.00, el 75% de los estudiantes tienen 4 horas o
menos de tiempo libre.
o El máximo de horas de tiempo libre registrado es 5.00. Esto indica que al
menos un estudiante tiene 5 horas de tiempo libre.

En conclusión, muestran que la mayoría de los estudiantes en esta base de datos tienen 3 o 4
horas de tiempo libre, con una media ligeramente superior a la mediana. Los valores mínimo
y máximo indican las horas de tiempo libre registradas, de 1 hasta 5 horas.

 INTERNET (0= NO) (1=SI)


o El mínimo es 0.0000, lo que indica que al menos un estudiante no tiene acceso
a Internet en el colegio.
o El primer cuartil (25%) es 1.0000, al menos el 25% de los estudiantes tienen
acceso a Internet.
o La mediana es 1.0000, lo que indica que el 50% de los estudiantes tienen
acceso a Internet. Esto implica que la mitad de los estudiantes tienen Internet
y la otra mitad no lo tienen.
o La media es 0.7673, en promedio aproximadamente el 76.73% de los
estudiantes tienen acceso a Internet en el colegio.
o El tercer cuartil (75%) es 1.0000, al menos el 75% de los estudiantes tienen
acceso a Internet.
o El máximo es 1.0000, lo que indica que al menos un estudiante tiene acceso a
Internet en el colegio.

En conclusion los resultados muestran que la mayoría de los estudiantes (aproximadamente


el 76.73%) tienen acceso a Internet en el colegio, mientras que al menos un estudiante no lo
tiene.

4. CORRELACION:

INTERPRETACION: La base de datos en R Studio muestra la matriz de correlación entre


diferentes variables del conjunto de datos.

 Para la variable "school", la correlación con otras variables es la siguiente:


o Con "address": La correlación es de 0.35451983, lo cual indica una
correlación positiva. Entonces existe relación entre el tipo de escuela y la
dirección del estudiante.
o Con "absences": La correlación es de -0.163932923, lo cual indica una
correlación negativa. Esto sugiere que los estudiantes de ciertas escuelas
pueden tener menos ausencias.
o Con "failures": La correlación es de 0.11378817, lo cual indica una
correlación débil. No parece haber una relación entre la escuela y el número
de fracasos académicos.
o Con "traveltime": La correlación es de 0.252935754, lo cual indica una
correlación positiva. Esto sugiere que hay una relación entre el tiempo de viaje
y el tipo de escuela.
 Para la variable "address":
o Tiene una correlación positiva con "school" (0.3545198), lo cual indica una
relación entre la dirección del estudiante y el tipo de escuela.
o Tiene una correlación negativa con "absences" (-0.073652802), lo cual
sugiere una relación débil entre la dirección y el número de ausencias de los
estudiantes.
o Tiene una correlación negativa con "failures" (0.06382446), lo cual indica
una relación débil entre la dirección y el número de fracasos académicos.
o Tiene una correlación positiva con "traveltime" 0.344901517 lo cual sugiere
una relación entre la dirección y el tiempo de viaje de los estudiantes
 Para la variable "absences", la correlación con otras variables es la siguiente:
o Con "failures": La correlación es de 0.122778835, lo cual indica una
correlación débil. No parece haber una relación entre las ausencias y los
fracasos académicos.
o Con "traveltime": La correlación es de -0.008149087, lo cual indica una
correlación muy negativa. No parece haber una relación significativa entre las
ausencias y el tiempo de viaje.
 Para la variable "failures"
o Tiene una correlación con "traveltime" (0.09772975), lo cual sugiere una
relación débil entre los fracasos académicos y el tiempo de viaje de los
estudiantes.
En conclusión, se observan correlaciones positivas y negativas de diferentes magnitudes
entre estas variables. Estas correlaciones pueden proporcionar información sobre posibles
relaciones y patrones en los datos, como la influencia del tipo de escuela en la dirección, las
ausencias y los fracasos académicos, o la relación entre el tiempo de viaje y las variables
estudiadas.

 La correlación entre "freetime" y "activities" es de aproximadamente 0.1503289.


Esta correlación positiva muestra una relación positiva, entre el tiempo libre de los
estudiantes y su participación en actividades extracurriculares. Esto podría
significar que los estudiantes con más tiempo libre tienden a participar más en
actividades.
 La correlación entre "studytime" y "activities" es de aproximadamente
0.07008025. Esta correlación es positiva pero lo que sugiere una relación débil entre
el tiempo de estudio y la participación en actividades. Esto podría indicar que el
tiempo de estudio no se ve significativamente afectado por la participación en
actividades extracurriculares.

En conclusión, los resultados de las correlaciones muestran las relaciones entre diferentes
variables en la base de datos. Estos resultados indican la fuerza y la dirección de las
relaciones, desde correlaciones negativas hasta positivas.

5. VARIABLE FACTOR Y CRUCE CON OTRAS VARIABLES

Se creó una variable f SEXO para convertir la variable SEXO en un factor, con dos niveles

MASCULINO =1

FEMENINO =0

A lo cual se clasifica las variable:


 RcmdrMisc y DescTools

INTERPRETACION:

 Para el grupo con f_sex igual a 0= FEMENINO:


o La media (mean) del tiempo de estudio (studytime) es de 2.073107, lo cual
indica que en promedio los estudiantes de sexo femenino dedican
aproximadamente 2 horas al tiempo de estudio.
o La desviación estándar (sd) del tiempo de estudio es de 0.8024064, lo cual
indica que hay una variabilidad moderada en los valores del tiempo de estudio.
o El rango (IQR) del tiempo de estudio es de 0.5, lo cual sugiere que el 50%
de los estudiantes de este sexo femenino tiene un tiempo de estudio de 2 a 2.5
horas.
o El valor mínimo del tiempo de estudio es 1, mientras que el máximo es 4.
o El número de observaciones en este grupo es de 383.
 Para el grupo con f_sex igual a 1= MASCULINO:
o La media (mean) del tiempo de estudio es de 1.725564, lo cual indica que en
promedio los estudiantes de este sexo masculino dedican aproximadamente
1.7 horas al tiempo de estudio.
o La desviación estándar (sd) del tiempo de estudio es de 0.8263723, lo cual
indica que hay una variabilidad en los valores del tiempo de estudio.
o El rango (IQR) del tiempo de estudio es de 1.0, lo cual sugiere que el 50% de
los estudiantes de este sexo masculino tiene un tiempo de estudio de 1 a 2
horas.
o El valor mínimo del tiempo de estudio es 1, mientras que el máximo es 4.
o El número de observaciones en este grupo es de 266.
En conclusión, muestran que hay diferencias en el tiempo de estudio entre los sexos tanto
como femeninos y masculinos (f_sex igual a 0=Femenino f_sex igual a masculino=1). Los
estudiantes en el género femenino=0 tienden a tener un tiempo de estudio ligeramente mayor
en comparación con el género masculino=1.

También podría gustarte