Está en la página 1de 29

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS ECONÓMICAS


INGENIERÍA ESTADÍSTICA

Asignatura:

Programación 2

Grupo:

Semestre:

Tercer Semestre Paralelo 1

Integrantes:

Ángel Ortiz

Dahari Mendoza

Autor

Angel Ortiz

Tema:
Edad de las personas con nivel de instrucción y sabe leer

Provincia: LOJA

Sector: EDUCACIÓN
INTRODUCCIÓN

Este trabajo consiste en el análisis de datos obtenidos de un repositorio de datos para


análisis estadístico, la base de datos consiste en los registros educativo de personas de la
provincia de Loja. base: “educa_gar”.

Esta base de datos contiene una muestra de 112128 personas donde se registran varios datos
por ejemplo Área, Ciudad, 3. Edad, 10A. Nivel de instrucción, 15. Como se considera, 19A.
Asiste a nivelación SENESCYT, 19B. Tipo de nivelación SENESCYT, 37. Trabajó
anteriormente, 43. El trabajo que tiene es, 55. Sitio de trabajo secundario, categoría laboral,
entre otros.

A las cuales realizamos un análisis a las variables

Tema 1: “Edad”, “Nivel de instrucción”, “Sabe leer y escribir”.

Tema 2: “Cuantos años trabaja”, “categoría de ocupación”, “Sabe leer y escribir”.

Tema 3: “Edad”, “Asiste a nivelación Senescyt”,” Sexo”

Tema 4: “Cuantos cursos de capacitación siguió”, “asistió a clases”, “Sabe leer”

Tema 5; “Cuantas horas utilizo internet al día”, “Asistió a clases”, “Porque asistió a clases”

A fin de comprobar las relaciones que pueden existir entre las mismas, además nos
apoyaremos en herramientas estadísticas a fin de conocer mediante los datos de la muestra el
comportamiento general de las variables estudiadas.

Es importante recalcar que los cálculos se realizaran en el programa “R”, que es un software
diseñado para estudios estadísticos ya que cuenta con diferentes funciones para realizar
gráficos, histogramas y tablas.
OBJETIVO GENERAL

Relacionar las variables ya mencionadas para cada tema mediante herramientas estadísticas
para comprobar y comparar distintos casos para cada tema.

OBJETIVOS ESPECÍFICOS

• Analizar los datos obtenidos de manera descriptiva y formular una interpretación de


los resultados
• Aplicar los conocimientos adquiridos en clase para realizar los diferentes análisis de
variables.
• Utilizar el programa R para la realización de los diferentes análisis y conclusiones del
mismo

DESCRIPCIPÓN DE LOS DATOS UTILIZADOS

Variables utilizadas

• P03: Edad (Numérica)


• P10a: Nivel de instrucción (Categórica)
• P11: Sabe leer y escribir (Categórica)
• P45: Cuantos años trabaja (Numérica)
• P42: Categoría de ocupación (Categórica)
• P19a: Asiste a nivelación de Senescyt (Categórica)
• P02: Sexo (categórica)
• Pc01b: Cuantos cursos de capacitación siguió (Numérica)
• P07: Asistió a clases (Categórica)
• Pt08: Cuantas horas de internet dedico al día
• P09: Porque no asistió a clases (Categórica)

Instrumentos para recopilación de datos

Los datos fueron tomados de los registros del INEC del sector educación
DEPURACIÓN DE LOS DATOS

Utilizaremos el método de omisión de valores perdidos con la ayuda de la función en


“na.rm=TRUE” en RStudio.

Seleccionaremos solo los datos de la provincia de Loja mediante la función subset ()

educacionloja<-subset (educacion, prov.=="Loja”, na.rm=TRUE)

ESTADISTICOS DESCRIPTIVAS

Tema 1: Edad de las personas con nivel de instrucción y sabe leer

Tabla No 1.1 Estadísticos descriptivos de la variable Edad

summary(edad,na.rm=TRUE)

Min. 1st Qu. Median Mean 3rd Qu. Max.


0.00 14.00 28.00 32.38 49.00 99.00
Gráfico No 1.1 Grafico de caja de la variable Edad

boxplot(edad,xlab="edad",main="Edad ",horizontal=TRUE,col="tomato1")

Interpretación:

Podemos observar en el grafico que la media de la variable edad es de 28 años, esto


ya que la mayoría de las personas se encuentran en el grupo de menor a 50 años, también
observamos que el máximo de edad de las personas era de 99 ya que eran personas que no
querían contestar.
Tabla No 1.2 Estadísticos descriptivos de la variable Nivel de instrucción

summary(instruccion,na.rm=TRUE)

Gráfico No 1.2 Grafico descriptivos de la variable Nivel de instrucción

barplot(instrucciontabla,col=instrucciontabla,las=2)
Interpretación

Podemos observar que hubo una frecuencia mayor en la primaria de 944 casos ya que
esta base es acerca de educación y fue realizada a mas personas en este nivel de instrucción
y como menor tenemos una frecuencia de jardín de infantiles 0 ya que los niños no
respondieron.

Tabla No 1.3 Estadísticos descriptivos de la variable Sabe leer y escribir

sabeleertabla<-table(sabeleer)
View(sabeleertabla)

Gráfico No 1.3 Grafico descriptivo de la variable Sabe leer y escribir

barplot(sabeleertabla,col=sabeleertabla,las=2)

Interpretación

Observamos que las personas que saben leer y escribir tiene un mayor porcentaje que
las personas que no saben leer ni escribir. Esto debido a que esta base fue realizada a personas
que se encontraban en unidades educativas y la mayoría si sabe leer y escribir
Tabla No 1.4 Tabla de la media de Edad con nivel de instrucción

aggregate(edad~instruccion,educacionloja,mean,na.rm=TRUE)

Tabla No 1.5 Tabla de la media Edad con nivel de instrucción y si sabe leer o escribir

View(aggregate(edad~instruccion+sabeleer,educacionloja,mean,na.rm=TRUE))
Gráfico No 1.4 Grafico de Edad con nivel de instrucción

Interpretación

Podemos observar en el grafico de edad por nivel de instrucción la persona con más
edad que sabe leer y escribir tiene 99 años y no se encuentra en ningún nivel de instrucción,
mientras que las personas con menor edad que sabe leer y escribir se encuentra en
educación básica
Gráfico No 1.5 Grafico de frecuencia de Nivel de instrucción por Sabe leer y escribir

ggplot(educacionloja,aes(sabeleer, fill=instruccion))+geom_bar(position ="dodge")+


xlab("Sabe leer")+
ylab("Frecuencia")+
ggtitle("SABE LEER POR NIVEL DE INSTRUCCION")

Interpretación

Se puede observar en el grafico de si sabe leer y escribir por nivel de instrucción que
la mayoría de las personas que si saben leer y escribir se encuentran en la primaria mientras
que las personas que no saben leer y escribir la mayoría se encuentra en educación básica,
esto debido a que en educación básica los niños pequeños aun no saben leer ni escribir.

Tema 2 Cuantos años trabaja según su categoría de ocupación

Tabla No 2.1 Estadísticos descriptivos de la variable Años de trabajo

summary(añostrabaja,na.rm=TRUE)

Min. 1st Qu. Median Mean 3rd Qu. Max. NA's


0.00 3.00 10.00 15.49 25.00 80.00 1933
Grafico No 2.1 Grafico de cajas de la variable años de trabajo

boxplot(añostrabaja,xlab="Años trabaja",main="Cuantos años trabaja


",horizontal=TRUE,col="tomato1")

Interpretación

Podemos observar en el grafico de cajas que la media de cuantos años trabaja es de


10 años, y el grafico tiene hacia la izquierda debido a que esta encuesta fue realizada a
personas que la mayoría se encuentran en escuelas educativas por eso se concentra más los
datos entre 0 y 20 años, la persona que puso que tiene 80 años trabajado fueron personas que
no quisieron contestar la pregunta.
Tabla No 2.2 Tabla de frecuencias de Categoría de ocupación

ocuapciontabla<-table(ocupacion)
View(ocuapciontabla)

Gráfico No 2.2 Grafico frecuencias de Categoría de ocupación

Interpretación

Se puede observar en el grafico que la mayoría de frecuencia se encuentra en que su


categoría de ocupación es de cuenta propia ya que son la mayoría estudiantes y aun no
consiguen un trabajo formal.
Tabla No 2.3 Estadísticos descriptivos de la variable Sabe leer y escribir

sabeleertabla<-table(sabeleer)
View(sabeleertabla)

Gráfico No 2.3 Grafico descriptivo de la variable Sabe leer y escribir

barplot(sabeleertabla,col=sabeleertabla,las=2)

Interpretación

Observamos que las personas que saben leer y escribir tiene un mayor porcentaje que
las personas que no saben leer ni escribir. Esto debido a que esta base fue realizada a personas
que se encontraban en unidades educativas y la mayoría si sabe leer y escribir
Tabla No 2.4 Tabla de la media de Cuantos años trabajo por categoría de ocupación

aggregate(añostrabaja~ocupacion+sabeleer,educacionloja,sum,na.rm=TRUE)

Tabla 2,5 Tabla de la media de cuantos años trabajada por categoría de ocupación y
por si sabe leer o escribir

aggregate(añostrabaja~ocupacion+sabeleer,educacionloja,sum,na.rm=TRUE)

Gráfico No 2.4 Gráfico de cuantos años trabaja y categoría de ocupación por saber leer
y escribir ggplot(educacionloja,aes(añostrabaja,ocupacion,fill= sabeleer))+

geom_bar(stat="identity", position="dodge")+
labs(x="Cuantos años trabajo",
y="Categoria de ocupacion",
title="Cuantos años trabaojo por categoria de ocupacion")
Interpretación

Podemos observar en el grafico de cuantos años trabaja y categoría de ocupación por


saber leer y escribir, la persona con mas años trabajadas es de 28 años y si sabe leer y escribir,
no se toma en cuenta el año 80 ya que este valor es de personas que no quisieron contestar la
pregunta.

Gráfico N0 2.5 Grafico de Si sabe leer por ocupación

ggplot(educacionloja,aes(sabeleer, fill=ocupacion))+geom_bar(position ="dodge")+


xlab("Sabe leer")+
ylab("Frecuencia")+
ggtitle("SABE LEER POR CATEGORIA DE OCUPACION")
Interpretación

Podemos observar en el grafico de si sabe leer y escribir por categoría de ocupación


que la mayoría de personas se encuentran en el grupo de ocupación es de cuenta propia y si
saben leer y escribir.

Tema 3 Edad con asiste a nivelación de Senescyt y por Sexo


Tabla No 3.1 Estadísticos descriptivos de la variable Edad

summary(edad,na.rm=TRUE)

Min. 1st Qu. Median Mean 3rd Qu. Max.


0.00 14.00 28.00 32.38 49.00 99.00

Gráfico No 3.1 Grafico de caja de la variable Edad

boxplot(edad,xlab="edad",main="Edad ",horizontal=TRUE,col="tomato1")
Interpretación:

Podemos observar en el grafico que la media de la variable edad es de 28 años, esto


ya que la mayoría de las personas se encuentran en el grupo de menor a 50 años, también
observamos que el máximo de edad de las personas era de 99 ya que eran personas que no
querían contestar.

Tabla No 3.2 Tabla de frecuencias de asiste a nivelación de Senescyt

asistesenescyttabla<-table(asistesenescyt)
View(asistesenescyttabla)

Gráfico No 3.2 Grafico de frecuencias de asiste a nivelación de Senescyt

barplot(asistesenescyttabla,col=asistesenescyttabla,las=2)
Interpretación

Podemos observar en el grafico que la mayoría de personas no han seguido curso de


capacitación del Senescyt ya que no se encuentran aún en el rango para dar las pruebas. Ya
que se encuentran estudiando en niveles inferiores y mayores a secundaria donde es el nivel
donde se da la prueba del Senescyt

Tabla No 3.3 Estadísticas descriptivos de la variable sexo

summary(sexo,na.rm=TRUE)

Grafico No 3.4 Grafico de frecuencia de la variable sexo

barplot(sexotabla,col=sexotabla,las=2)

Interpretación

Podemos observar que existe un porcentaje similar entre hombres y mujeres que han
respondido esta encuesta aunque viéndolo en términos de frecuencia respondieron mas
mujeres con un total de 1822 personas en comparación a los hombre con un total de 1797.

Tabla No 3.4 tabla de la media de personas según su edad si asisten a nivelación de


Senescyt o no

aggregate(edad~asistesenescyt,educacionloja,mean,na.rm=TRUE)
Tabla No 3.5 Tabla de la media de Edad con asiste a nivelación de Senescyt y sexo

aggregate(edad~asistesenescyt+sexo,educacionloja,mean,na.rm=TRUE)

Gráfico No 3.4 Grafico de Edad con asiste a nivelación de Senescyt por sexo

ggplot(educacionloja,aes(edad,asistesenescyt,fill= sexo))+
geom_bar(stat="identity", position="dodge")+
labs(x="Edad",
y="Asiste a nivelacion de senescyt",
title="Edad y Asiste a nivelacion de senescyt por sexo")

Interpretación

Podemos observar que la persona con mas edad se encuentra en la categoría de no


asiste a clases de Senescyt ya que se encuentra en una edad mayor para rendir esta prueba.
Gráfico No 3.5 Asiste a nivel del Senescyt por sexo

ggplot(educacionloja,aes(asistesenescyt, fill=sexo))+geom_bar(position = "dodge")+


xlab("Asite a nivelacion del senescyt")+
ylab("Frecuencia")+
ggtitle("ASISTE A NIVEL DEL SENESCYT POR SEXO")

Interpretación

Podemos observar que las personas que mas asisten a nivelación de Senescyt en esta
encuesta son mujeres podría decirse que porque las mujeres son un poquito mas aplicadas
que los hombres

Tema No 4 Cuantos cursos de capacitación asistió con asistió a clases y sabe leer y
escribir
Tabla No 4.1 Estadísticas descriptivos de la variable Cuantos cursos de capacitación
asistió

Min. 1st Qu. Median Mean 3rd Qu. Max. NA's


1.00 1.00 1.50 2.02 2.00 12.00 3373

Grafico No 4.1 Grafico de cajas de la variable Cuantos cursos de capacitación asistió


boxplot(cursoscapacitacion,xlab="Cursos de capacitacion",main="Cursos de
Capacitacion ",horizontal=TRUE,col="tomato1")
Interpretación
Podemos observar que la media de cursos de capacitación que han recibido las
personas esta entre 1 y 2 curos esto podría interpretarse como que las personas creen que
con un curso a dos cursos es suficiente para dar una prueba del Senescyt

Tabla No 4.2 Estadísticos descriptivos de la variable Sabe leer y escribir

sabeleertabla<-table(sabeleer)
View(sabeleertabla)

Gráfico No 4.2 Grafico descriptivo de la variable Sabe leer y escribir

barplot(sabeleertabla,col=sabeleertabla,las=2)
Interpretación

Observamos que las personas que saben leer y escribir tiene un mayor porcentaje que
las personas que no saben leer ni escribir. Esto debido a que esta base fue realizada a personas
que se encontraban en unidades educativas y la mayoría si sabe leer y escribir

Tabla No 4.3 Tabla de frecuencias de asistió a clase

asistioclasetabla<-table(asistioclase)
View(asistioclasetabla)

Grafico No 4.3 Grafico de frecuencias de asistió a clase

barplot(asistioclasetabla,col=asistioclasetabla,las=2)

Interpretación

Observamos que la mayoría de personas que contestaron a esta encuesta no han


asistido a clases podría ser porque se refiere a clases de Senescyt y no todas las personas
dieron esta prueba.
Tabla No 4.4 Tabla de la media de Cuantos cursos de capacitación siguió por asistió a
clase

aggregate(cursoscapacitacion~asistioclase,educacionloja,mean,na.rm=TRUE)

Tabla No 4.5 Tabla de la media de Cuantos cursos de capacitación siguió por asistió a
clase por si sabe leer o escribir

aggregate(cursoscapacitacion~asistioclase+sabeleer,educacionloja,mean,na.rm=TR
UE)

Gráfico No 4.4 Cuantos cursos de capacitación asistió y asistió a clases por saber leer
o escribir

ggplot(educacionloja,aes(cursoscapacitacion,asistioclase,fill= sabeleer))+
geom_bar(stat="identity", position="dodge")+
labs(x="Cuantos cursos de capacitacion asitio",
y="Asiste a clases",
title="Cuantos cursos de capacitación asistió y asistió a clases por sabe leer u escribir")

Interpretación
Podemos observar que la mayoría de personas que asistió a clases si saben leer y
escribir esto debido a que se encuentran en una institución educativa.
Gráfico No 4.5 Grafico asistió a clases por saber leer y escribir

ggplot(educacionloja,aes(asistioclase, fill=sabeleer))+geom_bar(position = "dodge")+


xlab("Asite a clases")+
ylab("Frecuencia")+
ggtitle("ASISTIO A CLASES POR SABE LEER Y ESCRIBIR")

Interpretación
Podemos observar en el grafico que la mayoría de personas que asistieron a clases si
saben leer y escribir mientras que la mayoría de personas que no asistieron a clases es un
número mayor si saben leer y escribir puede ser esto a que las personas que no asistieron a
clases se encuentren trabajando o tengan clase justo en la misma hora de clases de
nivelación de Senescyt

Tema No 5 Cuantas horas dedico al uso del internet al día con asiste a clases y si no es
así porque

Tabla No 5.1 Estadísticas descriptivos de la variable cuantas horas dedico al uso de


internet al día
summary(internet,na.rm=TRUE)

Min. 1st Qu. Median Mean 3rd Qu. Max. NA's


0.000 1.000 1.000 1.822 2.000 21.000 1887

Gráfico No 5.1 Grafico de cajas de la variable cuantas horas dedico al uso de internet
al día
boxplot(internet,xlab="Cuantas horas dedico al uso de internet al
día",main="cuantas horas dedico al uso de internet al
día",horizontal=TRUE,col="tomato1")
Interpretación
Podemos observar en el grafico que la media de horas que usan las personas que
contestaron esta encuesta esta entre 1 a 2 horas diarias mientras que la máxima de horas es
de 21 puede ser que esta persona contesto incorrectamente o también puede ser que si
ocupa 21 horas de internet por su trabajo.

Tabla No 5.2 Estadísticos descriptivos de la variable Sabe leer y escribir

sabeleertabla<-table(sabeleer)
View(sabeleertabla)

Gráfico No 5.2 Grafico descriptivo de la variable Sabe leer y escribir


barplot(sabeleertabla,col=sabeleertabla,las=2)
Interpretación

Observamos que las personas que saben leer y escribir tiene un mayor porcentaje que
las personas que no saben leer ni escribir. Esto debido a que esta base fue realizada a personas
que se encontraban en unidades educativas y la mayoría si sabe leer y escribir

Tabla No 5.3 Tabla de frecuencias de asistió a clase

asistioclasetabla<-table(asistioclase)
View(asistioclasetabla)

Gráfico No 5.3 Grafico de frecuencias de asistió a clase

barplot(asistioclasetabla,col=asistioclasetabla,las=2)

Interpretación

Observamos que la mayoría de personas que contestaron a esta encuesta no han


asistido a clases podría ser porque se refiere a clases de Senescyt y no todas las personas
dieron esta prueba.
Tabla No 5.4 Tabla de frecuencias de razón por la que no asistió a clases

Gráfico No5.4 Grafico de frecuencias de razón por la que no asistió a clases

barplot(table(razondenoasisitir),col=razondenoasisitir)

Interpretación
Podemos observar que la mayoría de personas no asistió a clases debido a su edad
puede ser que se encuentren trabajando o estén en niveles de instrucción menores a
secundaria, mientras que la razón por la que no asistieron menor fue de asistir a nivelación
de Senescyt
Tabla No 5.5 Tabla de la media de Cuantos cursos de capacitación siguió por asistió a
clase
aggregate(cursoscapacitacion~asistioclase,educacionloja,mean,na.rm=TRUE)

Tabla No 5.6 Tabla de la media de Cuantos cursos de capacitación siguió por asistió a
clase por si sabe leer o escribir

aggregate(cursoscapacitacion~asistioclase+sabeleer,educacionloja,mean,na.rm=TR
UE)

Gráfico No 5.5 Grafico de Cuantas horas de internet utilizo al día y razón de no asistir
a clases por saber leer y escribir

ggplot(educacionloja,aes(internet,razondenoasisitir,fill= sabeleer))+
geom_bar(stat="identity", position="dodge")+
labs(x="Cuantas horas de internet utilixo al dia",
y="Razon de no asistir a clases",
title="Cuantas horas de internet utilizo al día y razón de no asistir a clases por
saber leer y escribir")
Interpretación
Podemos observar en el grafico de cuantas horas utiliza internet al día razón de no
asistir por sabe leer y escribir, que la personas que más ocupa internet al día ya termino su
estudios y no respondieron si saben leer y escribir podemos concluir que si pueden leer y
escribir ya que acabaron sus estudios, mientras que la persona que menos ocupa horas de
internet al día es de 0 puede ser personas que no tienen internet en sus casas o personas que
no saben leer ni escribir y no les ha hecho falta utilizar el internet o por otro lado niños que
se encuentran en primaria y no saben utilizar internet.

Gráfico No 5.6 Grafico de razón de no asistir a clases por saber leer y escribir

ggplot(educacionloja,aes(sabeleer, fill=razondenoasisitir))+geom_bar(position =
"dodge")+
xlab("Sabe leer y escribir ")+
ylab("Frecuencia")+
ggtitle("RAZON DE NO ASISTIR A CLASES POR sabe leer y escribir")

Interpretación
Podemos observar en el grafico de razón de no asistir a clase con si sabe leer y
escribir, que la mayoría de personas si sabe leer y escribir, pero la razón de no asistir a
clases es por la edad. Mientras que la razón de las personas que no saben leer ni escribir es
también por la edad que no asistieron a clases.
Las personas que saben leer y escribir la menor razón por la que no asistieron a clases fue
por no hay establecimientos educativos esto puede ser ya que viven en lugares muy
alejados de las ciudades, campo. Y se les hace difícil asistir a clases ya que no cuentan con
los recursos económicos
CONCLUSIONES

• Es importante la identificación y el correcto tratamiento de los valores perdidos y


atípicos, ya que esto podría afectar a los resultados finales de nuestra investigación.
• La estadística descriptiva nos ayuda a comprender la estructura de los datos para
poder detectar cómo se comportan las variables y poder obtener resultados más
precisos.
• El software RStudio y sus variadas funciones nos facilita el cálculo de operaciones
estadísticas, tanto como para el tratamiento de los valores perdidos y filtración de la
base.

BIBLIOGRAFIA

• INEC, extraído de: https://www.ecuadorencifras.gob.ec/institucional/home/

También podría gustarte