Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TRABAJO COLABORATIVO
Profesor:
Ingeniería De Sistemas
2022
2
TABLA DE CONTENIDOS
1. Introducción.............................................................................................. 3
2. Objetivos ..................................................................................................4
3. Justificación ..................................................................................................... 5
4. Contextualización ........................................................................................... 6
5. Discusión del análisis hecho en grupo ......................................................... 7
6. Conclusiones............................................................................................8
7. Bibliografía ...................................................................................................... 9
3
INTRODUCCION
Dada la cantidad de datos que se pueden encontrar en la base de datos de la página web
www.datos.gov.co y como consecuencia de poder diligenciar la actividadcorrespondiente
en la materia Extracción, Transformación y Carga de datos, ETL, Teniendoen cuenta lo
planteado en la guía de trabajo se realizó la consulta de diferentes conjuntosde datos, el
grupo decidió entre todos los accesos posibles, identificar para ello el enlace
https://www.datos.gov.co/Educaci-n/Estudiantes-Matriculados-y-Graduados-CEFIT/a3jg-
j674.
La idea principal en base a nuestra elección de este conjunto de datos es manipular y
gestionar los datos suficientes con el objetivo de una mejor transformación y resultados de
lo que se requiera cuando se necesite el análisis correspondiente para las actividades a
desarrollar en las próximas semanas.
Esperamos con ellos el poder cumplir con las acciones requeridas y mantener el
aprendizaje de nuestra materia saliendo avante en los aspectos requeridos de nuestras
próximas actividades.
4
OBJETIVOS
JUSTIFICACION
Mediante el acceso a las diferentes bases de datos, obtenemos de ellos los necesarios
para poder entender y clasificar en el mismo nivel del aprendizaje continuo de los datos
fiables y verificables, aunque debemos tener en cuenta la veracidad de los mismos y poder
obtener una fiabilidad del cien por ciento en todo lo que necesitemos filtrar, con el fin de
trabajar sobre hechos y números reales, sin dejar al azar interpretaciones o resultados sin
fundamento o que sean de invención de alguno de los participantes.
Es necesario para lograr los objetivos propuestos no solo la intención de encontrar datos
en cualquier lugar o base de datos, sino verificar que estos sean reales y fiables y poder
contener la interpretación a la realidad, no solo por el aprendizaje directo de los mismos,
sino por la interpretación y el tener una base real y tener como finalidad una nueva
estructuración acorde a las necesidades que veamos o que nos exijan, su interpretación y
dejar esta nueva estructuración o una nueva base de datos para otros que deseen o
necesiten terminar con algún requerimiento especifico.
6
CONTEXTUALIZACION
Esta tabla de datos ha sido creada con fecha 16 de marzo de 2022, ofrecido para su
visualización por Jaider Velásquez Agudelo.
Encontramos entre otras, las siguientes columnas sobre los estudiantes graduados y
matriculados, Genero, Municipio de nacimiento, País, Municipio de residencia, Barrio
Dirección, Estrato, Estado civil, EPS, Grupo Sisbén, Zona, Nivel de formación, Ocupación,
Medio de transporte, Multiculturalidad, estado, Fecha de matrícula, Jornada, Programa,
periodo, nivel, Edad, para un total de 21 columnas.
Diferenciamos entonces Los datos del estudiante, tales como género, donde nació, país
donde nació, municipio donde vive, cual barrio, la dirección y el estrato, del estudiante
conoceremos su estado civil, en cual EPS se encuentra activo, que grupo de Sisbén tiene,
que zona, su nivel de formación y su ocupación, cual medio de transporte utiliza, que
multiculturalidad tiene, su estado de estudio, si es graduado, si cancelo o si esta inactivo,
la fecha en que se matriculo, en qué jornada estudio, que programa estudio y en qué periodo
del año estaba, en qué nivel de estudios se encontraba y la edad en años.
Obtenemos también los datos están en idioma español, la cobertura de estos datos es
municipal, se debe actualizar anualmente, así como los datos de información de la entidad
que los entrega, dentro del ámbito del departamento académico, como Centro de
Formación Integral para El Trabajo.
Este sitio donde se toman los datos para la tabla, está ubicado en Envigado en el
Departamento de Antioquia en Colombia, dentro del sector territorial correspondiente al
CEFIT, dado también por la parte de educación.
7
Se evidencio la entrega de dos tablas diferentes por parte de cada uno de los integrantes
del grupo, pero al revisar se obtuvo que alguna de las tablas por ejemplo la del puntaje del
icfes por departamento, se encontraba desactualizada al año 2020, mientras que
evidenciamos que la tabla https://www.datos.gov.co/Educaci-n/Estudiantes-Matriculados-
y-Graduados-CEFIT/a3jg-j674, se encontraba actualizada a julio de 2022.
Otro de los puntos que se discutió es que la tabla tiene una cantidad de 21 columnas con
diferentes datos, los cuales parecen más interesantes a tratar y manejar, pues sabemos
que, sobre esta tabla, buscaremos diferentes filtros y obtendremos información.
Por otro lado, se discutió sobre la fiabilidad de los datos encontrados en la tabla ya
mencionada, y consideramos que se observó una trasparencia y fiabilidad del cien por
ciento, así que decidió el grupo dejar la tabla del CEFIT.
De igual manera este conjunto de datos fácilmente representa ejemplo de la vida real y
laboral en cual debe manejar y ejecutar los procesos ETL. Ya que sus diferentes columnas
y datos ya ingresados pueden ser replanteados o formateados según se requiera en la
unidad de negocio y actividad nos afianzara capacidades y conocimientos los cuales son
objetivos del curso ETL.
8
CONCLUSIONES
Podemos concluir con seguridad que se logran los objetivos y se mantiene nuestra tabla
de datos, con la seguridad plena que servirá para posibles acciones dentro de la materia
ETL, teniendo la certeza que estos datos son fiables en un cien por ciento, sin temor a
obtener errores en las mediciones que hagamos de ellos.
Se logra la identificación de una base de datos, como fue solicitada en nuestra actividad
dos, y se hace un consentimiento en el grupo sobre la utilización de esta tabla como
representativa dentro de nuestro trabajo y que cumple con los parámetros para su
utilización, así que decidimos dejar nuestra tabla como bandera de nuestro grupo.
9
BIBLIOGRAFIA
• Aprender Big Data. (2019, May 5). Top 5 herramientas ETL empresariales
2019 en 1 minuto - Aprender BIG DATA #14 [Video].YouTube.
https://www.youtube.com/watch?v=ly2O_I3stls.