Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Introducción
2. Metodología
Apoyándonos en esta investigación y teniendo en cuenta que, dado que su definición es un conjunto de
métodos que se siguen en una investigación científica, un estudio o una exposición doctrinal.
Se utilizará el enfoque cuantitativo, ya que permite utilizar la colección de datos para probar hipótesis
basadas en la medición numérica y el análisis estadístico, con el fin de establecer patrones de teorías
de comportamiento y de prueba [2].
Se analizarán las variables recolectadas unas con otras para conformar un estudio que tenga relación.
Con el fin de llevar a cabo el proceso de minería de datos, se utilizó un conjunto de datos de
investigadores reconocidos por Colciencias obtenida desde el sitio de datos abiertos oficial del
Gobierno Digital Colombiana. Estos datos corresponden del año 2017. El conjunto de datos abiertos
tratados, tiene un total de 24 atributos, entre los que se consideran información de carácter general,
tales como la fecha del evento, el departamento, el género, nivel de formación, entre otros.
Se investigó análisis de un grupo de datos relacionados con los investigadores reconocidos por
Colciencias en Colombia durante el transcurso del año 2017, que determinaron los factores que
generan este tipo de eventos. A continuación, la Tabla 1muestra los atributos que conforman el
conjunto de datos con 13.001 instancias y 24 atributos
Tabla 1. Atributos
ATRIBUTOS DESCRIPCIÓN
Nombre de convocatoria Convocatoria
Año de convocatoria ¿En qué año se produce?
Genero de investigador Genero del Investigador
Municipio de nacimiendo de investigador Del Investigador
Departamento nacimiendo de investigador Del Investigador
País de nacimiento de investigador Del Investigador
Región de nacimiento de investigador Del Investigador
Dane ubicación nacimiento Del Investigador
Nivel de formación Del Investigador
Nombre de nivel de formación Del Investigador
Importancia nivel de formación Del Investigador
Categoría alcanzada Del Investigador
Nombre de categoría Categoría que se encuentra el investigador
Orden de importancia de categoría Del Investigador
Promedio de edad Del Investigador
Municipio de ubicación de investigador Donde reside el Investigador
Departamento de ubicación de investigador Donde reside el Investigador
País de ubicación de investigador Donde reside el Investigador
Región de ubicación de investigador Donde reside el Investigador
Dane ubicación investigador Donde reside el Investigador
Identificador de área Donde reside el Investigador
Especialidad área conocimiento Del investigador
Área conocimiento Del investigador
Gran área de conocimiento Del investigador
Modelado
Técnica: SimpleKMeans
Al analizar la información de algoritmo, varios grupos se relacionan en la Figura 1; los grupos agrupan
la información que apunta donde frecuenta el resultado, como ciencias biológicas que es el área de
especialidad del investigador, teniendo en cuenta los demás datos mostrados.
Evaluación
Teniendo en cuenta la información proporcionada por Weka en la Figura 2, se puede deducir que el
sexo masculino es el más involucrado como investigador.
Teniendo en cuenta la información proporcionada por Weka en la Figura 3, se puede deducir que
ciencias biológicas es el área más frecuente del investigador.
Figura 4. Departamento nacimiento de investigador.
Teniendo en cuenta la información proporcionada por Weka en la Figura 4, se puede deducir que
Bogotá es el departamento donde más investigadores nacieron.
Teniendo en cuenta la información proporcionada por Weka en la Figura 5, se puede deducir que el
departamento de Bogotá es donde más investigadores hay.
Teniendo en cuenta la información proporcionada por Weka en la figura 6, se puede deducir que 6458
personas alcanzaron el nivel máximo de formación alcanzado.
La Figura 7. Nombre de nivel de formación máximo.
Teniendo en cuenta la información proporcionada por Weka en la Figura 7, se deduce que 6458
investigadores tienen doctorados.
Figura 8. Nombre de categoría alcanzada del investigador.
Teniendo en cuenta la información proporcionada por Weka en la Figura 8, se deduce que gran parte
de los investigadores están en la categoría junior.
Teniendo en cuenta la información proporcionada por Weka en la Figura 9, se deduce que el país de
nacimiendo de los investigadores es en Colombia que es donde más hay.
Figura 10. Promedio de edad.
Teniendo en cuenta la información proporcionada por Weka en la Figura 10, se puede deducir que el
promedio de edad de los investigadores.
Teniendo en cuenta la información proporcionada por Weka en la Figura 11, se describe que la región
del distrito capital es el lugar más frecuente de nacimiento de los investigadores.
Despliegue o implantación
Los datos anteriores presentados y analizados, describen una serie de caracterizaciones que están
relacionados. Estas caracterizaciones determinadas en el análisis pueden funcionar como una ayuda
para predecir posibles hechos relacionados con futuras convocatorias realizadas por Colciencias;
Además, este tipo de información analizada sirve como una guía para desarrollar campañas sociales en
las comunidades con mayores investigadores, con el objetivo de motivar la investigación.
4. Conclusiones
El presente trabajo ha demostrado no sólo que es posible aplicar la minería de datos a la información
relacionada con los investigadores reconocidos por Colciencias en el año 2017 en Colombia, sino que
también representa un alto valor añadido para el análisis y la generación de nuevos conocimientos.
La experiencia obtenida mediante el análisis de los datos sobre los investigadores se deja inferir que, si
bien existen herramientas que permiten la recolección y análisis de grandes cantidades de datos, aún
existe información que actualmente no se utiliza en toda su dimensión.
El uso de minería de datos para el análisis de este tipo de información ha demostrado ser prometedor,
teniendo en cuenta que sus diferentes aplicaciones han permitido relacionar a los investigadores la
motivación de participar en dichos eventos.
Hay herramientas de minería de datos que ofrecen apoyo en el establecimiento de relaciones entre
variables para analizar aspectos de un fenómeno que se podía aislar previamente.
El uso de una herramienta como Weka era importante desarrollar un proceso de minería de datos; este
tipo de herramientas es fundamental, ya que además de permitir el uso de diferentes algoritmos, sino
que también optimiza el tiempo de generación de los resultados del análisis en cuestión.
Referencias
[1] mediciondegrupos-actene2015.pdf
[2] Hernández Sampieri-R y T Mendoza 2018 Metodología de la Investigación (México DF:
McGraw-Hill Interamericana)
[3] https://www.datos.gov.co/Ciencia-Tecnolog-a-e-Innovaci-n/INVESTIGADORES-
RECONOCIDOS-POR-COLCIENCIAS-2017/myet-x3bu/data
[4] https://colciencias.gov.co/node/2957
[5] https://www.monografias.com/docs110/data-mining-mineria-datos-conocimiento/data-mining-
mineria-datos-conocimiento.shtml
[6] anexo_1._documento_conceptual_modelo_medicion_de_grupos_e_investigadores_2017_-
_12_05_2017_protected.pdf