Está en la página 1de 7

Ingeniería en Sistemas

de Información

UNIVERSIDAD TÉCNICA DE COTOPAXI


FACULTAD DE CIENCIAS DE LA INGENIERIA Y APLICADAS
INGENIERIA EN SISTEMAS

NOMBRE: Alex Enrique Villamarín Chicaiza


CURSO: Séptimo
FECHA: 21/11/ 2022
TEMA: Proceso Y Fases De La Extracción Del Conocimiento.

Introducción:

El conocimiento de los procesos y las fases de extracción de información en la base de datos son
procesos muy complejos; la minería de datos solo se constituye una etapa de este proceso cuyo
objetivo consistir en la obtención de patrones y modelos.

La minería de datos tiene métodos estadísticos y técnicas de aprendizaje automática


examinando como se puede aplicar cada proceso conjunto a las fases de la extracción del
conocimiento.

Es necesario manejar una metodología al utilizar las etapas para la gestión en nuestros proyectos
y en este trabajo se va a realizar con registros estadísticos que nos ayude en la toma decisiones.

El desarrollo de este articulo se divide en dos partes importantes para la extracción del
conocimiento en la minería de datos [1]:

Procesos: Se comprende varios pasos.

1. Seleccionar.
2. Crear.
3. Probar.
4. Trabajar con modelos de minería.

Fases: Consiste en un ciclo de vida para la minería:

1. Comprensión del negocio.


2. comprensión de los datos.
3. Preparación de los datos.
4. Modelo.
5. Evaluación.
6. Despliegue.

Revisión de Literatura:

Porque es un ciclo de vida del proyecto de minería que se deben seguir para obtener información
de datos correctos. Se forma parte de un proceso mayor que incluye desde la formación de
preguntas acerca de los datos y la creación de la implementación del modelo en un entorno de
trabajo [2].
Ingeniería en Sistemas
de Información

Problema de Investigación:

La falta de procesos de la minería de datos en el ámbito de proyectos se define procesos y fases


que evalúa el trabajo que se realiza en la minería de datos ya que se realizan preguntas muy
frecuentes como, por ejemplo:

a) ¿Que está buscando?


b) ¿Indicador de cómo se resuelve los procesos de un proyecto?
c) ¿Atributos que desea pedir?
d) ¿Qué tipo de dato se obtiene?
e) ¿Distribución de datos de un proyecto?
f) ¿Qué datos estadísticos son obtenidos?

Están son preguntas muy frecuentes que se realizan al momento de buscar un buen proceso al
aplicar las fases y los procesos de la minería de datos ya que son eficientes a la obtención de
resultados muy eficientes [3].

Importancia del Problema de Investigación:

Una vez que los datos han sido pre procesados utilizando los procesos y las fases la información
se considerada datos que nos permite establecer el modelo buscado.

La Minería de Datos presenta un amplio espectro para obtener resultados que va a depender de
un análisis previo.

El conocimiento previo del problema, no garantizan patrones expresivos, novedosos y útiles. Los
algoritmos muchas veces ofrecen malos resultados debido a causas ajenas a su efectividad, ya
sea porque no existe una secuencia a seguir en los datos o porque no se está usando la
herramienta adecuada o porque el patrón es realmente difícil de encontrar [4].

Con esto en mente se realizó una investigación bibliográfica de los procesos y fases de la
extracción del conocimiento para obtener datos en la minería [5] [6].

Discusión:

En la minería de datos se utiliza para explorar datos mediante una aplicación de un algoritmo es
decir es algo más que un algoritmo o un contenedor de datos, estadísticas y patrones que se
pueden aplicar en predicciones ya que deducen relaciones obteniendo un objetivo claro.

Se pueden clasificar en dos partes para la extracción del conocimiento.

Procesos

1.- Selección y preparación de datos: se emplea para nombrar procesos y resultados que
alcanzar.
Ingeniería en Sistemas
de Información

2.- Crear: Modelo de minería de datos se crea a partir de un conjunto específico de datos de
entrada, durante el proceso de creación una vez preparados los datos se debe especificar sus
decisiones.

Las decisiones más comunes que se generan al crear son:

a) Dónde residen los datos de entrada.


b) Qué campos de los datos de entrada son apropiados.
c) Qué valores se deben utilizar para la función de minería determinada que está
utilizando.
d) Dónde desea almacenar el modelo final.

En la minería se utiliza los siguientes objetos de base de datos para crear un modelo:

a) Métodos definidos por el usuario.


b) Procedimientos almacenados.
c) Funciones definidas por el usuario.

3.- Prueba: Es decir que se puede probar un modelo y se puede analizar la calidad del modelo.

4.- Trabajar con modelos de minería: Se crea mediante la aplicación de un algoritmo, pero es
algo más que un algoritmo o un contenedor para generar predicciones y deducir relaciones [1]
[7].

Fases

1.- Comprensión del negocio: Es entender los objetivos conjuntos a los requerimientos del
proyecto desde una perspectiva de negocio y convertir este conocimiento en el problema de
minería de datos ya que es un plan preliminar para alcanzar los objetivos [8].

Las principales tares de la comprensión del negocio son:

a) Determinar los objetivos de negocio.


b) Evaluar el contexto.
c) Determinar los objetivos de minería de datos.
d) Generar el plan de proyecto.

Determinar los objetivos de negocio: Comprender desde una perspectiva de negocio lo que el
cliente quiere conseguir realmente.

Evaluar el contexto: Caracteriza los recursos que el proyecto va a utilizar y sus requerimientos.

Determinar los objetivos de minería de datos: La enunciación de los objetivos a describirlos de


la minería de datos.

Generar el plan de proyecto: Es importante incluir una valoración preliminar del tipo de
herramientas y técnicas que se pueden utilizar ya que la selección puede influir en el proyecto
completo [9] [10].

2.- Comprensión de los datos: La comprensión y seleccion de datos tiene como objetivo el inicio
de la recolección de datos. Estudiar de cerca los datos es necesario para seguir con la siguiente
fase, evitado problemas muy frecuentes y poder obtener una idea de lo que nos dice los datos.
Ingeniería en Sistemas
de Información

Esto conlleva a diferentes tareas que existen para poder completar esta fase por completo [11].

a) La recopilación inicial de los datos.


b) Descripción de los datos.
c) Exploración de datos.
d) Verificación de calidad de los datos.

La recopilación inicial de los datos: Adquirir los datos necesarios para la minería de datos. Esta
recopilación de datos inicial se refiere a la carga de datos ya sea descargarlo directamente de
una página web o la extracción desde una base de datos.

Descripción de los datos: Los aspectos son importantes de realizar en esta tarea las cuales son
el volumen y la calidad de los datos que se centrán en la cantidad de datos y el estado de los
mismos.

Exploración de datos: Es exploración para entender cómo se comportan las relación que tienen
para la visualización de datos ya que esta nos ayuda a entender visualmente todo lo mencionado
también se utiliza query y técnicas de reporte.

Verificación de calidad de los datos: Es la verificación de los datos que estén del todo perfectos
u los valores que se salen de lo estimado según el conjunto de datos, error de medición, entre
otros [12].

3.- Preparación de los datos: La preparación de datos sigue una serie de pasos que comienza
con la recopilación de los datos adecuados.

a) Recopilar datos.
b) Limpiar datos.
c) Etiquetar datos.
d) Validar y visualizar.

Recopilar datos: La recopilación de datos es el proceso de agrupar todos los datos que necesita
para almacenarlos la nube, aplicaciones y dispositivos.

Limpiar datos: La limpieza de datos se corrigen los errores y rellena espacio en caso de datos
perdidos como paso para garantizar la calidad de los datos.

Este proceso puede incluir cambiar formatos de campos como fechas, divisa, modificar
convenciones de nomenclatura, corregir valores y unidades de medida para que sean
consistentes.

Etiquetar datos: El etiquetado de datos es el proceso para identificar los datos sin procesar y
agregar una o más etiquetas significativas e informativas para proporcionar contexto.

Validar y visualizar: Una vez que los datos están limpios y etiquetados están listos para las
visualizaciones como histogramas, gráficos de dispersión, gráficos de caja, gráficos de línea y
gráficos de barra ya que son herramientas útiles para confirmar que los datos son correctos [13].
Ingeniería en Sistemas
de Información

4.- Modelo: Un modelo de minería de datos se crea mediante la aplicación de un algoritmo a los
datos ya que es un conjunto de datos, estadísticas y patrones que se pueden aplicar a los nuevos
datos para generar predicciones y deducir relaciones [14].

Para crear un modelo en la minería de datos se toca seguir los siguientes pasos.

a) Cree la estructura de minería de datos e incluir las columnas de datos que sean
necesarias.
b) Seleccione un algoritmo adecuado para el proyecto dependiendo las necesidades.
c) Se establecer parámetros para ajustar el procesamiento del algoritmo.
d) Se le llena el modelo con los datos procesando a la estructura.

5.- Evaluación: Se evalúa el algoritmo de la minería de datos para corregir algún error que se
presente caso contrario si los errores no se corrigen pasaría a un problema ya que estaría fuera
de tiempo y el proyecto no se llevaría a cabo al tiempo acordado.

Cuando se presenta un error se vuelve a corregir desde el principio verificando donde es el error
para corregirlo o también se le verifica si los pasos se siguieron adecuadamente sin saltarse
ninguna etapa ya que llevaría a problemas del algoritmo en la minería de datos [15].

6.- Despliegue: El despliegue es el proceso que consiste en utilizar sus nuevos conocimientos
para implementar las mejoras en su organización es decir que se puede significar que utilice los
conocimientos adquiridos en minería de datos para aplicar modificaciones en su organización
[16].

Las fases de despliegue son dos tipos de actividades:

a) Planificación y control del despliegue de los resultados que se obtuvieron en la recolecta


de la información.
b) La finalización de tareas que presentan como la producción de un informe final y la
revisión de un proyecto que no tenga ningún error [17].

Conclusiones:

En la extracción de los procesos y fases nos ayudan a sacar adecuadamente la información sin
tener casi ningún error ya el proyecto sea muy eficiente en la minería de datos.

La minería de datos se enfoca en el conocimiento a partir de los datos que se obtiene en el


estudio de manera manual ya que se adapta a los datos proyectos obteniendo grandes
beneficios que nos permiten aplicar algoritmos adecuados y teniendo resultados claros que nos
demuestren un rendimiento eficiente de acuerdo a la información recolectada.

En conclusión, para obtener datos concretos a la hora de ejecutar nuestros proyectos se deben
seguir una serie de pasos que nos permite no cometer errores comunes a la hora de la ejecución
del proyecto.
Ingeniería en Sistemas
de Información

Bibliografía

[1] L. E. M. L. y. C. S. Mariñelarena Dondena, «unc.edu.ar,» Revista Argentina de Ciencias


del Comportamiento, 9 8 2017. [En línea]. Available:
https://revistas.unc.edu.ar/index.php/racc/article/view/12701. [Último acceso: 21 11
2022].

[2] J. M. Moine, «SEDICI,» 23 9 2013. [En línea]. Available:


http://sedici.unlp.edu.ar/handle/10915/29582. [Último acceso: 7 11 2022].

[3] H. W. V. M. A. J. S. P. R. Z. G. C. J. P. F. B. A. O. V. J. Á. Lanzarini Laura Cristina, «SEDICI,»


Workshop de Investigadores en Ciencias de la Computación, 4 2019. [En línea].
Available: http://sedici.unlp.edu.ar/handle/10915/77022. [Último acceso: 21 11 2022].

[4] C. P. R. L. N. J. P. R. S. B. D. H. N. E. Battista Anabella, «SEDICI,» WICC, 19 5 2016. [En


línea]. Available: http://sedici.unlp.edu.ar/handle/10915/52901. [Último acceso: 21 11
2022].

[5] M. A. C. C. A. A. E. R. A. C. E. Bodero Poveda Elba María, «SEDICI,» 2022. [En línea].


Available: http://sedici.unlp.edu.ar/handle/10915/130339. [Último acceso: 21 11
2022].

[6] T. D. B. A. C. A. Manrique Daniela, «SEDICI,» Journal of Computer Science & Technology;


vol. 21, no. 1, 17 4 2021. [En línea]. Available:
http://sedici.unlp.edu.ar/handle/10915/118055. [Último acceso: 21 11 2022].

[7] IBM, «Proceso de mineria de datos,» 27 2 2021. [En línea]. Available:


https://www.ibm.com/docs/es/db2/11.1?topic=miner-data-mining-process. [Último
acceso: 21 11 2022].

[8] A. J. Y.-H. T.-W. H.-H. Wen-KwangTsao, «Base,» 3 2010. [En línea]. Available:
https://www.sciencedirect.com/science/article/abs/pii/S0031320309003434. [Último
acceso: 21 11 2022].

[9] EALDE, «La guia del PMBOK,» 2022. [En línea]. Available: https://www.ealde.es/grupos-
procesos-pmbok/#:~:text=proyecto%20o%20fase.-
,Diferencia%20entre%20procesos%20y%20fases,de%20uno%20o%20varios%20entrega
bles.. [Último acceso: 21 11 2022].

[10] J. C. Penalillo Gallo, «Base,» Universidad Católica Santo Toribio de Mogrovejo ; PE,
2019, 2019. [En línea]. Available: https://www.base-
search.net/Search/Results?lookfor=determinar+los+objetivos+de+negocio&name=&oa
boost=1&newsearch=1&refid=dcbases. [Último acceso: 21 11 2022].

[11] M. Niño, «Comprencion del negocio,» 18 11 2016. [En línea]. Available:


https://www.mikelnino.com/2016/11/crisp-dm-metodologia-data-mining-
comprension-negocio-business-understanding.html#:~:text=de%20cada%20fase.-
Ingeniería en Sistemas
de Información

,Fase%20de%20%E2%80%9CComprensi%C3%B3n%20del%20negocio%E2%80%9D%20(
Business%20Understanding),preliminar%20para%20a. [Último acceso: 21 11 2022].

[12] P. C. J. K. R. K. T. R. T. Chapman, «IBM,» 20 12 2020. [En línea]. Available:


https://es.wikipedia.org/wiki/Comprensi%C3%B3n_de_datos#:~:text=La%20comprensi
%C3%B3n%20de%20datos%20tiene,que%20nos%20dice%20los%20datos.. [Último
acceso: 21 11 2022].

[13] D. E. Valencia Salamanca, «BASE,» Ingeniería de Sistemas, 2021. [En línea]. Available:
https://repositorio.escuelaing.edu.co/handle/001/1639. [Último acceso: 21 11 2022].

[14] Microsoft, «Moelos de mineria de datos,» 27 9 2022. [En línea]. Available:


https://learn.microsoft.com/es-es/analysis-services/data-mining/mining-models-
analysis-services-data-mining?view=asallproducts-allversions. [Último acceso: 21 11
2022].

[15] A. Soto, «uap.edu.pe,» REVISTA CIENTÍFICA INGETECNO, 2014. [En línea]. Available:
http://revistas.uap.edu.pe/ojs/index.php/RCI/article/view/115. [Último acceso: 21 11
2022].

[16] J. C. Penalillo Gallo, «El modelo de negocios como reforzador del emprendimiento en la
Universidad Católica Santo Toribio de Mogrovejo,» BASE, 2019. [En línea]. Available:
https://www.base-
search.net/Record/0ee19f69ecc5d1451cd5d0e203bf911f32c65a4bbd671df967244134e
f3264e9/. [Último acceso: 21 11 2022].

[17] P. A. Castañeda García, «Universidad EAFIT,» BASE, 2019. [En línea]. Available:
https://repository.eafit.edu.co/handle/10784/13842. [Último acceso: 21 11 2022].

También podría gustarte