Está en la página 1de 5

Red de Revistas Científicas de América Latina, el Caribe, España y Portugal

Sistema de Información Científica

Apolinar Velarde Martínez Minería de Datos. Una Introducción Conciencia Tecnológica, núm. 23, 2003 Instituto Tecnológico de Aguascalientes México
Disponible en: http://www.redalyc.org/articulo.oa?id=94402303

Conciencia Tecnológica, ISSN (Versión impresa): 1405-5597 contec@correo.ita.mx Instituto Tecnológico de Aguascalientes México

¿Cómo citar?

Fascículo completo

Más información del artículo

Página de la revista

www.redalyc.org
Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

Redes Neuronales Artificiales. Estadística. Aprendizaje Computacional. Este documento está distribuido en 4 partes principales. La minería de datos es una disciplina que combina técnicas de Inteligencia Artificial. El fácil almacenamiento de la información en sistemas de cómputo. a través de la automatización de aplicaciones. Palabras Clave. algoritmos de Árboles de decisión y reglas. México avelarde@ita. Apolinar Velarde Martínez Departamento del Centro de Cómputo Instituto Tecnológico de Aguascalientes Aguascalientes. en la primera parte se describe el concepto de Minería de Datos. Finalmente. Los algoritmos de aplicación a la Minería de Datos se mencionan en la cuarta sección. se presentan las conclusiones de éste trabajo. CONCEPTO DE MINERÍA DE DATOS Existen varias definiciones para el concepto de Minería de Datos. Probabilidad. el uso de lectores de código de barras y otros métodos de captura. las áreas de investigación aplicables a la minería de datos se describen en la tercera sección. conocido como generación masiva de datos. Modelos gráficos de dependencias probabilísticas.Minería de Datos Una Introducción M. Algoritmos de clasificación. y Bases de Datos para extraer información y conocimientos útiles desde grandes cantidades de datos [2]. Los trabajos futuros encaminados a hacer uso de la Minería de Datos se exponen en la sección cinco. C. han permitido la creación de almacenes masivos de información. Matemáticas Multivariantes. Ags. El sueño del hombre a través de la historia de la computación ha sido el desarrollar sistemas inteligentes para el manejo de la información en sistemas de cómputo [1]. hasta el punto en el que consultas enunciadas con hipótesis concretas en lenguajes de consulta estructurados (SQL) han sido insuficientes para explotar estos almacenes. en la segunda se presenta un esquema genérico para el descubrimiento de conocimiento en un sistema de minería de datos. pero la esencia de éstas se fundamenta en el concepto de escarbar en la información almacenada para descubrir elementos de utilidad desde grandes cantidades .mx RESUMEN. Minería de datos. I.

Selección de el ó los algoritmos a utilizar. 7. valores incompletos. 9. regresión. 5. 9. 6. otros algoritmos otras metas y otras estrategias. con el objetivo de detectar patrones de comportamiento consistentes. secuencias de tiempo y otros. Llevar a cabo el proceso de minería de datos. Selección de la tarea de descubrimiento a realizar. Incorporar el conocimiento descubierto al sistema (normalmente para mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente. otros algoritmos otras metas y otras estrategias. 3. regresión. Selección de la tarea de descubrimiento a realizar. II. Seleccionar un conjunto de datos y enfocar la búsqueda en subconjuntos de variables y / ó muestras de datos en donde realizar el proceso de descubrimiento. 4. Incorporar el conocimiento descubierto al sistema (normalmente para mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente. quizás con otros datos. Limpieza y preprocesamiento de datos. 4. etcétera. diseñando una estrategia adecuada para manejar ruido. 3. PROCESO DE DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS El proceso de descubrimiento de conocimiento en Bases de Datos involucra nueve pasos que a continuación se describen y que se muestran esquemáticamente en la figura 1 [4]: 1. 8. secuencias de tiempo y otros. Esto puede involucrar repetir el proceso. Limpieza y preprocesamiento de datos. Interpretar los resultados y posiblemente regresar a los pasos anteriores. con el objetivo de encontrar relaciones entre las diferentes variables. Reducción de datos y proyecciones para reducir el número de variables a considerar. 8. diseñado para explorar grandes cantidades de datos. Esto puede involucrar repetir el proceso. 5. clasificación. 2. Interpretar los resultados y posiblemente regresar a los pasos anteriores. valores incompletos. Reducción de datos y proyecciones para reducir el número de variables a considerar. agrupamiento. clasificación. Selección de el ó los algoritmos a utilizar. o relaciones entre los diferentes campos de una base de datos para aplicarlos a nuevos conjuntos de datos. Llevar a cabo el proceso de minería de datos. el conocimiento relevante a usar y las metas del usuario. Entendimiento del dominio de aplicación. para aplicarlas a nuevos conjuntos de datos [3]. por ejemplo.de datos almacenadas. Puede visualizarse también como un proceso analítico. . por ejemplo. diseñando una estrategia adecuada para manejar ruido. etcétera. quizás con otros datos. 6. 7. agrupamiento.

como el Método del vecino más cercano. ALGORITMOS DE APLICACIÓN A LA MINERÍA DE DATOS Destacan entre los algoritmos de aplicación a la Minería de Datos [4]: 1. V. Los Algoritmos de clasificación entre las que se pueden destacar las Redes Neuronales Artificiales (Backpropagation). 3. Modelos gráficos de dependencias probabilísticas como las Redes bayesianas. TRABAJOS FUTUROS . la Estadística y la Visualización de Datos. Proceso de descubrimiento de conocimiento en bases de datos. Métodos basados en ejemplos. las Bases de Datos. Los algoritmos de Árboles de decisión y reglas. IV. 2. 4.Interpretación / Evaluación Minería de Datos Transformación Preprocesado Selección Figura 1. ÁREAS DE INVESTIGACIÓN APLICABLES A LA MINERÍA DE DATOS Para llegar al conocimiento de los datos la Minería de Datos hace uso de las siguientes áreas de investigación: la Inteligencia Artificial. III.

almacenes que se tornan difíciles de explorar con herramientas clásicas de administración de Bases de Datos. REFERENCIAS [1] Velarde M. AAAI Press.. Data Mining Solutions. . (1998). se presenta como una herramienta de mucha aplicabilidad para la exploración y explotación de información en grandes almacenes de datos. así como la explotación de la misma por los usuarios. Advances in Knowledge Discovery and Data Mining. 1996. [3] Fayyad U..El presente trabajo ha servido como punto de partida para el desarrollo de un Minero de datos utilizando PHP (processor Hipertext) el permitirá el procesamiento de la Base de Datos de Alumnos del Instituto Tecnológico de Aguascalientes. J. Tesis de Maestría. C y Blaxton. [5] Westphal.. Wiley. modelos de agrupamiento y de afinidad sobre el conjunto de datos existentes. G. Inducción de Conocimiento con Incertidumbre en Bases de Datos Relaciónales Borrosas. [4] Gómez Flechoso A. Tesis Doctoral – ETSIT-UPM Madrid. CENIDET. November. Editors (1996). Piatetsky-Shapiro.(1998). Centro Nacional de Investigación y Desarrollo Tecnológico. Sistema de Visión Artificial. [2] Communications of the ACM: Special Issue on Data Mining:. dadas la necesidades de generación de reportes a gran escala. (1999). CONCLUSIONES Una tecnología emergente como la Minería de Datos. modelos de segmentación. A. T. La Minería de Datos utiliza modelos predictivos. lo que permite el manejo y estructuración eficiente de la información para presentar datos visuales de gran utilidad en la toma de decisiones. generación de datos estadísticos y otras aplicaciones útiles en Instituciones y Empresas.