Está en la página 1de 6

UNIVERSIDAD

CUAUHTÉMOC PLANTEL
AGUASCALIENTES
EDUCACIÓN A DISTANCIA

Maestría en ciencias de los datos y procesamiento


de datos masivos (Big-Data)

DESCUBRIMIENTO DE CONOCIMIENTOS DE DATOS


Segundo Cuatrimestre

Alumnos: Andrés Arismendi Ramírez

Fabián Echeverry García

1.1 Cuestionario. Conceptos Generales de KDD

Objetivos específicos: Comprender que es conocimiento descubrimiento de conocimiento de


datos, minería de datos y elementos iniciales.

Profesor: Dr. Francisco Javier Luna Rosas


Fecha de entrega: 17 de Septiembre de 2017

“EXCELENTES PROFESIONISTAS, MEJORES SERES HUMANOS”


Nombre de la Unidad.
Unidad I. Conceptos Generales de Descubrimiento del Conocimiento en Bases de Datos

Objetivo de la Unidad.
 Comprender que es Descubrimiento del Conocimiento en Bases de Datos
 Comprender el concepto de Minería de Datos
 Analizar la diferencia entre KDD y minería de datos

Descripción de la Actividad(es):

Se realiza una lectura del documento Unidad I. KDD (Descubrimiento del Conocimiento en
bases de Datos) para posteriormente generar un cuestionario (pregunta - respuesta) de los
conceptos y temas analizados en el texto.
CONCEPTOS GENERALES DESCUBRIMIENTO DEL CONOCIMIENTO
DE BASES DE DATOS

CUESTIONARIO

1. ¿Qué es Minería?
Búsqueda y Extracción, Inicialmente de un Metal o Roca Preciosa o patrón, dato.

2. ¿Qué es Dato?
Es el elemento inicial de la información, representado en un símbolo, imagen, letra, numero o
gesto. Que es el punto de partida para la obtención de un objetivo.

3. ¿Qué es Minera de datos?


Búsqueda y Extracción de conocimiento a partir de un elemento inicial o dato de información
para obtener un propósito o resultado específico.

4. ¿Qué es Minería del Conocimiento?


Es la búsqueda y extracción de grandes cantidades de datos filtradas de la información
suministrada para lograr el objetivo mencionado con anterioridad

5. ¿Qué es KDD?
Descubriendo el conocimiento en Bases de Datos, Se refiere al proceso no-trivial de descubrir
conocimiento e información potencialmente útil dentro de los datos contenidos en un repositorio
de información, es un proceso iterativo que explora exhaustivamente volúmenes agrandes de
información, es un proceso que extrae información de calidad que puede usarse para sacar
conclusiones de un tema específico.
6. Limpieza de Datos
En este paso se elimina todo lo inconcluso de la información o suciedad caracteres especiales
valores o atributos perdidos, datos inconsistentes y en algunos casos eliminación de estos ya
que pueden contribuir a un análisis inexacto e impreciso y resultados incorrectos.

7. Integración de Datos
Combina datos de múltiples procedencias incluyendo múltiples bases de datos, que podrían
tener diferentes contenidos y formatos

8. Selección de Datos
Consiste en buscar los objetivos y herramientas del proceso de minería, identificando los datos
que han de ser extraídos, buscando los atributos apropiados de entrada y la información de
salida para a representar la tarea. Se debe saber qué es lo que se quiere obtener y cuáles son
los datos que nos facilitara esa información para poder llegar al objetivo propuesto.

9. Transformación de Datos.
Consiste en las modificaciones de sintaxis que se aplican a los datos y hacer comprensible las
reglas de transformación de los mismos, ejemplo de transformar datos de bajo nivel a alto nivel
y reducir significativamente el algoritmo que realiza la búsqueda.
Desventaja reduce la exactitud del conocimiento descubierto, dado por aproximaciones de los
datos.

10. Minería de Datos


Consiste en la búsqueda de patrones de interés que pueden expresarse como un modelo o
simplemente que expresen dependencia de los datos. Se tiene que especificar un criterio de
preferencia para seleccionar un modelo de un conjunto de posibilidades de modelos. También
se tiene que especificar la estrategia de búsqueda a utilizar o algoritmo de minería.
11. Evaluación de patrones
Se identifican verdaderamente patrones interesantes que representan conocimiento, usando
diferentes técnicas, incluyendo análisis estadístico y lenguajes de consulta.

12. Presentación del Conocimiento


Donde la visualización y las técnicas de representación del conocimiento utilizado para
representar el conocimiento extraído del usuario

13. Motor de Minería de Datos


Es una parte esencial para la minería de datos consiste en un conjunto de módulos funcionales
que realizan tareas como la caracterización, asociación y correlación. Análisis, clasificación y
predicción de conglomerados de datos.

14. Interfaz de Usuario


Este módulo comunica a los usuarios con la minería de datos permitiendo al usuario interactuar
con el sistema especificando una consulta o tarea de minería de datos, proporcionando
información para ayudar a enfocar la búsqueda y minería de datos exploratoria basado en los
datos intermedios resultado de la minería. Además este componente permite al usuario
examinar bases de datos y esquemas o datos de almacenes de datos estructuras, evaluar los
patrones y visualizarlos en diferentes formas.
Bibliografía.

[Han 2006] Data Mining: Concepts and Techniques, Second Edition, Jiawei
Han, University of Illinois at Urbana-Champaign. Elsevier 2006.
http://www.webmining.cl/2011/01/proceso-de-extraccion-de-conocimiento/