Documentos de Académico
Documentos de Profesional
Documentos de Cultura
conocimiento
El proceso de extracción de conocimiento
Unidad 1.
M.C. Ana Cristina Palacios García Sesión 4
Definición 1:
El proceso de extracción de conocimiento
2
Preparación de los datos (1)
• Determinar las fuentes de información que pueden ser útiles y dónde conseguirlas.
3
Preparación de los datos (2)
1. Fase de integración y recopilación de datos
Almacén:
Es un
A repositorio de
Bases información
5
Preparación de los datos (4)
• Hay varias formas para mezclar las distintas bases de datos para crear el
repositorio o almacén:
1. Hacer una copia de las bases de datos (eliminando inconsistencias y
redundancias).
• No aplicaría a bases de datos heterogéneas.
6
Almacén de datos (1)
7
Almacén de datos (2)
8
Almacén de datos (3)
• Interfaces y Gestores de Consulta que permiten acceder a los datos conectándose sobre ellos
herramientas más sofisticadas:
• OLAP.
• Minería de datos.
• …
10
Almacén de datos (5)
• Diferencias entre almacén de datos y un sistema operacional
OLTP (On-LineTransactional Processing).
11
Almacén de datos (6)
Base de datos vs Almacén de datos
12
• OLAP
OLAP: vs Minería de datos • Es un proceso deductivo.
14
Preparación de los datos (5)
15
Preparación de los datos (6)
16
Preparación de los datos (7)
17
Preparación de los datos (8)
2. Fase de selección, limpieza y transformación
18
Preparación de los datos (9)
• La selección incluye:
• Selección en forma vertical (columnas o atributos).
• Selección en forma horizontal (filas o registros).
19
Preparación de los datos (10)
20
Preparación de los datos (11)
21
Preparación de los datos (12)
22
Preparación de los datos (13)
2. Fase de selección, limpieza y transformación
23
Preparación de los datos (14)
24