Está en la página 1de 18

SISTEMAS EXPERTOS

La Minería de Datos como herramienta de


inteligencia competitiva. Marín Llanes, Luis A.

Ing. Santos Pavon


Email: ing.spavon@gmail.com
Tema 3: Minería de datos

Objetivo
 Procesar datos relevantes en la
minería de datos
Tratamiento de Datos

Valores Valores
Erróneos Ausentes
Valores ausentes

 Son valores que no están, valores


nulos, basura o simplemente valores
vacíos.
 Generalmente se representan por el
carácter ?
Valores ausentes

Por ejemplo
 Al llenar un formulario en una
aplicación, y dejamos ciertos
campos vacíos.
Valores erróneos

 Son datos que están, pero que no


cumplen las condiciones
especificadas para el dato en
mención.
 Están fuera de rango, por lo
general
Valores erróneos

Por ejemplo
 Que en el campo temperatura de un
paciente, este un valor de 24 o 40
grados Celsius
 Que en el campo altura de una
persona este un valor de 3 metros
de altura
Tratamiento

 Tanto valores ausentes como valores


erróneos deben ser tratados, o
corregidos antes de ser utilizados,
dado que si no lo hacemos,
obtendremos valores con mucha
incertidumbre, y las decisiones
tomadas no serán las idóneas.
Tratamiento

 Al utilizar datos históricos, lo


primero que debemos realizar es el
tratamiento de datos, para limpiar
los datos lo mas que se pueda
 Será necesario utilizar herramientas
auxiliares para realizar esta tarea
 Necesitamos conocimientos
estadísticos
Tratamiento Minería de datos

 Abrir el archivo .data en Excel


 Insertar una fila y nombrar las columnas
 Activar filtro
 Procesar valores ausentes
Puede utilizar la función Contar.Si para
agilizar los procesos
Tratamiento Minería de datos

 Encontrar el porcentaje de valores


ausentes
 Tratarlo
con moda, máximo, mínimo,
promedio o media
 Eliminar las columnas que no cumplen
con el criterio de valores ausentes
Tratamiento Minería de datos

 Encontrar el porcentaje de valores


erróneos
 Tratarlo
con moda, máximo, mínimo,
promedio o media
 Eliminar las columnas que no cumplen
con el criterio de valores erróneos
Tratamiento Minería de datos

 Guardar como Fase 1, como libro de Excel


 Actualizar los valores ausentes con el
tratamiento indicado
 Actualizar los valores erróneos con el
tratamiento indicado
 Guardar como Fase 2
Tratamiento Minería de datos

 Eliminar las columnas que no cumplen con los


criterios de valores ausentes y erróneos
 Eliminar los cálculos estadísticos realizados
 Eliminar la primera fila agregada
 Guardar como Fase 3, como libro de Excel
 Luego, guardar como Fase 4, como CSV
(delimitado por comas)
 Cerrar Excel
WEKA
@relation nombre
@attribute nombre1 integer
@attribute nombre2 real
@attribute nombre3 numeric
@attribute nombre4 {valor1, valor2,…., valorN}
@data
Copiar el archivo Fase 4 CSV
Guardar como texto sin formato MS-DOS
Darle un nombre y extensión .arff
WEKA

 Abrir el archivo en WEKA


 Clasificar con:
OneR, MultiLayerPerceptron, SimpleLogistic,
J48, IBK, IB1, NaiveBayes
 Analizar el mejor de los clasificadores
Resumen

 WEKA nos proporciona una serie de


herramientas que nos permiten
clasificar el conocimiento, y poder
incluso, seleccionar aquellos datos mas
relevantes en la solución de problemas.
SISTEMAS EXPERTOS
La Minería de Datos como herramienta de
inteligencia competitiva. Marín Llanes, Luis A.

Ing. Santos Pavon


Email: ing.spavon@gmail.com

También podría gustarte