Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Javier Serrano
Business Intelligence
Instituto IACC
18-06-2018
Desarrollo
Una organización dedicada a la venta de productos ferreteros, desea analizar información que se
encuentra en distintas bases de datos para obtener antecedentes relevantes que permitan mejorar
las ventas. Para ello el equipo de tecnología decide realizar un proceso de unificación de los
datos, comenzando con la limpieza, integración y transformación de los datos. De acuerdo al
caso presentado responda las siguientes preguntas.
¿Cuáles son los métodos para limpiar los datos que se encuentran en las distintas fuentes?
Ejemplifique.
simplemente datos en papel, suele no ser consistente en el tipo de información para algunos datos
que serían de suma relevancia. Para ello se aplica la integración de datos, que consiste en
suavizar un poco el ruido y solo identificar los valores y las inconsistencias de estos mismos.
Ignorar Tuplas: cuando la etiqueta de la clase no se encuentra, buscar valores que faltan por
atributo.
Rellenar el valor faltante manualmente: buscar uno a uno los datos faltantes.
Utilizar constante global: rellenar los datos que faltan con alguna etiqueta generalizada como
Utilizar el atributo significa rellenar el valor faltante: utilizar el promedio del dato para completar
los faltantes.
Utilizar el atributo para todas las muestras que pertenecen a la misma clase que se encuentra
árbol de decisión, se pueden utilizar datos de otro cliente similar para completar los datos
faltantes
Algunos métodos que solicitan hacer el rellenado de datos, Cabe decir que no siempre la falta de
datos significa un error, dado que en la mayoría de los sistemas siempre existirán datos que son
opcionales. Otro problema que suele suceder es no hacer un buen diseño de las bases de datos y
de los datos.
Los tipos de datos pueden referirse a los mismo, pero son diferentes, en el caso de monedas,
algunos sistemas los pueden valorizar con otro tipo de moneda ya sea peso, dólar, euro, etc. El
3. Generalización de los datos: Datos en bruto se sustituyen por conceptos más generales
Se realizan distintas funciones para un análisis previo, el objetivo es preparar de mejor manera la
información para aplicar una técnica que se adapte bien a la minería de datos y dar solución al
Contenidos Semana 2.