Está en la página 1de 3

Descubriendo valor en los datos

KDD: El término descubrimiento de conocimiento en bases de datos, o KDD, se refiere al


amplio proceso de búsqueda de conocimiento en los datos y hace hincapié en la aplicación de
alto nivel de determinados métodos de minería de datos. El objetivo unificador del proceso
KDD es extraer un conocimiento de datos en el contexto de una gran base de datos. Se utilizan
métodos de minería de datos (algoritmos) para extraer (identificar) lo que se considera
conocimiento, de acuerdo con las especificaciones de medidas y umbrales. Esto se produce al
combinar una base de datos con cualquier preprocesamiento, submuestreo y
transformaciones requeridas de dicha base.

El proceso general para encontrar e interpretar patrones a partir de datos implica la aplicación
repetida de los siguientes pasos:

 Desarrollar un entendimiento de:


o El dominio de apps
o El conocimiento previo pertinente
o Los objetivos del usuario final
 Creación de un conjunto de datos de destino
 Limpieza y preprocesamiento de datos
 Reducción y proyección de datos
 Elegir la tarea de minería
 Elegir el/los algoritmo/s de minería de datos.
 Extracción de datos
 Interpretación de patrones minados
 Consolidar el conocimiento descubierto
almacén de datos

Un almacén de datos es un repositorio para todos los datos que recogen los diversos sistemas
empresariales de una organización. El repositorio puede ser físico o lógico. Un
almacenamiento de datos es una tecnología que agrega información estructurada de una o
más fuentes con el fin de que pueda ser comparada y analizada para lograr una mayor
inteligencia de negocios. Hay dos enfoques para el almacenamiento de datos: de arriba hacia
abajo y de abajo hacia arriba. El enfoque de arriba hacia abajo crea los data marts para grupos
específicos de usuarios después de que se haya creado el almacén de datos completo. El
enfoque de abajo hacia arriba construye primero los data marts y luego los combina en un solo
y completo almacén de datos.

Un almacén de datos se emplea para hacer el trabajo analítico, dejando la base de datos
transaccional libre para centrarse en las transacciones. Otros beneficios de un almacén de
datos son la capacidad de analizar datos de múltiples fuentes y negociar diferencias en el
esquema de almacenamiento mediante el proceso ETL. Los almacenes de datos son caros a
escala y no sobresalen en el manejo de datos crudos, no estructurados o complejos. Sin
embargo, siguen siendo una herramienta importante en la era de los grandes datos.

Arquitectura de los almacenes de datos

Un almacén de datos y una arquitectura de BI de próxima generación están emergiendo de


todo el tumulto. Esta nueva arquitectura incluye la necesidad de:

 capacidades analíticas avanzadas


 gestión de fuentes de datos nuevas e inusuales a través de nuevos conceptos y el uso
de herramientas de virtualización o mezcla de datos para aumentar los enfoques
estándares
 nuevas opciones de implementación

Una arquitectura de almacén de datos consta principalmente de tres capas. Dentro de la


primera, se crea un repositorio de documentos para almacenar informes estándares de la
empresa. La segunda es una capa de inteligencia empresarial global que soporta múltiples
aplicaciones, incluye informes de ventas, análisis de ventas, análisis de la cadena de suministro
y de adquisiciones, etcétera. Y por último, debajo de estas dos primeras se encuentra el propio
EDW.

Minería de datos

La minería de datos es el proceso de encontrar anomalías, patrones y correlaciones dentro de


grandes conjuntos de datos para predecir los resultados. Utilizando una amplia gama de
técnicas, puede emplear esta información para aumentar los ingresos, reducir los costos,
mejorar las relaciones con los clientes, reducir los riesgos y más. La minería de datos permite
entender qué es relevante y luego hacer un buen uso de esa información para evaluar
resultados probables y acelerar el ritmo de la toma de decisiones informadas.

¿Quiénes la utilizan?

 Comunicaciones
 Seguros
 Educación
 Manufacturas
 Bancos
 retails

También podría gustarte