Está en la página 1de 4

Minería de Datos

La minería de datos o exploración de datos es un campo de las ciencias de la computación


referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de
datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y
sistemas de bases de datos. El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en una estructura comprensible
para su uso posterior.
Un proceso típico de minería de datos consta de los siguientes pasos generales:
1. Selección del conjunto de datos, tanto en lo que se refiere a las variables objetivo
(aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las
que sirven para hacer el cálculo o proceso), como posiblemente al muestreo de los registros
disponibles.
2. Análisis de las propiedades de los datos, en especial los histogramas, diagramas de
dispersión, presencia de valores atípicos y ausencia de datos (valores nulos).
3. Transformación del conjunto de datos de entrada, se realizará de diversas formas en
función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de
datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como
pre procesamiento de los datos.
4. Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo,
de clasificación o segmentación.
5. Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un
modelo de conocimiento, que representa patrones de comportamiento observados en los
valores de las variables del problema o relaciones de asociación entre dichas variables.
También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque
generalmente cada técnica obliga a un pre procesado diferente de los datos.
6. Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su
validación comprobando que las conclusiones que arroja son válidas y suficientemente
satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas
técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema.

Administración del Conocimiento.


La gestionar el Conocimiento significa gestionar los procesos de creación, desarrollo, difusión
y explotación del conocimiento para ganar capacidad organizativa
La administración del conocimiento implica la conversión del conocimiento tácito (el que sabe
un trabajador especifico) en explicito (conocimiento documentado y explicable) para
convertirlo en un activo estratégico de la organización.
Los procesos y Subprocesos clave de la Administración de Conocimiento definidos por el
Centro de Sistemas de Conocimiento son los siguientes:
1. Alineación y consolidación estratégica de capitales:
a. Definición de Sistemas Diferenciales
b. Estructuración y Operación de Capitales
c. Estrategia de Administración del Conocimiento y Desarrollo de capitales articuladores

2. Administración del Capital Agente


a. Administración del Aprendizaje Organización
b. Desarrollo de Prácticas de Valor
c. Desarrollo de Competencias Claves

3. Administración del Capital Instrumental


a. Métodos y Herramientas para instrumentar las estratégicas de administración del
conocimiento
b. Selección e Implantación de Plataformas Tecnológicas para la administración del
conocimiento
c. Desarrollo de la Base de Conocimiento

Aplicaciones Analíticas
Una aplicación analítica consiste en una serie lógicamente integrada de informes interactivos
incluyendo dashboards y scorecards, permitiendo de esta manera el acceso a una amplia
gama de usuarios, al análisis de información integrada de procesos comerciales y tareas que
se manejan en la actividad comercial del negocio como son las ventas, servicios y
operaciones.
Características de las aplicaciones analíticas:
1. Integradas Lógicamente: Una aplicación analítica es por encima de todo una aplicación,
eso significa que algún grado de lógica comercial es incluido en la aplicación que ayude a los
usuarios a navegar a través de una serie de tareas, entre otras cosas.
2. Informes Interactivos que permitan a los usuarios acceder, analizar y actuar: Esto
significa que los usuarios pueden penetrar con una vista de nivel más alto de un reporte a
niveles más bajos o inferiores para adicionar información. Los reportes interactivos pueden
ser entregados por varias tecnologías: cubos OLAP, reportes parametrizados, técnicas
avanzadas de visualización, y formulación estadística entre otras.
3. Información Integrada: Arquitectónicamente una aplicación analítica es un objeto
soportado por un repositorio de almacenamiento de datos de la empresa, un simple almacén
de datos puede soportar docenas de aplicaciones analíticas.
4. Dirección de un dominio comercial: Las aplicaciones analíticas son definidas por los
requerimientos de información de la actividad comercial, como las ventas, servicios o
infraestructura

Elementos de una aplicación analítica


Una aplicación analítica está compuesta por seis elementos primordiales los cuales son:
1. Visualización y percepción: La visualización consiste en un ambiente grafico amigable al
usuario, con definición de colores, fuentes, fondos de pantalla, en lo referente a la percepción
se enfatiza la navegación de las áreas de trabajo.
2. Reportes y Análisis: Los reportes en vistas de información predefinidas, que pueden
presentarse como estáticas o como documentos interactivos, los cuales permiten mirar al
detalle o filtrar los datos que se obtienen de las diversas vistas; el análisis incorpora
sofisticados cálculos, algoritmos estadísticos, y visualizaciones avanzadas para ayudar a los
usuarios a analizar grandes y complejos volúmenes de información.
3. El servidor de análisis: El servidor de análisis es generalmente el responsable de
procesar peticiones utilizando run-time de metadatos definidos y guardándolos en el almacén
del servidor. El servidor de análisis también realiza funciones administrativas como la
seguridad, entrega de reportes, rastreo, clustering y archivos de almacenamiento.
4. Lógica de negocios: Ya se ha mencionado un tipo de lógica comercial, las reglas de
navegación de los usuarios son paso a paso a través de reportes, vistas, acciones.
5. Modelo de Datos: El modelo de datos es el cerebro de aplicaciones analíticas, a menudo
trabajando en conjunto con la capa semántica de BI eso representa los elementos de los
datos en las condiciones comerciales comunes, los modelos de datos son usados en las
definiciones de los cubos de OLAP.
6. El mapeo de las fuentes: Se definen las transformaciones requeridas para llevar los datos
fuentes dentro del modelo de datos designado.
Sistemas de Reportes
Un sistema de reportes le permite tener un conocimiento pleno de toda su empresa a través
de una gran cantidad amplia de datos manipulados de tal manera que satisfaga las
necesidades del usuario y pueda realizar un análisis coherente, concreto y objetivo sobre los
mismos.
un ejemplo de un sistema de reportes es el siguiente.
El SGR es un potente generador de informes que utiliza un cubo OLAP para mostrar los datos
que el usuario desea ver y a su vez estos datos se reflejan en distintos gráficos ilustrativos.
Cuenta con la posibilidad de exportar el cubo OLAP a un archivo de Excel por si se requiere
manipular los datos en una hoja de cálculo o PDF si se desea imprimir.
También permite la posibilidad de armar un reporte con Título, logo de empresa, descripción,
autor, datos y gráficos. Con solo un clic obtendrá un reporte completo y listo para presentar.

Ventajas:
El SGR es totalmente adaptable a cualquier universo de datos, lo cual lo hace compatible con
la gran variedad de sistemas del mercado actual. De cada informe, el usuario puede realizar
distintas combinaciones y guardarlas para luego utilizarlas o imprimir un informe por cada
configuración.
Si su informe posee muchos datos, el cubo OLAP que maneja el SGR está paginado para
aumentar así el rendimiento y orden de los datos. Cuenta con una sección para realizar
distintos tipos de filtros sobre el mismo de una manera rápida, ágil y fácil de utilizar. También
brinda la posibilidad de crear campos calculados en los informes, podrá crear supuestas
simulaciones en sus datos como saber en qué afectará un aumento del 10% en el precio de
un producto, en las ventas del mismo producto y comparar la columna original con la columna
que posee el aumento.

Multidimensionalidad.
La multidimensionalidad dentro de la inteligencia de negocios ayuda a representar los datos
en forma cercana a la intuición del usuario y al mismo tiempo resolver problemas planteados
en sistemas relacionales.
La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc.
Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa
e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad,
poder y flexibilidad que necesitan para analizar la información.
Se representan los datos como una matriz.
- En los ejes están los criterios de análisis.
- En los cruces están los valores a analizar.
- A esta estructura se le llama Cubo o Hipercubo.
Los Cubos o Hipercubos constan de:
 Dimensiones:
 Criterios de análisis de los datos.
 Macro-objetos del problema.
 Variables independientes.
 Ejes en el hipercubo.
 Medidas:
 Valores o indicadores a analizar.
 Datos asociados a relaciones entre los objetos problema.
 Variables dependientes.
 Variables en la intersección de las dimensiones.

Data Warehouse.
características del Data Warehouse.

También podría gustarte