Está en la página 1de 2

BASES DE DATOS AVANZADAS LECCION DE RECONOCIMIENTO UNIDAD 2

Anvar Chaves Torres

Bodegas de datos Las organizaciones continuamente estn generando datos por diferentes fuentes, en diferentes lugares, momentos y formatos. Estos datos se constituyen en insumos para sus operaciones y sobre todo para la toma de decisiones. No obstante, los datos no son muy tiles cuando estn en bruto, es necesario integrarlos, sistematizarlos, analizarlos y presentarlos en el formato adecuado y en el momento oportuno para obtener informacin relevante. En este contexto surgen y toman sentido las bodegas de datos. Inmon(1997) define una bodega de datos como una coleccin de datos, orientados a hechos relevantes del negocio, integrados, que incluyen el tiempo como caracterstica importante de referencia y no voltiles para el proceso de toma de decisiones (citado por Abril y Prez, 2007: 3). De esta definicin se deduce que la bodega de datos se construye con todos los datos asociados a las operaciones y actividades de la organizacin y se van cargando a travs del tiempo, de manera que constituyen un sistema de informacin histrico. Las bodegas de datos como concepto y como tecnologa son relativamente nuevas, su implementacin ha sido posible gracias al avance en la capacidad de almacenamiento y de procesamiento de los computadores y del desarrollo de software especializado para diferentes anlisis de datos. Las organizaciones utilizan diferentes esquemas para registrar y almacenar los datos en diferentes tiempos, esto hace que un Data Warehouse tenga como fuentes bases de datos de diferentes esquemas. La importancia de la bodega de datos consiste, precisamente, en su capacidad para concentrar toda la informacin generada a travs del tiempo y generar conocimiento que permite la toma de decisiones con mayor certeza. La principal fuente de datos para la bodega de datos son los sistemas operacionales. Por lo anterior es necesario analizar y definir cuidadosamente que datos que representan la esencia o filosofa del negocio que se pretenda manejar y cuales sern importantes para la meta que se le ha determinado a la bodega de datos. La informacin sobre los datos importados se almacena en metadatos, que son precisamente los que describen a los datos provenientes de los sistemas operacionales. Los metadatos guardan informacin sobre los formatos, significado y origen de los datos y facilitan, por lo tanto, el acceso, la navegacin y la administracin de los datos en la bodega. Son datos sobre los datos.

Minera de Datos (Data Mining) y descubrimiento de conocimiento en base de datos (KDD). En las grandes bases de datos se oculta gran cantidad de conocimiento que no es posible descubrirlo con los mtodos y tcnicas convencionales y mucho menos de forma manual. La minera de datos es la respuesta a la necesidad de identificar patrones y tendencias a partir de los datos recolectados en las bodegas de datos. De ah surge la analoga con la minera, se trata de descubrir una veta de oro en una montaa de datos. Las dimensiones de las base de datos grandes (montaas) y sus velocidades de crecimiento, hacen muy difcil para un humano su anlisis y la extraccin de alguna informacin importante (oro). An con el uso de herramientas estadsticas clsicas esta tarea es casi imposible. El descubrimiento de conocimiento en base de datos (KDD) combina las tcnicas tradicionales con numerosos recursos desarrollados en el rea de la inteligencia artificial. En algunos casos las herramientas provenientes de la inteligencia artificial son nuevas, no del todo comprendidas y carentes de un soporte terico formal. La minera de datos tiene como propsito descubrir, extraer y almacenar informacin relevante de amplias bases de datos, a travs de programas de bsqueda e identificacin de patrones y relaciones globales, tendencias, desviaciones y otros indicadores aparentemente caticos que tienen una explicacin que pueden descubrirse mediante diversas tcnicas. El objetivo fundamental es aprovechar el valor de la informacin localizada y usar los patrones preestablecidos para que los directivos tengan un mejor conocimiento de su negocio y puedan tomar decisiones confiables. (Larrieta y Santilln, 2007). En conclusin, la minera de datos es la tcnica de descubrimiento de conocimientos a partir de una gran cantidad de informacin sobre las operaciones de una organizacin, almacenada en bodegas de datos, mediante el uso de algoritmos y herramientas especializadas. Este conocimiento se utiliza especialmente para la toma de decisiones. Referencias Abril, Diego y Perez, Jos. (2007). Estado de las tecnologas de bodega de datos y OLAP aplicadas a las bases de datos espaciales. En: Ingeniera e investigacin, V. 27, N. 1, Abril. Universidad Nacional de Colombia, Bogot Inmon, W. (1997). Building de Data Warehouse. 2 ed. John Wiley & Sons, 1997. Larrieta, Mara y Santilln (2007), Anglica. Minera de datos: concepto, caractersticas y aplicaciones. En E-journal, UNAM. Consultado: jul., 18, 2012. Disponible en: http://www.ejournal.unam.mx/rca/190/RCA19007.pdf

También podría gustarte