Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de Datos
Concepto
Avances
Minería de datos.
es un campo de la estadística y las ciencias de la computación referido al proceso
que intenta descubrir patrones en grandes volúmenes de conjuntos de datos.1
Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y
sistemas de bases de datos. El objetivo general del proceso de minería de datos
consiste en extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior. Además de la etapa de análisis en
bruto, supone aspectos de gestión de datos y de bases de datos, de
procesamiento de datos, del modelo y de las consideraciones de inferencia, de
métricas de Intereses, de consideraciones de la Teoría de la complejidad
computacional, de post-procesamiento de las estructuras descubiertas, de la
visualización y de la actualización en línea.
El término es un concepto de moda, y es frecuentemente mal utilizado para
referirse a cualquier forma de datos a gran escala o procesamiento de la
información (recolección, extracción, almacenamiento, análisis y estadísticas),
pero también se ha generalizado a cualquier tipo de sistema de apoyo informático
decisión, incluyendo la inteligencia artificial, aprendizaje automático y la
inteligencia empresarial. En el uso de la palabra, el término clave es el
descubrimiento, comúnmente se define como "la detección de algo nuevo". Incluso
el popular libro "La minería de datos: sistema de prácticas herramientas de
aprendizaje y técnicas con Java" (que cubre todo el material de aprendizaje
automático) originalmente iba a ser llamado simplemente "la máquina de
aprendizaje práctico", y el término "minería de datos" se añadió por razones de
marketing. A menudo, los términos más generales "(gran escala) el análisis de
datos", o "análisis" -. o cuando se refiere a los métodos actuales, la inteligencia
artificial y aprendizaje automático, son más apropiados
Almacenamiento de datos de OLAP.
OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line
Analytical Processing). Es una solución utilizada en el campo de la llamada
Inteligencia de negocios (o Business Intelligence) cuyo objetivo es agilizar la
consulta de grandes cantidades de datos. Para ello utiliza estructuras de datos
diversas, normalmente multidimensionales (o Cubos OLAP), que contienen datos
resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se
usa en informes de negocios de ventas, marketing, informes de dirección, minería
de datos y áreas similares.
La razón de usar OLAP para las consultas es la rapidez de respuesta. Una base
de datos relacional almacena entidades en tablas discretas si han sido
normalizadas. Esta estructura es buena en un sistema OLTP pero para las
complejas consultas multitabla es relativamente lenta. Un modelo mejor para
búsquedas (aunque peor desde el punto de vista operativo) es una base de datos
multidimensional.
La principal característica que potencia a OLAP, es que es lo más rápido a la hora
de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es
la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE [cita
requerida].
En todos los temas de seguridad de datos existen elementos comunes que todas
las organizaciones deben tener en cuenta a la hora de aplicar sus medidas: las
personas, los procesos y la tecnología.