Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Data Mining
Data Mining
Viene del Ingl�s Data = datos y WareHouse = almac�n, por eso, una data warehouse
es un almac�n de datos. Esta palabra se utiliza para hablar de un almac�n de datos
dise�ado para permitir las actividades de inteligencia de un negocio. En definitiva
sirve para ayudar analizar los datos recopilados por la empresa con el fin de
mejorar su rendimiento.
Todo el mundo sabe hoy en d�a que la informaci�n es un potente activo del que se
pueden obtener importantes beneficios y ventajas competitivas para cualquier
organizaci�n. De hecho las empresas valoran los datos como un activo m�s de la
empresa. Estos datos pueden darnos informaci�n acerca de clientes, competidores,
etc. De ah� nacen las datas warehouses.
Es importante que la empresa cuente con un �nico DataWarehouse. As�, los miembros
de la organizaci�n podr�n acceder a una misma fuente de informaci�n organizada
seg�n convenciones determinadas por el management.
El t�rmino "Data WareHouse" fue acu�ado por primera vez por Bill Inmon en 1990.
De acuerdo con Inmon, una data warehouse es un conjunto de datos estructurados
orientados por temas, integrados, variables con el tiempo, y no vol�tiles empleados
para tomar decisiones.
- No vol�tiles: quiere decir que los datos no van a cambiar con el tiempo una vez
que se encuentran en el almac�n. El almac�n de informaci�n de un datawarehouse
existe para ser le�do, pero no modificado. La informaci�n ni se modifica ni se
elimina.
- Variables con el Tiempo: Los cambios producidos en los datos a lo largo del
tiempo quedan registrados para que los informes que se puedan generar reflejen esas
variaciones.
Otras formas que podemos encontrar de llamar a las data warehouse pueden ser: dw,
data wharehouse, data warhouse o simplemente almac�n de datos. Data Warehousing, es
el proceso que facilita la creaci�n y explotaci�n de un Data Warehouse.
Las data warehouse son la base para los sistemas de gesti�n de relaciones con los
clientes, ya que pueden ser utilizados para la consolidaci�n de los datos del
cliente y la identificaci�n de �reas de satisfacci�n y/o frustraci�n del cliente.
Los fabricantes pueden utilizarla para comparar los costos de cada una de sus
l�neas de productos en los �ltimos a�os, a determinar qu� factores producen
incrementos y ver qu� efecto tuvieron estos aumentos en los m�rgenes globales.
Ahora vamos hacer un breve recorrido por esas otras herramientas que toda data
warehouse debe tener. La mayor�a de los data warehouse tiene la siguiente
arquitectura:
Expliquemos los pasos ETL y de an�lisis.
OLAP permite al usuario extraer y ver con facilidad y de forma selectiva los datos
desde diferentes puntos de vista.
Un ejemplo, un usuario puede solicitar que se analizaron los datos para mostrar
una hoja de c�lculo que muestra todos los productos una pelota de playa de una
empresa que se venden en Madrid en el mes de julio, comparar las cifras de ingresos
con los de los mismos productos en septiembre y luego ver una comparaci�n de otras
ventas de productos en Madrid en el mismo per�odo de tiempo.
Data Mining
Data Mining significa "miner�a del datos". En general, el data mining (a veces
descubrimiento de conocimiento) es el proceso de analizar los datos desde
diferentes perspectivas y resumirlos en informaci�n �til; informaci�n que puede ser
utilizada para aumentar los ingresos, reducir los costes, o ambos. El data mining
descubre patrones ocultos en los datos.
Un ejemplo:
Una cadena de supermercados utiliza la capacidad de extracci�n de datos de Oracle
software para analizar los patrones de compra locales. Descubrieron que cuando los
hombres compran pa�ales los jueves y los s�bados, tambi�n tend�an a comprar
cerveza. Un an�lisis m�s detallado mostr� que estos compradores normalmente
hicieron su compra semanal los s�bados. Los jueves, sin embargo, s�lo han comprado
algunos art�culos. El minorista lleg� a la conclusi�n de que deber�a comprar
cerveza para tenerla disponible para el pr�ximo fin de semana. La cadena de
supermercados podr�a utilizar esta informaci�n recientemente descubierta de
diversas maneras para aumentar los ingresos. Por ejemplo, podr�an mover la
estanter�a de la cerveza m�s cerca de la de los pa�ales y los jueves no har�an
ninguna oferta para pa�ales y cerveza.
Con OLAP se resumen los datos y se hacen pron�sticos. Por ejemplo, responde a
cuestiones operativas como "�Cu�l es el promedio de ventas de autom�viles, por
regi�n y por a�o?".
Data Mining descubre patrones ocultos en los datos y opera a un nivel detallado en
lugar de un nivel de resumen. Por ejemplo, en una industria de las
telecomunicaciones, donde la p�rdida de clientes es un factor clave, la miner�a de
datos podr�a responder a preguntas como: "�Qui�n es probable que cambie los
proveedores de servicios y cu�les son las razones para que cambien?"