Está en la página 1de 5

1.2.

1 Minera de datos
Las instituciones y empresas privadas coleccionan bastante informacin,
aprovechando que las computadoras y los discos de almacenamiento se han
abaratado y las comunicaciones son confiables. Esta informacin reside en bases
de datos operacionales.
Posteriormente la informacin se depura y sumariza para transferirla a bases de
datos conocidas como bodegas de datos; aqu se lleva a cabo la labor estratgica
de la misma: averiguar que pasa en ella. Esta es la zona de las decisiones
estratgicas, y los sistemas usados para ellas se conocen como sistemas de
apoyo a la toma de decisiones; el sistema contesta con daos y grficas para que
aquel pueda tomar decisiones. Aunque el directivo o gerente tiene la experiencia
necesaria, a menudo no mira situaciones que estn tomando rumbos interesantes,
peligrosos quizs recientemente a partir del auxilio de la computacin ha surgido
la minera de datos.
La minera de datos puede describirse como el anlisis de datos exploratorio. El
propsito es buscar patrones interesantes en los datos que pueden usarse para
especificar la estrategia del negocio o para identificar comportamientos fuera de lo
comn. Las herramientas de minera de datos aplican tcnicas estadsticas a una
gran cantidad de datos almacenados para buscar tales patrones.
En las bodegas de datos se colocan mineros, algoritmos que buscan tendencias,
anomalas, desviaciones o situaciones interesantes pero desconocidas y otros
eventos importantes. Esto mineros auxilian al directivo al mando de la institucin a
mantener el mejor rumbo posible. Utilizan adems de las bases de datos la
inteligencia artificial y la estadstica, pero a diferencia de esta ltima que toma una
muestra de los datos y la estudia, la minera de datos estudia todos los datos.
Mientras ms datos se analicen, ms precisa es, y su poder de deteccin y
prediccin aumenta.

Buscando establecer una secuencia genrica de etapas para un proyecto de


minera de datos tendremos:
a) Definicin del problema: la respuesta una pregunta mal formulada queda
comprometida desde el inicio del proceso. Uno de los mayores desafio de
los analistas de sistemas es describir lo que el usuario realmente quiere.
Adems,

el

ambiente

en

grandes

corporaciones

involucra

el

relacionamiento con diferentes comunidades dentro de la misma empresa.


Por detrs del usuario final hay que considerar el ambiente del software y
hardware de la empresa. Destacamos entonces las siguientes tareas:
Entrevistar al usuario final.
Entrevistar al responsable del mantenimiento de los datos.
Compilar documentacin.
Seleccionar medios de comunicacin y medios de almacenamiento.
Identificar herramientas.
b) Adquisicin y evaluacin de los datos: partimos del principio de que los
daos son la fuente predominante para obtencin de informacin, por lo
tanto esta etapa como la anterior constituyen los pilares del proceso de
minera de datos. Las tareas a ser cumplidas en esta etapa seran las
siguientes:
Adquirir datos.
Formatear datos.
Crear ambiente y herramientas.
Validar adquisicin y formato.
Crear muestras de trabajo.
Particin de los datos.
c) Extraccin de caractersticas y realce: en esta etapa es preciso identificar
cuales atributos contribuyen para la solucin del problema en discusin.
Atributos que no se alteran, en nada contribuyen para el anlisis. De la
misma forma atributos fuertemente dependientes pueden ser reducidos. La
meta de esta etapa es:
Producir un conjunto de datos representativo, reproducible y
confiable.
d) Plan de prototipaje y desarrollo del modelo:
Desarrollar hiptesis y plan de tesis.
Prototipaje.
Desarrollar modelos descriptivos y/o predictivos.

e) Evaluacin del modelo:


Evaluar los resultados del prototipo.
f) Implementacin:
Entregar el producto final.
g) Evaluacin del retorno sobre la inversin: en esta fase debe ser conducida
por la gerencia de la empresa para evaluar si los cambios consecuentes al
proyecto representaron efectivamente una ganancia material.
Aplicaciones de la minera de datos
Algunas de las tareas importantes de la minera de datos incluyen la identificacin
de aplicaciones para las tcnicas existentes, y desarrollar nuevas tcnicas para
dominios tradicionales o de nueva aplicacin, como el comercio electrnico y la
bioinformtica. Existen numerosas reas donde la minera de datos se puede
aplicar, prcticamente en todas las actividades humanas que generen datos:

Comercio y banca: segmentacin de clientes, previsin de ventas,

anlisis de riesgo.
Medicina y Farmacia: diagnstico de enfermedades y la efectividad

de los tratamientos.
Seguridad y deteccin

identificaciones biomtricas, accesos a redes no permitidos, etc.


Recuperacin de informacin no numrica: minera de texto, minera

de

fraude:

reconocimiento

facial,

web, bsqueda e identificacin de imagen, video, voz y texto de

bases de datos multimedia.


Astronoma: identificacin de nuevas estrellas y galaxias.
Geologa, minera, agricultura y pesca: identificacin de reas de uso
para distintos cultivos o de pesca o de explotacin minera en bases

de datos de imgenes de satlites


Ciencias Ambientales: identificacin de modelos de funcionamiento
de ecosistemas naturales y/o artificiales (p.e. plantas depuradoras de

aguas residuales) para mejorar su observacin, gestin y/o control.


Ciencias Sociales: Estudio de los flujos de la opinin pblica.
Planificacin de ciudades: identificar barrios con conflicto en funcin
de valores sociodemogrficos.

BIBLIOGRAFIA

Minera de datos: Como hallar una aguja en un pajar Gilberto Lorenzo

Martnez Luna Ingenieras Octubre-Diciembre 2011, Vol. XIV, No. 53.


Introduccin a los sistemas de bases de datos C. J. Date Pearson
Educacin, 2001 936 paginas.

Introduccin a la minera de datos Luis Paulo Vieira Braga, Santiago

Segundo Ramrez Carbajal Editora E-papers, 2009 218 paginas.


Minera de datos: conceptos y tendencias revista Iberoamericana de
inteligencia Artificial No. 29 (2006), pp. 11-18.

También podría gustarte