Está en la página 1de 3

MINERIA DE DATOS (DATA MINING)

APLICADA A LA INTELIGENCIA ARTIFICIAL


INTRODUCCION
Cada da generamos una gran cantidad de informacin, algunas veces conscientes
de que lo hacemos y otras veces inconscientes de ello porque lo desconocemos.
Nos damos cuenta de que generamos informacin cuando registramos nuestra
entrada en el trabajo, cuando entramos en un servidor para ver nuestro correo,
cuando pagamos con una tarjeta de crdito o cuando reservamos un billete de
avin. Otras veces no nos damos cuenta de que generamos informacin, como
cuando conducimos por una va donde estn contabilizando el nmero de
automviles que pasan por minuto, cuando se sigue nuestra navegacin por Internet
o cuando nos sacan una fotografa del rostro al haber pasado cerca de una oficina
gubernamental.
Con qu finalidad queremos generar informacin? Son muchos los motivos que
nos llevan a generar informacin, ya que nos pueden ayudar a controlar, optimizar,
administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar
decisiones de cualquier mbito segn el dominio en que nos desarrollemos. La
informacin por s misma est considerada un bien patrimonial. De esta forma, si
una empresa tiene una prdida total o parcial de informacin provoca bastantes
perjuicios. Es evidente que la informacin debe ser protegida, pero tambin
explotada.
Qu nos ha permitido poder generar tanta informacin? En los ltimos aos,
debido al desarrollo tecnolgico a niveles exponenciales tanto en el rea de cmputo
como en la de transmisin de datos, ha sido posible que se gestionen de una mejor
manera el manejo y almacenamiento de la informacin. Sin duda existen cuatro
factores importantes que nos han llevado a este suceso:
1. El abaratamiento de los sistemas de almacenamiento tanto temporal
como permanente.

2. El incremento de las velocidades de cmputo en los procesadores.

3. Las mejoras en la confiabilidad y aumento de la velocidad en la


transmisin de datos.

4. El desarrollo de sistemas administradores de bases de datos ms


poderosos.
Actualmente todas estas ventajas nos han llevado a abusar del almacenamiento de
la informacin en las bases de datos. Podemos decir que algunas empresas
almacenan un cierto tipo de datos al que hemos denominado dato-escritura, ya que

slo se guarda (o escribe) en el disco duro, pero nunca se hace uso de l.


Generalmente, todas las empresas usan un dato llamado dato-escritura-lectura, que
utilizan para hacer consultas dirigidas. Un nuevo tipo de dato al cual hemos
denominado dato-escritura-lectura-anlisis es el que proporciona en conjunto un
verdadero conocimiento y nos apoya en las tomas de decisiones. Es necesario
contar con tecnologas que nos ayuden a explotar el potencial de este tipo de datos.

Concepto
El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten
explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo
de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de
los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un
repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos,
de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les
atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge
entre la informacin y ese modelo represente
un valor agregado, entonces nos referimos al
conocimiento.
Aunque en datamining cada caso concreto
puede ser radicalmente distinto al anterior, el
proceso comn a todos ellos se suele
componer de cuatro etapas principales:

Determinacin de los objetivos. Trata


de la delimitacin de los objetivos que
el cliente desea bajo la orientacin del

especialista en data mining.


Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa
consume generalmente alrededor del setenta por ciento del tiempo total de un
proyecto de data mining.
Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de
los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para
tener una primera aproximacin. Segn los objetivos planteados y la tarea que
debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes
reas de la Inteligencia Artificial.
Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los
coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El
cliente determina si son novedosos y si le aportan un nuevo conocimiento que le
permita considerar sus decisiones.

En resumen, el datamining se presenta como una tecnologa emergente, con varias


ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las
personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y
abre nuevas oportunidades de negocios. Adems, no hay duda de que trabajar con esta

tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra
"toma de decisiones".

MINERA DE DATOS: QU ES? PARA QU SIRVE?


Hay diferentes definiciones para minera de datos. Una muy simple sera decir que es el
estudio y tratamiento de datos masivos para extraer conclusiones e informacin relevante
de ellos.
En otras palabras, la minera de datos prepara, sondea y explora los datos para sacar la
informacin oculta en ellos.

Ejemplos:
Supongamos una empresa de desarrollo de software. Un equipo de ingenieros puede
desarrollar aplicaciones informticas y por cada una de ellas se recopilan distintos datos
relacionados con la mtrica del software (por ejemplo Horas de trabajo / Lneas de cdigo /
Nmero de errores por cada 1000 lneas de cdigo, etc.). Para qu le servira la minera
de datos a la empresa de desarrollo de software? Pues por ejemplo para saber el nmero
de errores que previsiblemente se va a encontrar en un proyecto y el tiempo que puede
necesitar para corregirlos, antes de que el proyecto en s se haya desarrollado
completamente.

METODOLOGA DE LA MINERA DE DATOS


Un trabajo de minera de datos podramos decir que tpicamente consta de las siguientes
partes:
1. Entendimiento del problema: se trata de hablar con el cliente, conocer sus necesidades,
conocer su negocio o actividad, conocer qu datos relevantes tiene disponibles y cules
seran necesarios pero no estn disponibles, etc.
2. Entendimiento de los datos: hay que saber qu significan los datos, si son continuos o
discretos, qu tipo de valores toman, qu utilidad futura pueden tener y saber si estn bien
capturados o no.
3. Preparacin de datos: se trata de reflexionar sobre cmo guardar los datos. Tpicamente
hablaremos de tablas con filas y columnas, pero hay que ver cmo se organizan las tablas,
cmo se interrelacionan entre ellas, etc. En definitiva organizar los datos para poder
sacarles partido.
4. Modelamiento: una vez se tienen los datos organizados hay que definir los algoritmos
que se van a utilizar para tratar los datos. Una vez tratados, los datos nos devolvern
informacin til.
5. Evaluacin: los resultados obtenidos deben de ser sometidos a comprobacin, verificar
que estn libres de errores, ratificar que son tiles para los objetivos perseguidos, etc.
6. Despliegue funcional-comercial: una vez se tiene automatizada la captura y tratamiento
de datos para obtener unos resultados, se desarrollan herramientas, normalmente en
forma de aplicaciones informticas que permiten generar alertas, informes, estadsticas,
etc. que tienen una utilidad directa para la toma de decisiones y sistema de informacin del
cliente.

También podría gustarte