Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Concepto
El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten
explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo
de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de
los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un
repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos,
de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les
atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge
entre la informacin y ese modelo represente
un valor agregado, entonces nos referimos al
conocimiento.
Aunque en datamining cada caso concreto
puede ser radicalmente distinto al anterior, el
proceso comn a todos ellos se suele
componer de cuatro etapas principales:
tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra
"toma de decisiones".
Ejemplos:
Supongamos una empresa de desarrollo de software. Un equipo de ingenieros puede
desarrollar aplicaciones informticas y por cada una de ellas se recopilan distintos datos
relacionados con la mtrica del software (por ejemplo Horas de trabajo / Lneas de cdigo /
Nmero de errores por cada 1000 lneas de cdigo, etc.). Para qu le servira la minera
de datos a la empresa de desarrollo de software? Pues por ejemplo para saber el nmero
de errores que previsiblemente se va a encontrar en un proyecto y el tiempo que puede
necesitar para corregirlos, antes de que el proyecto en s se haya desarrollado
completamente.