Está en la página 1de 4

UNIVERSIDA ICEL

CAMPUS LOMAS VERDES

Datamining
La minera de datos
PROFRA. BEATRIZ PAOLA ARREDONDO HERNNDEZ 30/JUNIO/2011 ALUMNO CARLOS VILCHIS MARTNEZ

Datamining
La minera de datos (DM, Data Mining) consiste en la extraccin no trivial de informacin que reside de manera implcita en los datos. Dicha informacin era previamente desconocida y podr resultar til para algn proceso. En otras palabras, la minera de datos prepara, sondea y explora los datos para sacar la informacin oculta en ellos. Bajo el nombre de minera de datos se engloba todo un conjunto de tcnicas encaminadas a la extraccin de conocimiento procesable, implcito en las bases de datos. Est fuertemente ligado con la supervisin de procesos industriales ya que resulta muy til para aprovechar los datos almacenados en las bases de datos. Las bases de la minera de datos se encuentran en la inteligencia artificial y en el anlisis estadstico. Mediante los modelos extrados utilizando tcnicas de minera de datos se aborda la solucin a problemas de prediccin, clasificacin y segmentacin.

Inteligencia artificial
Se denomina inteligencia artificial (IA) a la rama de las ciencias de la Computacin[1] [2] [3] dedicada al desarrollo de agentes racionales no vivos. Para explicar la definicin anterior, entindase a un agente como cualquier cosa capaz de percibir su entorno (recibir entradas), procesar tales percepciones y actuar en su entorno (proporcionar salidas), y entindase a la racionalidad como una capacidad humana que permite pensar, evaluar y actuar conforme a ciertos principios de optimidad y consistencia , para satisfacer algn objetivo o finalidad. De acuerdo al concepto previo, racionalidad es ms general y por ello ms adecuado que inteligencia para definir la naturaleza del objetivo de esta disciplina.

Protocolo de un proyecto de minera de datos


Un proyecto de minera de datos tiene varias fases necesarias que son, esencialmente: Comprensin del negocio y del problema que se quiere resolver. Determinacin, obtencin y limpieza de los datos necesarios. Creacin de modelos matemticos.

Validacin, comunicacin, etc. de los resultados obtenidos. Integracin, si procede, de los resultados en un sistema transaccional o similar. La relacin entre todas estas fases slo es lineal sobre el papel. En realidad, es mucho ms compleja y esconde toda una jerarqua de subfases. A travs de la experiencia acumulada en proyectos de minera de datos se han ido desarrollando metodologas que permiten gestionar esta complejidad de una manera ms o menos uniforme.

Tcnicas de minera de datos


Como ya se ha comentado, las tcnicas de la minera de datos provienen de la Inteligencia artificial y de la estadstica, dichas tcnicas, no son ms que algoritmos, ms o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Las tcnicas ms representativas son: Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automtico inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin de neuronas en una red que colabora para producir un estmulo de salida. Algunos ejemplos de red neuronal son: El Perceptrn. El Perceptrn multicapa. Los Mapas Autoorganizados, tambin conocidos como redes de Kohonen. Regresin lineal.- Es la ms utilizada para formar relaciones entre datos. Rpida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse ms de 2 variables. rboles de decisin.- Un rbol de decisin es un modelo de prediccin utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema. Ejemplos: Modelos estadsticos.- Es una expresin simblica en forma de igualdad o ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta.

Clustering
Agrupamiento o Clustering.- Es un procedimiento de agrupacin de una serie de vectores segn criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que estn ms cercanos aquellos que tengan caractersticas comunes. Ejemplos: Un algoritmo de agrupamiento (en ingls, clustering) es un procedimiento de agrupacin de una serie de vectores de acuerdo con un criterio de cercana. Esta cercana se define en trminos de una determinada funcin de distancia, como la eucldea, aunque existen otras ms robustas o que permiten extenderla a variables discretas. Generalmente, los vectores de un mismo grupo (o clsters) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripcin sinttica de un conjunto de datos multidimensional complejo. De ah su uso en minera de datos. Esta descripcin sinttica se consigue sustituyendo la descripcin de todos los elementos de un grupo por la de un representante caracterstico del mismo. En algunos contextos, como el de la minera de datos, se lo considera una tcnica de aprendizaje no supervisada puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo

Segn el objetivo del anlisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998): Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos. Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.

BIBLIOGRAFIA.
http://www.gsi.dit.upm.es/~anto/tesis/html/stateart.html http://www.menem.com/~ilya/digital_library/learning/hershkowitz-nadal.pdf http://citeseer.ist.psu.edu/341770.html http://dmsurvivor.sarovar.org/L.html

También podría gustarte