Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Datamining
La minera de datos
PROFRA. BEATRIZ PAOLA ARREDONDO HERNNDEZ 30/JUNIO/2011 ALUMNO CARLOS VILCHIS MARTNEZ
Datamining
La minera de datos (DM, Data Mining) consiste en la extraccin no trivial de informacin que reside de manera implcita en los datos. Dicha informacin era previamente desconocida y podr resultar til para algn proceso. En otras palabras, la minera de datos prepara, sondea y explora los datos para sacar la informacin oculta en ellos. Bajo el nombre de minera de datos se engloba todo un conjunto de tcnicas encaminadas a la extraccin de conocimiento procesable, implcito en las bases de datos. Est fuertemente ligado con la supervisin de procesos industriales ya que resulta muy til para aprovechar los datos almacenados en las bases de datos. Las bases de la minera de datos se encuentran en la inteligencia artificial y en el anlisis estadstico. Mediante los modelos extrados utilizando tcnicas de minera de datos se aborda la solucin a problemas de prediccin, clasificacin y segmentacin.
Inteligencia artificial
Se denomina inteligencia artificial (IA) a la rama de las ciencias de la Computacin[1] [2] [3] dedicada al desarrollo de agentes racionales no vivos. Para explicar la definicin anterior, entindase a un agente como cualquier cosa capaz de percibir su entorno (recibir entradas), procesar tales percepciones y actuar en su entorno (proporcionar salidas), y entindase a la racionalidad como una capacidad humana que permite pensar, evaluar y actuar conforme a ciertos principios de optimidad y consistencia , para satisfacer algn objetivo o finalidad. De acuerdo al concepto previo, racionalidad es ms general y por ello ms adecuado que inteligencia para definir la naturaleza del objetivo de esta disciplina.
Validacin, comunicacin, etc. de los resultados obtenidos. Integracin, si procede, de los resultados en un sistema transaccional o similar. La relacin entre todas estas fases slo es lineal sobre el papel. En realidad, es mucho ms compleja y esconde toda una jerarqua de subfases. A travs de la experiencia acumulada en proyectos de minera de datos se han ido desarrollando metodologas que permiten gestionar esta complejidad de una manera ms o menos uniforme.
Clustering
Agrupamiento o Clustering.- Es un procedimiento de agrupacin de una serie de vectores segn criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que estn ms cercanos aquellos que tengan caractersticas comunes. Ejemplos: Un algoritmo de agrupamiento (en ingls, clustering) es un procedimiento de agrupacin de una serie de vectores de acuerdo con un criterio de cercana. Esta cercana se define en trminos de una determinada funcin de distancia, como la eucldea, aunque existen otras ms robustas o que permiten extenderla a variables discretas. Generalmente, los vectores de un mismo grupo (o clsters) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripcin sinttica de un conjunto de datos multidimensional complejo. De ah su uso en minera de datos. Esta descripcin sinttica se consigue sustituyendo la descripcin de todos los elementos de un grupo por la de un representante caracterstico del mismo. En algunos contextos, como el de la minera de datos, se lo considera una tcnica de aprendizaje no supervisada puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo
Segn el objetivo del anlisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998): Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos. Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.
BIBLIOGRAFIA.
http://www.gsi.dit.upm.es/~anto/tesis/html/stateart.html http://www.menem.com/~ilya/digital_library/learning/hershkowitz-nadal.pdf http://citeseer.ist.psu.edu/341770.html http://dmsurvivor.sarovar.org/L.html